近年来,生成式AI视频技术进入爆发期,Sora、Pika等产品的迭代不断刷新AI内容生产的效率边界,但行业始终缺乏标准化的物理合理性评估基准——大量生成视频存在物体穿模、重力规律异常、运动逻辑违背物理常识等问题,人工评估不仅效率低且主观性强,物理模拟、3D生成等领域也长期面临训练样本不统一、校验标准不一致的痛点。
2026年4月29日,人工智能研究机构TIGER-Lab正式在HuggingFace平台首发VisPhyWorld-Sub-All基准数据集,为上述行业痛点提供了标准化的解决方案。本次发布的数据集融合了来自VisPhyBench/VisPhyWorld的 `sub` 分割地面实况视频与 `TIGER-Lab/VisPhyWorld-Sub-Generated-Videos` 中相应的生成视频,将真实物理场景样本与AI生成样本配对存储,旨在为样本级效果检查、模型横向能力比较、定性效果评估以及各类需要同时调用地面实况和生成视频的下游工具研发提供数据支撑。
从数据集结构来看,VisPhyWorld-Sub-All包含 GT/*.mp4、threejs/<model>/*.mp4、p5js/<model>/*.mp4、video/<model>/*.mp4、detection_json/*.json、metadata.jsonl、difficulty_table.json 和 metadata.json 等多类文件:其中 `GT/` 文件夹为原始 `data/sub/videos` 文件的副本,生成视频文件夹保留了配套生成视频数据集使用的引擎/模型层次结构,方便研发人员按模型分类调用;元数据文件 `metadata.jsonl` 为 `sub` 分割中每个基准样本单独设置记录项,`video_path` 字段指向 `GT/` 下的对应地面实况文件,`detection_json_path` 字段在可用时指向 `detection_json/` 中的注释文件;`metadata.json` 则提供数据集级样本计数、布局信息和源引用。为降低调用成本,地面实况和生成视频的文件名完全对齐,3D 生成文件采用重新映射的基准名称,研发人员可快速完成两类样本的匹配校验。
具体到应用场景,该数据集可覆盖多个AI研发核心赛道:一是视频生成领域的效果评估,研发团队可通过配对的实况与生成样本,量化不同视频大模型在物理逻辑还原度上的表现,识别生成内容的常识性错误,替代传统人工评估大幅提升校验效率;二是物理模拟与3D生成领域的模型训练,无论是游戏引擎的物理效果优化、数字孪生场景的仿真模拟,还是机器人的环境感知推理模型训练,都可借助该数据集的标准化样本降低研发门槛;三是代码生成领域的效果校验,针对AI生成threejs、p5js等3D渲染代码的场景,可通过该数据集的对照样本校验生成代码的可视化效果是否符合物理规律;此外,该数据集还可为AI生成内容检测、物理常识推理工具等下游产品的研发提供数据支撑。
作为公开的垂直领域基准数据集,VisPhyWorld-Sub-All的发布是生成式AI产业基础设施的重要补充。当前数据要素已成为数字经济核心生产要素,高质量的基准数据集是AI技术迭代的核心底座,该数据集的开放将有效统一相关领域的评估标准,降低研发成本,推动视频生成、工业仿真、数字孪生等技术的商业化落地进程。
首页 / 开源数据市场 / 正文
TIGER-Lab发布VisPhyWorld-Sub-All基准数据集 填补视频生成物理合理性评估空白
五号数据雷达开源数据市场2026-04-30 02:5414
人工智能研究机构TIGER-Lab于2026年4月29日在HuggingFace首发VisPhyWorld-Sub-All数据集,整合物理场景地面实况视频与对应AI生成对照样本,可广泛应用于视频生成效果评估、物理模拟模型训练等领域,为AI多模态能力的物理合理性校验提供标准化基准支撑。

社区讨论
近期热门




_1769672084863.jpg)