首页 / 开源数据市场 / 正文

国立阳明交通大学联合发布YoCausal因果基准数据集破解视频生成模型因果评测痛点

五号数据雷达开源数据市场2026-05-30 07:227

国立阳明交通大学联合盛大人工智能研究院东京团队于2026年5月29日在预印本平台arXiv首发YoCausal因果认知评估基准数据集，依托真实视频样本与零成本时间反转技术生成反事实样本对，可应用于视频生成模型评估、因果推理基准测试两大领域，为世界模型等前沿AI研发提供核心诊断工具。

随着文生视频大模型、通用人工智能技术的快速迭代，行业对模型因果理解能力的评测需求持续攀升。当前大量生成式视频存在违背物理规律、常识逻辑的错误，本质上是模型尚未真正内化真实世界的因果结构，但此前业内主流的因果评测数据集普遍依赖人工合成数据，存在场景真实性不足、覆盖范围有限、构建成本高等痛点，难以适配视频生成技术的快速迭代需求。

2026年5月29日，国立阳明交通大学联合盛大人工智能研究院东京团队在预印本平台arXiv首发YoCausal因果认知评估基准数据集，为上述行业痛点提供了全新的解决方案。该数据集首批包含1232个真实世界视频样本，覆盖日常生活、物理现象、人类行为及动物活动四大核心主题领域，几乎囊括了普通用户日常接触的绝大多数视频场景。其核心技术创新在于采用零成本时间反转技术生成自然反事实样本对，彻底摒弃了传统因果评测数据集的构建局限：仅通过对现有真实视频资源进行时间维度的反转处理，即可快速生成符合人类认知的反事实对照样本，既保障了样本的真实性，也实现了数据规模的任意扩展与场景多样性的突破，大幅降低了因果评测数据集的构建成本。

作为专为评估视频扩散模型因果理解能力设计的专用基准，YoCausal的核心价值在于能够精准诊断生成模型是否真正掌握了真实世界的时序逻辑与因果规则，而非单纯拟合训练数据的分布。从行业应用场景来看，该数据集可覆盖两大核心方向：其一为视频生成模型效果评估，厂商在迭代文生视频、视频编辑产品时，可依托该数据集快速定位模型生成内容中的因果错误，优化模型在影视内容制作、数字孪生场景构建、安防仿真训练等落地场景的实用性；其二为因果推理领域的通用基准测试，可作为多模态大模型、世界模型研发过程中的核心诊断工具，推动人工智能从“内容生成”向“理解世界运行规则”的高阶方向演进。

作为人工智能产业的核心公共技术资源，高质量评测数据集是推动技术迭代的关键数据要素底座。YoCausal数据集的发布，进一步丰富了多模态因果评测领域的优质数据集供给，对完善人工智能产业的数据要素支撑体系、加快通用人工智能与世界模型的研发落地具有重要的行业参考价值。

查看YoCausal

详情页内容：

社区讨论

近期热门

国立阳明交通大学联合发布YoCausal因果基准数据集 破解视频生成模型因果评测痛点

详情页内容：

社区讨论

国立阳明交通大学联合发布YoCausal因果基准数据集破解视频生成模型因果评测痛点