浙江大学本次发布的数据集SynRL,SynRL是由浙江大学与阿里巴巴团队联合开发的视频理解合成数据集,包含程序化生成的几何运动视频及其精确标注。该数据集包含14,700条样本(7,700条思维链样本和7,000条强化学习样本),通过Python代码生成30FPS的合成视频,并附带帧级元数据标注。数据创建过程采用物理模拟引擎追踪物体运动轨迹、速度变化和状态转换,确保时空标注的绝对准确性。该数据集专注于解决视频语言模型在时序推理(如运动方向判断、速度比较、状态跟踪等)中的核心挑战,显著提升了模型在15个视频理解基准任务上的表现。
关于浙江大学,浙江大学是中国著名的综合性研究型大学,位于浙江省杭州市,是国家“双一流”、“211工程”和“985工程”重点建设高校之一,以工学、理学、医学、农学等学科见长。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)