中国科学院自动化研究所 本次发布的数据集 MMR-V, MMR-V数据集是由中国科学院自动化研究所等单位创建的多模态视频深度推理基准。该数据集包含317个视频和1257个任务,涵盖了动画、电影、哲学、电视、生活和艺术六大类别。数据集的特点是要求模型进行长距离多帧推理,不仅要感知问题帧,还要分析远离问题帧的证据帧。任务包括显式推理和隐式推理两种类型,旨在评估模型在视频理解、情感识别、因果推理、序列结构推理、反直觉推理、跨模态迁移推理和视频类型与意图推理等方面的能力。数据集的创建遵循多帧、深度推理和现实性三个原则,视频来源广泛,任务设计严谨,旨在推动多模态推理能力的研究。
关于 中国科学院自动化研究所 , 中国科学院自动化研究所是中国科学院下属的研究机构,专注于自动化、人工智能、模式识别等领域的研究。其在人工智能和自动化技术方面取得了多项重要成果,为国家的科技发展做出了重要贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)