OPPO人工智能中心 本次发布的数据集 H2VU-Benchmark, H2VU-Benchmark是由OPPO人工智能中心构建的层次化全景视频理解基准数据集,涵盖从3秒短视频到1.5小时长视频的完整时间谱系。该数据集包含10,183个评估任务,覆盖离线通用视频和在线流媒体视频两大场景,整合了传统感知推理与创新的反常识理解、状态轨迹追踪等47种核心能力维度。通过光学流动态筛选和对话内容识别等三重质量管控流程构建,该基准旨在解决现有视频理解模型在长时序依赖、动态场景适应和第一视角流媒体处理方面的核心挑战,为多模态大语言模型提供全面性能评估框架。
关于 OPPO人工智能中心 , OPPO人工智能中心是OPPO公司下属的研究机构,专注于人工智能领域的研究与开发,推动人工智能技术在智能手机和其他智能设备上的应用。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)