浙江大学本次发布的数据集LVOmniBench,LVOmniBench是由浙江大学、西湖大学等机构联合创建的首个专注于长音频-视频跨模态理解的基准数据集。该数据集包含275个高质量长视频,时长介于10至90分钟,总时长140小时,覆盖娱乐、生活方式等五大领域,并严格筛选动态视听内容。通过人工标注构建了1,014个需跨模态推理的多选题,涵盖感知、理解、推理和逻辑四个认知维度。该数据集旨在解决现有评估对长视频(如影视、纪录片)理解不足的问题,推动全模态模型在复杂时空对齐和细粒度推理方面的研究。
关于浙江大学,浙江大学是中国著名的综合性研究型大学,位于浙江省杭州市,是国家“双一流”、“211工程”和“985工程”重点建设高校之一。学校历史悠久,学科门类齐全,科研实力雄厚,在国内外享有很高的声誉。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)