中山大学 本次发布的数据集 HUMANVBENCH, HUMANVBENCH是由中山大学和阿里巴巴集团联合创建的一个专注于人类中心视频理解的多模态大语言模型(MLLMs)基准数据集。该数据集包含17个细粒度任务,涵盖情感感知、人物识别、行为分析和语音视觉对齐等多个维度。数据集通过先进的自动化视频标注和干扰项包含的问答生成管道构建,利用了超过20种先进的算法和模型,减少了人工标注的依赖。HUMANVBENCH旨在解决现有视频理解模型在情感和行为分析方面的不足,特别是在跨模态和时间对齐方面的挑战。
关于 中山大学 , 中山大学是中国的一所著名综合性大学,位于广东省广州市,是中国教育部直属的重点大学之一,拥有悠久的历史和卓越的学术声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)