奈良先端科学技术大学院大学 本次发布的数据集 BQA, BQA数据集由奈良先端科学技术大学院大学创建,旨在评估视频大语言模型(VideoLLMs)对人类身体语言情感的理解能力。该数据集包含7632个5-10秒的短视频,每个视频带有26种情感标签和元数据(性别、年龄、种族)。数据集的创建过程包括提取候选答案、生成问题、过滤不适当的问题以及分配难度标签。BQA数据集主要用于评估模型在理解人类情感表达方面的能力,特别是在对话系统等应用中,旨在解决模型在情感理解和交互中的准确性问题。
关于 奈良先端科学技术大学院大学 , 奈良先端科学技术大学院大学(Nara Institute of Science and Technology, NAIST)是日本一所专注于科学技术研究的高等教育机构,位于奈良县生驹市。该校以培养高水平的科研人才和推动前沿科技研究为主要目标,尤其在信息科学、生物科学和材料科学等领域具有显著的研究成果。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)