北京邮电大学 本次发布的数据集 ListenerX, ListenerX是一个大规模的3D对话数据集,包含了超过140万个有效帧,用于多模态响应交互。该数据集由北京邮电大学、香港科技大学和中国科学院自动化研究所共同创建。数据集内容涵盖了高质量的长期对话视频片段,包括对话双方的头部动作、说话人的音频、详细的文本描述以及情感强度标签。ListenerX的创建过程采用了先进的3D面部角色估计方法和面部表情分析技术,确保了数据集的准确性和多样性。该数据集旨在解决目前多模态响应交互中数据集稀缺的问题,为人类交互分析、说话人脸生成和响应交互建模等下游任务提供了基础。
关于 北京邮电大学 , 北京邮电大学是中国一所以信息技术为特色,工学、理学、管理学、文学、法学、经济学等多学科协调发展的全国重点大学,位于中国北京市。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)