香港中文大学(深圳) 本次发布的数据集 TalkVid, TalkVid 是一个大型、高质量、多样化的数据集,包含来自 7729 位独特说话者的 1244 小时视频。该数据集通过一个多阶段的自动化管道进行策划,严格筛选运动稳定性、美学质量和面部细节,并经过人工验证以确保其可靠性。TalkVid-Bench 是一个分层评估集,包含 500 个剪辑,精心平衡在关键人口和语言轴上。实验表明,在 TalkVid 上训练的模型比在先前数据集上训练的模型表现更好,展现出卓越的跨数据集泛化能力。TalkVid-Bench 的分析揭示了子群体之间的性能差异,这些差异被传统的聚合指标所掩盖,强调了其对未来研究的必要性。
关于 香港中文大学(深圳) , 香港中文大学(深圳)是一所位于中国广东省深圳市的综合性研究型大学,是香港中文大学在深圳的校区,致力于培养具有国际视野和专业能力的人才,并在多个学科领域进行科研和学术交流。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)