Publicly accessible 本次发布的数据集 MAV-Celeb, 该数据集是一个包含英语、印地语和乌尔都语等多语种说话视频的视听资料集,这些视频是从网络媒体平台上收集而来的。为了分析语言效应,数据集被分为两个版本(V1和V2),其中包含了真实世界场景的视频,且视频质量受到无约束的噪声退化影响。该数据集涵盖了154个不同的身份,以及多种真实世界的场景。其研究任务是在多语言环境中进行人脸与声音的关联分析。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)