Meta AI 本次发布的数据集 Casual Conversations v2 Dataset, Casual Conversations v2数据集是由Meta AI创建的一个大型、多样化的音频/视觉/语音数据集,旨在评估算法偏见和模型鲁棒性。该数据集包含26,467个视频,涉及5,567名独特的付费参与者,这些参与者来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国,具有多样化的地理和人口特征。参与者提供了年龄、性别、语言/方言、残疾状况、身体装饰和地理位置等自我报告信息,而训练有素的注释者则标注了皮肤色调和声音音色等属性。此数据集不仅用于测量公平性,还用于评估模型的鲁棒性,适用于从计算机视觉和音频/语音识别到深度伪造检测等多种AI任务。
查看Casual Conversations v2 Dataset
关于 Meta AI , Meta AI是Meta(前Facebook)公司的人工智能研究部门,专注于推动人工智能技术的前沿研究,包括机器学习、自然语言处理、计算机视觉等领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。




_1769672084863.jpg)