Meta AI 发布 Casual Conversations v2 Dataset 数据集, 应用在算法偏见评估、模型鲁棒性领域

首页 / 开源数据市场 / 正文

五号数据雷达开源数据市场2024-10-12 19:2124

Casual Conversations v2 Dataset 是 Meta AI 发布的数据集,于 2023-03-09 首发在 arXiv 应用于算法偏见评估、模型鲁棒性领域

Meta AI 本次发布的数据集 Casual Conversations v2 Dataset, Casual Conversations v2数据集是由Meta AI创建的一个大型、多样化的音频/视觉/语音数据集，旨在评估算法偏见和模型鲁棒性。该数据集包含26,467个视频，涉及5,567名独特的付费参与者，这些参与者来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国，具有多样化的地理和人口特征。参与者提供了年龄、性别、语言/方言、残疾状况、身体装饰和地理位置等自我报告信息，而训练有素的注释者则标注了皮肤色调和声音音色等属性。此数据集不仅用于测量公平性，还用于评估模型的鲁棒性，适用于从计算机视觉和音频/语音识别到深度伪造检测等多种AI任务。

查看Casual Conversations v2 Dataset

关于 Meta AI , Meta AI是Meta（前Facebook）公司的人工智能研究部门，专注于推动人工智能技术的前沿研究，包括机器学习、自然语言处理、计算机视觉等领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门