five

五号数据雷达

资产融资
资源入表
产品交易
知识产权
首页 / 开源数据市场 / 正文
Meta AI 发布 Casual Conversations v2 Dataset 数据集, 应用在 算法偏见评估、模型鲁棒性 领域
五号数据雷达开源数据市场2024-10-12 19:2124
Casual Conversations v2 Dataset 是 Meta AI 发布的数据集,于 2023-03-09 首发在 arXiv 应用于 算法偏见评估、模型鲁棒性 领域

Meta AI 本次发布的数据集 Casual Conversations v2 Dataset, Casual Conversations v2数据集是由Meta AI创建的一个大型、多样化的音频/视觉/语音数据集,旨在评估算法偏见和模型鲁棒性。该数据集包含26,467个视频,涉及5,567名独特的付费参与者,这些参与者来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国,具有多样化的地理和人口特征。参与者提供了年龄、性别、语言/方言、残疾状况、身体装饰和地理位置等自我报告信息,而训练有素的注释者则标注了皮肤色调和声音音色等属性。此数据集不仅用于测量公平性,还用于评估模型的鲁棒性,适用于从计算机视觉和音频/语音识别到深度伪造检测等多种AI任务。

查看Casual Conversations v2 Dataset

关于 Meta AI , Meta AI是Meta(前Facebook)公司的人工智能研究部门,专注于推动人工智能技术的前沿研究,包括机器学习、自然语言处理、计算机视觉等领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们