首页 / 开源数据市场 / 正文

NeuLab @ LTI/CMU 发布 PangeaBench-xgqa 数据集, 应用在视觉问答、跨语言处理领域

五号数据雷达开源数据市场2024-12-13 07:1022

PangeaBench-xgqa 是 NeuLab @ LTI/CMU 发布的数据集,于 2024-11-01 首发在 HuggingFace 应用于视觉问答、跨语言处理领域

NeuLab @ LTI/CMU 本次发布的数据集 PangeaBench-xgqa, xGQA是一个跨语言的视觉问答数据集，包含多种语言的问答对，如孟加拉语、德语、英语、印尼语、韩语、葡萄牙语、俄语和中文。每个语言子集包含9666个样本，总大小为3985425625字节。

关于 NeuLab @ LTI/CMU , NeuLab @ LTI/CMU是卡内基梅隆大学语言技术研究所下的一个研究实验室，专注于自然语言处理与机器学习领域的前沿技术研究。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台，专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型，包括文本、图像、视频、音频和3D数据，并提供开源工具和付费计算及企业解决方案。

近期热门

NeuLab @ LTI/CMU 发布 PangeaBench-xgqa 数据集, 应用在 视觉问答、跨语言处理 领域