Qwen 本次发布的数据集 P-MMEval, P-MMEval是一个多语言多任务基准测试,涵盖了有效的基本和能力专业化数据集。它扩展了现有的基准,确保所有数据集之间的一致语言覆盖,并提供多种语言之间的平行样本,支持多达10种语言(包括英语、中文、阿拉伯语、西班牙语、日语、韩语、泰语、法语、葡萄牙语和越南语)。P-MMEval有助于对多语言能力进行整体评估,并进行跨语言可转移性的比较分析。
Dataset card 内容:
Files and versions 内容:
关于 Qwen , Qwen是阿里云自主研发的超大规模语言模型,代表阿里巴巴在自然语言处理领域的最新成果。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)