ellamind本次发布的数据集hendrycks-math-multilingual,该数据集包含两个语言配置(德语 deu 和法语 fra),每个配置均包含测试集分割。数据集主要特征包括:问题ID、基准来源、问题类型、难度级别、问题描述、解决方案、提取答案等核心字段,同时包含翻译质量标记(目标语言、翻译置信度、翻译注释)、内容适配标记(需适配标志、适配说明)以及格式保留标记等元数据字段。德语配置包含4947个样本(5.3MB),法语配置包含100个样本(82KB)。数据集适用于多语言问题解答、机器翻译质量评估等NLP任务。
关于ellamind,ellamind是一家专注于人工智能技术研发与应用的公司,致力于推动AI在教育、医疗、金融等多个领域的创新发展和实践应用。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)