本次发布的数据集multilingual_reasoning_gap_outputs,该数据集包含用于研究多语言推理差距的Qwen3-4B模型的实验输出。具体包括:用于理解失败分析的探针检查点、模型推理输出、理解失败检测信号以及用于探测和分析的辅助工件。数据集支持对推理语言模型中多语言推理行为的透明度、可重复性和进一步分析。数据集由Deokhyung Kang等人策划,涵盖10种语言(英语、德语、西班牙语、阿拉伯语、日语、韩语、泰语、孟加拉语、斯瓦希里语、泰卢固语),许可证为Apache-2.0。实验输出基于MMLU-ProX-Lite和Polymath数据集的评估。数据集旨在用于多语言推理行为分析、结果复现、理解失败探测分析以及多语言推理差距缓解策略研究。
查看multilingual_reasoning_gap_outputs
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)