苹果公司本次发布的数据集mAceReason-Math,mAceReason-Math是由苹果公司与哈索·普拉特纳研究所联合创建的多语言数学推理数据集,包含源自AceReason-Math的14万道高质量翻译数学题,覆盖14种语言且每种语言含超1万样本。该数据集通过混合LLM翻译与人工校验流程构建,特别关注保留原题的逻辑复杂性和数学严谨性,其核心7,620条样本实现全语言平行对齐。作为强化学习可验证奖励(RLVR)研究的重要资源,该数据集旨在突破当前多语言数学推理模型训练的瓶颈,为GRPO等先进算法提供跨语言评估基准。
README内容:
关于苹果公司,苹果公司(Apple Inc.)是一家总部位于美国加利福尼亚州库比蒂诺的跨国科技公司,专注于设计、开发和销售消费电子产品、计算机软件和在线服务。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)