东京大学本次发布的数据集Omanic,Omanic是由东京大学等机构联合构建的开放领域多跳问答基准数据集,包含10,296条机器生成的训练样本和967条专家评审的测试样本。该数据集通过结构化标注(分解的子问题及中间答案)支持逐步推理分析,覆盖8个知识领域并嵌入数学推理环节。数据来源于MuSiQue的2跳问题扩展和Wikidata知识图谱,经过严格的自动过滤和人工审核流程。其核心价值在于诊断大语言模型在多跳推理中的知识依赖和错误传播现象,适用于复杂推理能力评估与提升研究。
关于东京大学,东京大学是日本的一所国立综合性大学,成立于1877年,是日本最高学术殿堂和七所旧帝国大学之首,在全球享有极高声誉。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)