随着大语言模型在运筹优化场景的应用逐步深入,工业生产调度、城市交通治理、物流路径规划等领域对自动化优化建模的需求持续攀升,但长期以来,大模型在优化建模过程中的策略选择存在隐式化、「黑盒化」问题,输出方案的可解释性、可行性与求解效率难以保障,垂直领域高质量训练数据的缺失已成为制约相关技术落地的核心瓶颈。
2026年5月4日,北京航空航天大学联合九天研究院共同构建的SAGE多策略优化建模数据集正式首发于arXiv平台,瞄准上述行业痛点给出了数据层面的解决方案。
据了解,SAGE数据集核心由「问题描述、建模推理、求解器代码」三元组构成,在构建环节首先通过教师模型生成多策略候选方案,随后采用行业通用的Gurobi求解器完成可行性验证,同时引入大语言模型作为「裁判」完成语义冗余策略的筛选与去重,最终数据集特别强化了对流量分配、序列位置等不同建模范式的显式区分,可有效帮助模型建立策略选择的明确逻辑。
从应用价值来看,该数据集可广泛应用于多个领域的自动化优化建模场景:在城市交通治理场景中,基于该数据集训练的大模型可明确匹配流量分配类建模范式,输出可直接落地的路网调度方案,大幅降低人工建模的调试成本;在工业生产与物流调度场景中,模型可快速识别序列位置类优化问题,自动生成对应求解代码,提升生产线排程、配送路径规划的决策效率;在学术研究领域,该数据集也可作为标准化测试基准,为优化算法、自动化求解技术的迭代提供统一的验证维度。
北京航空航天大学本次发布的SAGE多策略优化建模数据集,最终可有效提升自动化优化建模的准确性、可执行性及求解效率,为大模型在运筹优化领域的落地提供核心数据支撑。查看SAGE多策略优化建模数据集
详情页内容:
作为国内首个聚焦多策略优化建模的垂直领域高质量数据集,SAGE的发布不仅填补了大模型在自动化求解优化领域的训练数据缺口,也为数据要素在工业级AI落地场景中的价值释放提供了参考样本,对推动运筹优化与大语言模型技术的融合落地、加速各行业数字化转型的决策智能化进程具有重要意义。





_1769672084863.jpg)