近年来,高阶自动驾驶技术进入规模化落地的关键窗口期,多模态视觉-语言-动作(VLA)模型凭借更强的泛化适配能力,已经成为全球自动驾驶行业公认的主流技术路线。但这类大模型在极端、罕见的长尾复杂场景下的推理决策能力不足、决策过程可解释性弱,始终是制约自动驾驶安全性提升、阻碍高阶自动驾驶落地的核心行业痛点之一。针对这一行业共性需求,2026年4月22日,加州大学洛杉矶分校在预印本平台arXiv正式首发了名为mReasoning的自动驾驶专用推理数据集。
本次发布的mReasoning数据集由自动驾驶技术企业Motional负责底层构建,全量包含3万条经过严格筛选的真实复杂交通交互场景样本,覆盖车道变更、无保护路口通行、弱势道路使用者(含行人、非机动车、特殊需求出行者等)交互等多个高风险安全关键场景,所有样本均来自经过脱敏处理的专业司机驾驶日志,最大程度避免了合成场景与真实路况的偏差问题。为了强化数据集对推理能力的训练价值,研发团队采用Google Gemini-3-Pro大模型对所有样本完成了紧凑思维链标注,完整还原了人类司机在面对复杂场景时的判断逻辑与决策链路,区别于传统自动驾驶数据集仅标注动作结果的粗放标注模式。
据官方介绍,mReasoning数据集的核心定位是解决当前VLA模型在长尾场景中的推理能力短板,可为自动驾驶系统的决策规划模块提供精细化的训练支撑。基于该数据集训练的自动驾驶模型,未来有望在突发路况下实现更接近人类驾驶逻辑的决策,同时可解释的思维链标注也能帮助技术团队快速定位模型决策错误的核心原因,大幅降低模型迭代的试错成本。从数据要素行业层面来看,高质量垂直场景数据集是人工智能技术落地的核心生产要素,自动驾驶作为对安全性要求最高的AI应用场景之一,面向推理能力训练的专用标注数据集此前长期处于稀缺状态,本次mReasoning的发布不仅能直接推动自动驾驶大模型的技术迭代,也为垂直领域专用数据集的构建提供了可参考的标准化范式。





_1769672084863.jpg)