清华大学本次发布的数据集InstructScene,InstructScene是由清华大学与GigaAI联合构建的大规模自动驾驶指令数据集,包含10万条标注自然语言指令与对应轨迹的场景数据,基于NAVSIM平台扩展生成。数据集通过视觉语言模型自动生成驾驶意图描述,并辅以规则化方法补充,形成图像-指令-动作三元组序列。其核心价值在于推动模仿驾驶向指令驾驶的范式转变,为个性化自动驾驶系统提供细粒度监督信号,支持视觉-语言-动作联合建模研究。
README内容:
关于清华大学,清华大学是中国北京市的一所顶尖综合性研究型大学,成立于1911年,以工程、计算机科学、经济管理等领域见长,在国内外享有盛誉。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)