首页 / 开源数据市场 / 正文

清华大学发布InstructScene数据集,应用在自动驾驶、指令学习领域

五号数据雷达开源数据市场2026-03-28 05:4247

InstructScene是清华大学发布的数据集,于2026-03-27首发在arXiv应用于自动驾驶、指令学习领域

清华大学本次发布的数据集InstructScene,InstructScene是由清华大学与GigaAI联合构建的大规模自动驾驶指令数据集，包含10万条标注自然语言指令与对应轨迹的场景数据，基于NAVSIM平台扩展生成。数据集通过视觉语言模型自动生成驾驶意图描述，并辅以规则化方法补充，形成图像-指令-动作三元组序列。其核心价值在于推动模仿驾驶向指令驾驶的范式转变，为个性化自动驾驶系统提供细粒度监督信号，支持视觉-语言-动作联合建模研究。

查看InstructScene

README内容：

关于清华大学,清华大学是中国北京市的一所顶尖综合性研究型大学，成立于1911年，以工程、计算机科学、经济管理等领域见长，在国内外享有盛誉。

关于arXiv,全球最大的预印本学术论文数据库，涵盖物理、数学、计算机科学等多个学科领域。

社区讨论

近期热门