随着具身智能成为全球人工智能落地的核心赛道,标准化、场景化的机器人训练数据集已经成为制约行业技术迭代的核心要素。其中消防、工业泄漏、灾害救援等低能见度烟雾场景的高质量标注数据集供给长期不足,且多数未适配通用机器人训练框架,大幅抬高了特种服务机器人的研发门槛。HuggingFace推出的LeRobot格式是当前全球机器人学习领域通用的标准化数据集格式,通过统一数据结构、标注规范大幅降低了不同开发者之间的数据复用成本,已成为全球具身智能领域应用最广的数据集标准之一。
brandonyang本次发布的数据集droid_raw_overlay_smoke,该数据集为HuggingFace LeRobot格式机器人数据集,于2026年4月22日首发上线后已开放给全球开发者获取使用。
Dataset card内容:
Files and versions内容:
从应用场景来看,该数据集覆盖了烟雾场景下的机器人原始感知数据与叠加标注信息,可广泛应用于多个特种机器人研发领域:一是消防救援机器人的避障、火源识别与被困人员定位模型训练,帮助机器人在火灾现场低能见度环境下完成作业任务;二是工业巡检机器人在有害气体泄漏、粉尘爆炸等烟雾场景下的决策逻辑优化,提升工业场景安全巡检的可靠性;三是灾害搜救机器人的环境感知算法迭代,助力地震、爆炸等事故现场的搜救效率提升;四是多传感器融合机器人的低能见度场景校准测试,为多模态感知算法研发提供标准化测试基准。
当前我国数据要素市场建设正快速推进,垂直领域高质量AI训练数据集是数字经济核心生产要素的重要组成部分。本次droid_raw_overlay_smoke数据集的发布,进一步丰富了全球LeRobot格式数据集的特种场景供给,为全球具身智能开发者降低了特种场景训练数据的获取门槛,也为我国特种服务机器人的技术迭代、场景落地提供了核心数据支撑,对推动具身智能在应急、安防、工业等垂直领域的商业化落地具有积极意义。





_1769672084863.jpg)