作为AI产业下一阶段的核心落地方向,具身智能与机器人自动化技术的迭代高度依赖高质量的真实场景操作数据集,但由于机器人实操数据的采集需匹配硬件设备、多维度同步标注,行业长期面临优质垂直数据集供给不足的痛点,大幅抬高了中小研发团队的准入门槛。
近日,专注机器人领域数据研发的厂商michios正式发布droid_xxjd_6_2多模态机器人操作数据集,该产品于2026年4月23日率先上线全球最大的AI开源社区HuggingFace,面向全球研发团队开放获取。
据官方披露,本次发布的droid_xxjd_6_2基于HuggingFace推出的通用机器人学习开源框架LeRobot搭建,所有原始数据均从工业级主流协作机械臂Franka的真实操作场景中采集,数据的通用性与可复用性显著高于模拟生成的同类数据集。该数据集共包含75个完整的任务操作情节、39503帧同步标注数据,覆盖夹持器位置、关节位置等核心动作参数,同时搭载多机位摄像头同步采集的视频数据,形成“动作参数+视觉感知”的双维度多模态数据体系。此外,数据集元数据还同步标注了对应任务的语言指令、任务类别信息,进一步降低了算法训练环节的二次标注成本。
从数据属性来看,droid_xxjd_6_2可覆盖多类机器人学习、操作场景的训练需求:在工业制造场景下,可用于训练协作机器人的物料分拣、精密装配、设备运维等操作算法,提升工业自动化产线的柔性适配能力;在商用服务场景下,可支撑服务机器人的物品抓取、空间摆放、人机协同操作的模型迭代;配套的语言指令标注数据还可支持“自然语言指令→机器人动作执行”的端到端模型研发,为通用具身智能的交互能力训练提供数据支撑。
当前,AI训练数据已成为数字经济时代的核心生产要素,垂直领域的高质量标注数据更是细分赛道技术迭代的核心底座。本次droid_xxjd_6_2数据集的发布,填补了机器人操作领域标准化多模态数据集的供给空白,可有效降低研发团队的自主数据采集成本,缩短算法研发周期,对完善具身智能领域的数据要素供给体系、推动机器人操作技术的落地普及具备积极意义。





_1769672084863.jpg)