five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

HSP-IIT正式发布toast_prep_merged多模态数据集 覆盖机器人操作学习、视觉动作控制核心训练场景

五号数据雷达开源数据市场2026-05-08 00:129
HSP-IIT于2026年5月7日在HuggingFace平台首发由LeRobot打造的toast_prep_merged机器人操作专项数据集,覆盖动作、姿态、多视角图像等全维度特征,可为具身智能领域算法研发提供高质量标准化训练支撑。

随着具身智能产业进入快速落地阶段,高标注质量、场景匹配度高的真实机器人操作数据,已成为制约机器人操作学习、视觉动作控制算法迭代的核心瓶颈。相较于虚拟仿真生成的训练数据,真实环境下采集的机器人操作数据能够还原物理世界的摩擦、姿态误差、视觉遮挡等不可控因素,可大幅提升训练后算法的实际落地适配性,因此这类公开数据集也成为全球具身智能研发领域的核心刚需资源。

近日,HSP-IIT正式对外发布toast_prep_merged机器人操作专项数据集,该数据集由LeRobot团队打造,于2026年5月7日率先在HuggingFace平台上线,面向全球科研机构、科技企业研发团队开放获取。

HSP-IIT本次发布的数据集toast_prep_merged,该数据集由LeRobot创建,包含机器人操作相关的数据。数据集结构包括动作、观察状态、图像等特征,具体包括位置、方向、夹持器状态等信息,以及来自手腕和左侧摄像头的RGB图像。数据集总共有101个片段,14751帧,2个任务。数据以parquet格式存储,视频以mp4格式存储。帧率为10fps,图像分辨率为480x640。

从应用价值来看,该数据集覆盖了机器人精细化操作的全链路特征维度,可广泛应用于多个具身智能研发方向:一是机器人操作学习算法训练,基于标注完整的动作参数、空间姿态、夹持器状态数据,研发团队可快速搭建端到端的操作动作生成模型,大幅降低自主采集标注同类数据的时间与经济成本;二是视觉动作控制的跨模态对齐研究,结合手腕、侧方双视角RGB图像与对应动作序列参数,可有效验证“视觉输入-动作输出”映射模型的准确率,优化机器人在遮挡、光线变化等复杂场景下的动作稳定性;三是家庭服务机器人的场景化训练,数据集围绕吐司制备的真实家务操作场景搭建,可直接为轻量级家务操作机器人的任务规划、动作精细度优化提供训练支撑。此外,该数据集采用parquet、mp4等通用标准化存储格式,可直接兼容主流的具身智能训练框架,进一步降低了研发团队的数据接入门槛。

作为数据要素在具身智能垂直领域的典型落地成果,本次公开的数据集进一步丰富了全球机器人操作领域的公开数据供给,对于推动中小研发团队的技术创新、降低具身智能算法的研发门槛、加快家用服务机器人操作技术的落地进度具有重要的行业价值。

查看toast_prep_merged

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们