five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

tomato-store首发双手机器人多模态训练数据集 支撑模仿学习与多模态控制研发

五号数据雷达开源数据市场2026-05-25 02:306
2026年5月24日,AI数据集服务商tomato-store在HuggingFace首发eval_smolvla_p_data_0523_v3_multi专用数据集,该数据集基于双手机器人真机演示场景构建,可覆盖机器人模仿学习、多模态控制等核心研发需求,进一步丰富了通用机器人领域的训练数据供给。

当前,通用机器人、人形机器人正成为全球科技领域的核心赛道,而基于真机操作的多模态训练数据,是机器人模仿学习、智能控制算法迭代的核心基础,也是当前行业供给缺口较大的核心生产要素之一。2026年5月24日,AI数据集服务商tomato-store正式在HuggingFace首发eval_smolvla_p_data_0523_v3_multi专用数据集,聚焦双手机器人任务训练场景,为行业提供标准化的真机采集训练数据源。

据悉,该数据集基于LeRobot工具创建,覆盖bi_so_follower类型双手机器人的全流程演示数据,共包含1个完整任务episode、506帧采样数据,所有数据以parquet格式存储并配套原始视频文件,方便研发人员快速调用与解析。从数据特征来看,该数据集覆盖了机器人全链路运行的核心维度:既包含机器人12个关节的动作指令数据、12个关节的实时观察状态数据,也同步采集了三个不同视角摄像头的图像数据,分辨率分别覆盖480x640与360x640档位,采样帧率为20fps,同时配套了时间戳、帧索引、episode索引等完整元数据,确保数据的可追溯性与训练对齐需求。

从应用价值来看,该数据集可广泛支撑各类机器人学习相关的研发需求:除了基础的机器人模仿学习、强化学习算法训练外,也可用于双手机器人协作路径规划、多模态视觉反馈控制、小样本机器人任务迁移等方向的算法验证。对于缺少真机采集环境的中小研发团队、高校研究团队而言,该标准化数据集可大幅降低研发前期的数据采集成本,加快算法验证与迭代效率,对推动通用机器人技术普惠、完善机器人领域数据要素供给体系具有积极意义。

查看eval_smolvla_p_data_0523_v3_multi

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们