当前,通用机器人、人形机器人正成为全球科技领域的核心赛道,而基于真机操作的多模态训练数据,是机器人模仿学习、智能控制算法迭代的核心基础,也是当前行业供给缺口较大的核心生产要素之一。2026年5月24日,AI数据集服务商tomato-store正式在HuggingFace首发eval_smolvla_p_data_0523_v3_multi专用数据集,聚焦双手机器人任务训练场景,为行业提供标准化的真机采集训练数据源。
据悉,该数据集基于LeRobot工具创建,覆盖bi_so_follower类型双手机器人的全流程演示数据,共包含1个完整任务episode、506帧采样数据,所有数据以parquet格式存储并配套原始视频文件,方便研发人员快速调用与解析。从数据特征来看,该数据集覆盖了机器人全链路运行的核心维度:既包含机器人12个关节的动作指令数据、12个关节的实时观察状态数据,也同步采集了三个不同视角摄像头的图像数据,分辨率分别覆盖480x640与360x640档位,采样帧率为20fps,同时配套了时间戳、帧索引、episode索引等完整元数据,确保数据的可追溯性与训练对齐需求。
从应用价值来看,该数据集可广泛支撑各类机器人学习相关的研发需求:除了基础的机器人模仿学习、强化学习算法训练外,也可用于双手机器人协作路径规划、多模态视觉反馈控制、小样本机器人任务迁移等方向的算法验证。对于缺少真机采集环境的中小研发团队、高校研究团队而言,该标准化数据集可大幅降低研发前期的数据采集成本,加快算法验证与迭代效率,对推动通用机器人技术普惠、完善机器人领域数据要素供给体系具有积极意义。
查看eval_smolvla_p_data_0523_v3_multi





_1769672084863.jpg)