five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Smencomojica发布机器人多模态专用数据集 支撑跟随控制、多模态感知技术研发

五号数据雷达开源数据市场2026-05-08 00:067
科技机构Smencomojica于2026年5月7日在HuggingFace首发由LeRobot创建的机器人领域专用数据集,覆盖实机运动、多视角视觉等核心标注数据,将为机器人跟随控制、多模态感知技术研发提供高质量训练支撑。

当前,全球机器人产业正处于规模化落地的关键周期,协作机器人、服务机器人、特种机器人等细分品类的功能迭代速度不断加快,而高质量、场景化的实机训练数据,是制约机器人智能感知、运动控制技术落地的核心瓶颈之一。近日,科技机构Smencomojica正式对外发布由LeRobot打造的机器人领域专用数据集rollout_highlight_eval_act_arch_wide_192_hil_finetune_20260507_092545,该数据集于2026年5月7日率先在HuggingFace平台上线,定向服务于机器人跟随控制、多模态感知两大核心研发场景。

从公开的数据集参数来看,该数据集全部来自so_follower型号机器人的实机采集,核心数据维度覆盖两大类别:一是结构化运动数据,包含机器人全量动作指令、实时观测状态(含关节位置、夹持器位置)等核心运动参数;二是多模态视觉数据,同步收录了机器人前视、侧视、腕部三类摄像头拍摄的全流程实拍视频。全量数据集共包含11个完整任务序列(episodes)、7390帧经过标注的有效数据,全部围绕1项核心跟随任务采集,结构化数据采用行业通用的parquet格式存储,视频素材采用mp4格式存储,可适配绝大多数主流AI训练框架。同时该数据集采用apache-2.0开源许可证,科研团队、商业机构均可在许可范围内免费使用。

从应用价值来看,该类场景化实机数据集可覆盖多个典型研发场景:在跟随控制算法训练方向,可用于工业AGV跟随作业人员运输物料、商用服务机器人跟随用户移动、特种巡检机器人跟随运维人员进入高危区域等场景的控制逻辑训练,大幅降低前期实机数据采集的成本投入;在多模态感知模型训练方向,融合运动状态、多视角视觉的多维度输入,可帮助机器人优化动态障碍物规避、跟随目标重识别、复杂地形下姿态调整等能力,解决当前多数机器人跟随功能在遮挡、光线突变、非结构化路面等场景下的失效痛点。

从行业意义来看,据公开行业研究数据显示,2025年全球协作机器人市场规模已突破百亿美元,跟随功能作为工业协作、商用服务、家庭陪护等多个机器人品类的标配功能,市场需求规模正快速扩张。本次数据集的发布,填补了细分跟随场景下实机多模态数据集的供给空白,可为中小机器人厂商、高校科研团队降低研发门槛,加速相关技术的落地验证进程。

查看rollout_highlight_eval_act_arch_wide_192_hil_finetune_20260507_092545

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们