five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Idontknowmaxime发布机器人动作控制数据集demo_so101 首发HuggingFace 降低实体AI研发门槛

五号数据雷达开源数据市场2026-04-23 23:3715
开源技术贡献者Idontknowmaxime于2026年4月23日在HuggingFace平台首发由LeRobot打造的demo_so101数据集,覆盖多关节机器人动作指令、状态观测及多视角视觉同步数据,可广泛应用于机器人动作控制、路径规划等领域的算法研发与验证。

当前人形机器人、工业机械臂等实体AI赛道进入技术爆发期,动作控制算法的精准度、泛化性已成为产业核心竞争点,而高质量标注级运动数据集是算法训练的核心底座。此前行业内公开的多关节机器人全链路观测数据集相对稀缺,数据采集、标注成本高成为中小研发团队的核心准入门槛,Idontknowmaxime本次发布的demo_so101数据集正是瞄准这一行业共性需求推出。

据公开信息显示,demo_so101数据集由LeRobot创建,主要面向机器人技术领域研发需求,共包含50个完整动作序列(episodes),累计24217帧同步采集数据,覆盖机器人动作指令、状态观测、多视角视觉三类核心数据维度:其中动作数据覆盖shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos共6个核心关节的位置指令,同时配套相同关节的实时状态观测数据,可实现动作指令与实际反馈的对照训练;视觉维度同步搭载前方360x640分辨率、腕部480x640分辨率两路摄像头的视频观测数据,还原机器人执行任务时的第一视角操作场景与全局环境信息。数据集采用适合大数据训练的parquet格式存储,结构化数据文件总大小为100MB,配套视频文件大小为200MB,采集帧率为30fps,可直接对接主流深度学习训练框架,无需额外做格式适配。

从行业应用来看,该数据集可广泛支撑多个机器人研发方向的需求:一是可用于机械臂精细动作的模仿学习训练,帮助算法快速掌握关节联动控制逻辑,降低抓取、组装等工业场景的动作调试成本;二是可用于多模态机器人控制模型的预训练,结合关节数据与视觉数据,提升模型对复杂环境的感知决策能力;三是可作为动作控制算法的标准测试集,验证不同算法在相同动作序列下的控制精度、响应延迟等核心指标。

作为机器人领域的开源数据集,demo_so101的发布也填补了细分场景公开数据的供给缺口,对于推动数据要素在人工智能实体化落地领域的流通共享具有积极意义——当前全球人形机器人、工业自动化赛道均处于技术迭代关键期,高质量公开数据集的开放,能够有效降低中小研发团队的训练数据获取成本,加快技术落地效率,推动整个机器人产业的普惠化发展。

查看demo_so101

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们