five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

CoRL2026-CSI发布人形机器人操作基准数据集 开源上线HuggingFace助力具身智能研发

五号数据雷达开源数据市场2026-05-02 23:4821
近日,机器人学习顶会CoRL2026旗下CSI专项发布SO101-cap_distribute_choco_100ep_baseline_10fps人形机器人物品分发场景基准数据集,基于HuggingFace LeRobot工具搭建,采用Apache-2.0开源协议开放使用,可为具身智能算法训练、效果评估提供标准化数据支撑。

具身智能作为人工智能下一阶段的核心发展方向,近年来持续获得产业界与科研领域的重点投入,而标准化的场景数据集是算法训练、效果评估的核心基础设施,直接影响研发效率与技术落地速度。作为全球机器人学习领域的顶级学术会议,CoRL(Conference on Robot Learning)长期推动机器人领域的数据集标准化建设,其旗下CSI专项的成果已成为全球机器人研发团队的重要参考依据。2026年5月2日,CoRL2026-CSI正式对外发布首款SO101系列场景基准数据集,首发上线HuggingFace开源平台面向全球开发者开放。

CoRL2026-CSI本次发布的数据集SO101-cap_distribute_choco_100ep_baseline_10fps,该数据集使用LeRobot创建,LeRobot是HuggingFace推出的专为具身智能研发打造的开源工具栈,支持多类型机器人的数据集采集、模型训练与仿真验证。本次发布数据集的核心参数为:代码库版本v3.0;适配机器人类型为so101_follower人形机器人;总动作片段数100;采样帧率10fps;许可证为apache-2.0,支持各类研发主体免费用于非商业及商业场景的二次开发与使用。

查看SO101-cap_distribute_choco_100ep_baseline_10fps

作为面向物品分发场景的标准化baseline数据集,该数据集可支撑多个具身智能研发方向的技术迭代:一是可作为人形机器人精细操作算法的训练数据源,覆盖小体积物品抓取、姿态调整、精准递送等核心动作的模型训练;二是可作为通用具身智能算法的基准测试集,统一不同研发团队的算法效果评估维度,降低行业横向对比的成本;三是可用于Sim2Real(仿真到真实场景迁移)技术的验证,帮助研发团队在仿真环境中完成算法初步验证后,快速适配真实机器人的操作逻辑,减少真实场景调试的耗材与时间成本。

当前人形机器人产业化正处于从实验室走向商用场景的关键节点,末端执行器的操作精度、稳定性是决定其能否落地服务场景、工业场景的核心指标,该类细分场景开源基准数据集的发布,将有效降低中小研发团队的数据集构建门槛,推动具身智能领域的技术普惠,加速服务机器人、工业机器人等多个赛道的落地进程。

Dataset card内容:

数据集卡片内容

Files and versions内容:

文件与版本内容

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们