five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

DAVIAN-Robotics发布robocasa-ms-h50数据集 上线HuggingFace赋能家庭机器人技能训练

五号数据雷达开源数据市场2026-05-25 02:066
2026年5月24日,DAVIAN-Robotics正式发布符合HuggingFace LeRobot标准的robocasa-ms-h50数据集,面向家庭机器人操作、技能学习等具身AI训练场景开放,将有效降低相关领域的研发数据适配成本。

当前,具身AI与家庭服务机器人赛道正处于商业化落地的关键阶段,自主操作技能、复杂场景适应能力已成为产品核心竞争力。但长期以来,面向真实家庭场景的标准化机器人操作训练数据供给不足,不同机构产出的数据集格式不统一、标注维度不一致,大幅抬高了研发团队的训练成本,也制约了机器人技能的泛化效果。作为全球领先的AI开源社区,HuggingFace推出的LeRobot格式为机器人学习数据集提供了统一的规范标准,有效解决了不同数据集间的适配难题,已成为全球机器人研发领域的主流数据格式之一。

DAVIAN-Robotics本次发布的数据集robocasa-ms-h50,是国内少数符合HuggingFace LeRobot格式的家庭场景机器人专用数据集,首发上线HuggingFace后面向全球研发人员开放获取。查看robocasa-ms-h50

从应用方向来看,robocasa-ms-h50数据集主要面向家庭机器人操作、机器人技能学习两大核心场景,可被用于家庭环境下物品抓取、分类收纳、家用电器操作、陪护辅助动作等多类机器人核心技能的模型训练,也可支撑多模态具身AI感知-决策-执行全链路的端到端训练,帮助提升机器人在不同家居布局、不同用户习惯下的场景泛化能力。对于科研机构而言,该数据集可用于机器人通用技能学习、少样本学习等前沿方向的研究;对于商用机器人企业而言,基于该标准化数据集可有效降低训练数据的预处理成本,缩短产品研发迭代周期。

Dataset card内容:

Files and versions内容:

从行业发展层面来看,本次robocasa-ms-h50数据集的发布,进一步丰富了我国家庭机器人领域的标准化数据供给,为具身AI赛道的产学研协作提供了统一的数据基础,也为数据要素在垂直AI赛道的产业化应用探索了新的路径。随着后续更多细分场景数据集的开放,家庭服务机器人的通用操作能力有望迎来快速提升,推动行业从“工具级”产品向“助理级”服务升级。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们