five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

开发者arjunsinghyadav2发布LeRobot格式彩色杯分拣数据集 覆盖仿真+真实双场景训练需求

五号数据雷达开源数据市场2026-04-29 23:569
近日,开发者arjunsinghyadav2于2026年4月29日在HuggingFace平台首发blue_sort_black_bg_color_cups_sim_and_real_50数据集,该数据集采用LeRobot标准格式,覆盖黑色背景下彩色杯分拣的仿真与真实双场景数据,可为具身智能、工业分拣等领域的机器人视觉模型训练提供标准化数据源支撑。

随着具身智能产业进入快速落地期,机器人视觉识别、自主分拣等任务的模型训练对高质量、标准化场景数据集的需求持续攀升。作为HuggingFace面向机器人学习领域推出的通用数据格式,LeRobot统一了数据标注规则、存储结构与调用接口,可大幅降低不同机构之间的数据集适配成本,已成为全球机器人研发领域主流的数据集标准之一。

近日,开发者arjunsinghyadav2正式发布blue_sort_black_bg_color_cups_sim_and_real_50数据集,该数据集于2026年4月29日首发于HuggingFace平台,是当前为数不多适配LeRobot格式的垂直场景专项训练数据集。从数据集命名规则可获悉,该数据集聚焦黑色背景下的彩色杯分拣场景,同步包含仿真环境生成的标注数据与真实物理环境采集的实拍数据,共覆盖50组完整的分拣流程样本,兼顾了仿真数据的标注成本优势与真实数据的场景还原度优势,可有效支撑机器人模型的Sim2Real(仿真到真实环境迁移)能力训练。

从应用方向来看,该类垂直场景数据集可覆盖多个领域的研发需求:在工业制造场景,可用于产线分拣机器人的颜色识别、物料分类模型训练,适配电子制造、食品包装等行业的自动化分拣产线升级需求;在服务机器人场景,可支撑家庭收纳机器人、商用整理机器人的视觉识别模块迭代;在学术研究领域,可作为域自适应、多模态机器人感知等方向的基准测试数据集,降低相关研究的数据集准备成本。

arjunsinghyadav2本次发布的数据集blue_sort_black_bg_color_cups_sim_and_real_50,该数据集为HuggingFace LeRobot格式机器人数据集。

查看blue_sort_black_bg_color_cups_sim_and_real_50

Dataset card内容:

Files and versions内容:

从数据要素市场发展角度来看,垂直领域的训练数据集是AI技术向实体产业落地的核心生产资料,这类适配国际通用标准、覆盖多场景的专项数据集发布,一方面降低了中小研发团队的机器人模型开发门槛,另一方面也为国内训练数据要素的标准化、流通化发展提供了参考样本,对推动具身智能产业的普惠化发展具有积极意义。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们