近年来,具身智能与服务机器人赛道进入快速落地期,桌面整理、精细操作等民用场景的训练数据供给不足、格式不统一,一直是制约相关产品研发效率的核心痛点。作为HuggingFace面向机器人学习领域推出的统一数据集规范,LeRobot格式通过标准化的数据标注、存储结构,解决了不同平台机器人数据集跨框架复用难的问题,已经成为全球具身智能研发领域广泛采用的主流数据格式之一。
andyv237本次发布的数据集eval_so101-clean-desk,是国内为数不多的严格遵循HuggingFace LeRobot格式打造的桌面场景专用机器人数据集,于2026年5月14日正式在HuggingFace平台首发。查看eval_so101-clean-desk
从公开的数据集信息来看,eval_so101-clean-desk围绕桌面整理、机器人操作场景的核心需求设计,覆盖了常见桌面物品类型、摆放状态、操作动作序列等多维度标注内容,可直接适配主流机器人学习框架,研发团队无需进行大量格式转换、数据清洗工作即可投入训练使用,大幅降低场景化研发的前置数据成本。
Dataset card内容:
Files and versions内容:
从应用场景来看,该数据集可广泛用于多类机器人研发场景:一是家用服务机器人的桌面整理功能训练,帮助家用机器人识别不同类型的桌面物品、规划最优整理路径、完成低损伤的精细操作;二是办公、商业场景的专用收纳机器人研发,满足工位整理、文件归档、物料摆放等场景的需求;三是工业桌面级协作机器人的操作能力训练,支撑电子制造、精密组装等场景下的物料分拣、工位整理任务;此外,该数据集还可作为通用具身智能体桌面操作能力的统一评测基准,帮助研发团队验证算法的通用性、稳定性。
作为数据要素市场中面向垂直场景的高质量训练数据,本次eval_so101-clean-desk数据集的发布,进一步丰富了LeRobot生态下的场景化数据供给,也为桌面操作类机器人的研发提供了标准化的数据参考,对推动具身智能技术从工业场景向民用场景落地、降低细分领域研发门槛具有积极意义。





_1769672084863.jpg)