当前,农业数字化转型进入深水区,智慧农机、农业服务机器人成为降低农业生产人力成本、提升作业效率的核心抓手,而采摘场景因作物形态差异大、操作精度要求高,一直是农业机器人商业化落地的难点领域,高质量标注数据集的缺失,更是制约采摘机器人算法迭代的核心瓶颈之一。近日,开源数据集平台tomato-store正式上架由LeRobot创建的eval_smolvla_farm_harvest37数据集,该数据集于2026年5月7日首发于HuggingFace,专门面向农业采摘机器人的技术研发需求打造。
据公开信息显示,该数据集覆盖bi_so_follower类型机器人的全链路作业数据,包含三大核心维度:第一是机器人动作数据,覆盖左右肩、肘、腕、夹持器等核心执行部件的实时位置参数;第二是环境与状态观察数据,包含机器人运行状态参数,以及搭载的三个摄像头同步采集的视觉图像数据;第三是配套的时间戳与各类索引标签,可实现动作、视觉、状态三类数据的精准对齐。存储格式方面,结构化数据采用高效压缩的parquet格式存储,视频流数据采用通用mp4格式封装,采集帧率为20fps,全数据集共包含1项采摘作业任务、1个完整作业片段、总计1051帧对齐标注数据。
从应用价值来看,该数据集可广泛应用于两大核心研发场景:其一,机器人运动控制算法训练,研发人员可基于标注的关节位置、动作时序数据,优化采摘机器人的路径规划、力度控制算法,降低机械臂作业时的碰撞概率,提升采摘动作的流畅度与精准度;其二,机器视觉感知模型优化,依托多摄像头同步采集的田间图像数据,可训练果实识别、成熟度判定、障碍物检测等视觉模型,提升机器人在复杂田间环境下的环境感知能力。除此之外,该数据集也可为多模态具身智能大模型的微调、农业机器人算法的落地验证提供基础数据支撑。
作为聚焦农业采摘场景的细分机器人数据集,eval_smolvla_farm_harvest37的上架,进一步丰富了具身智能、农业机器人领域的开源数据供给,为中小研发团队降低了农业机器人的算法研发门槛,也为数据要素在智慧农业领域的落地应用提供了新的实践样本。





_1769672084863.jpg)