近年来,随着具身智能、工业机器人赛道的快速爆发,真实场景下的多模态操作训练数据已成为制约相关算法落地的核心瓶颈之一——多数开源机械臂数据集要么体量过大对算力要求极高,要么数据维度不全,无法同时覆盖运动参数、多视角视觉信号等训练必需的维度。近日,dnn1002正式对外发布so101-simple-pickup-2-cameras数据集,该数据集由LeRobot创建,于2026年4月22日首发于HuggingFace,面向机器人技术、计算机视觉两大领域的研发需求打造。
据公开信息显示,该数据集共包含57个episodes,总帧数达23177帧,视频采集帧率为30fps,覆盖多维度的采集数据:一方面包含机械臂全关节位置参数(shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos)及观测状态数据,另一方面同步采集了顶部全局摄像头与夹爪第一视角摄像头的480x640分辨率3通道图像数据,可实现运动参数与视觉信号的精准对齐。存储层面,结构化数据采用parquet格式存储,视频文件采用通用mp4格式存储,整体体积仅为100MB(数据文件)+200MB(视频文件),对研发算力的门槛要求极低。
从应用价值来看,该数据集的适配场景覆盖机器人与计算机视觉两大核心方向:在机器人技术领域,其可用于机械臂抓取策略训练、运动路径规划、关节力控算法优化、小样本抓取任务验证等场景,轻量级的体积尤其适合高校科研项目、中小创业团队的原型算法测试,无需高额算力投入即可完成快速模型迭代;在计算机视觉领域,双视角同步对齐的图像数据可支撑多视角目标检测、6D物体位姿估计、双目深度估计算法研发,也可用于视觉伺服、动态物体跟踪等交叉领域的技术验证。
当前,AI训练数据作为数据要素市场的核心垂直品类,高质量、场景明确的标注数据集已成为人工智能研发的核心公共基础设施。本次so101-simple-pickup-2-cameras数据集的发布,进一步丰富了全球开源机械臂操作数据集的供给体系,为降低具身智能研发门槛、推动相关技术从实验室走向落地场景提供了重要支撑。
查看so101-simple-pickup-2-cameras





_1769672084863.jpg)