随着具身智能赛道进入快速落地期,模仿学习、操作学习作为机器人实现通用化操作能力的核心技术路径,对高标注质量、场景针对性的实机训练数据集需求持续上涨。当前公开领域中,面向按键操作等细分场景的专用数据集供给相对稀缺,成为制约中小研发团队技术迭代、降低算法验证成本的核心瓶颈之一。近日,开发者saipuneethgottam正式发布专为机器人按键操作训练打造的press_button_1view_new_2数据集,该数据集基于LeRobot框架构建,核心面向机器人操作学习、模仿学习领域研发需求。
该数据集共包含29个操作episodes,总计11722帧采样数据,采样帧率为30fps,所有数据均划分为训练集,可直接适配主流机器人操作学习模型的训练流程。数据主体采用parquet文件格式存储,总大小为100MB,配套视频文件总大小为500MB:parquet格式兼容主流AI训练框架与大数据处理工具,可帮助研发团队大幅降低数据读取、预处理环节的开发成本,兼顾了易用性与存储空间效率。
从标注维度来看,数据集覆盖动作、观测状态、多视角图像三类核心特征,配套完整元数据体系:其中动作(action)为6维浮点数组,对应机器人肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置六大关节的实时位置;观测状态(observation.state)同样为6维浮点数组,同步记录关节位置数据,可支持视觉-动作对齐、状态预测等多类研究方向。图像观测数据来自三个不同机位的摄像头:camera1与camera2提供720×1280分辨率的3通道视频,覆盖操作场景全局视角;camera3提供480×640分辨率的3通道视频,聚焦按键操作的近景细节,所有视频均采用av1编解码器压缩,在保障画面清晰度的前提下进一步降低了存储与下载成本。除此之外,数据集还配套时间戳、帧索引、episode索引、任务索引等完整元数据,可支撑时序动作分割、操作轨迹预测等延伸研究需求。该数据集采用Apache 2.0开源许可证,支持学术研究、商业开发等场景的免费使用、修改与二次分发,大幅降低了不同类型研发主体的使用门槛。
从应用场景来看,该数据集可广泛应用于服务机器人电梯按键、家电面板操作训练,工业机器人工位按钮操作调试,人机协作场景示教学习算法优化等方向,也可作为基准数据集用于模仿学习算法泛化性验证、多模态机器人控制模型性能测试等研究工作,为机器人操作能力的泛化落地提供标准化的数据支撑。
首页 / 开源数据市场 / 正文
多视角机器人按键操作数据集press_button_1view_new_2上线HuggingFace 支撑操作学习与模仿学习研发
五号数据雷达开源数据市场2026-05-16 23:4212
开发者saipuneethgottam基于LeRobot框架构建的press_button_1view_new_2数据集于2026年5月16日首发上线HuggingFace,该数据集面向机器人操作学习、模仿学习领域提供标准化多视角按键操作训练数据,采用Apache 2.0许可证,支持学术与商业场景免费使用。

社区讨论
近期热门




_1769672084863.jpg)