首页 / 开源数据市场 / 正文

vis22首发机器人操作学习专用数据集piper3_dataset_Train_biscuit_3 赋能具身智能研发落地

五号数据雷达开源数据市场2026-05-18 23:339

科技机构vis22于2026年5月18日在全球AI开源社区HuggingFace首发基于LeRobot构建的piper3_dataset_Train_biscuit_3机器人专用数据集，覆盖多视角视觉观测、关节动作等多维度标注数据，可为机器人操作学习、视觉控制等具身智能领域研发提供高质量训练数据支撑。

当前具身智能正成为全球人工智能领域的核心新赛道，而高质量、高标注精度的实采机器人操作数据集，是支撑机器人操作学习模型训练、视觉控制算法迭代的核心基础设施。长期以来，面向细分作业场景的专用数据集供给不足，一直是制约具身智能技术从实验室走向落地应用的核心瓶颈之一。近日，科技机构vis22正式发布piper3_dataset_Train_biscuit_3机器人专用数据集，该数据集于2026年5月18日首发于全球最大的AI开源社区HuggingFace，定向服务于机器人操作学习、机器人视觉控制两大核心研发场景。

据介绍，该数据集是基于LeRobot框架构建的piper3_dataset系列专用数据集，共计包含20个数据子集、18011帧标注样本、60段原始作业视频，覆盖完整的机器人作业全流程。数据集结构维度包含时间戳、帧索引、集索引等标准化特征字段，可直接适配主流机器人学习框架的训练需求，减少研发团队的数据预处理成本。视觉数据层面，数据集同步采集了全局、夹爪、局部三个摄像头视角的图像观测数据，分辨率统一为480x640像素，采用标准视频编码格式存储——多视角的同步采集设计，既可以支撑模型对作业场景的全局环境感知训练，也能满足操作端精细动作学习的细节数据需求，填补了单视角数据集无法覆盖多维度观测逻辑的短板。除视觉数据外，数据集还同步提供了7维度的观测状态与动作标注数据，对应机器人关节1至关节6及夹爪的完整运动参数，可直接用于机器人控制策略训练、多模态学习模型迭代等研发任务。

本次发布的数据集采用Apache-2.0开源许可证，允许学术研究、商业开发等多场景免费使用，大幅降低了机器人领域研发团队的数据获取门槛。从应用方向来看，该数据集可广泛应用于工业场景下的食品分拣、包装作业机器人的操作模型训练，服务机器人的日常物品抓取、摆放任务研发，以及机器人视觉伺服控制算法的精度优化等多个场景，为具身智能技术的落地提供高质量的数据底座支撑。作为数据要素在人工智能垂直领域的典型应用，本次专用数据集的发布，也进一步丰富了机器人学习领域的开源数据供给，对于完善具身智能产业的基础设施体系、加速相关技术的落地迭代具有重要的行业价值。

查看piper3_dataset_Train_biscuit_3

Dataset card内容：

Files and versions内容：

社区讨论

近期热门