首页 / 开源数据市场 / 正文

JianwenCao开源机器人多模态数据集box 首发HuggingFace 赋能关节控制与视觉感知研发

五号数据雷达开源数据市场2026-05-02 23:1813

开发者JianwenCao于2026年5月2日在HuggingFace平台首发开源机器人领域专用数据集box，该数据集基于LeRobot框架构建，同步覆盖运动参数与视觉标注数据，可为机器人关节控制算法训练、视觉感知模型迭代提供标准化支撑，有效降低相关领域研发的数据采集门槛。

当前具身智能与服务机器人产业正进入落地加速期，机器人的关节运动精度、动态环境感知能力是决定产品实用性的核心指标，但长期以来，同步匹配运动参数与视觉信息的高质量标注训练数据供给不足，始终是中小研发团队技术迭代的核心阻碍，垂直领域开源数据集的供给也成为机器人产业普惠发展的关键支撑。

近期，开发者JianwenCao正式在HuggingFace平台首发开源名为box的机器人领域专用数据集，为关节控制、视觉感知两大核心方向的研发提供了新的标准化数据选择。该数据集是基于LeRobot框架打造的专用训练数据集，LeRobot作为HuggingFace面向机器人学习领域推出的开源工具链，本身就具备数据集标准化构建、快速适配主流训练框架的特性，也让本次发布的box数据集具备更低的适配门槛。

JianwenCao本次发布的数据集box，共包含40个完整的任务场景episodes，累计11859帧同步标注数据，采集帧率为30fps。数据集结构覆盖动作、观测状态、图像三类核心特征维度，其中动作和观测状态均为6维浮点数组，分别对应机器人不同关节的实时位置参数；图像特征为480x640x3的RGB视频数据，采用压缩效率更优的av1编解码器，在保证视觉信息完整度的前提下大幅降低存储与传输成本。数据集总大小为100MB（结构化数据文件）和200MB（视频文件），采用Apache 2.0开源许可证，商业与非商业研发场景均可免费使用，无额外授权限制。

查看box

从典型应用场景来看，box数据集实现了运动参数与第一视角视觉数据的精准同步标注，可覆盖两大核心研发方向：其一为机器人关节控制领域，可用于机械臂轨迹规划算法训练、力控参数优化、碰撞预判模型验证等场景，助力提升工业机器人装配、搬运，服务机器人递送、整理等场景下的运动稳定性与精度；其二为视觉感知领域，可用于目标识别、空间定位、动态避障等模型的训练，尤其适合多模态具身智能大模型的联合训练，解决传统训练数据中运动与视觉信息不同步的痛点。

从行业价值来看，随着数据要素对人工智能产业的支撑作用持续凸显，垂直领域的高质量开源数据集正在成为重要的公共技术资源。本次box数据集的发布，不仅填补了机器人细分训练场景的多模态数据供给空白，也为机器人领域开源数据集生态的建设提供了参考样本，后续开发者可基于该数据集的结构框架，拓展更多场景下的训练数据资源，进一步推动具身智能、工业服务机器人等领域的技术落地与普惠发展。

Dataset card内容：

Files and versions内容：

社区讨论

近期热门