首页 / 开源数据市场 / 正文

enea-c首发VBTI-Align-v4A-OneDemo-AL1多模态机器人数据集支撑具身智能训练场景落地

五号数据雷达开源数据市场2026-04-23 02:257

2026年4月22日，技术主体enea-c在HuggingFace开源平台首发VBTI-Align-v4A-OneDemo-AL1机器人动作数据集，由LeRobot框架创建，覆盖so101型机器人关节参数、多视角视频等多模态对齐数据，可广泛应用于人形机器人控制算法训练、具身大模型迭代等前沿领域。

当前具身智能与人形机器人产业正进入落地攻坚期，算法训练对“动作-视觉”时空对齐的高质量标注数据集需求持续攀升，标准化的机器人动作观测数据已成为支撑具身大模型迭代、机器人控制精度提升的核心生产要素。近日，技术研发主体enea-c于2026年4月22日在全球知名AI开源社区HuggingFace首发VBTI-Align-v4A-OneDemo-AL1专业数据集，为机器人技术研发、动作数据领域的研究提供了新的基准数据源。

本次发布的数据集由业内主流开源机器人数据集开发框架LeRobot创建，针对so101型机器人研发需求设计，完整覆盖机器人运行过程中的状态观测和全链路动作数据，包含肩部、肘部、腕部、夹持器四大核心关节的实时位置信息，同时同步采集了手腕摄像头、顶部摄像头、左侧摄像头、右侧摄像头四路多视角视频数据，实现了机器人动作执行数据与环境视觉感知数据的时空精准对齐，解决了传统机器人数据集多源数据不同步的痛点。

技术参数方面，本次公开的所有视频素材分辨率为480x640，帧率30fps，采用av1编码格式压缩，在保障画面清晰度的同时大幅降低存储与传输成本。数据集规模方面，当前版本共包含1个任务演示episode，累计151帧有效标注数据，结构化数据文件大小为100MB，采用parquet格式存储，可直接适配主流AI训练框架读取调用；配套视频文件总大小200MB，采用通用mp4格式存储，兼容各类动作标注工具与可视化平台。

从行业应用价值来看，该类“动作-视觉”对齐的机器人数据集可广泛应用于多个前沿研发场景：一是人形机器人控制算法训练，研究人员可基于标注好的关节位置与对应视觉数据，优化机器人动作执行的精准度，降低实体机器人在实际场景下的调试成本；二是具身大模型的多模态对齐训练，补充机器人第一视角与第三方视角的联动数据，提升大模型对物理世界动作指令的理解与执行精度；三是动作数据标注标准研究，可作为基准测试集，验证不同动作标注工具、语义对齐算法的准确率。

本次数据集的公开，也为具身智能垂直领域的数据要素供给提供了新的参考，随着机器人产业的快速发展，垂直场景高质量数据集的开放共享，将进一步降低中小研发团队的技术准入门槛，推动整个具身智能领域的技术迭代速度。

查看VBTI-Align-v4A-OneDemo-AL1

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

enea-c首发VBTI-Align-v4A-OneDemo-AL1多模态机器人数据集 支撑具身智能训练场景落地

Dataset card内容：

Files and versions内容：

社区讨论

enea-c首发VBTI-Align-v4A-OneDemo-AL1多模态机器人数据集支撑具身智能训练场景落地