five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

enea-c首发VBTI-Align-v4A-OneDemo-AL1多模态机器人数据集 支撑具身智能训练场景落地

五号数据雷达开源数据市场2026-04-23 02:257
2026年4月22日,技术主体enea-c在HuggingFace开源平台首发VBTI-Align-v4A-OneDemo-AL1机器人动作数据集,由LeRobot框架创建,覆盖so101型机器人关节参数、多视角视频等多模态对齐数据,可广泛应用于人形机器人控制算法训练、具身大模型迭代等前沿领域。

当前具身智能与人形机器人产业正进入落地攻坚期,算法训练对“动作-视觉”时空对齐的高质量标注数据集需求持续攀升,标准化的机器人动作观测数据已成为支撑具身大模型迭代、机器人控制精度提升的核心生产要素。近日,技术研发主体enea-c于2026年4月22日在全球知名AI开源社区HuggingFace首发VBTI-Align-v4A-OneDemo-AL1专业数据集,为机器人技术研发、动作数据领域的研究提供了新的基准数据源。

本次发布的数据集由业内主流开源机器人数据集开发框架LeRobot创建,针对so101型机器人研发需求设计,完整覆盖机器人运行过程中的状态观测和全链路动作数据,包含肩部、肘部、腕部、夹持器四大核心关节的实时位置信息,同时同步采集了手腕摄像头、顶部摄像头、左侧摄像头、右侧摄像头四路多视角视频数据,实现了机器人动作执行数据与环境视觉感知数据的时空精准对齐,解决了传统机器人数据集多源数据不同步的痛点。

技术参数方面,本次公开的所有视频素材分辨率为480x640,帧率30fps,采用av1编码格式压缩,在保障画面清晰度的同时大幅降低存储与传输成本。数据集规模方面,当前版本共包含1个任务演示episode,累计151帧有效标注数据,结构化数据文件大小为100MB,采用parquet格式存储,可直接适配主流AI训练框架读取调用;配套视频文件总大小200MB,采用通用mp4格式存储,兼容各类动作标注工具与可视化平台。

从行业应用价值来看,该类“动作-视觉”对齐的机器人数据集可广泛应用于多个前沿研发场景:一是人形机器人控制算法训练,研究人员可基于标注好的关节位置与对应视觉数据,优化机器人动作执行的精准度,降低实体机器人在实际场景下的调试成本;二是具身大模型的多模态对齐训练,补充机器人第一视角与第三方视角的联动数据,提升大模型对物理世界动作指令的理解与执行精度;三是动作数据标注标准研究,可作为基准测试集,验证不同动作标注工具、语义对齐算法的准确率。

本次数据集的公开,也为具身智能垂直领域的数据要素供给提供了新的参考,随着机器人产业的快速发展,垂直场景高质量数据集的开放共享,将进一步降低中小研发团队的技术准入门槛,推动整个具身智能领域的技术迭代速度。

查看VBTI-Align-v4A-OneDemo-AL1

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们