近年来,随着具身智能、通用人形机器人产业进入快速落地期,高质量、多模态的实体交互训练数据,成为制约机器人行为学习、决策算法迭代的核心瓶颈之一。作为AI训练数据供给体系的重要组成部分,面向垂直场景的专用开源数据集,能够大幅降低研发团队的数据采集成本,减少跨平台数据适配工作量,加速技术落地进程。
2026年4月23日,AI开源贡献方kb127正式在全球主流的AI模型与数据集开源平台HuggingFace首发eval_act75_300k_02专用数据集,重点覆盖机器人技术、行为学习两大应用领域。据介绍,该数据集基于LeRobot框架开发完成,LeRobot是当前全球机器人研发领域广泛使用的开源框架,能够统一不同机器人平台的数据接口,降低跨场景数据适配成本。
kb127本次发布的数据集eval_act75_300k_02核心结构包含动作、观察两大维度数据,具体特征覆盖机器人关节位置参数、前视/顶视双视角图像、时序索引等多类信息,整体采用parquet高效存储格式,同时配套完整的视频数据,可支撑多模态训练需求,适配不同技术路线的机器人研发需求。
从行业应用来看,该数据集可广泛适用于多个典型研发场景:其一可用于行为模仿学习算法训练,帮助机器人快速学习人类操作动作、完成复杂抓取、装配等工业/服务场景任务;其二可用于具身智能模型的微调与验证,基于双视角视觉数据+关节参数的多模态数据输入,提升机器人在非结构化环境下的感知与决策能力;其三可用于机器人安全控制算法的测试,通过对关节位置数据的时序分析,优化机器人运动路径规划、规避操作风险。
从数据要素市场发展的角度来看,垂直领域专用开源数据集的持续涌现,既能够完善AI训练数据供给体系,也为数据要素在人工智能领域的市场化流通、价值释放提供了可参考的落地路径,将进一步支撑数字经济核心产业的创新发展。





_1769672084863.jpg)