five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAION eV上线强化学习专用nemotron-gym-agent-workplace数据集 支撑可验证智能体训练与商用落地

五号数据雷达开源数据市场2026-05-17 04:0815
全球知名开源AI数据集机构LAION eV于2026年5月16日在HuggingFace首发nemotron-gym-agent-workplace数据集,作为NVIDIA原版数据集的Harbor格式转换版本,该数据集聚焦可验证奖励任务方向,可支撑强化学习智能体训练、可验证任务执行等场景,为AI智能体落地提供标准化数据支撑。

作为全球知名的开源AI数据集贡献机构,LAION eV此前曾推出LAION-5B等大规模多模态数据集,为全球生成式AI、多模态大模型的开源发展提供了核心数据支撑。当前AI智能体、具身智能等前沿方向进入快速落地期,强化学习作为智能体决策能力训练的核心技术路径,长期面临训练场景标准化不足、奖励机制可验证性弱、跨机构实验复现难度大等行业痛点。在此背景下,LAION eV本次发布的nemotron-gym-agent-workplace数据集一经上线HuggingFace,便引发强化学习领域的广泛关注。

本次发布的数据集是nvidia/Nemotron-RL-agent-workplace_assistant的Harbor格式转换版本,属于强化学习垂直领域专用数据集,核心聚焦可验证奖励任务方向,数据规模在1000到10000个样本区间,全部采用英语标注,为结构化存储格式。每一条数据包含两个核心字段:path字段为确定性短ID字符串,格式为<family>-<sha256[:12]>.tar.gz;task_binary字段为二进制数据,存储gzip压缩的tar包,其中包含完整的Harbor任务。每个任务包均遵循标准Harbor布局,包含7类核心文件:面向智能体的任务提示文件instruction.md、基于python:3.11-slim-bookworm的任务特定Python环境配置文件environment/Dockerfile、验证器入口点文件tests/test.sh、确定性验证器实现文件tests/verifier.py、JSON格式的验证器输入数据文件tests/verifier_data.json、记录数据来源与属性的metadata.json,以及标准Harbor任务配置文件task.toml。

为保障训练数据的安全性与实验确定性,该数据集采用了全流程安全构建转换机制:内容不直接插入shell、Python或Dockerfile源码,所有参数值通过JSON文件传递,基础镜像固定版本,pip依赖规范经过严格验证,文本字段经过专项安全处理,tarball路径经过校验防止路径穿越等攻击,且全部数据集生成过程具备确定性,不同机构下载使用的数据集内容完全一致。该数据集的验证器家族为tool_call_match,通过比较JSON格式的name、arguments与地面真实工具调用来完成任务效果评估。

从应用价值来看,该数据集可覆盖多个前沿应用场景:其一,办公场景智能助理训练,可基于标准化的任务指令与验证逻辑,训练能够完成日程调度、文档处理、工具调用等办公任务的AI智能体,大幅降低智能体与人类需求对齐的训练成本;其二,自动化运维与开发智能体研发,依托内置的Docker环境与测试验证脚本,可用于训练能够完成代码测试、环境部署、问题排查等DevOps任务的专用智能体,确保智能体输出的可预期性;其三,强化学习基础研究,科研机构可基于该数据集的可验证奖励框架,开展奖励函数优化、智能体对齐机制等方向的研究,有效降低跨机构实验的复现门槛。本次数据集的发布,进一步丰富了全球开源AI训练数据集供给,为强化学习领域的标准化研究、AI智能体的商用落地提供了重要的数据基础设施支撑,也为数据要素市场中垂直领域AI训练数据集的规范化开发提供了参考范例。

查看nemotron-gym-agent-workplace

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们