five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAION推出nemotron-gym指令遵循v2数据集 为RL智能体训练提供高可靠验证基准

五号数据雷达开源数据市场2026-05-19 03:3813
全球知名开源AI数据集机构LAION eV于2026年5月18日在HuggingFace首发nemotron-gym-instruction-following-v2数据集,针对v1版本核心故障完成两大关键优化,可广泛应用于强化学习指令遵循、智能体任务验证等场景,为大模型与多智能体系统的能力校准提供标准化支撑。

随着大模型驱动的多智能体系统、具身智能、自动化运维等应用快速落地,强化学习(RL)阶段的指令遵循能力校准、任务执行可靠性验证已经成为AI研发领域的核心痛点,高质量的专用训练与验证数据集是解决这一问题的核心基础。作为全球最具影响力的开源AI数据集研发机构之一,LAION eV此前推出的大规模图文数据集曾为Stable Diffusion等生成式AI产品的落地提供了核心支撑,在AI基础数据资源领域具备极高的行业认可度。

本次LAION发布的nemotron-gym-instruction-following-v2数据集,由英伟达Nemotron-RL-instruction_following原始数据集转换为Harbor格式而来,定位为强化学习指令遵循场景的专用验证基准。v2版本针对v1此前暴露的2.5%任务解决率短板完成了两大关键优化:首先实现了对Google IFEval分类法的全约束覆盖,支持的约束ID从v1的17个扩容至48个,直接消除了约55%试验中出现的“UNSUPPORTED — failing closed”故障模式;其次强化了指令头部设计,明确提供了写入/app/answer.txt的shell示例,解决了v1版本中约40%的“answer.txt missing”常见故障,大幅降低了开发者在使用过程中的无效调试成本。

该数据集规模介于10K到100K之间,每个样本包含两个核心字段:path字段为格式为<family>-<sha256[:12]>.tar.gz的确定性短ID,task_binary字段为Gzipped tar格式的二进制数据,包含完整的Harbor任务。验证器家族采用声明式实现的ifeval_constraints,任务容器无第三方依赖,开发者可直接快速部署使用。数据集语言为英语,标签涵盖harbor、nemotron-gym、rl、verifiable-rewards,采用CC-BY-4.0开源许可证,商业与非商业场景均可合规使用。

从应用价值来看,该数据集可广泛应用于多个AI研发场景:一是大语言模型的强化学习微调阶段的指令遵循能力验证,帮助开发者快速定位模型在复杂指令理解、多步任务执行中的能力短板;二是多智能体系统的任务执行可靠性测试,为办公智能体、具身智能机器人、自动化运维智能体等产品的能力校准提供标准化基准;三是强化学习奖励机制的研发验证,其可验证奖励的设计逻辑,可为新型RLHF、RLAIF机制的迭代提供参考支撑。在当前AI基础数据资源价值持续凸显的背景下,本次优化版专用数据集的发布,填补了强化学习指令遵循场景高质量开源验证基准的空白,将有效降低AI开发者的研发成本,加速大模型与智能体产品的落地进程。

查看nemotron-gym-instruction-following-v2

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们