首页 / 开源数据市场 / 正文

LAION eV发布nemotron-gym-reasoning-gym-v2数据集为强化学习推理基准验证提供标准化支撑

五号数据雷达开源数据市场2026-05-21 19:4510

开源AI数据领域核心机构LAION eV于2026年5月18日在HuggingFace首发nemotron-gym-reasoning-gym-v2数据集，该数据集基于NVIDIA原有版本完成Harbor格式转换与兼容性修复，可为强化学习推理训练、大模型能力验证提供高安全、可复现的基准工具。

当前大模型推理能力迭代、通用人工智能Agent研发进入爆发期，标准化、可复现、高安全的任务验证基准数据集，已成为AI研发端降低重复投入、实现能力横向对比的核心基础设施。作为全球开源AI数据领域的核心贡献机构，LAION eV曾主导构建支撑Stable Diffusion诞生的LAION-5B等标杆级开源数据集，在AI训练测试数据集的标准化建设领域拥有广泛的行业影响力。

LAION eV本次发布的nemotron-gym-reasoning-gym-v2数据集，是NVIDIA Nemotron-RL-ReasoningGym-v1数据集的Harbor格式转换版本，主要面向强化学习任务场景，尤其适配推理相关的任务验证需求。数据集规模覆盖10K到100K量级，每个数据行包含两个核心字段：path（确定性短ID，格式为-.tar.gz）和task_binary（包含完整Harbor任务的gzip压缩tar文件）。压缩包内严格遵循Harbor任务布局，涵盖instruction.md（代理提示）、环境Dockerfile、测试验证脚本（test.sh、verifier.py）、验证器输入数据（verifier_data.json）、元数据（metadata.json）和任务配置（task.toml），使用者无需额外搭建测试环境即可快速开展相关验证工作。

本次数据集转换过程针对AI研发场景的安全需求做了专项设计：内容不插入shell、Python或Dockerfile源代码，所有值通过JSON文件传递；基础镜像固定避免环境差异干扰测试结果；文本字段全部去除控制字符防范注入风险；压缩包路径做防攻击处理；且压缩包具备确定性特征可确保测试结果完全可复现。该数据集验证器家族为reasoning_gym，委托上游推理健身房评分器并包含标准化匹配回退机制，可适配不同研发主体的验证需求。

相较于此前版本，本次发布的v2版本重点修复了两大核心问题：一是通过预装编译工具链解决了原有版本沙箱构建失败的问题，二是统一调用正确的公共API解决了验证器API不匹配的问题，大幅提升了数据集的易用性和兼容性。目前该数据集可直接用于Harbor框架运行推理任务，同时支持通过Hugging Face datasets库加载和提取任务。

从行业应用来看，该数据集可覆盖多个核心AI研发场景：可为大模型厂商提供逻辑推理、代码推理、数学推理等能力的标准化基准测试工具，降低企业自建测试集的投入成本；可为科研机构的强化学习Agent研发提供标准化任务池，支撑交互型推理任务的训练与验证；也可为AI安全研究提供可复现的测试环境，用于验证大模型推理过程的鲁棒性与合规性。作为开源AI基准数据集的新增标杆产品，该数据集的上线也将进一步推动AI评测体系的标准化，为AI研发端的能力迭代、横向对比提供公共基础设施支撑，助力大模型推理领域的技术落地。

查看nemotron-gym-reasoning-gym-v2

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

LAION eV发布nemotron-gym-reasoning-gym-v2数据集 为强化学习推理基准验证提供标准化支撑

Dataset card内容：

Files and versions内容：

社区讨论

LAION eV发布nemotron-gym-reasoning-gym-v2数据集为强化学习推理基准验证提供标准化支撑