five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAION eV发布nemotron-gym-reasoning-gym-v2数据集 为强化学习推理基准验证提供标准化支撑

五号数据雷达开源数据市场2026-05-21 19:4510
开源AI数据领域核心机构LAION eV于2026年5月18日在HuggingFace首发nemotron-gym-reasoning-gym-v2数据集,该数据集基于NVIDIA原有版本完成Harbor格式转换与兼容性修复,可为强化学习推理训练、大模型能力验证提供高安全、可复现的基准工具。

当前大模型推理能力迭代、通用人工智能Agent研发进入爆发期,标准化、可复现、高安全的任务验证基准数据集,已成为AI研发端降低重复投入、实现能力横向对比的核心基础设施。作为全球开源AI数据领域的核心贡献机构,LAION eV曾主导构建支撑Stable Diffusion诞生的LAION-5B等标杆级开源数据集,在AI训练测试数据集的标准化建设领域拥有广泛的行业影响力。

LAION eV本次发布的nemotron-gym-reasoning-gym-v2数据集,是NVIDIA Nemotron-RL-ReasoningGym-v1数据集的Harbor格式转换版本,主要面向强化学习任务场景,尤其适配推理相关的任务验证需求。数据集规模覆盖10K到100K量级,每个数据行包含两个核心字段:path(确定性短ID,格式为-.tar.gz)和task_binary(包含完整Harbor任务的gzip压缩tar文件)。压缩包内严格遵循Harbor任务布局,涵盖instruction.md(代理提示)、环境Dockerfile、测试验证脚本(test.sh、verifier.py)、验证器输入数据(verifier_data.json)、元数据(metadata.json)和任务配置(task.toml),使用者无需额外搭建测试环境即可快速开展相关验证工作。

本次数据集转换过程针对AI研发场景的安全需求做了专项设计:内容不插入shell、Python或Dockerfile源代码,所有值通过JSON文件传递;基础镜像固定避免环境差异干扰测试结果;文本字段全部去除控制字符防范注入风险;压缩包路径做防攻击处理;且压缩包具备确定性特征可确保测试结果完全可复现。该数据集验证器家族为reasoning_gym,委托上游推理健身房评分器并包含标准化匹配回退机制,可适配不同研发主体的验证需求。

相较于此前版本,本次发布的v2版本重点修复了两大核心问题:一是通过预装编译工具链解决了原有版本沙箱构建失败的问题,二是统一调用正确的公共API解决了验证器API不匹配的问题,大幅提升了数据集的易用性和兼容性。目前该数据集可直接用于Harbor框架运行推理任务,同时支持通过Hugging Face datasets库加载和提取任务。

从行业应用来看,该数据集可覆盖多个核心AI研发场景:可为大模型厂商提供逻辑推理、代码推理、数学推理等能力的标准化基准测试工具,降低企业自建测试集的投入成本;可为科研机构的强化学习Agent研发提供标准化任务池,支撑交互型推理任务的训练与验证;也可为AI安全研究提供可复现的测试环境,用于验证大模型推理过程的鲁棒性与合规性。作为开源AI基准数据集的新增标杆产品,该数据集的上线也将进一步推动AI评测体系的标准化,为AI研发端的能力迭代、横向对比提供公共基础设施支撑,助力大模型推理领域的技术落地。

查看nemotron-gym-reasoning-gym-v2

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们