five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAION eV发布nemotron-gym-instruction-following-adversarial数据集,应用在强化学习指令遵循、对抗性评估领域

五号数据雷达开源数据市场2026-05-17 04:0119
nemotron-gym-instruction-following-adversarial是LAION eV发布的数据集,于2026-05-16首发在HuggingFace应用于强化学习指令遵循、对抗性评估领域

LAION eV本次发布的数据集nemotron-gym-instruction-following-adversarial,该数据集是 nvidia/Nemotron-RL-Instruction-Following-Adversarial-v1 的 Harbor 格式转换版本,适用于强化学习任务,特别是指令遵循和对抗性评估场景。数据集以 Harbor 任务格式组织,每个样本包含两列:path(确定性短ID字符串,格式为 -.tar.gz)和 task_binary(gzip 压缩的 tar 文件,包含完整的 Harbor 任务)。任务 tarball 内含多个文件:instruction.md(展示给智能体的提示文本)、environment/Dockerfile(基于 python:3.11-slim-bookworm 镜像并添加任务特定 pip 依赖)、tests/test.sh(验证器入口点脚本,负责写入奖励日志)、tests/verifier.py(确定性嵌入式验证器实现)、tests/verifier_data.json(每个任务的验证器输入 JSON 数据,无代码插值)、metadata.json(来源元数据,如源数据集、行索引、家族等)和 task.toml(标准 Harbor 任务配置,包括 CPU/内存/超时默认值)。数据集强调安全构建转换,确保内容不插值到 shell、Python 或 Dockerfile 源码中,所有值通过 JSON 传递,基础镜像固定,pip 规范经过严格允许列表正则验证,文本字段去除控制字符并长度限制,tarball 路径经过遍历/NUL/绝对路径攻击验证,且 tarball 具有确定性(排序条目、固定时间戳和用户组),保证字节可复现。数据规模在 1千到1万样本之间,语言为英语,采用 CC-BY-4.0 许可证。它源自 NVIDIA 的 NeMo-Gym 集合,可用于强化学习训练和评估,支持通过 Harbor 工具运行单个任务。

查看nemotron-gym-instruction-following-adversarial

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们