首页 / 开源数据市场 / 正文

LAION eV发布nemotron-gym-instruction-following-adversarial数据集，应用在强化学习指令遵循、对抗性评估领域

五号数据雷达开源数据市场2026-05-17 04:0119

nemotron-gym-instruction-following-adversarial是LAION eV发布的数据集，于2026-05-16首发在HuggingFace应用于强化学习指令遵循、对抗性评估领域

LAION eV本次发布的数据集nemotron-gym-instruction-following-adversarial，该数据集是 nvidia/Nemotron-RL-Instruction-Following-Adversarial-v1 的 Harbor 格式转换版本，适用于强化学习任务，特别是指令遵循和对抗性评估场景。数据集以 Harbor 任务格式组织，每个样本包含两列：path（确定性短ID字符串，格式为 -.tar.gz）和 task_binary（gzip 压缩的 tar 文件，包含完整的 Harbor 任务）。任务 tarball 内含多个文件：instruction.md（展示给智能体的提示文本）、environment/Dockerfile（基于 python:3.11-slim-bookworm 镜像并添加任务特定 pip 依赖）、tests/test.sh（验证器入口点脚本，负责写入奖励日志）、tests/verifier.py（确定性嵌入式验证器实现）、tests/verifier_data.json（每个任务的验证器输入 JSON 数据，无代码插值）、metadata.json（来源元数据，如源数据集、行索引、家族等）和 task.toml（标准 Harbor 任务配置，包括 CPU/内存/超时默认值）。数据集强调安全构建转换，确保内容不插值到 shell、Python 或 Dockerfile 源码中，所有值通过 JSON 传递，基础镜像固定，pip 规范经过严格允许列表正则验证，文本字段去除控制字符并长度限制，tarball 路径经过遍历/NUL/绝对路径攻击验证，且 tarball 具有确定性（排序条目、固定时间戳和用户组），保证字节可复现。数据规模在 1千到1万样本之间，语言为英语，采用 CC-BY-4.0 许可证。它源自 NVIDIA 的 NeMo-Gym 集合，可用于强化学习训练和评估，支持通过 Harbor 工具运行单个任务。

查看nemotron-gym-instruction-following-adversarial

Dataset card内容：

Files and versions内容：

社区讨论

近期热门