LAION eV本次发布的数据集nemotron-gym-instruction-following-adversarial,该数据集是 nvidia/Nemotron-RL-Instruction-Following-Adversarial-v1 的 Harbor 格式转换版本,适用于强化学习任务,特别是指令遵循和对抗性评估场景。数据集以 Harbor 任务格式组织,每个样本包含两列:path(确定性短ID字符串,格式为 -.tar.gz)和 task_binary(gzip 压缩的 tar 文件,包含完整的 Harbor 任务)。任务 tarball 内含多个文件:instruction.md(展示给智能体的提示文本)、environment/Dockerfile(基于 python:3.11-slim-bookworm 镜像并添加任务特定 pip 依赖)、tests/test.sh(验证器入口点脚本,负责写入奖励日志)、tests/verifier.py(确定性嵌入式验证器实现)、tests/verifier_data.json(每个任务的验证器输入 JSON 数据,无代码插值)、metadata.json(来源元数据,如源数据集、行索引、家族等)和 task.toml(标准 Harbor 任务配置,包括 CPU/内存/超时默认值)。数据集强调安全构建转换,确保内容不插值到 shell、Python 或 Dockerfile 源码中,所有值通过 JSON 传递,基础镜像固定,pip 规范经过严格允许列表正则验证,文本字段去除控制字符并长度限制,tarball 路径经过遍历/NUL/绝对路径攻击验证,且 tarball 具有确定性(排序条目、固定时间戳和用户组),保证字节可复现。数据规模在 1千到1万样本之间,语言为英语,采用 CC-BY-4.0 许可证。它源自 NVIDIA 的 NeMo-Gym 集合,可用于强化学习训练和评估,支持通过 Harbor 工具运行单个任务。
查看nemotron-gym-instruction-following-adversarial
Dataset card内容:
Files and versions内容: