首页 / 开源数据市场 / 正文

CAMEL-AI.org发布SETA-Env终端强化学习数据集为代码生成、智能体自动化研发提供基准支撑

五号数据雷达开源数据市场2026-05-26 04:338

2026年5月25日，开源AI研究社区CAMEL-AI.org在Hugging Face首发开源可验证强化学习终端环境数据集SETA-Env，该数据集覆盖4567个独立环境实例，可为终端智能体训练评估、代码生成、自动化任务研发等领域提供标准化基准资源。

当前，AI技术迭代已从通用大模型阶段转向垂直场景落地阶段，智能体（Agent）作为下一代AI交互与执行的核心载体，其研发进度高度依赖高质量、标准化的训练与评估数据集，而终端场景下的智能体训练长期存在环境复现难、测试标准不统一、任务覆盖度不足等痛点。作为全球知名的聚焦多智能体协作研究的开源社区，CAMEL-AI.org本次发布的SETA-Env数据集，正是针对上述行业痛点推出的开源、可验证的强化学习终端环境数据集，旨在服务于全球AI社区的模型训练与评估需求。

本次发布的数据集共包含两个顶层子集：SETA_Synth（合成任务）和 SETA_Evolve（终端智能体任务的演化变体），总计提供 4567 个独立的环境实例。其中，SETA_Synth 子集包含 3255 个任务，SETA_Evolve 子集包含 1312 个任务。每个任务均以自包含的 Harbor 风格任务目录形式打包，内含运行任务、构建环境、执行参考解决方案以及运行测试所需的所有文件，典型任务目录结构包括：定义任务核心参数的 `task.toml` 文件、任务说明文档 `instruction.md`、用于构建环境的 `environment/` 目录（内含 Dockerfile 等）、包含参考解决脚本的 `solution/` 目录，以及用于验证的 `tests/` 目录。这种全链路自包含的打包方式，解决了此前同类数据集存在的环境配置复杂、复现难度高、测试标准不统一等问题，研发者仅需拉取对应任务目录即可完成训练、验证全流程操作，大幅降低研发验证成本。

该数据集的基础数据来源于ask_ubuntu、kaggle_notebook、nl2bash、stack_overflow 和 unix_linux_se等多个公开技术社区与平台，覆盖了真实场景下开发者高频遇到的终端操作、代码调试、环境配置等需求。其中SETA_Synth 子集直接基于这些来源构建，而 SETA_Evolve 子集则是对源自这些社区的任务进行了演化处理，生成了具有不同上下文（后缀 `__b1` 表示）或难度（后缀 `__d1` 表示）的变体，进一步增加了任务的多样性和挑战性，可用于验证智能体的跨场景泛化能力，而非仅能解决固定场景的特定任务。

从应用方向来看，SETA-Env数据集可覆盖多个前沿AI研发场景：在终端智能体研发领域，可用于训练智能体自主理解自然语言指令、完成Shell命令执行、服务器环境配置、日常运维操作等任务，相关技术未来可落地于企业IT自动化运维、云资源智能调度、开发者效率工具等场景；在代码生成领域，该数据集可作为标准化基准测试集，验证大模型生成的自动化脚本、运维代码的可用性与鲁棒性，弥补当前代码生成模型终端场景验证数据不足的短板；在强化学习研究方向，其提供的多难度、多上下文的任务变体，可用于研究稀疏奖励场景下的智能体决策优化、跨任务泛化能力提升等核心问题，推动强化学习技术从游戏、仿真场景走向真实终端应用场景。

该数据集采用混合许可证模式，具体许可规则取决于数据来源，其中 Stack Exchange 系列内容（stack_overflow, unix_linux_se, ask_ubuntu）基于 CC BY-SA 协议，nl2bash 基于 MIT 协议，kaggle_notebook 则依据其原始公开资产的许可证，研发者可根据自身使用场景灵活选择对应子集，规避知识产权风险。

查看SETA-Env

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

CAMEL-AI.org发布SETA-Env终端强化学习数据集 为代码生成、智能体自动化研发提供基准支撑

Dataset card内容：

Files and versions内容：

社区讨论

CAMEL-AI.org发布SETA-Env终端强化学习数据集为代码生成、智能体自动化研发提供基准支撑