five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

CAMEL-AI.org发布SETA-Env终端强化学习数据集 为代码生成、智能体自动化研发提供基准支撑

五号数据雷达开源数据市场2026-05-26 04:338
2026年5月25日,开源AI研究社区CAMEL-AI.org在Hugging Face首发开源可验证强化学习终端环境数据集SETA-Env,该数据集覆盖4567个独立环境实例,可为终端智能体训练评估、代码生成、自动化任务研发等领域提供标准化基准资源。

当前,AI技术迭代已从通用大模型阶段转向垂直场景落地阶段,智能体(Agent)作为下一代AI交互与执行的核心载体,其研发进度高度依赖高质量、标准化的训练与评估数据集,而终端场景下的智能体训练长期存在环境复现难、测试标准不统一、任务覆盖度不足等痛点。作为全球知名的聚焦多智能体协作研究的开源社区,CAMEL-AI.org本次发布的SETA-Env数据集,正是针对上述行业痛点推出的开源、可验证的强化学习终端环境数据集,旨在服务于全球AI社区的模型训练与评估需求。

本次发布的数据集共包含两个顶层子集:SETA_Synth(合成任务)和 SETA_Evolve(终端智能体任务的演化变体),总计提供 4567 个独立的环境实例。其中,SETA_Synth 子集包含 3255 个任务,SETA_Evolve 子集包含 1312 个任务。每个任务均以自包含的 Harbor 风格任务目录形式打包,内含运行任务、构建环境、执行参考解决方案以及运行测试所需的所有文件,典型任务目录结构包括:定义任务核心参数的 `task.toml` 文件、任务说明文档 `instruction.md`、用于构建环境的 `environment/` 目录(内含 Dockerfile 等)、包含参考解决脚本的 `solution/` 目录,以及用于验证的 `tests/` 目录。这种全链路自包含的打包方式,解决了此前同类数据集存在的环境配置复杂、复现难度高、测试标准不统一等问题,研发者仅需拉取对应任务目录即可完成训练、验证全流程操作,大幅降低研发验证成本。

该数据集的基础数据来源于ask_ubuntu、kaggle_notebook、nl2bash、stack_overflow 和 unix_linux_se等多个公开技术社区与平台,覆盖了真实场景下开发者高频遇到的终端操作、代码调试、环境配置等需求。其中SETA_Synth 子集直接基于这些来源构建,而 SETA_Evolve 子集则是对源自这些社区的任务进行了演化处理,生成了具有不同上下文(后缀 `__b1` 表示)或难度(后缀 `__d1` 表示)的变体,进一步增加了任务的多样性和挑战性,可用于验证智能体的跨场景泛化能力,而非仅能解决固定场景的特定任务。

从应用方向来看,SETA-Env数据集可覆盖多个前沿AI研发场景:在终端智能体研发领域,可用于训练智能体自主理解自然语言指令、完成Shell命令执行、服务器环境配置、日常运维操作等任务,相关技术未来可落地于企业IT自动化运维、云资源智能调度、开发者效率工具等场景;在代码生成领域,该数据集可作为标准化基准测试集,验证大模型生成的自动化脚本、运维代码的可用性与鲁棒性,弥补当前代码生成模型终端场景验证数据不足的短板;在强化学习研究方向,其提供的多难度、多上下文的任务变体,可用于研究稀疏奖励场景下的智能体决策优化、跨任务泛化能力提升等核心问题,推动强化学习技术从游戏、仿真场景走向真实终端应用场景。

该数据集采用混合许可证模式,具体许可规则取决于数据来源,其中 Stack Exchange 系列内容(stack_overflow, unix_linux_se, ask_ubuntu)基于 CC BY-SA 协议,nl2bash 基于 MIT 协议,kaggle_notebook 则依据其原始公开资产的许可证,研发者可根据自身使用场景灵活选择对应子集,规避知识产权风险。

查看SETA-Env

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们