NVIDIA本次发布的数据集Nemotron-Terminal-Synthetic-Tasks,Terminal-Corpus 是一个基于 Linux 终端环境的技能导向型合成任务数据集,专为评估和训练自主智能体而设计。数据集采用 cc-by-4.0 许可,包含英语编写的代码相关任务,规模在10万至100万样本之间。每个任务遵循严格的四组件架构:1) 自然语言描述的指令文件(instruction.md);2) 基于9个预构建领域专用Docker镜像的环境上下文;3) 使用pytest框架的自动化验证套件;4) 包含黄金执行路径的解决方案轨迹(solution/)。数据集通过标准化容器环境、程序化验证机制和结构化任务设计,支持大规模终端操作任务的自动化测试与学习。
查看Nemotron-Terminal-Synthetic-Tasks
Dataset card内容:
Files and versions内容:
关于NVIDIA,英伟达是一家专注于图形处理器开发的全球知名技术公司。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)