NVIDIA本次发布的数据集Nemotron-RL-Agentic-SWE-Pivot-v1,SWE-RL 数据集提供了用于在 NeMo Gym 的 OpenHands 环境中训练和验证现实世界软件工程代理的 GitHub 问题。该数据集是对 SWE-Gym、R2E-Gym 和 SWE-Bench-Verified 数据集的重构版本,以支持 NeMo Gym 输入格式。数据集包含 6436 个训练样本,具有两个顶级特征(responses_create_params 和 agent_ref),训练数据大小约为 4.25GB。该数据集作为 NVIDIA NeMo Gym 的一部分发布,旨在用于大型语言模型(LLMs)的后训练。数据集采用 Creative Commons Attribution 4.0 International (CC-BY 4.0) 许可,适用于商业用途。
查看Nemotron-RL-Agentic-SWE-Pivot-v1
关于NVIDIA,英伟达是一家专注于图形处理器开发的全球知名技术公司。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的开发与分享。它提供了丰富的资源,包括超过100万个模型、25万个数据集和40万个应用程序,支持文本、图像、视频、音频和3D等多种模态。此外,平台还提供企业级解决方案和开源工具,如Transformers、Diffusers等,以加速机器学习的研究和应用。





_1769672084863.jpg)