代尔夫特理工大学本次发布的数据集MOSAIC-agentic-3m,该数据集由代尔夫特理工大学等机构联合构建,收录了约11万条开源GitHub pull requests及其关联元数据,涵盖提交、评论、审查记录等问题追踪信息,涉及数百万行源代码。数据通过挖掘五个主流编码代理(包括OpenAI Codex、GitHub Copilot等)的协作痕迹构建,重点捕捉AI代理与人类开发者的交互模式。数据集旨在研究自主编码代理对代码质量、团队协作及软件可维护性的影响,为AI原生软件开发提供实证分析基础。
关于代尔夫特理工大学,代尔夫特理工大学(Technische Universiteit Delft)位于荷兰代尔夫特市,是荷兰规模最大、历史最悠久的理工类大学,创建于1842年。该校在工程、技术、建筑等领域享有盛誉,是欧洲顶尖的理工大学之一。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)