中国科学院 本次发布的数据集 SWE-bench-java-verified, SWE-bench-java-verified是由中国科学院、北京大学、华为有限公司等机构联合创建的Java版本GitHub问题解决基准数据集。该数据集包含91个高质量问题实例,涵盖6个流行的GitHub Java仓库,旨在评估大型语言模型在Java项目中自动解决问题的能力。数据集的创建过程包括候选仓库收集、问题实例爬取、运行时环境确定、失败到通过测试提取和基于问卷的手动验证。该数据集主要应用于软件工程领域,特别是自动化编程和问题解决。
Dataset card 内容:
Files and versions 内容:
关于 中国科学院 , 中国科学院是中国最高的学术机构和综合性研究机构,致力于科学研究与人才培养,涵盖自然科学、工程技术、生命科学等多个领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)