哈尔滨工业大学(深圳) 本次发布的数据集 ProjectEval, ProjectEval是一个针对编程代理自动化评估的新基准,由LLM生成并与人工审核相结合构建而成。它包含三个不同级别的输入,分别是自然语言提示、自然语言检查表和代码框架。该数据集支持网站项目和批处理/控制台程序两种任务类型,旨在通过模拟用户交互来自动化评估项目代码质量。
关于 哈尔滨工业大学(深圳) , 哈尔滨工业大学(深圳)是哈尔滨工业大学在深圳设立的分校,成立于2014年。该校依托深圳的创新环境和哈工大的学术优势,致力于培养具有国际视野的高端人才,特别是在计算机科学与技术、智能科学等领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)