爱荷华州立大学本次发布的数据集ConceptCoder数据集,ConceptCoder数据集由爱荷华州立大学团队构建,包含80,204个代码示例,涵盖134种常见弱点枚举(CWE)类型。该数据集聚焦漏洞检测和分支预测两大代码推理任务,其中28,974条专项数据标注了空指针解引用、缓冲区溢出等四类漏洞的7种语义概念。数据通过静态分析工具自动生成概念标签,采用真实场景的不平衡分布设计,旨在提升大语言模型对代码语义的层次化推理能力,在软件安全分析和程序行为预测领域具有重要应用价值。
关于爱荷华州立大学,爱荷华州立大学(Iowa State University)成立于1858年,位于美国爱荷华州埃姆斯市,是一所著名的公立研究型大学。该校在农业、工程、设计、兽医等领域享有盛誉,尤其在计算机科学、生物技术和环境科学方面有显著的研究成果。爱荷华州立大学是美国大学协会的成员之一,拥有广泛的学术项目和研究设施。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)