加州大学戴维斯分校 本次发布的数据集 ComPile, ComPile数据集是由加州大学戴维斯分校等机构合作创建的一个大规模的中间表示(IR)数据集,专门从生产环境中收集的代码中提取。该数据集包含了2.8TB的文本中间表示,涵盖了Rust, Swift, Julia, 和C/C++等多种编程语言。通过直接接入语言的包管理器或编译器,ComPile从生产级程序中提取了这些中间表示。数据集的创建旨在支持编译器优化和机器学习模型的训练,特别是在编译器中间表示层面的分析和优化。ComPile的应用领域包括编译器优化、代码分析和生成,以及机器学习在编译器设计中的应用,旨在提高编译器的性能和效率。
关于 加州大学戴维斯分校 , 加州大学戴维斯分校(University of California, Davis)是美国加州大学系统中的一所公立研究型大学,位于加州戴维斯市。该校以其农业、生命科学、工程和社会科学等领域的研究而闻名,是全美顶尖的公立大学之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)