阿贡国家实验室 本次发布的数据集 ALDbench, ALDbench是由阿贡国家实验室的研究团队创建的一个开放式问题基准数据集,专门用于评估大型语言模型(LLMs)在材料合成领域,特别是原子层沉积(ALD)技术中的表现。该数据集包含70个问题,涵盖从研究生水平到领域专家级别的难度,涉及ALD技术的多个方面,如材料生长、过程细节、一般知识及应用。数据集的创建过程由六位ALD领域的专家共同完成,问题经过精心设计,确保每个问题具有可验证的答案。ALDbench主要用于测试LLMs在材料合成中的知识深度和研究辅助能力,旨在解决材料科学领域中复杂问题的自动化处理问题。
关于 阿贡国家实验室 , 阿贡国家实验室是美国能源部下属的著名研究机构,成立于1946年,位于伊利诺伊州。该实验室致力于进行基础和应用科学研究,涵盖能源、环境、国家安全等多个领域,拥有先进的科研设施和强大的科研团队,是全球领先的研究机构之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)