The University of British Columbia 本次发布的数据集 EDUADAPT, EDUADAPT是一个包含近4.8万个按年级标记的问答对的数据集,涵盖九个科学科目,跨越1至12年级,并分为四个年级水平。数据集遵循K-12框架,并与下一代科学标准(NGSS)对齐,确保从基本回忆到高级推理的覆盖范围。该数据集旨在评估大型语言模型(LLMs)在特定年级水平上的知识适应性和评估能力。EDUADAPT数据集通过两阶段流程创建:生成过程和人工验证过程。生成过程涉及从维基百科文章中提取和清洁文本,然后使用LLM生成与不同教育水平相对应的QA对。人工验证过程确保了数据集的质量和年级水平的适当性。EDUADAPT数据集在评估LLMs在不同年级水平上调整其输出的一致性方面发挥着关键作用,旨在促进更符合发展阶段的AI教育系统的发展。
关于 The University of British Columbia , 不列颠哥伦比亚大学(The University of British Columbia,简称UBC)是加拿大卑诗省的一所公立研究型大学,成立于1908年,是加拿大最古老的大学之一。它位于温哥华市,拥有美丽的校园和卓越的学术声誉,在全球范围内都有很高的排名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)