five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

The University of British Columbia 发布 EDUADAPT 数据集, 应用在 教育评估、自然语言处理 领域

五号数据雷达开源数据市场2025-10-22 08:5638
EDUADAPT 是 The University of British Columbia 发布的数据集,于 2025-10-20 首发在 arXiv 应用于 教育评估、自然语言处理 领域

The University of British Columbia 本次发布的数据集 EDUADAPT, EDUADAPT是一个包含近4.8万个按年级标记的问答对的数据集,涵盖九个科学科目,跨越1至12年级,并分为四个年级水平。数据集遵循K-12框架,并与下一代科学标准(NGSS)对齐,确保从基本回忆到高级推理的覆盖范围。该数据集旨在评估大型语言模型(LLMs)在特定年级水平上的知识适应性和评估能力。EDUADAPT数据集通过两阶段流程创建:生成过程和人工验证过程。生成过程涉及从维基百科文章中提取和清洁文本,然后使用LLM生成与不同教育水平相对应的QA对。人工验证过程确保了数据集的质量和年级水平的适当性。EDUADAPT数据集在评估LLMs在不同年级水平上调整其输出的一致性方面发挥着关键作用,旨在促进更符合发展阶段的AI教育系统的发展。

查看EDUADAPT

关于 The University of British Columbia , 不列颠哥伦比亚大学(The University of British Columbia,简称UBC)是加拿大卑诗省的一所公立研究型大学,成立于1908年,是加拿大最古老的大学之一。它位于温哥华市,拥有美丽的校园和卓越的学术声誉,在全球范围内都有很高的排名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们