清华大学 本次发布的数据集 EDUKG, 该数据集名为EDUKG,是一个包含丰富跨学科知识主题及关系的异构可持续K-12教育知识图谱。它从教材中提取知识,旨在提高教育知识的充足性和可持续性。EDUKG包含256个单元、779节课以及来自46本教材的2371个节段,并配有6518道练习题,细分为10602个问题。此外,该数据集还融入了图像数据,平均每个教材节段关联3.11张图片。其规模宏大,拥有超过2.52亿个实体和38.6亿个三元组。该数据集可应用于学习管理系统开发、智能辅导系统研究、教育数据挖掘探索等多种任务。
README 内容:
关于 清华大学 , 清华大学是中国的顶尖学府之一,位于北京,是中国教育部直属的全国重点大学,有着很高的学术声誉和国际影响力。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)