West Chester University of Pennsylvania 本次发布的数据集 EduScopeQA, EduScopeQA 是一个针对中学和高等教育应用的问答数据集,包含 3,176 个问答对,涵盖历史、文学、科学和计算机科学四个学科,总共有 210 万个 tokens。数据集由四部分组成,分别是历史、文学、科学和计算机科学。每个学科都包含不同长度、风格和信息的文本,以模拟真实课堂环境。数据集中的问题分为三类:具体问题、部分问题和主题问题。EduScopeQA 的创建过程包括文本分割、内容筛选、层次化摘要、具体/部分问题生成、主题问题生成和过滤与审查。EduScopeQA 的应用领域是教育技术,旨在解决大型语言模型在教育场景中提供不准确或过时信息的问题。
README 内容:
关于 West Chester University of Pennsylvania , -_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)