five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

越南信息科技大学发布KG20C, KG20C-QA数据集,应用在知识图谱、问答系统领域

五号数据雷达开源数据市场2025-12-30 14:2370
KG20C, KG20C-QA是越南信息科技大学发布的数据集,于2025-12-26首发在arXiv应用于知识图谱、问答系统领域

越南信息科技大学本次发布的数据集KG20C, KG20C-QA,KG20C是由越南信息科技大学和日本国立情报学研究所联合构建的高质量学术知识图谱数据集,基于微软学术图谱(MAG)精选20个顶级计算机科学会议数据,包含5,047篇论文、8,680位作者等16,362个实体,通过严格的质量过滤和标准化分割形成48,213条训练三元组。该数据集采用与WN18RR相同的TSV格式,支持知识图谱嵌入、链接预测等任务。其衍生数据集KG20C-QA通过预定义模板将三元组转化为自然语言问答对,为学术领域的问答系统提供基准测试,特别适用于评估大型语言模型与知识图谱相结合的推理能力。

查看KG20C, KG20C-QA

关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们