中国科学技术大学 本次发布的数据集 M3KG, M3KG是一个基于真实医学报告构建的大规模多模态医学知识图谱,包含2477个实体、3种关系、37424个三元组和6943个疾病感知视觉Tokens,用于CheXpert Plus数据集。它通过GPT-4o生成训练数据,并使用ReXKG进行实体和关系提取,构建了一个包含解剖结构、疾病、概念、设备、程序、尺寸和视觉Tokens等六种实体类型和修改、位于、提示三种关系类型的知识图谱。该数据集旨在为基于大型语言模型的放射学报告生成提供大规模知识图谱,解决现有医学知识图谱规模有限、多模态信息缺失和静态图谱无法支持多级知识关联等问题。
README 内容:
关于 中国科学技术大学 , 中国科学技术大学是一所专注于培养高等学历理工人才的高等学府,致力于促进科技发展。学校提供从高等专科到博士研究生的全方位学历教育,涵盖理学、工学、管理学、经济学、文学、法学、农学等多个学科领域。此外,学校还开展博士后培养、相关科学研究以及继续教育、专业培训和学术交流等活动。近期,中国科学技术大学旗下的ABACUS原子轨道基组数据资源在浙江省数据知识产权登记平台完成了登记,这一数据集可能涉及原子轨道基组的理论与计算,对于科学研究与实际应用具有重要意义。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)