随着全球医疗数字化转型加速,生物医学知识图谱已成为临床辅助决策、医学科研、药物研发等领域的核心数据基础设施,但当前主流生物医学知识图谱多为静态结构,普遍缺失疾病发病窗口、进展分期、表型出现时序等关键时间维度信息,无法支撑时间敏感型临床问题的推理需求,成为制约医疗AI向全周期临床场景渗透的核心瓶颈之一。
2026年5月22日,南丹麦大学联合汉堡大学研究团队在arXiv平台正式发布时序生物医学知识图谱数据集ChronoMedKG,瞄准上述行业痛点展开技术攻关。
据公开信息显示,ChronoMedKG共包含460,497条经过严格验证的三元组,覆盖13,431种常见与罕见疾病,每条知识关联均标注有发病窗口、进展阶段等核心时间成分,同时附有对应的PMID文献溯源编码与多信号可信度评分,确保知识的可追溯性与准确性。该数据集采用疾病自主的多智能体流水线构建,依托前沿大语言模型从PubMed、PMC等全球权威生物医学文献库中独立提取知识,仅保留多模型共识、通过可信度筛选与本体对齐校验的关联关系,从源头保障了数据集的专业质量。
从应用价值来看,ChronoMedKG主要面向临床推理领域,尤其是纵向临床决策支持场景,能够为检索增强生成(RAG)架构的临床辅助系统提供关键的全周期时间轴信息,帮助解决疾病表型出现时间、进展节点预判等时间敏感的临床问题。除此之外,该数据集还可广泛应用于多个医疗相关场景:在慢病管理场景中,可基于疾病进展的时序规律,为患者定制个性化随访与干预计划;在药物研发场景中,可辅助研发人员定位不同疾病阶段的靶点表达时间窗口,优化临床试验的入组分层标准与干预时机设计;在公共卫生场景中,可支撑季节性流行病、慢性病发病规律的挖掘,为区域健康预警体系的搭建提供数据支撑。
作为当前少有的覆盖广、可信度高的时序生物医学知识图谱数据集,ChronoMedKG的发布填补了行业在时间维度医学知识结构化领域的空白,不仅为医疗AI的落地提供了关键的基础设施支撑,也为全球生物医学知识图谱的构建提供了可复用的技术范式,对推动医疗数据要素价值释放、加速数字医疗行业高质量发展具有重要的参考意义。





_1769672084863.jpg)