five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成医学文献萃取大模型插件数据知识产权登记 破解医疗大模型幻觉痛点

五号数据雷达数据知识产权登记2026-05-27 07:204
2026年5月26日,浙江省安诊儿医学人工智能科技有限公司旗下医学文献萃取后大模型插件数据正式在浙江省数据知识产权登记平台完成知识产权登记,该数据可在不调整大模型参数的前提下为医疗AI提供结构化知识支撑,大幅降低医疗大模型的幻觉风险与应用成本。

作为数字经济的核心生产要素,数据知识产权的合规确权是数据要素流通、交易、权益保护的核心前提,而医疗作为知识密度最高、合规要求最严的垂直领域,专业数据的知识产权规范化管理一直是产业关注的焦点。浙江省数据知识产权登记平台是浙江省推进数据要素市场化配置改革的核心基础设施,承担着全省数据知识产权的权属确认、存证固证、流通备案等职能,为各类数据资产的合规流转、价值变现提供基础制度支撑。
2026年5月26日,浙江省安诊儿医学人工智能科技有限公司旗下的医学文献萃取后大模型插件数据正式在该平台完成知识产权登记,是国内医疗AI领域为数不多的完成官方确权的大模型专用结构化数据资产。
本次登记的数据集合为安诊儿自主构建的知识胶囊提取与外部KV注入(KVI)算法框架的直接产出,通过将医学文献等公开语料输入自研的文档分块与三元组提取流水线,由冻结基础大语言模型(frozen LLM)自动抽取并编译生成,是对现有公开语料进行系统性结构化转化的智力成果,具备完全独立的知识产权属性。
不同于传统的原始语料数据集,本次登记的插件数据本身可直接注入大语言模型注意力机制作为结构化知识记忆,无需更新任何模型参数即可为各类大语言模型提供外部专业知识支持,可广泛应用于医疗领域知识密集型问答、医学事实核查、大模型幻觉抑制等多个场景:在临床端可支撑临床辅助决策的医学文献溯源查询,在研发端可满足药企靶点研究、临床试验设计的跨文献关联分析需求,在教育端可适配医学培训的精准知识问答,在科普端可用于医疗科普内容的事实校验。
据公开信息显示,该数据集合包含多跳关联事实、结构化知识及长上下文推理所需的高密度信息条目,可适配大语言模型在知识密集型问答场景中的检索与生成任务,尤其适用于需要基于精准事实进行多步推理、处理长文本信息及跨段落或跨文档的关联知识整合的场景,覆盖开放域通用医疗问答、生物医药专业领域深度问答、医学科普内容事实一致性核查及大模型幻觉抑制评估等多个需求方向,各类基座大语言模型、检索增强生成(RAG)系统及知识增强型自然语言处理应用均可直接接入使用。
相较于传统RAG系统依赖文本token注入的知识供给方式,该插件数据提供的结构化知识内存级表示,可有效缓解传统RAG普遍存在的知识传递间接性、长上下文或多跳推理不稳定、专业知识准确率不足等行业痛点,大幅降低医疗大模型的应用门槛与运维成本。本次登记也为医疗领域衍生数据资产的确权、流通提供了可参照的样本,将进一步推动医疗数据要素的合规价值释放,助力医疗AI产业的规范化发展。

查看医学文献萃取后大模型插件数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们