当前数据要素已成为生物医药研发领域的核心生产要素,随着AI辅助药物研发(AIDD)渗透率持续提升,高质量、细分领域的专属标注数据集成为决定模型预测精度、压缩研发成本的核心竞争力。作为国内率先落地数据知识产权登记制度的省份,浙江近年持续推动高价值研发数据的合规确权与流通,为医药、高端制造等领域的数据资产化提供制度支撑,浙江省数据知识产权登记平台也承担着数据权属确认、流通交易存证、权益保护等核心职能,为数据要素的市场化配置提供底层基础。2026年5月6日,浙江司太立制药股份有限公司旗下「碘克沙醇结构的小分子渗透性预测评价数据」正式在该平台完成登记,成为国内造影剂研发领域首个完成知识产权确权的专属数据集。
造影剂作为医学影像检查的核心配套耗材,其分子结构普遍具有分子量500~1500 g/mol、极性表面积(TPSA)普遍超过140 Ų的特征,理化性质远超出传统药物研发通用的Lipinski五规则适用范围,导致通用ADMET(吸收、分布、代谢、排泄、毒性)预测工具对这类分子的渗透性预测精度严重不足。而细胞膜渗透性是限制造影剂口服吸收效率、组织分布效果的核心指标,直接决定造影剂产品的临床安全性与适用场景。但目前公开的Caco-2渗透性数据库对造影剂母核结构、各国药典法定杂质的覆盖度极低,研发团队在早期筛选阶段只能通过耗时耗力的体外Caco-2细胞实验逐一验证,单批次实验周期长达2-3周,研发成本较虚拟筛选高出数十倍,大幅拖慢了造影剂类产品的迭代速度。
本次登记的数据集,以行业通用公开Caco-2渗透性数据集(caco2_wang.csv)为基础,专项补充了碘克沙醇母核原料药、全球主要国家药典收载的全部法定杂质的渗透性实测数据,构建了面向造影剂特定化学空间的专属训练数据集,基于该数据集训练的图卷积神经网络(GCN)预测模型,可实现对碘克沙醇结构域内所有候选分子渗透性的高精度预测,有效填补了现有通用数据集在造影剂专属结构域的预测空白。
该预测评价数据可直接应用于多个造影剂研发场景:在早期研发阶段可用于候选化合物虚拟筛选与结构优化,将候选分子的渗透性评估周期从周级压缩至分钟级,大幅降低实验成本;在中试阶段可用于合成杂质的渗透性风险评估,提前排查临床安全隐患;在申报阶段可作为补充验证材料支撑新药申报,提升评审效率。此外,该数据集及配套模型还可通过授权方式向医学影像设备企业、生物材料研发企业、CXO服务机构开放,为整个造影剂产业链的研发效率提升提供数据支撑。
登记内容:
本次高价值医药研发数据完成知识产权登记,也是浙江推动数据要素市场化配置在生物医药领域的典型落地,通过明确数据权属,既保障了研发企业的投入回报,也为细分领域研发数据的合规流通建立了示范,后续有望带动更多医药企业开放合规的研发数据集,推动整个AI辅助药物研发行业的精度提升与成本下降,为数字经济与实体经济融合发展提供细分场景的落地参考。





_1769672084863.jpg)