five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江司太立钆特醇渗透性预测数据集完成知识产权登记 破解造影剂ADMET评价行业痛点

五号数据雷达数据知识产权登记2026-05-21 04:496
2026年5月20日,浙江司太立制药旗下钆特醇结构的小分子渗透性预测评价数据正式在浙江省数据知识产权登记平台完成确权登记,该数据集填补了通用ADMET工具在大环类造影剂领域的预测精度空白,可广泛应用于造影剂研发筛选、杂质风险评估、新药申报支撑等场景,为医药研发领域数据资产的确权与流通提供了参考样本。

随着数据要素市场化配置改革持续推进,医药研发领域的高价值专有数据正成为创新主体的核心数字资产。作为国内率先落地数据知识产权确权制度的省份,浙江近日新增一项医药研发专属数据集登记成果:2026年5月20日,浙江司太立制药股份有限公司旗下「钆特醇结构的小分子渗透性预测评价数据」正式完成浙江省数据知识产权登记平台确权登记。该平台是浙江省推进数据要素制度建设的核心基础设施之一,可为登记主体提供数据资产确权凭证,为后续的数据交易流通、权益保护、合规融资等场景提供基础支撑。

造影剂是医学影像诊断的核心支撑耗材,近年来大环型钆螯合物类造影剂因安全性更高、成像效果更稳定,成为行业研发的热门方向。但长期以来,造影剂研发始终面临ADMET(吸收、分布、代谢、排泄、毒性)预测精度不足的行业痛点:由于造影剂分子量普遍在500~1500 g/mol、极性表面积(TPSA)普遍超过140 Ų,理化性质远超传统药物研发通用的Lipinski五规则适用范围,市面上的通用ADMET预测工具对此类分子的渗透性预测精度普遍偏低。与此同时,现有公开的Caco-2渗透性数据库对造影剂母核结构及其药典法定杂质的覆盖极为有限,研发团队在早期筛选阶段只能依赖耗时耗力的体外Caco-2细胞实验逐一评估,大幅拉长了研发周期、抬高了研发成本。

浙江司太立制药本次登记的钆特醇结构的小分子渗透性预测评价数据,正是针对上述行业痛点研发的专属数据集。本数据集以公开Caco-2渗透性数据集(caco2_wang.csv)为基础,专项补充纳入钆特醇母核原料药及主要国家药典收载的法定杂质渗透性数据,构建面向该特定化学空间的专属训练数据集,训练图卷积神经网络(GCN)预测模型,实现对钆特醇结构域内候选分子渗透性的高精度预测。

本次登记的数据集核心构建逻辑分为四大环节:一是数据收集与特征加工,在公开数据集基础上专项补充钆特醇母核及各国药典收载的法定杂质(含大环配体开环降解产物、配位中间体等)的化合物名称、分子结构(SMILES字符串)与实验logPapp值,覆盖钆特醇大环多氮多羧酸钆螯合物化学空间,同时通过RDKit计算分子量、脂水分配系数、极性表面积等七项理化参数作为数据字段;二是特征工程与模型构建,将SMILES转换为图结构数据作为输入,以logPapp实验值为预测目标划分数据集,采用图卷积网络提取分子特征训练专属模型,适配钆特醇结构域大环刚性骨架、多氮配位节点的特征分布;三是分类判定规则,将预测LogPapp划分为高、中、低三档,对应不同的跨膜能力与研发参考价值;四是备注字段规则,可快速定位渗透性受限的核心理化原因,为分子结构优化提供明确方向。

从应用价值来看,该预测评价数据可直接用于候选化合物虚拟筛选与结构优化,大幅减少早期研发阶段的体外实验频次,降低研发成本、缩短筛选周期;可用于合成杂质渗透性风险评估,为新药申报阶段的杂质安全性评价提供数据支撑,加快审评进度;相关模型及数据亦可授权给其他医学影像或生物材料企业复用,减少行业重复研发投入,填补了现有通用数据集在造影剂专属结构域的预测空白。本次登记也为国内医药研发领域高价值专有数据的确权、流通提供了可复制的实践样本,对推动AI辅助药物研发领域的数据要素市场化具有典型参考意义。

查看钆特醇结构的小分子渗透性预测评价数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们