five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江司太立碘海醇结构小分子渗透性预测数据集完成知识产权登记 赋能药物研发效率升级

五号数据雷达数据知识产权登记2026-05-16 06:399
2026年5月11日,浙江司太立制药股份有限公司研发的碘海醇结构小分子渗透性预测评价数据,正式在浙江省数据知识产权登记平台完成登记。该数据集可广泛应用于药物渗透性预测、ADMET计算模型开发等核心研发场景,将为造影剂及相关药物研发降本提效提供数据支撑。

当前,我国数据要素市场化建设正进入快车道,生物医药研发数据作为技术壁垒极高的工业数据资产,是驱动医药产业数字化转型、提升新药研发效率的核心生产要素。作为国内领先的造影剂生产研发企业,浙江司太立制药股份有限公司本次完成登记的数据集,是造影剂研发领域少数获得官方知识产权确权的专业研发工具类数据资产。其登记载体浙江省数据知识产权登记平台,是浙江省推进数据要素流通体系建设的核心基础设施,可为市场主体提供数据权属存证、权益登记、交易备案等官方服务,经其登记的数据资产权益具备公信力,可支撑后续的授权运营、交易流转、质押融资等多元商业化场景。

碘海醇是当前临床应用最广泛的非离子型造影剂品类之一,其分子具备大分子量、多羟基、高极性的典型结构特征,这类“类药性边界分子”的细胞膜渗透性,一直是限制造影剂口服吸收效率、靶组织分布能力的核心瓶颈。传统研发模式下,研发团队需要通过大量体外Caco-2细胞实验测定分子表观渗透系数,不仅周期长、成本高,也无法支撑早期研发阶段海量虚拟候选化合物的高通量筛选需求,本次登记的数据集正是针对这一行业痛点开发的核心研发工具。

浙江司太立制药股份有限公司本次登记的数据知识产权为碘海醇结构的小分子渗透性预测评价数据,核心应用在于加速新型造影剂及类似大分子量、多羟基分子的生物利用度与跨膜运输研究。
企业内部应用:因造影剂通常具有较大的分子量和较高的极性,其细胞膜渗透性往往是限制其口服吸收或组织分布的关键瓶颈。在药物发现的早期阶段,研发团队可利用此数据训练的深度学习模型,对海量虚拟候选化合物进行高通量虚拟筛选(HTVS),在无需进行繁琐的体外 Caco-2 细胞实验的前提下,快速预测其表观渗透系数(Papp)。这能有效剔除透膜性极差的分子,集中资源优化具有适当生物膜透过性的高潜力候选物,从而显著缩短新型造影剂的药代动力学(PK)优化周期并降低临床前开发风险。此外,它还可用于指导已有先导化合物的亲脂性修饰,以数据驱动的方式定向平衡其水溶性与渗透性。
外部及行业应用:本数据集可作为化学信息学领域针对“类药性边界分子”的专业基准,用于开发和验证针对大极性表面积(TPSA)分子的新预测算法。同时,训练好的模型可以作为 ADMET 评估工具,授权给其他医学影像或生物材料企业,帮助其建立快速、高精度的分子生物药剂学评估能力,推动整个造影剂行业的数字化研发进程。本数据基于图卷积神经网络(GCN)算法构建了分子渗透性预测模型,该模型通过学习分子拓扑结构与渗透性之间的内在规律,实现对全新分子结构渗透性的预测。
1. 数据收集与特征加工:收集现有已知造影剂及类药化合物的分子结构(以 SMILES 字符串形式表示)、实验测定的 Caco-2 细胞表观渗透系数对数值(logPapp),并采用基于图论的分子图作为特征表示,用于深度学习预测模型的构建。
2. 特征工程与模型构建(1)特征工程:针对每个类药性边界分子的 SMILES 字符串(SMILES),通过 DeepChem 的 ConvMolFeaturizer 算法将其转换为包含原子特征向量和邻接列表的图结构数据,作为模型的输入特征矩阵 X;以对应的 logPapp 实验值(经过归一化处理)作为模型的预测目标(输出变量 Y)。(2)模型构建:采用图卷积网络算法构建预测模型,核心参数与结构如下:网络架构: 包含多层图卷积层以提取局部化学环境特征,以及图池化层以聚合全局分子特征;关键超参数: Dropout 比率设为 0.2(防止过拟合,增强模型对新结构的泛化能力),批处理大小设为 32(平衡计算效率与梯度稳定性),并使用 Pearson R2 作为训练监控指标。(3)预测规则:模型训练完成后,神经网络权重被固定。对于新分子,其渗透性预测值(预测LogPapp)通过如下方式计算:渗透性预测值 = 输入分子的图特征经过多层图卷积与全连接层的非线性映射输出 × 归一化因子的逆变换。这一过程综合考虑了分子的极性表面积(TPSA)、分子大小(MW)及柔性(RotBonds)对穿膜能力的影响。
3. 预测结果的分类判定规则:模型直接输出的渗透性预测值为连续型浮点数(单位:log cm/s)。为便于成药性评估与决策,将预测值进一步转化为分类标记(对应表格列:渗透性分级),规则如下:若预测LogPapp > -4.7,标记为 “高 (High)”,提示该分子极易穿透细胞膜,口服吸收潜力高或易于进入靶组织;若预测LogPapp 在 [-5.2, -4.7] 范围内,标记为 “中 (Medium)”,提示分子跨膜能力尚可,可能需要辅以制剂技术或结构微调;若预测LogPapp < -5.2,标记为 “低 (Low)”,提示该分子难以穿透生物膜,存在较高的吸收障碍。

从行业价值来看,本次登记不仅意味着司太立的高价值研发数据资产获得了官方确权,也为生物医药行业研发数据的资产化、流通化探索了可行路径。未来,经过合规授权的医药研发数据集可在产业界、学术界之间高效流转,进一步打通产学研数据共享的壁垒,推动国内生物医药研发的数字化、智能化升级。

查看碘海醇结构的小分子渗透性预测评价数据

登记内容:

碘海醇结构的小分子渗透性预测评价数据登记证明

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们