five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江司太立制药碘佛醇小分子渗透性预测数据集完成知识产权登记 填补造影剂研发专属数据空白

五号数据雷达数据知识产权登记2026-05-21 04:3811
2026年5月20日,浙江司太立制药股份有限公司旗下碘佛醇结构的小分子渗透性预测评价数据正式完成浙江省数据知识产权登记平台登记。该数据集解决了通用ADMET预测工具对造影剂类分子渗透性预测精度不足的行业痛点,可应用于造影剂研发、图卷积神经网络算法训练等场景,为医药领域数据要素确权与流通提供了典型样本。

当前,全球创新药研发正步入数字化驱动的新阶段,高质量标注的研发数据已成为AI药物研发、制剂优化等环节的核心生产要素,而数据知识产权登记作为数据资产确权、流通、权益保护的核心前提,正成为医药产业释放数据价值的关键基础设施。作为国内率先落地的数据要素确权公共服务平台,浙江省数据知识产权登记平台主要承担数据资源的权属确认、存证公示、流通备案等职能,为数据资产后续的交易、授权、维权提供法定依据,目前已覆盖智能制造、生物医药等多个重点产业领域。2026年5月20日,浙江司太立制药股份有限公司提交的“碘佛醇结构的小分子渗透性预测评价数据”正式完成在该平台的登记,成为造影剂研发细分领域极具应用价值的专业确权数据集。

造影剂是医学影像诊断环节的核心耗材,其研发长期面临渗透性评估效率低下的行业痛点:由于造影剂普遍具有分子量大(通常500~1500 g/mol)、极性表面积高(TPSA普遍超过140 Ų)的理化特征,整体参数远超传统Lipinski五规则适用范围,通用ADMET预测工具对此类分子的渗透性预测精度严重不足。同时,现有公开Caco-2渗透性数据库对造影剂母核结构及其药典法定杂质的覆盖极为有限,研发团队在早期筛选阶段只能依赖耗时耗力的体外Caco-2细胞实验逐一评估,大幅拉长了造影剂研发周期、抬升了研发成本。

本次登记的碘佛醇结构小分子渗透性预测评价数据,正是针对上述行业痛点研发的专属训练数据集:该数据集以公开Caco-2渗透性数据集(caco2_wang.csv)为基础,专项补充纳入碘佛醇母核原料药及主要国家药典收载的法定杂质渗透性数据,构建面向该特定化学空间的专属训练数据集,基于图卷积神经网络(GCN)算法训练预测模型,可实现对碘佛醇结构域内候选分子渗透性的高精度预测。

该数据集的构建流程包含四大核心环节:一是数据收集与特征加工,在公开数据集基础上专项补充碘佛醇母核及各国药典收载的法定杂质(含脱碘降解产物、碘代苯环酰胺水解中间体等)的化合物名称、分子结构(SMILES字符串)与实验logPapp值,同时通过RDKit计算每条分子结构的分子量、脂水分配系数、极性表面积等七项理化参数作为核心字段;二是特征工程与模型构建,将SMILES转换为图结构数据作为输入,以logPapp实验值作为预测目标,按8:1:1划分训练/验证/测试集,基于多层图卷积层、图池化层构建专属预测模型,针对碘佛醇结构域三碘苯环刚性核心、多羟基侧链的特征单独训练模型权重,预测精度远高于通用模型;三是明确分类判定规则,根据预测LogPapp数值将渗透性分为高、中、低三档,匹配不同的研发决策路径;四是设置备注字段规则,依据分子的极性、分子量、亲水性特征标记渗透性受限的核心原因,直接为分子结构优化提供方向指引。

从应用价值来看,该预测评价数据可直接应用于三大场景:一是造影剂研发环节,可用于候选化合物虚拟筛选与结构优化、合成杂质渗透性风险评估及新药申报辅助支撑,大幅降低早期研发阶段的实验成本、缩短筛选周期;二是AI药物研发算法训练场景,其针对特定化学空间的标注数据,可用于优化图卷积神经网络在特殊结构药物分子预测领域的模型效果;三是产业协同场景,相关模型及数据可授权给其他医学影像、生物材料研发企业及CRO机构,实现研发数据的跨主体价值复用,填补现有通用数据集在造影剂专属结构域的预测空白。本次数据知识产权登记的完成,也为医药行业研发数据的确权流通提供了可参考的样本:以往药企的内部研发数据往往仅作为内部资产使用,通过数据知识产权登记明确权属后,高价值的研发数据可作为合规的数据要素进入流通市场,在实现资产变现的同时,也能减少行业内的重复实验投入,提升整个产业的研发效率。

查看碘佛醇结构的小分子渗透性预测评价数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们