five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江司太立钆贝葡胺小分子渗透性预测数据完成知识产权登记 填补造影剂研发数据空白

五号数据雷达数据知识产权登记2026-04-29 02:418
2026年4月28日,浙江司太立制药股份有限公司旗下钆贝葡胺结构小分子渗透性预测评价数据正式在浙江省数据知识产权登记平台完成登记,该数据解决了通用ADMET工具对造影剂类分子渗透性预测精度不足的行业痛点,可应用于造影剂研发、图神经网络虚拟筛选等场景,为医药领域数据要素确权流通提供了典型样本。

当前数据要素作为新型生产要素,在医药研发领域的价值正在加速释放,数据知识产权登记是明确数据权属、保障数据要素合规流通、激发市场主体数据创新活力的核心基础环节。作为全国数据要素市场化配置改革先行区,浙江省搭建的数据知识产权登记平台已为多领域创新主体提供了规范的确权服务,此次医药研发专属数据集的落地,是该平台在生物医药细分场景的重要探索。

2026年4月28日,浙江司太立制药股份有限公司本次登记的数据知识产权钆贝葡胺结构的小分子渗透性预测评价数据,造影剂作为支撑CT、核磁共振等医学影像诊断的核心刚需耗材,临床需求持续攀升,但其研发门槛长期居高不下:因分子量大(通常500~1500 g/mol)、极性表面积高(TPSA普遍超过140 Ų),整体理化性质处于"类药性边界"区域,远超传统Lipinski五规则适用范围,通用ADMET预测工具对此类分子的渗透性预测精度严重不足。细胞膜渗透性是限制造影剂口服吸收及组织分布的关键瓶颈,然而现有公开Caco-2渗透性数据库对造影剂母核结构及其药典法定杂质的覆盖极为有限,导致研发团队在早期候选物筛选阶段缺乏可靠的渗透性预测依据,只能依赖耗时耗力的体外Caco-2细胞实验逐一评估,大幅拉长了造影剂研发周期、抬高了研发投入成本。

本数据集以公开Caco-2渗透性数据集(caco2_wang.csv)为基础,专项补充纳入钆贝葡胺母核原料药及主要国家药典收载的法定杂质渗透性数据,构建面向该特定化学空间的专属训练数据集,训练图卷积神经网络(GCN)预测模型,实现对钆贝葡胺结构域内候选分子渗透性的高精度预测。所产生的预测评价数据可直接用于候选化合物高通量虚拟筛选、先导化合物结构优化、合成杂质渗透性风险评估及新药申报渗透性评估的辅助支撑,填补了现有通用数据集在造影剂专属结构域预测能力上的空白,相关模型及预测数据也可授权给其他医学影像或生物材料企业合规使用,为医药研发领域的数据要素价值变现、跨主体共享提供了可复制的路径。

1、加工前的数据说明
以公开Caco-2渗透性数据集(caco2_wang.csv)为基础训练数据,补充纳入钆贝葡胺母核原料药及主要国家药典收载的法定杂质渗透性数据,共同构成本数据集训练集。原始数据包含化合物名称及SMILES分子结构字符串,均来源于公开数据库及药典文献,不涉及个人数据,无需匿名化或去标识化处理。

2、处理规则:对每条记录的SMILES字符串,通过RDKit模块计算MW(相对分子量)、LogP(脂水分配系数对数值)、TPSA(拓扑极性表面积)、HBD(氢键供体数)、HBA(氢键受体数)、RotBonds(可旋转键数)、QED(定量类药性评分)七项理化参数。以ConvMolFeaturizer将SMILES转换为图结构输入特征,以logPapp值(归一化处理)为预测目标,训练图卷积神经网络(GCN)模型,输出预测LogPapp。依据阈值规则生成渗透性分级(>−4.7为高,[−5.2,−4.7]为中,<−5.2为低)。依据TPSA≥140 Ų标记"高极性"、MW≥800 g/mol标记"大分子"、LogP≤−3标记"强亲水"的多条件规则自动生成备注字段,不满足标记的条件不再备注,上述条件全部不满足则标记"性质适中",多条件同时满足时以";"分隔组合标记。

3、数据内容描述:模型直接输出的渗透性预测值为连续型浮点数(单位:log cm/s)。为便于成药性评估与决策,将预测值进一步转化为分类标记(对应表格列:渗透性分级),规则如下:若预测LogPapp > -4.7,标记为 “高 (High)”,提示该分子极易穿透细胞膜,口服吸收潜力高或易于进入靶组织;若预测LogPapp 在 [-5.2, -4.7] 范围内,标记为 “中 (Medium)”,提示分子跨膜能力尚可,可能需要辅以制剂技术或结构微调;若预测LogPapp < -5.2,标记为 “低 (Low)”,提示该分子难以穿透生物膜,存在较高的吸收障碍。

查看钆贝葡胺结构的小分子渗透性预测评价数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们