随着全国数据要素市场化配置改革持续深化,数据知识产权登记作为明确数据权属、保障数据资产合规流通的核心基础制度,正在向高端制造、生物医药等细分领域快速落地。作为国内数字经济创新发展试验区,浙江率先搭建的数据知识产权登记平台,为省内市场主体的数据资产提供具有公信力的权属证明、价值存证服务,有效破解了长期以来产业级训练数据“权属不清、流通不畅”的行业痛点。
2026年5月9日,临海市产业大脑有限公司旗下的消化系统药物原料药工艺匹配与杂质控制训练数据,正式在该平台完成知识产权登记。作为国内重要的化学原料药生产集聚区,临海市在消化系统药物、特色原料药等领域拥有深厚的产业积累,本次登记的训练数据集正是针对当地原料药生产企业普遍面临的合成工艺管控精度不足、杂质生成率高、环保排放压力大等共性痛点研发,可直接适配消化系统药物原料药化学结构敏感、易降解、工艺管控要求高、环保标准严格的规模化连续生产需求。
据介绍,本次登记的数据应用于消化系统药物原料药合成工段,重点用于尾气排放全过程管控与关键工艺参数协同控制,通过实时监测反应尾气浓度、组分波动与排放速率,联动调节反应温度、压力、加料速率及 pH 等核心工艺参数,优化反应路径与工艺匹配度,从源头削减挥发性有机物、酸性气体等特征尾气产生量,同时有效抑制副反应发生与杂质生成,避免易降解药物原料药在合成、中转及精制环节出现降解、氧化或异构化变质,稳定保障原料药关键质量属性与成品合格率。
该训练数据集对应的AI管控模型采用决策树与规则引擎组合架构,适配消化系统药物原料药合成的工艺匹配性特点,能够精准捕捉工艺参数与药物原料药稳定性、杂质含量的关联规律,实现工艺匹配与杂质控制的精准管控。模型超参数设置为学习率0.0002,批量大小32,迭代次数850,使用梯度下降优化器,该参数设置重点强化工艺稳定性与杂质控制精度,适配消化系药物原料药合成中易降解、工艺匹配要求高的特点,确保模型能够精准调控工艺参数。
其算法逻辑覆盖四大环节:1. 训练数据预处理:对采集的生产训练数据进行清洗、去重、异常值剔除,对缺失值采用线性插值法补充,对工艺参数训练数据进行标准化处理,确保训练数据质量;2. 特征提取:选取实时反应温度、物料粘度、工艺参数偏差值、杂质含量等10个核心特征,构建特征矩阵,重点突出工艺匹配参数(消化系药专属特征)与产品质量的关联关系;3. 模型训练:以工艺匹配参数、实时产品纯度为目标变量,训练决策树与规则引擎组合模型,优化模型参数,提升工艺匹配与杂质管控精度;4. 模型应用:将实时采集的合成反应训练数据输入训练好的模型,输出工艺参数调整建议,优化工艺匹配度,抑制杂质生成,保障药物原料药稳定性。
目前该模型已采用独立生产测试集开展全方位性能评估,核算核心指标,同步对接车间合成场景开展落地验证,确保模型在工艺匹配、杂质管控环节稳定运行,最终形成企业完全自主可控、无权属争议的专属AI模型资产包。
行业分析人士指出,本次登记不仅为企业自身的AI工艺管控应用提供了权属保障,未来也可在合规前提下向产业链上下游开放共享,应用于同类消化系统药物研发阶段的工艺参数预演、药企环保合规性智能审核、区域医药产业集群工艺能效对标等场景,为中小药企降低数字化改造成本,也为医药制造领域的数据资产确权、流通交易提供了可复制的实践样本。





_1769672084863.jpg)