近年来,随着生成式AI、大模型产业的高速发展,AI研发全流程产生的模型训练文件、权重参数、版本迭代记录等核心数字资产的权属认定、追溯管理、合规流通,已经成为制约产业规范化发展的共性痛点。作为国内数据要素市场化配置改革的先行试点城市,上海推出的上海市数据产品知识产权管理平台,是承担全市数据知识产权存证、登记、公示及流转支撑的官方公共服务载体,其出具的登记证明可作为数据资产权属认定、合规交易、权益保护的重要法定依据。
2026年5月22日,壹珈智晟(上海)科技有限公司旗下「模型训练部署文件版本管理数据库」正式在该平台完成数据知识产权登记,成为AI研发工具类数据资产登记的典型实践,可广泛应用于模型版本管理、模型仓库建设等核心领域。
据公开登记信息显示,本次完成登记的模型训练部署文件版本管理数据库,采用结构化索引信息与文件对象协同存储方式,在计算机存储介质中形成“文件主表—版本信息—存储位置—状态记录”的四层稳定组织结构。结构化信息存储于关系型数据表,用于保存模型标识、名称、类型、版本、来源、大小、格式、创建时间、更新时间及状态信息;模型权重文件、配置文件、词表文件和校验文件以文件对象形式存储,并通过唯一标识与主表关联。模型文件主表以model_file_id为主关键字段,属性为字符串型唯一标识,不可为空且不得重复。主要字段包括model_name,属性为字符型;model_type,属性为枚举型;version_no,属性为字符型;file_format,属性为字符型;file_size,属性为数值型;storage_path,属性为字符型;file_hash,属性为字符型;source_tag,属性为字符型;status,属性为枚举型;created_at和updated_at,属性为时间型。整体数据结构具备主键唯一、字段清晰、版本可追溯和存储关联稳定的特点,从数据底层解决了模型文件版本混淆、权属不清、追溯困难的行业痛点,为模型资产的全生命周期管理提供了标准化的数据支撑。
这套标准化的数据库结构可覆盖多个AI产业核心应用场景:在企业内部MLOps研发流程中,可实现模型从训练、测试到上线部署的全版本追溯,避免多团队协同研发时出现版本冲突、重复训练造成的算力资源浪费;在模型资产交易环节,可作为权属证明的核心存证依据,降低AI产品交易中的知识产权纠纷风险;在算法合规备案场景中,可提供模型迭代全链路的可信记录,满足监管部门对算法透明度、可追溯性的相关要求。
本次登记的完成,也为国内AI类新型数据资产的知识产权确权提供了可参考的实践路径。随着数据要素市场建设的不断推进,AI模型、训练数据集等新型数字资产的登记、流通规则正在逐步完善,这类标准化数据资产的登记实践,将进一步助力数字经济核心资产的规范化管理,推动AI产业的健康有序发展。





_1769672084863.jpg)