five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

壹珈智晟用户自训练大模型平台完成上海官方数据知识产权登记 为大模型训练合规提供落地参考

五号数据雷达数据知识产权登记2026-05-15 08:5717
2026年5月14日,壹珈智晟(上海)科技有限公司旗下用户自训练大模型平台相关数据知识产权正式在上海市数据产品知识产权管理平台完成登记,该平台构建的全链路关联数据体系可支撑大模型微调、训练运维全流程的可追溯、可复现,为人工智能领域数据资产合规管理提供典型范本。

随着国内大模型产业进入规模化落地阶段,训练数据、模型衍生资产的知识产权确权、全链路可追溯成为行业合规发展的核心痛点。作为全国数据要素市场化配置改革的先行试点,上海市数据产品知识产权管理平台是承担全市数据资产知识产权存证、登记、流转服务的官方公共基础设施,旨在为各类市场主体的数据资产权益提供官方背书,降低数据要素流通交易的信任成本。

2026年5月14日,壹珈智晟(上海)科技有限公司旗下的用户自训练大模型平台相关数据知识产权正式在该平台完成登记,是国内为数不多的完成官方合规确权的大模型训练类数据资产。

本次完成登记的用户自训练大模型平台,围绕用户自主训练大模型的全业务流程搭建标准化数据结构,采用结构化数据与训练文件对象协同存储的创新模式,在底层存储中构建了覆盖用户信息、训练任务、数据集对象、模型配置、资源配置、训练过程、评估结果和版本归档的全链路关联数据体系。其中,结构化信息以关系型数据表形式存储,统一保存任务属性、训练参数、资源分配、状态流转及评估指标等核心字段;非结构化内容包括原始数据集文件、清洗样本文件、分词结果文件、LoRA权重文件、训练日志文件和模型快照文件等,以文件对象形式独立存储,并通过唯一标识字段与关系型主表实现精准关联。整个系统以训练任务表的task_id为核心主关键字段,关联用户、基座模型、训练数据集和资源配置等全维度信息,配套的数据集表、模型配置表、微调参数表、资源配置表、训练过程表、评估结果表和模型版本表分别对应存储各环节的专属数据,最终通过主键、外键、唯一索引、版本字段和时间戳字段维持各类数据对象之间的稳定映射关系,从技术层面保证所有训练任务可检索、可追踪、可复现,可全面满足数据上传、参数配置、资源调度、模型训练、效果评估和版本管理等全流程业务需求。

从产业应用价值来看,完成官方知识产权登记后的该平台数据资产,可广泛落地于大模型产业的多个核心场景:一是垂直领域大模型微调场景,企业在定制开发行业大模型时,可依托该平台的全链路存证能力明确训练数据、微调参数、衍生模型的知识产权归属,大幅降低合作开发、授权使用过程中的产权纠纷风险;二是大模型训练运维场景,对于提供MLOps(机器学习运维)服务的厂商而言,该平台的可追溯、可复现能力可有效缩短训练故障排查周期,提升模型迭代效率;三是大模型资产流通场景,经过官方登记的数据资产具备标准化的权益背书,可作为合规数据要素参与市场化流转,为训练服务采购、模型授权交易等场景提供可信的权益依据。查看用户自训练大模型平台

本次登记的落地,既验证了上海市数据产品知识产权管理平台对人工智能领域新型数据资产的适配能力,也为国内大模型相关企业的数据资产合规管理、确权登记提供了可复制的落地范本,对推动人工智能产业合规化发展、丰富数据要素市场的人工智能品类资产供给都具有积极的探索意义。

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们