five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

配方智能体训练数据加工数据集完成上海官方知识产权登记 赋能智能配方研发等场景

五号数据雷达数据知识产权登记2026-05-24 07:476
2026年5月22日,壹珈智晟(上海)科技有限公司旗下配方智能体训练数据加工数据集正式在上海市数据产品知识产权管理平台完成登记,该权属清晰、可溯源的训练类数据产品,可应用于智能配方生成、训练数据全生命周期管理等场景,为垂直领域AI研发数据合规流通提供了典型参考。

当前,AI大模型向垂直产业场景落地进程加速,训练数据作为AI产业的核心生产要素,其知识产权确权、合规流通已经成为制约化工、食品、生物医药等领域研发类AI落地的核心痛点。作为上海落实国家数据要素市场化配置改革要求打造的官方基础设施,上海市数据产品知识产权管理平台主要面向市场主体提供数据产品的知识产权存证、登记、公示等服务,通过官方登记的数据产品可获得明确的权益凭证,为后续的流通交易、权益保护提供合规依据。2026年5月22日,壹珈智晟(上海)科技有限公司旗下配方智能体训练数据加工数据集产品正式在该平台完成数据知识产权登记,成为配方研发垂直赛道为数不多完成官方合规确权的训练类数据产品。

据了解,本次完成登记的配方智能体训练数据加工数据集,采用结构化索引信息与样本文件协同存储方式,在计算机存储介质中形成数据集主表、样本明细表、标签信息表、任务来源表和日志表相互关联的完整数据结构。结构化信息存储于关系型数据表,用于保存数据集名称、样本类型、标签类别、来源任务、版本编号、处理状态和更新时间;原始文本文件、标注文件、样本切分文件和索引文件以文本对象或文件对象形式存储,并通过唯一标识与主表关联。数据集主表以dataset_id为主关键字段,属性为字符串型唯一标识,不可为空且不得重复。主要字段包括dataset_name,属性为字符型;sample_type,属性为字符型;label_tag,属性为字符型;task_id,属性为字符型;file_path,属性为字符型;sample_count,属性为数值型;process_status,属性为枚举型;version_no,属性为字符型;created_at和updated_at,属性为时间型。任务来源表和日志表分别保存任务批次、校验状态和更新时间等信息。整体数据结构具备字段清晰、版本可追溯、来源明确和样本关联稳定的特点。

从应用价值来看,该具备标准化结构、全链路溯源能力的训练数据集,可广泛覆盖多类垂直产业研发场景:在精细化工领域,可用于训练配方优化AI智能体,缩短特种材料、日化产品的配方研发周期,降低实验室试错成本;在食品饮料行业,可支撑风味配方、营养配比的AI快速生成,满足新消费市场下产品快速迭代的研发需求;在生物医药领域,可辅助试剂配比、药物组分的智能研发,提升临床前研发效率。此外,该数据集规范的全链路溯源结构,也可为AI训练数据的全生命周期管理提供标准化参考,解决当前行业普遍存在的训练数据来源不清、版本混乱、权属不明等痛点,降低AI企业的训练数据合规风险。

查看配方智能体训练数据加工数据集产品

登记内容:

本次登记也为垂直行业训练类数据产品的合规化提供了可复制的样本。随着我国数据要素市场建设持续推进,训练数据的知识产权确权已经成为AI产业健康发展的核心基础,更多垂直领域训练数据集通过官方登记,将进一步打通数据流通交易的合规路径,为数字经济与实体经济深度融合提供支撑。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们