five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成保健食品产业链结构文本训练数据知识产权登记 可支撑多场景产业数字化应用

五号数据雷达数据知识产权登记2026-05-24 04:075
2026年5月22日,火石创造旗下保健食品产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规结构化数据集可服务于产业监管、市场分析、供应链对接等多个健康产业数字化场景,为国内大健康领域数据要素的确权流通提供了典型实践样本。

作为全国数据要素市场化配置改革的先行试点省份,浙江近年来持续推进数据知识产权登记制度的落地,浙江省数据知识产权登记平台作为省级官方确权基础设施,承担着数据资产存证、权益界定、流通赋能的核心职能,已覆盖多个细分产业的数据资产登记需求。2026年5月22日,国内产业大数据服务商火石创造科技有限公司旗下的保健食品产业链结构文本训练数据,正式在该平台完成数据知识产权登记,成为国内大健康领域少数完成合规确权的人工智能专用训练数据集。

作为大健康产业的核心消费赛道,我国保健食品产业近年来保持稳定增长,同时监管体系持续完善,产业端、监管端、投资端对产业链精准数据的需求持续攀升。但长期以来,保健食品相关数据分散在企业公开信息、监管备案文件、市场研究报告等多元渠道,非结构化、标准不统一、敏感信息混杂的问题突出,难以直接用于智能化分析场景,本次登记的训练数据集正是瞄准这一行业痛点开发的核心数据资产。

据介绍,该数据集核心服务于保健食品产业链智能分类与产业图谱构建,通过精准关联企业文本与产品标签,为健康产业发展提供标准化的核心数据工具,其潜在应用场景覆盖产业全链路:在产业规划与监管支撑领域,可辅助监管部门与产业园区快速摸清区域产业底数、掌握辖区企业的产品矩阵与原料布局,为行业规划编制、重点企业培育、合规性监管排查等工作提供数据依据;在市场分析与投资洞察领域,可为投资机构、行业研究方提供统一的标准化分类标签,支持对增强免疫力、维生素矿物质、改善记忆、缓解视疲劳等数十个细分产品赛道开展竞争格局梳理、创新趋势研判等研究;在供应链优化与精准对接领域,可赋能原料供应商、品牌方、渠道平台等市场主体,实现原料供需匹配、新产品合作开发的智能对接,大幅降低产业协同的信息成本。

本次登记的数据集在开发全流程严格遵循合规要求与专业标准:
一、加工前数据说明
本数据集旨在构建服务于保健食品产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,完全符合《数据安全法》《个人信息保护法》等法律法规要求,为模型训练提供了合规的输入基础。
二、数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:1.分类体系构建:首先参考国家保健食品法规与官方产业分类标准,预先定义了以“保健食品”为一级节点,下设“增强免疫力类”“维生素、矿物质类”等核心功能类别的二级节点,并进一步细分为“名贵动植物保健品”“纯维生素补充剂”等具体产品形态的三级分类体系,确保分类结果与监管要求、市场认知保持高度一致,为自动化处理提供了结构化框架。2.业务匹配:采用 “自动化规则匹配与人工校验相结合” 的策略,首先依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的涵盖功能声称、原料、剂型等维度的保健食品产业语义规则库,自动计算并推荐初步的分类节点;随后由具备产业背景的标注专家对系统推荐结果进行全文语境审核与最终判定,确保每家企业的主营产品被精准归入最贴切的分类节点,保障了标签的业务一致性与准确性。3.特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品、原料、技术及资质的关键术语与名词性短语(如:GMP认证、动植物提取、维生素、全产业链),经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的细粒度语义补充,为模型提供更丰富的学习信息。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据,每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一级至三级节点、产业标签)与业务特征词(正向词)。数据内容全面覆盖增强免疫力、维生素矿物质补充、缓解视疲劳等主流保健食品功能类别,形成了一个分类体系清晰、标注一致性高、特征明确的专用数据集,可直接用于保健食品产业链图谱构建、企业智能分类及产品创新分析等模型的训练与评估。

业内人士指出,本次保健食品训练数据的成功登记,不仅是企业数据资产化的重要实践,也为国内大健康领域细分赛道的训练数据确权、合规流通提供了可复制的参考样本,对于推动数据要素在生物医药、健康消费等领域的落地应用具有积极的示范意义。

查看保健食品产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们