当前我国数据要素市场化配置改革进入落地攻坚期,数据知识产权登记作为明确数据权属、保障数据权益、规范数据流通的核心前置环节,已成为各区域释放数据价值、推进数字经济发展的重要基础制度安排。作为国内省级数据要素制度探索的先行公共服务载体,浙江省数据知识产权登记平台承担着数据资源合规存证、权属公示、流通赋能的核心职能,为各类市场主体的数据资产化、市场化应用提供官方公信力背书。
2026年5月29日,火石创造科技有限公司旗下的日用轻工产业链结构文本训练数据正式在该平台完成知识产权登记。据介绍,本次登记的数据集核心定位为日用轻工产业链智能分析类AI模型的专用训练语料,通过关联脱敏后的企业文本信息与多层级细分产业标签,为政产学研多类主体的日用轻工产业数字化应用提供标准化数据工具,目前已明确可支撑三大核心应用方向:
一是产业链全景分析,可辅助政府及产业规划部门绘制日用轻工产业链中食品工业(谷物加工、油脂加工、乳制品、饲料、果蔬加工等)细分赛道的企业地图,精准识别区域产业结构、优势环节与短板缺口,为产业招商、强链补链、集群培育提供数据支撑;二是市场研究与投资决策,可帮助投资机构、行业研究机构梳理休闲食品、食品添加剂、宠物食品等不同食品子行业的企业分布、技术路线与市场集中度,洞察消费升级、健康饮食趋势下的细分赛道投资机遇;三是供应链优化与合规监管,既可赋能大型食品企业、连锁零售平台精准匹配上游原料供应商,搭建智能寻源体系降低采购成本,也可支持市场监管部门动态分析辖区食品生产企业的合规情况与产品质量水平,提升监管精准度,防范食品安全风险。
为保障数据的合规性与可用性,该数据集在生产全流程建立了严格的规范体系:
一、加工前数据说明
本数据集旨在构建用于日用轻工产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,完全符合《数据安全法》《个人信息保护法》等法律法规要求,为模型训练提供了洁净、可靠的输入基础。
二、数据处理规则
数据处理严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:
体系先行:首先,参考国家《国民经济行业分类》与食品工业相关标准,预先定义了以“日用轻工”为一级节点,下设“快速消费品领域”为二级节点,再细分为“食品工业”为三级节点,并进一步划分为“食品制造业”与“农副食品加工业”为四级节点,以及“动物饲料”、“乳制品加工”、“谷物加工”、“食用油及乳制品”、“果蔬加工”、“休闲食品”、“食品添加剂”等具体产品品类为五级节点。该树状分类体系与国标完全对齐,为数据加工提供了专业、清晰、通用性强的产业框架。
业务匹配:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的食品工业语义规则库自动计算并推荐初步分类节点。随后,由具备食品行业专业知识的标注专家进行审核与最终判定,确保企业被归入最贴切的产业节点,保障分类结果的专业准确性。
特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品与技术的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的语义补充,进一步提升数据集的应用价值。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至五级节点)、细粒度的业务特征词(正向词)与多层次的产业标签。数据内容全面覆盖了日用轻工产业链中食品工业的谷物加工、油脂加工、乳制品制造、饲料生产、果蔬加工、食品添加剂、休闲食品等多个细分领域,形成了一个分类体系专业、特征标注精准、可直接用于产业链分析、企业分类与供应商寻源等模型训练与评估的高质量专用数据集。
业内分析认为,本次登记不仅标志着该数据集的知识产权权属获得官方认可,也为产业类训练数据的合规生产、登记、流通提供了可复制的参考样本,对于推进消费品领域的数据要素落地应用、支撑传统轻工产业的数字化转型具有重要的示范意义。
首页 / 数据知识产权登记 / 正文
火石创造日用轻工产业链训练数据完成浙江数据知识产权登记 可支撑食品产业多场景数字化应用
五号数据雷达数据知识产权登记2026-05-30 08:506
2026年5月29日,火石创造科技有限公司旗下日用轻工产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该合规脱敏的结构化训练数据集可覆盖产业链分析、投资决策、供应链优化等多类产业场景,为消费品领域数据要素落地应用提供标准化支撑。

社区讨论
近期热门




_1769672084863.jpg)