近年来,随着国内预制菜产业规模持续扩容,产业分类标准不统一、供应链匹配效率低、垂直领域数字化工具供给不足等痛点逐步凸显,高质量结构化产业数据已成为破解上述痛点的核心基础。与此同时,随着我国数据要素市场化配置改革持续推进,垂直行业训练数据的知识产权确权、合规流通也成为产业数字化领域的核心关注方向。作为国内率先落地的省级数据知识产权官方登记载体,浙江省数据知识产权登记平台承担着数据资源合规存证、权属确认、流通赋能的核心职能,其出具的登记证明可为数据资产估值、流通交易、权益保护提供官方依据。
2026年5月27日,火石创造科技有限公司旗下的预制菜产业链结构文本训练数据,正式在该平台完成数据知识产权登记,这也意味着该数据集的知识产权归属得到官方公示认可,具备了合规商用、授权流通的基础条件。据介绍,本次登记的预制菜产业链结构文本训练数据,核心定位是为预制菜产业链智能分类、产业图谱构建类AI模型的训练开发提供高质量标注语料,目前已全面覆盖预制菜生产领域的核心品类,可直接用于预制菜产业结构分析、细分品类企业识别、食品供应链寻源等多类模型的训练与评估。
为保障数据合规性与质量,该数据集在生产全流程建立了严格的规范:加工前所有数据已完成严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合隐私保护与数据安全合规要求,为模型训练提供了洁净、可靠的输入基础。数据处理环节严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了完整的标准化生产流程:首先依据国家食品生产许可分类目录及预制菜产业相关标准,搭建了从一级节点“预制菜”到四级节点具体品类的四层树状分类体系,为数据加工提供了清晰的产品分类框架;随后采用“自动化规则匹配与人工校验相结合”的策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的食品产业语义规则库自动推荐初步分类节点,再由具备食品行业专业背景的标注专家进行审核与最终判定,确保企业被精准归入对应的细分品类节点;在完成业务匹配的同时,同步从企业简介文本中系统性抽取代表其核心产品与技术的关键术语,经过去重与标准化格式化后组合成“正向词”特征串,作为对分类标签的语义补充。
最终加工完成的数据集为结构化“文本-标签”格式,每条数据均包含脱敏后的企业描述文本,以及经人工校验的完整四级分类标签、高度细化的产品特征词与产业标签,可适配多类产业数字化应用需求:在产业结构分析场景,可辅助地方政府、产业研究机构梳理区域预制菜细分品类的企业分布、产业集聚特征,为产业扶持政策制定、园区招商定位、区域产业规划提供数据支撑;在供应链与采购寻源场景,可赋能食品流通企业、商超采购、餐饮连锁品牌以及预制菜品牌企业,精准匹配不同细分品类的优质生产厂家,大幅缩短供应商筛选周期,降低采购成本,同时也可为食安应急溯源提供企业分布数据参考;在细分赛道市场研究场景,可支持投资机构、行业分析师快速洞察不同预制菜细分赛道的竞争格局、企业规模分布与增长趋势,挖掘潜在的隐形冠军企业,提升行业研究与投资决策效率。
本次预制菜垂直领域训练数据完成知识产权登记,是数据要素市场化改革在食品消费领域的一次重要落地实践。当前大模型在垂直产业的落地应用普遍面临高质量标注数据稀缺、数据权属不清晰、流通合规性不足等问题,该数据集的成功登记,不仅为预制菜产业数字化提供了合规可用的核心数据资产,也为其他垂直行业训练数据的确权、流通、商业化探索提供了可参考的样本,对推动食品产业数字化转型、完善数据要素市场的垂直领域应用体系具有积极作用。
首页 / 数据知识产权登记 / 正文
预制菜产业链结构文本训练数据完成浙江省数据知识产权登记 多场景赋能食品产业数字化
五号数据雷达数据知识产权登记2026-05-28 05:093
2026年5月27日,火石创造科技有限公司旗下预制菜产业链结构文本训练数据正式完成浙江省数据知识产权登记,该数据集可支撑预制菜产业分析、供应链寻源、赛道研究等多类应用,是数据要素市场化改革在食品垂直领域的重要落地实践。

社区讨论
近期热门




_1769672084863.jpg)