作为数字经济大省,浙江近年来持续推进数据要素市场化配置改革,省级数据知识产权登记平台作为国内率先落地的省级数据知识产权公共服务载体,承担着数据存证、权属登记、公示公开等核心职能,为数据要素的确权、流通、交易及权益保护提供合规依据,是浙江数据要素市场建设的核心基础设施之一。2026年5月29日,火石创造科技有限公司旗下的都市农业产业链结构文本训练数据正式在该平台完成知识产权登记,标志着农业垂直领域的训练数据资产获得省级层面的合规权属认定。
本次登记的都市农业产业链结构文本训练数据,专门面向现代农业与都市农业产业链智能分类、产业图谱构建等AI模型的训练与开发需求设计,通过关联企业文本信息与种植品类标签,为农业产业全链路分析提供标准化的数据工具,其应用场景覆盖农业产业发展的多个核心环节:在特色农业产业规划领域,可辅助地方政府与农业主管部门分析区域内谷物、水果、蔬菜、食用菌等不同品类的种植布局、产业集聚度,以及“种植+观光”“种植+加工”等融合业态的发展情况,为制定精准农业扶持政策、培育特色农业产业集群提供数据支撑;在农产品供应链与市场研究领域,可赋能农产品流通企业、生鲜电商平台、食品加工企业精准识别特定品类的规模化种植基地、初加工企业及具备生态观光属性的休闲农业主体,优化采购链路与合作伙伴选择,降低供应链寻源成本,提升产销匹配效率。除此之外,该数据集未来还可拓展应用于农业精准招商、农旅融合项目评估、智慧农业模型训练等多个涉农数字化场景。
为保障数据安全合规,本次登记的数据集在加工前已完成严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》及农业农村部涉农数据安全管理的相关要求,为后续模型训练提供了洁净、可靠的输入基础。
在数据处理环节,本次数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了一套覆盖分类框架构建到标签生成的全流程标准化处理体系:1. 分类框架搭建:团队依据国家现代农业产业分类标准,结合都市农业“生产+生活+生态”的三重属性,预先定义了以“都市农业”为一级节点、“种植农业”为核心二级节点,向下细化为“谷物种植”“水果种植”“蔬菜种植”“油料种植”“食用菌种植”“花卉种植”及设施农业下的“精准农业”等具体类目的三级树状分类体系,为数据加工提供了专业、统一的标准框架;2. 业务匹配:采用“自动化规则匹配+人工校验”的人机协同策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的涵盖“水稻”“有机蔬菜”“生态观光”“智能农业”“精深加工”等术语的现代农业语义规则库,自动计算并推荐初步分类节点,再由具备农业领域专业背景的标注专家进行审核判定,确保所有经营主体被归入最贴合的种植品类与经营业态节点;3. 特征抽取:在完成业务匹配的同时,从企业简介文本中系统性抽取代表其种植品类、技术应用、经营模式及产业链环节的关键术语与名词性短语,经过去重、标准化格式化后组合成“正向词”特征串,作为对分类标签的细粒度、多维度语义补充。
加工完成后的数据集为结构化“文本-标签”格式,每条数据均包含脱敏后的企业描述文本、经人工校验的一至三级完整分类标签、精准的业务特征词及产业标签,全面覆盖从传统谷物种植到高附加值果蔬、食用菌种植,以及融合观光旅游、精深加工、智能管理的各类现代都市农业经营主体,是一套分类体系专业、特征刻画深入、可直接用于现代农业企业分类、特色产业分析、农旅融合业态研究等模型训练与评估的高质量专用数据集。
本次数据集完成省级数据知识产权登记,是农业垂直领域数据要素合规化开发利用的典型实践,一方面为涉农数据的权属认定、资产化管理提供了可复制的样本,另一方面也丰富了都市农业领域专用训练数据的供给储备,随着后续这类合规农业数据的有序流通,将进一步推动AI技术在农业场景的落地应用,为智慧农业建设、农业产业大脑迭代、数字乡村发展提供核心数据支撑,助力农业现代化转型与数字经济在涉农领域的深度渗透。





_1769672084863.jpg)