随着双碳战略的深入推进,节能环保产业进入数字化转型快车道,高质量、合规的产业训练数据已成为支撑绿色产业智能分析、精准决策的核心生产要素。而数据知识产权登记作为数据资产确权、合规流通的核心前置环节,是保障数据持有方权益、释放数据要素价值的重要基础。2026年5月26日,火石创造科技有限公司旗下节能环保产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成登记,是绿色产业垂直领域训练数据知识产权合规化的典型落地案例。
本次登记的数据集是专门面向节能环保产业链智能分类与产业图谱构建场景的人工智能模型训练语料,通过精准关联企业文本与产业标签,为政府、金融机构、产业主体的绿色发展决策提供标准化、高准确率的核心数据工具。
在数据加工前,运营方已对原始数据进行了严格的匿名化与去标识化处理,将原始企业名称统一替换为不可逆的规范标识符,彻底移除所有个人及商业敏感信息,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练、数据流通应用筑牢了合规底座。
本次数据处理严格遵循“体系先行、业务匹配、特征抽取”的核心逻辑,形成了覆盖全流程的标准化加工体系:首先是以国家绿色产业指导目录与行业通用标准为依据,预先构建了从“节能环保”一级节点到细分领域、具体业务类型的多级树状分类体系,确保分类逻辑清晰、类目互斥覆盖全面,为自动化处理提供了统一的结构化框架;其次采用“自动化规则匹配+人工专家校验”的双重质控策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的节能环保产业语义规则库自动推荐初步分类节点,再由具备产业背景的标注专家结合全文语境进行审核判定,确保每家企业的主营业务精准归入高效节能、资源循环、先进环保等对应产业链节点,标签准确率与业务一致性均达到产业级应用要求;最后同步完成核心特征抽取,从企业简介文本中系统性抽取代表其核心业务、技术方向的关键术语,经过去重、标准化处理后形成“正向词”特征串,作为分类标签的细粒度语义补充,为AI模型训练提供更丰富的学习维度。
最终形成的数据集为标准化的“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本、经人工校验的全层级分类标签(一级至三级节点、产业标签)以及业务特征词,全面覆盖高效节能、资源循环利用、先进环保等全产业链关键环节,可直接用于绿色产业链图谱构建、企业智能分类等模型的训练与评估。
从落地价值来看,本次登记的数据集可覆盖三大核心应用场景:一是支撑政府与园区的绿色产业规划与招商工作,可辅助绘制区域节能环保产业全景地图,精准识别当地在高效节能设备、固废资源化、低碳技术等细分领域的优势与短板,助力靶向招商与绿色产业集群培育,解决传统产业统计颗粒度粗、更新不及时的痛点;二是赋能绿色金融与赛道研究,为投资机构、研究机构提供标准化的企业业务标签,可对节能设备、环保工程、资源循环等细分赛道进行量化分析,有效降低“洗绿”风险,为绿色信贷、绿色投资的精准投放提供数据支撑;三是驱动绿色供应链构建与产业协同,可为龙头企业、产业平台提供绿色供应商智能寻源、技术合作伙伴匹配能力,助力区域内废弃物资源化供需对接、低碳协同解决方案落地,支撑产业链全链路的碳管理工作。
首页 / 数据知识产权登记 / 正文
火石创造节能环保产业链文本训练数据完成浙江数据知识产权登记 解锁三大绿色产业应用场景
五号数据雷达数据知识产权登记2026-05-27 06:503
2026年5月26日,火石创造科技有限公司旗下节能环保产业链结构文本训练数据正式完成浙江省数据知识产权登记平台登记,作为合规专用的AI训练语料,可支撑产业链智能分类、绿色产业分析等多场景应用,为绿色低碳领域的数据要素价值落地提供了标杆样本。

社区讨论
近期热门




_1769672084863.jpg)