在双碳目标驱动建筑行业绿色转型、数据要素市场化配置加速推进的行业背景下,被动式超低能耗建筑作为近零能耗建筑的核心品类,其产业链的数字化、智能化分析需求持续攀升。作为浙江省推进数据要素权益保护的核心基础设施,浙江省数据知识产权登记平台承担着数据知识产权存证、公示、权益确认的公共服务职能,为合规数据资产的交易流通、创新应用提供官方公信力支撑。2026年5月22日,火石创造科技有限公司旗下的被动式超低能耗建筑产业链结构文本训练数据,正式在该平台完成知识产权登记,成为国内建筑节能领域少数完成官方合规登记的专用AI训练数据集。
本次登记的数据集,核心定位是服务于被动式超低能耗建筑产业链智能分类与产业图谱构建模型的训练与开发,可覆盖绿建产业链上下游多个核心应用场景:在政府与园区的绿色建材产业招商与规划环节,该数据集训练出的产业分析模型可辅助地方精准识别和聚集高性能防水、保温、功能性涂料等关键材料供应商,为绿建产业集群的补链强链、精准招商提供数据支撑;在建筑企业、总包方的供应链管理与协同环节,可赋能采购平台实现绿色建材供应商的智能寻源与资质评估,在提升供应链匹配效率的同时,保障绿建项目用材的合规性与节能指标达标;在建筑评估与认证环节,可为绿色建筑认证机构、设计院提供标准化的材料企业标签库,辅助评估团队快速核验建筑项目的材料选用是否符合被动式超低能耗建筑的性能要求,降低人工核验成本。
为保障数据的合规性与专业性,该数据集在全流程加工环节建立了严格的标准规范。加工前,所有原始数据已完成严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为AI模型训练提供了合规的输入基础。
在数据处理环节,团队严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了全流程标准化的加工链路:首先基于国家及行业层面的绿色建筑与节能材料标准,预先搭建了四级树状分类体系,一级节点为“被动式超低能耗建筑”,二级节点为“绿色建筑功能材料”,三级节点细分为“防水密封材料”“保温绝热材料”“新型装饰装修材料”,四级节点对应各细分品类的具体产品类型,为自动化处理提供了结构化的标准框架;其次采用“自动化规则匹配+人工校验”的双重校验策略,依托Spark大数据处理框架对企业简介文本进行分布式清洗、分词,通过预构建的绿色建材产业语义规则库(覆盖各类材料关键词、性能指标等)自动推荐初步分类节点,再由具备绿建产业知识背景的标注专家对系统推荐结果进行全文语境审核与最终判定,确保每家企业被精准归入最贴合的材料品类节点;在完成分类匹配的同时,技术团队还会从企业简介文本中系统性抽取代表其核心产品、技术特性与应用场景的关键术语,经去重、标准化格式化后组合成“正向词”特征串,为模型提供细粒度的语义标注信息。
加工完成后的数据集为结构化的“文本-标签”对格式,每条数据均包含脱敏处理后的原始企业描述文本,以及经人工校验的四级分类标签、产业标签与业务特征词,内容全面覆盖防水、保温、涂料等绿色建筑核心材料领域,分类体系清晰、标注一致性高,可直接用于绿色建材供应链图谱构建、企业智能分类等AI模型的训练与评估。
本次数据知识产权登记的完成,既从官方层面确认了数据集的知识产权归属,保障了研发方的合法权益,也为建筑节能领域专用训练数据的合规登记、市场化流通提供了可复制的参考样本。随着后续这类合规产业数据集的有序开放与流通,将进一步推动绿建领域的数字化转型,为数据要素在实体经济领域的价值落地提供典型示范。





_1769672084863.jpg)