随着我国数据要素市场化配置改革持续深化,数据知识产权登记作为明确数据权属、保障数据主体合法权益、推动数据合规流通的核心基础环节,正在各产业领域加速落地。作为浙江省官方打造的公共服务平台,浙江省数据知识产权登记平台承担着数据资源确权公示、流通溯源、合规校验等核心职能,为当地数据要素市场规范化发展提供重要支撑。2026年5月27日,火石创造科技有限公司旗下云计算产业链结构文本训练数据正式在该平台完成知识产权登记,为云计算产业专用数据的合规流通奠定了权属基础。
本次登记的云计算产业链结构文本训练数据,主要服务于云计算产业智能分类与垂直行业应用图谱构建模型的训练与开发,通过关联企业文本与行业应用标签,为云计算产业发展分析提供核心数据工具,可广泛应用于三大核心场景:
一是垂直行业应用分析:辅助政府与产业研究机构,绘制云计算在医疗、教育、制造、能源、电商、数字媒体等领域的应用企业地图,识别重点行业的技术服务能力与市场格局,为地方云计算产业招商、政策制定提供数据支撑;
二是投资与市场研究:帮助投资机构与行业分析师,洞察云计算在不同垂直赛道(如智慧医疗、智能制造、数字文创)的竞争态势、技术创新热点与成长潜力,降低产业研究的信息差成本;
三是生态合作与供需对接:赋能云服务提供商、系统集成商及行业客户,精准匹配具备特定行业解决方案能力的合作伙伴,构建高效的产业生态,提升云计算技术与实体产业的融合效率。
一、加工前数据说明
本数据集旨在构建用于云计算产业智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,完全符合《数据安全法》《个人信息保护法》等法律法规关于隐私保护与安全合规的要求,为模型训练提供了洁净、可靠的输入基础。
二、数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:
1.分类体系构建:首先,依据云计算产业服务模式与行业应用场景,预先定义了从“云计算”(一级节点)出发,按服务形态划分为“云服务”(二级节点),再细分为“服务”(三级节点),并进一步按垂直行业划分为“行业垂直类”(四级节点)及具体的行业应用方向(五级节点,如“智慧医疗”、“电子商务”、“智慧制造”等)的树状分类体系,为数据加工提供了清晰的产业应用逻辑框架。
2.业务匹配:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的云计算产业语义规则库自动计算并推荐初步的行业应用节点。随后,由具备产业知识的标注专家进行审核与最终判定,确保企业被精准归入对应的垂直行业应用类别。
3.特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品与技术的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,作为对分类标签的语义补充,为后续模型训练提供更丰富的特征维度。这套流程确保了数据集的分类准确性与行业适配性,为后续AI模型训练的效果提供了基础保障。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至五级节点)、高度细化的业务特征词(正向词)与产业标签。数据内容全面覆盖了云计算在智慧医疗、电子商务、智慧制造、数字媒体、能源、教育、金融等多个垂直行业的典型应用企业,形成了一个分类体系专业、行业指向明确、特征粒度丰富、可直接用于云计算产业图谱构建、垂直行业应用分析、服务商能力评估等模型训练与评估的高质量专用数据集,可大幅降低云计算产业相关AI模型的训练成本,提升模型的行业适配精度。
当前,人工智能产业的高速发展对高质量、合规的训练数据需求持续攀升,而数据知识产权权属不清晰一直是制约训练数据要素流通的核心瓶颈之一。本次云计算产业链结构文本训练数据完成浙江省官方登记,不仅为该数据集的后续商业化应用、跨主体流通提供了明确的权属凭证,也为国内产业垂直领域训练数据的确权、登记、流通全流程提供了可借鉴的操作范式,对推动我国数据要素市场尤其是AI训练数据细分领域的规范化发展具有积极意义。
首页 / 数据知识产权登记 / 正文
浙江省完成云计算产业链结构文本训练数据知识产权登记 覆盖多垂直行业应用场景
五号数据雷达数据知识产权登记2026-05-28 04:532
2026年5月27日,火石创造科技有限公司旗下云计算产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,该数据集可应用于云计算产业图谱构建、垂直行业应用分类等领域,为产业类训练数据的合规流通与落地应用提供了实践样本。

社区讨论
近期热门




_1769672084863.jpg)