当前,边缘计算作为支撑“云-边-端”协同算力体系的核心产业,已成为各地数字基建布局、科创投资的热门赛道,但其产业链条长、细分领域多、企业分类边界模糊等问题,长期制约着产业分析效率与相关AI模型的训练效果。与此同时,随着我国数据要素市场化建设持续推进,数据知识产权登记已成为数据资产合规确权、流通交易的核心前置环节,为数据资源的商业化应用、权益保护提供官方公信力背书。
2026年5月27日,火石创造科技有限公司申报的边缘计算产业链结构文本训练数据正式完成浙江省数据知识产权登记。作为浙江省官方打造的公共服务平台,浙江省数据知识产权登记平台承担着数据知识产权存证、确权、公示、流转服务等核心职能,是区域数据要素市场规范化建设的核心基础设施,本次登记也意味着该数据集的合规性、独创性得到官方认可。
据介绍,本次登记的边缘计算产业链结构文本训练数据,核心服务于边缘计算产业链智能分类与产业图谱构建模型的训练与开发,通过关联企业文本与标准化产业标签,为“云-边-端”协同产业分析提供核心数据支撑,其典型应用场景覆盖三大领域:
一是产业规划与生态构建:当前国内已有多个省市将边缘计算纳入数字经济重点布局赛道,该数据集可辅助政府及园区精准识别区域内从底层芯片、硬件设备到上层平台服务、行业应用的完整产业链条,清晰定位产业链薄弱环节,为产业招引、强链补链、政策制定提供量化决策依据;
二是技术投资与赛道洞察:边缘计算赛道覆盖AI芯片、边缘云平台、5G专网、行业解决方案等十余类细分领域,传统人工分类效率低、标准不统一,该数据集可为投资及研究机构提供标准化的企业标签体系,支持对核心细分赛道的企业分布、技术迭代、市场格局进行精准量化分析与趋势研判,大幅降低行业研究成本;
三是供应链协同与方案集成:边缘计算落地对“软硬件一体化”协同要求较高,该数据集可赋能终端厂商或解决方案集成商,智能匹配芯片供应商、硬件制造商与平台服务商,缩短供应链对接周期,促进边缘计算解决方案的高效集成与落地。
为保障数据合规性,该数据集在加工前已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息已被彻底移除,完全符合《数据安全法》《个人信息保护法》等法律法规要求,为后续模型训练、数据流通提供了合规基础。
在数据处理环节,研发团队严格遵循“体系先行、业务匹配、特征抽取”的核心规则,构建了全流程标准化处理体系:
1. 分类体系搭建:依据边缘计算产业“基础设施-服务平台-行业应用”的三层架构,预先定义了树状分类体系,一级节点为“边缘计算”,二级节点拆分“基础设施”“服务平台”等核心板块,三级节点进一步细化为“硬件”“电信运营商”“边缘云服务”等具体产业链环节,确保分类逻辑的系统性与全面性;
2. 业务匹配标注:采用“自动化规则匹配+人工专家校验”的双轨策略,首先依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的边缘计算产业语义规则库自动推荐初步分类节点,再由具备产业研究背景的标注专家对系统结果进行语境校验与逻辑判定,尤其对芯片设计、服务平台等边界模糊的领域进行严格区分,确保每家企业精准归入对应产业链节点;
3. 特征抽取补充:在完成分类匹配的同时,从企业简介文本中系统性抽取核心技术、产品、服务相关特征词(如芯片设计、AI加速、低延迟、云服务等),经去重、标准化处理后形成“正向词”特征串,作为分类标签的细粒度语义补充,为AI模型提供更丰富的学习维度。
经过全流程处理后的数据集为结构化“文本-标签”配对数据,每条数据均包含脱敏后的企业描述文本、经人工校验的三级分类标签、产业标签与业务特征词,全面覆盖边缘计算基础设施层、服务层、应用层的核心环节,具备分类逻辑清晰、标注一致性强、特征维度丰富等特点,可直接用于边缘计算产业链图谱构建、企业智能分类等模型的训练与评估。





_1769672084863.jpg)