five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

火石创造光电产业链训练数据完成浙江知识产权登记 可支撑多场景产业数字化应用

五号数据雷达数据知识产权登记2026-05-30 03:492
2026年5月29日,火石创造科技有限公司旗下光电信息产业链结构文本训练数据正式完成浙江省数据知识产权登记平台登记,该合规结构化数据集可服务于光电产业链分析、产业图谱构建等AI模型训练,为政产学研各类主体提供标准化的产业数据支撑。

当前我国数据要素市场化配置改革进入纵深推进阶段,数据知识产权登记作为明确数据权属、保障数据合规流通、激活数据要素价值的核心基础制度安排,已成为各地区推进数字经济创新发展的重要抓手。作为全国数据要素改革先行试点省份,浙江省搭建的省级数据知识产权登记平台,承担着全省数据资源的确权存证、合规校验、流通赋能等公共职能,为各类合规数据产品的市场化应用提供官方公信力背书。本次火石创造提交的光电信息产业链结构文本训练数据成功完成登记,也是垂直产业类训练数据合规化流通的一次典型实践。

本次登记的数据集专门面向光电信息产业链智能分类、产业图谱构建类AI模型的训练与开发需求打造,通过关联脱敏企业文本与标准化产业链环节标签,为光电产业的数字化分析提供了高可靠性的基础数据工具,其典型应用场景覆盖产业治理、行业研究、企业经营三大维度:一是产业链分析与强链补链:可辅助各地政府及产业规划部门,快速绘制区域在光学材料、光通信设备、光有源器件等细分领域的企业分布地图,精准识别产业链优势环节与短板缺失环节,为光电产业的精准招商、政策制定、产业扶持提供数据支撑,避免区域产业同质化布局,提升地方光电产业集群的核心竞争力。二是企业画像与技术追踪:可为行业研究机构、产业投资方提供标准化分析基底,快速梳理光电领域不同类型市场主体(包括光学玻璃制造商、光通信基站服务商、激光器研发企业等)的核心技术路线、产品结构与应用市场,动态洞察光电产业的技术演进趋势与市场竞争格局,降低行业研究与投资尽调的信息获取成本。三是供应链协同与市场合作:可赋能光电产业下游集成商与终端应用方,精准匹配上游光学元件、光组件、通信设备等领域的潜在供应商与技术服务商,优化供应链配置效率,降低供应链波动风险,推动产业链上下游的技术创新合作。

为保障数据集的合规性与专业度,整个数据加工流程建立了严格的规范体系:
一、加工前数据说明
本数据集旨在构建用于光电信息产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理,原始企业名称被统一替换为不可逆的规范标识符,并彻底移除所有的个人及商业敏感信息,确保数据完全符合《数据安全法》《个人信息保护法》等法律法规的隐私保护与安全合规要求,为模型训练提供了洁净、可靠的输入基础。
二、数据处理规则
数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:1.首先,依据国家战略性新兴产业分类及光电信息产业专业分工,预先定义了以“光电信息”为一级节点,按产业链环节划分为“光学材料及元件”、“光学器件、模块及设备”两个二级节点,并进一步细分为“光学材料”、“光学元件”、“光通信设备”、“光学器件”等三级节点,以及“光玻璃”、“光组件”、“基站”、“光有源器件”等四级节点的树状分类体系,为数据加工提供了清晰、专业的技术框架。2.业务匹配:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的光电信息产业语义规则库(涵盖“光学玻璃”、“激光器”、“光通信基站”、“滤光片”、“光纤预制棒”、“半导体芯片”等)自动计算并推荐初步分类节点。随后,由具备光电、通信行业专业背景的标注专家进行审核与最终判定,确保企业被精准归入对应的技术与产品节点。3.特征抽取:在完成业务匹配的同时,从同一段企业简介文本中,系统性地抽取代表其核心产品、关键技术及主要应用领域的关键术语与名词性短语,经过去重与标准化格式化,组合成“正向词”特征串,并归纳其所属的“产业标签”,共同作为对分类标签的精准语义补充与业务特征刻画。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整分类标签(一至四级节点)、反映核心业务的“正向词”特征串与产业标签。数据内容覆盖了光电信息产业上游的光学材料、光学元件制造,以及中下游的光通信设备、光有源器件等核心领域,形成了一个分类体系专业、可用于光电信息产业链分析、核心技术企业识别、应用场景关联挖掘等模型训练与评估的专用数据集。

查看光电信息产业链结构文本训练数据

登记内容:

业内人士指出,本次光电信息产业链训练数据的成功登记,不仅为光电产业的数字化分析提供了合规的基础素材,更对垂直产业类训练数据的确权流通具有示范意义:一方面明确了数据集的知识产权归属,为后续数据的市场化流通、价值变现扫清了权属障碍;另一方面也为其他垂直产业的训练数据合规登记、标准化加工提供了可参考的实践路径,将进一步推动我国产业类数据要素的合规高效应用,助力实体经济的数字化转型。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们