five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

火石创造相关服务业产业链训练数据完成浙江数据知识产权登记 支撑产业图谱与智能分类应用

五号数据雷达数据知识产权登记2026-05-24 03:285
2026年5月22日,火石创造科技有限公司旗下相关服务业产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记,作为合规的垂直产业AI训练语料,将为产业链图谱构建、服务业智能分类等场景提供高质量数据支撑,助力现代服务业治理与产业服务效率升级。

随着全国数据要素市场化配置改革持续深化,数据知识产权登记作为明确数据权属、保障数据权益、推动合规流通的核心前置环节,已成为产业类数据资产化的重要基础。作为国内率先落地的数据知识产权公共服务载体,浙江省数据知识产权登记平台承担着数据存证公示、权益认定、流通对接等核心职能,为各类市场主体的数据资产合规运营、价值变现提供官方公信力支撑。

2026年5月22日,火石创造科技有限公司旗下的相关服务业产业链结构文本训练数据正式在上述平台完成知识产权登记,成为国内少有的具备明确权属、合规可复用的现代服务业垂直领域AI训练语料资源。据介绍,本数据集专门服务于现代服务业产业链智能分类与产业图谱构建场景,通过精准关联企业文本与产业标签,为服务业态分析提供标准化的核心数据工具。

在数据加工前,研发团队已对所有原始数据完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等法律法规的隐私保护与安全合规要求,为后续模型训练提供了洁净、可靠的输入基础。

本次数据集的加工严格遵循「体系先行、业务匹配、特征抽取」的核心规则,形成了覆盖分类框架构建到标签生成的全闭环标准化流程:
1. 分类体系搭建:依据国家现代服务业分类标准,预先定义了以「相关服务业」为根节点,下设「新技术与创新创业服务」「其他相关服务」二级节点,进一步细分出「其他技术推广服务」「现代金融服务」「研发服务」「检验检测认证服务」等具体业态的三级树状分类体系,保障分类逻辑清晰、类目互斥且覆盖全面,为自动化处理提供结构化框架。
2. 业务匹配校验:采用「自动化规则匹配+人工专业校验」的双层策略,首先依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的服务业语义规则库自动计算并推荐初步分类节点,随后由具备产业研究背景的标注专家对系统推荐结果进行全文语境审核与最终判定,确保技术中介、投资机构、研发中心等各类市场主体均被精准归入对应业态节点,标签业务一致性与准确率达到行业领先水平。
3. 核心特征抽取:在完成业务匹配的同时,从同一段企业简介文本中系统性抽取代表企业核心服务、技术领域、商业模式的关键术语与名词性短语,经去重、标准化格式化后组合成「正向词」特征串,作为分类标签的细粒度语义补充,为AI模型提供更丰富的学习维度。

最终形成的加工后数据集为标准化「文本-标签」结构,每条数据均包含脱敏后的企业描述文本,以及经人工校验的完整三级分类标签、产业标签与业务特征词,全面覆盖技术推广、科技金融、研发创新等现代服务业核心领域,具备分类体系清晰、标注一致性高、特征维度丰富等优势,可直接用于服务业产业链图谱构建、企业智能分类等模型的训练与评估。

从落地场景来看,本次登记的数据集可在三大领域发挥核心价值:
一是服务业态洞察与规划:可为政府部门、产业园区提供智能分类工具,快速摸清区域内技术推广、创新创业、现代金融等专业服务的分布与生态结构,替代传统人工调研的高成本模式,为优化区域服务业结构、引入高端服务要素、制定服务业扶持政策提供数据依据,尤其适用于现代服务业集聚区、高新区等载体的产业规划工作。
二是专业服务市场分析:可为投资机构、咨询公司、研究机构提供标准化分类标签,无需自行开展大规模数据标注即可快速对科技中介、私募基金、研发设计等细分服务领域开展市场格局、竞争态势、增长潜力分析,大幅降低产业研究的前置成本。
三是产业赋能与资源对接:可赋能产业园区或龙头企业搭建智能服务匹配系统,为制造业主体精准对接技术创新、成果转化、资本对接等关键服务供应商,有效破解产业供需信息不对称难题,促进产业链、创新链与资金链的深度融合。

业内分析指出,当前产业大模型落地的核心瓶颈之一就是垂直领域高质量、合规训练语料的短缺,本次相关服务业产业链结构文本训练数据完成知识产权登记,不仅为该数据集的后续流通、授权、资产化运营提供了官方权属依据,也为国内产业类训练数据的知识产权保护、合规流通探索了可参考的实践路径,对推动数据要素在现代服务业治理领域的落地应用具有示范意义。

查看相关服务业产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们