five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成新材料产业产业链结构文本训练数据知识产权登记 赋能产业数字化全场景应用

五号数据雷达数据知识产权登记2026-05-30 02:516
2026年5月29日,火石创造科技有限公司旗下新材料产业产业链结构文本训练数据正式完成浙江省数据知识产权登记,该合规结构化数据集可支撑产业规划、市场研判、产业协同等多场景应用,为新材料产业数字化转型提供标准化数据支撑。

随着全国数据要素市场化配置改革进入深水区,数据知识产权登记作为明确数据权益、保障数据合规流通的核心基础制度,正在成为各行业垂类数据入市流通的前置条件。作为全国首批数据要素市场化配置改革试点省份,浙江省近年来持续完善数据知识产权登记服务体系,为产业类数据的合规确权、流通交易提供了规范化通道。2026年5月29日,火石创造科技有限公司旗下的新材料产业产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成登记,为产业类训练数据的合规价值释放提供了全新实践样本。

本次登记的数据集定位为新材料产业链智能分析的人工智能模型训练专用语料,从源头到加工全流程严格符合数据安全与隐私保护要求。加工前,所有原始数据已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,企业简介中的具体地址、联系人、商业机密类敏感信息已被全部移除,从源头保障了数据的合规性,为后续模型训练提供了洁净、可靠的输入基础。

在数据处理环节,本次数据集严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了全流程标准化的处理链路:1.分类框架搭建:依据国内通用的新材料产业分类标准,预先定义了以“新材料产业”为根节点,下设“前沿新材料”等二级节点,并进一步细分为“生物医用材料制造”“3D打印用材料制造”“纳米材料制造”等具体材料门类的三级节点树状分类体系,确保产业分类的逻辑性与专业度。2.业务匹配对齐:将脱敏后的企业经营、产品、技术相关文本与上述三级分类体系逐一匹配校验,确保企业所属产业链环节标注的准确性,避免跨领域错配问题。3.特征抽取标注:在分类标注的同时,从企业公开简介中系统性抽取体现其材料特性、工艺水平、应用领域、资质能力的关键词,比如“医疗认证”“定制化生产”“高性能”“发明专利”等,组合形成“正向词”特征串,作为分类标签的细粒度补充,精准刻画企业的技术优势与产品特点。

完成加工后的数据集为标准化的“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本,以及经人工校验的完整一至三级产业链分类标签、细分产业标签与业务特征词,数据内容覆盖医用金属、特种化工、先进塑胶、复合材料等新材料产业多个核心赛道,形成了分类体系清晰、标注专业、特征明确的专用数据集,可直接用于新材料产业图谱构建、企业智能分类、产业链分析等模型的训练与评估。

从应用场景来看,该数据集可覆盖产业端、政府端、资本端的多元需求:在产业规划场景,可辅助地方政府、产业园区精准掌握生物医用材料、3D打印材料等前沿领域的企业分布与产业生态,为区域产业布局优化、精准招商、政策制定提供数据支撑;在市场研判场景,可为投资机构、行业研究机构分析细分赛道竞争格局、筛选优质标的、预判技术迭代趋势提供标准化的参考依据;在产业协同场景,可赋能链主企业智能匹配上下游材料供应商与技术合作伙伴,也可帮助中小新材料企业对接下游应用端需求,破解产业链供需信息不对称痛点,促进创新链与供应链的深度融合。

本次新材料产业训练数据完成知识产权登记,不仅为垂类产业数据的合规确权、价值量化提供了可参考的实践路径,也为AI训练数据集的合规化建设树立了行业样本,进一步推动数据要素在先进制造领域的落地应用,助力新材料产业数字化转型与产业链安全体系建设。

查看新材料产业产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们