five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

纺织材料产业链结构文本训练数据完成浙江登记 打通纺织产业数字化核心数据源

五号数据雷达数据知识产权登记2026-05-24 08:2510
2026年5月22日,火石创造科技有限公司旗下纺织材料产业链结构文本训练数据正式完成浙江省数据知识产权登记,该数据集可广泛应用于纺织原料供应商识别、产业链知识图谱构建等场景,为纺织产业数字化转型提供合规、高质量的训练数据支撑。

当前我国数据要素市场化建设正处于加速落地期,垂直产业领域的专用数据确权、合规流通,是推动数据价值向实体经济转化的核心前提。作为我国传统优势支柱产业,纺织产业年产值超5万亿元,供应链覆盖原料种植、化纤制造、纺织加工、品牌零售等多个环节,产业链复杂度高、数字化升级需求迫切,而浙江省作为全国纺织产业集聚度最高的省份之一,近年来持续推进纺织产业数字化改造,对产业链级大数据的合规应用需求持续攀升。作为浙江省数据要素流通体系的核心基础设施,浙江省数据知识产权登记平台承担着数据知识产权权属确认、存证公示、流通背书等核心职能,为登记数据的后续交易、授权、应用提供合规基础。2026年5月22日,火石创造科技有限公司旗下的纺织材料产业链结构文本训练数据正式在该平台完成数据知识产权登记,成为纺织产业领域为数不多完成合规确权的专用AI训练数据集,为纺织产业智能分析场景提供了高质量的合规数据源。 本次登记的数据集是专门面向纺织材料产业链智能分类、图谱构建等AI模型训练开发打造的专用语料库,核心价值在于通过精准关联企业经营文本与纺织原料类型标签,为纺织产业供应链分析、竞争力评估等场景提供核心数据工具。为保障数据全流程合规,数据集在加工前已完成全量匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人敏感信息、商业涉密信息均被彻底移除,完全符合《数据安全法》《个人信息保护法》及数据知识产权登记的相关要求,从源头解决了训练数据的合规流通障碍。 整个数据集的加工严格遵循“体系先行、业务匹配、特征抽取”的核心规则,形成了标准化的处理流程:首先依据纺织工业国家标准及材料科学分类体系,构建了覆盖全产业链的四级树状分类框架:一级节点为“纺织材料”,二级节点按产业环节划分为“纺织原料及设备”,三级节点按原料来源与技术原理细分为“天然原料”与“化学纤维”,四级节点进一步拆解为“植物纤维”“动物纤维”“合成纤维”“再生纤维”等细分品类,实现了从原料种植、初级加工到成品生产的全链条覆盖。其次采用“自动化规则匹配+人工专业校验”的双重匹配机制:依托Spark大数据处理框架对海量企业公开文本进行分布式清洗、分词与关键词匹配,通过涵盖“棉花收购”“亚麻加工”“涤纶生产”等数千个专业术语的纺织产业语义规则库,自动计算推荐初步分类节点,再由具备纺织化工专业背景的标注团队进行逐一审定,确保分类准确率达标。最后同步完成特征抽取:从企业文本中系统性提取核心原料品类、加工工艺、技术特点等关键术语,经过去重、标准化处理后形成细粒度“正向词”特征串与产业标签,作为多级分类标签的补充,实现对企业产业链定位的精细化刻画。 加工完成后的数据集为标准化的“文本-标签”结构化数据,每条数据均包含脱敏后的企业描述文本、经人工校验的一至四级完整分类标签、细化的原料与技术特征词及产业标签,全面覆盖棉花、亚麻等天然植物纤维,涤纶、丙纶等合成纤维,粘胶、莱赛尔等再生纤维的全部纺织原料体系,可直接用于纺织原料供应商识别、技术路线分析、产业链竞争力评估等多种AI模型的训练与评估。 从应用价值来看,该数据集可广泛覆盖多类产业场景:在企业端,可赋能纺织服装制造商、品牌商、贸易商快速识别匹配各类天然纤维、化学纤维的供应商,优化原材料采购策略,降低供应链采购成本,还可支撑产业链供应链断点预警,保障生产经营稳定;在政府及产业服务端,可辅助地方政府、产业园区、研究机构分析特定区域的纺织产业集聚情况、产能布局完整度,为产业政策制定、招商引资精准匹配、产业集群升级提供数据支撑,还可用于构建纺织产业链知识图谱,支撑绿色纤维溯源、低碳制造评估等场景,助力纺织产业双碳目标落地。本次数据知识产权登记的完成,既明确了数据集的权属,为后续的数据授权、流通交易奠定了合规基础,也为传统制造领域的专用训练数据确权、价值释放提供了可参考的实践样本,对推动数据要素与实体经济深度融合具有重要示范意义。

查看纺织材料产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们