five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江完成家具产业链结构文本训练数据知识产权登记 覆盖三大产业数字化应用场景

五号数据雷达数据知识产权登记2026-05-30 03:185
2026年5月29日,火石创造科技有限公司旗下家具产业链结构文本训练数据正式在浙江省数据知识产权登记平台完成知识产权登记。该高粒度结构化训练语料可支撑家具产业链分析、供应链智能识别、产业图谱构建等多场景应用,为垂直制造领域数据资产化落地提供了典型样本。

当前数据要素市场化改革正加速推进,数据知识产权登记作为数据确权、合规流通的核心前置环节,已成为垂直产业领域数据资产化的核心抓手。作为国内率先落地数据知识产权登记机制的省份,浙江依托官方打造的浙江省数据知识产权登记平台,承担着数据资源合规存证、权属确认、流通赋能的核心职能,是浙江推进数据要素市场化配置改革的重要基础设施,目前已逐步形成覆盖多行业的数据资产登记服务体系。2026年5月29日,火石创造科技有限公司旗下的家具产业链结构文本训练数据正式在该平台完成数据知识产权登记,为家居制造产业的数字化应用提供了高价值的合规训练语料支撑。

本次登记的家具产业链结构文本训练数据,是专门为训练家具产业链智能分类、产业图谱构建类AI模型打造的结构化语料,核心逻辑是通过关联企业公开文本信息与产业链环节标签,为全链路的家居产业分析、决策提供标准化数据工具。

在合规性层面,数据集加工前已完成严格的匿名化与去标识化处理:原始企业名称被统一替换为不可逆的规范标识符,所有个人及商业敏感信息被彻底移除,完全符合《数据安全法》《个人信息保护法》等相关法律法规要求,为后续模型训练、应用落地筑牢了安全基础。

数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:首先参考家具行业专业分类标准,预先定义了覆盖五级节点的树状分类体系,最高颗粒度可细化至“导轨”“脚轮”“硬木家具”“轻有色金属家具”等具体产品品类,远高于通用产业分类标准的颗粒度,为数据加工提供了精细化的结构化框架;其次采用“自动化规则匹配与人工校验相结合”的策略,依托Spark大数据处理框架对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的家具产业语义规则库自动推荐初步分类节点,再由具备家居行业知识的标注专家进行审核与最终判定,确保企业被精准归入最贴切的五级产品节点;最后在完成业务匹配的同时,从企业简介文本中系统性抽取代表其核心产品、主营业务与产业链角色的关键术语,经过去重与标准化格式化,组合成“正向词”特征串,并归纳生成体现其产业链位置与核心产品的“产业标签”,作为对五级分类标签的多维度精准语义补充。

加工后的数据集为一条条结构化的“文本-标签”数据,每条数据均包含经过脱敏处理的原始企业描述文本,以及与之对应、经人工校验的完整五级分类标签、高相关度的产品特征词(正向词)与产业链标签,全面覆盖了家具产业上游的木材、五金配件、电器配件、涂料、包装材料等细分领域,以及中游的实木、金属等各类家具制造企业,可直接用于家具产业链末端的供应商智能识别、产品级市场分析及产业地图绘制等模型的训练与评估。

从应用场景来看,该数据集可落地三大核心方向:一是细分零部件供应链寻源,当前家居行业普遍面临原材料价格波动、柔性生产需求提升、供应链安全防控等挑战,基于该数据集训练的模型可赋能家具品牌商、大型制造商或电商平台,精准识别上游导轨、脚轮、连接件、涂料等细分材料与配件的专业供应商,优化采购决策与供应链管理,降低运营成本、提升应急响应能力;二是产品级产业图谱构建,可辅助政府、园区及研究机构,绘制区域在实木家具、金属家具、软木家具等不同品类,以及导轨、脚轮等细分零部件环节的企业分布地图,识别产业优势与配套短板,为产业集群培育、精准招商、政策制定提供数据支撑;三是市场竞争与投资分析,可支持投资机构与行业研究团队,对特定细分领域的制造企业、品牌商及材料供应商的市场格局、技术能力与商业模式进行量化分析,降低信息差,提升研究与投资决策效率。

本次家具产业链训练数据的成功登记,是垂直制造领域训练类数据资产化的典型实践,既为家居产业数字化转型提供了核心数据工具,也为其他垂直产业的训练数据确权、流通提供了可参考的样本,进一步丰富了浙江省数据要素市场的供给品类,助力数字经济与实体经济的深度融合。

查看家具产业链结构文本训练数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们