当前离散制造业数字化转型进入深水区,塑胶等细分领域普遍存在下游需求零散、中小客户手写订单占比高的行业痛点:传统人工录入模式不仅效率低下,信息误差率通常超过10%,易引发生产错配、交期延误、客诉赔偿等连锁问题,是行业长期亟待解决的共性卡点。作为全国数据要素市场化配置改革先行区,浙江省搭建的省级数据知识产权登记平台是当地数据要素流通体系的核心基础设施,可为合规登记的数据资产提供权属确权、权益保护、流通背书等公共服务,支撑数据资产实现合规流转、作价出资、质押融资等多元价值。
本次台州市路桥数字产业有限公司与浙江中邦塑胶股份有限公司联合登记的供应链订单AI精准解析与智能纠错数据,正是瞄准塑胶行业订单处理的核心痛点研发,是构建塑胶行业手写订单图像识别AI模型的核心信息基础。整套数据资产覆盖近千张真实订单图片和塑胶行业知识图谱数据集,经过标准化处理后结构清晰、复用性强,可直接支撑塑胶制品订单识别垂域模型训练。基于该数据训练的识别模型,可实现手写订单图片中紧急标识、材料属性、加工要求、精确尺寸等关键信息的精准识别、结构化提取与智能优化,完成手写订单数据自动化录入、标准化处理与快速下单,大幅降低企业人工录入成本与信息误差率,显著高于传统模式的解析效率。
整套数据资产的构建经过了全链路标准化处理,核心流程与技术指标如下:
1.数据采集与标注
采集真实业务中产生的图片订单作为原始数据源,具体包含两部分:
①业务规则验证数据集:将已处理的订单信息结构化,形成涵盖订单紧急标识、成型样式、材料属性(品类、品牌、等级、颜色)、加工要求、精确尺寸、数量包装等完整字段的业务实体数据集,用于验证和驱动下游的规则引擎。
②领域专用OCR训练数据集:针对订单图片中手写体(工整/潦草)、印刷体等多变样式,进行人工精细化标注(文本区域框选与内容转录),构建了高质量的定制化图像-文本对齐数据集。目前OCR数据集包含近千条样本数据,按照8:2比例划分为训练集和测试集。
2.数据预处理
对采集的订单图片进行灰度化、降噪、倾斜校正等预处理操作,提升OCR识别准确率;提取图片中的文本信息,形成原始OCR识别结果,标注模糊、错误、缺失等问题字段。
3.OCR模型训练
基于卷积神经网络(CNN)和循环神经网络(RNN)的组合架构,采用“图像输入→特征提取→序列识别→输出文本”的端到端架构,建立AI手写订单识别模型,对OCR识别结果进行综合后处理优化,通过大量标注数据训练,采用公式矫正、常见错字替换、尺寸标准化等方法,有效纠正识别错误,生成高质量的订单文本,实现从图像到文字的直接映射。此模型在训练集中识别准确率为89%。
4.关键词矫正
基于行业订单数据词典与语义分析模型,对OCR识别结果中的关键词进行矫正,根据预先定义的、融合了领域知识的详细规则库,从优化后的文本中自动提取并结构化订单关键信息,实现非结构化文本到标准化业务数据的精准转化。包括产品规格单位统一(如“丝”与“mm”换算)、错别字修正(如“分斤”改为“公斤”)、模糊信息补全(如日期格式标准化)。目前订单解析的准确率可达95%以上。
5.历史数据关联与智能补全
在AI手写订单识别模型中添加当前订单与客户历史订单的关联关系,采用“最多字段匹配”算法,依据品类、品牌、等级三个核心字段判断订单相关性,并自动利用最相关历史订单的信息来填充当前订单中的空缺字段,实现数据知识的传承与增强。
从应用价值来看,该数据资产除了直接应用于手写订单识别、塑胶行业生产自动化场景外,未来还可拓展应用于供应链需求预判、生产排程优化、库存动态调整等多个数字化环节,也可复用至五金、文具、汽配等同样存在大量手写订单需求的同类离散制造场景,为中小制造企业轻量化数字化转型提供开箱即用的垂域数据支撑。此次完成省级数据知识产权登记,也为该数据资产后续面向全行业合规开放共享、实现价值变现打通了制度路径。
首页 / 数据知识产权登记 / 正文
台州两企联合研发供应链订单AI解析数据完成浙江省级知识产权登记 垂域识别准确率超95%
五号数据雷达数据知识产权登记2026-05-09 03:579
2026年4月10日,台州市路桥数字产业有限公司联合浙江中邦塑胶股份有限公司研发的供应链订单AI精准解析与智能纠错数据,正式在浙江省数据知识产权登记平台完成登记,该数据可将塑胶行业手写订单解析准确率提升至95%以上,为制造企业订单处理降本提效提供可复用的合规数据资产支撑。

社区讨论
近期热门




_1769672084863.jpg)