five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

浙江台州生产损耗垂类大模型语料完成省数据知识产权登记 落地工业NLP、自然语言转SQL场景

五号数据雷达数据知识产权登记2026-04-28 11:527
2026年4月25日,台州市路桥数字产业有限公司联合浙江保镖电子有限公司打造的生产损耗问数垂类大模型语料,正式在浙江省数据知识产权登记平台完成知识产权登记,填补了工业生产质量管理场景垂类语料供给空白,为工业质检智能化升级提供合规数据支撑。

当前,工业大模型正成为制造业数字化转型的核心抓手,而面向特定生产场景的高质量垂直语料,是制约工业大模型落地的核心瓶颈之一。作为全国数据要素市场化配置改革试点省份,浙江省打造的数据知识产权登记平台是当地数据要素流通体系的核心基础设施,承担数据知识产权存证、登记、公示、维权支撑等职能,为合规数据产品的流通交易提供确权基础,有效破解数据要素“确权难、流通难”的行业痛点。
2026年4月25日,台州市路桥数字产业有限公司联合浙江保镖电子有限公司共同打造的生产损耗问数垂类大模型语料数据,正式在浙江省数据知识产权登记平台完成知识产权登记,成为国内少有的聚焦工业生产损耗、质量管理场景的合规登记语料产品。
据介绍,本次登记的语料数据专为训练工业企业设备运维、生产质量管理垂类大语言模型构建,核心目标是让模型能够深度理解工业生产场景中的自然语言查询需求,并精准转化为可执行的SQL查询语句,让没有技术背景的一线生产管理人员也能实现生产数据的即时、高效查询与分析,大幅降低生产数据的使用门槛。
该语料依托工业企业真实经营数据构建,经过了全流程标准化加工,确保语料的高质量与高适配性:在数据清洗与标准化环节,团队对从MES、SCADA等工业设备管理系统收集的原始问答对进行清洗,剔除重复、无效或存在明显逻辑矛盾的样本,同时特意保留“查询无返回结果”的典型场景样本,增强模型对数据缺失场景的理解能力;随后统一问题表述中的时间格式、指标名称、SQL语法风格,规范建表语句的字段类型与注释风格,确保语料的规范性与跨场景适配性。
在问题分类与结构化环节,团队按照设备运维的特定场景对问题进行归类,覆盖趋势分析、阈值查询等核心生产管理场景,全面适配“生产损耗”“半成品不良”等工业质检特有需求。核心算法建模阶段,团队通过语义解析与要素提取、SQL语句自动生成、异常值双重检测、业务逻辑人工核验四大步骤保障语料质量:先通过规则与词典结合的方式提取自然语言问题中的时间、对象、指标、约束条件等核心要素,再基于预设的映射规则自动生成标准化SQL语句,随后通过IsolationForest等算法检测SQL逻辑异常、结合数据统计特征识别结果异常值,最后由资深设备运维人员对“问题-SQL-结果”三元组进行最终核验,确保语料不仅语法合规,更符合工业生产实际业务逻辑。此外,该语料库还搭建了闭环迭代机制,新产生的经核验业务查询数据会定期注入语料库,同时结合大模型实际应用反馈针对性补充薄弱场景语料,形成“应用-反馈-优化”的良性循环,持续提升语料库的覆盖度与质量。
从应用价值来看,该语料可广泛应用于工业质检自然语言处理、自然语言转SQL等领域,工业企业可基于语料中的“指标名称”“问题查询”等字段内容,适配自身数据表结构,替换对应表名、字段名,即可快速启用文字转SQL功能,无需从零开始训练垂类大模型。典型应用场景包括生产损耗实时查询、不良率统计分析、设备运维异常预警、生产趋势预判等,一线生产管理人员无需掌握SQL技能,仅通过自然语言提问即可调取所需生产数据,大幅提升生产管理效率,对于缺乏大数据研发团队的中小制造企业而言,可大幅降低其部署工业智能化应用的成本与周期。
本次生产损耗垂类大模型语料完成数据知识产权登记,一方面为该数据产品的后续流通、交易、商业化应用提供了合规确权基础,另一方面也填补了国内工业生产质量管理场景垂类语料的供给空白,为工业大模型在生产端的规模化落地提供了高质量的数据支撑,对推动工业生产数据价值深度挖掘、智能运维技术发展、制造业数字化转型均具有重要的示范意义。
查看生产损耗问数垂类大模型语料数据

登记内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们