台州市路桥数字产业有限公司,浙江保镖电子有限公司本次登记的数据知识产权灯具生产流程管控问数垂类大模型语料数据,本数据产品专为训练工业企业灯具生产流程管控垂类大语言模型而构建,旨在让模型深度理解企业日常生产流程管控场景中的自然语言问题,并精准转化为可执行的SQL查询语句,从而实现灯具生产过程中总成、制程、来料缺陷追溯等核心质量数据的即时、高效查询与分析。依托企业真实经营数据构建标准化语料体系,模型经训练后可精准理解“总成不良”“烟纹不良”“打胶-毛絮不良”等灯具制造特有质量指标,并支持按时间、产线、产品型号、缺陷类型等多维度进行数据检索。工业企业可基于本语料数据的“指标名称”“问题查询”等字段内容,适配自身数据表结构(如替换表名、字段名),快速启用文字转SQL功能进行复用,为灯具生产流程管控领域提供了稀缺、高质量的垂直领域语料,有力支撑生产质量管理场景下的自然语言处理技术研发、模型训练与评测,对推动工业企业生产质量管理数据价值的深度挖掘和智能运维技术的发展具有重要意义。1.数据预处理:采用数据清洗与格式标准化双重机制,剔除重复、无效及存在逻辑矛盾的样本,统一指标名称(如“不良率”“总成-制程”)、SQL语法和业务表述方式。特别保留“结果输出”中“无匹配数据”的样本,作为模型理解数据缺失场景的标准语料,增强模型对查询无返回结果情况的处理能力,确保语料规范、通用、一致。 2.问题收集与分类:从生产管理、质量控制等核心业务场景中收集常见问题,按指标名称(如“产量”“不良率”)、业务对象(如“总成”“组别”)和查询类型(如“单点查询”“条件筛选”“聚合统计”)进行分类整理,覆盖灯具生产过程中关键质量指标的查询需求,确保语料覆盖核心业务场景。 3.核心算法建模:构建“语义解析-查询生成-异常检测-逻辑验证”全流程算法体系。(1)语义解析与结构化:采用基于规则和词典的文本分析方法,对自然语言问题中的时间(如“06月01日”)、产品型号(如“九号24D04大灯”)、质量指标(如“打胶-底壳不良”)、生产组别等关键要素进行精准提取,为后续分析奠定基础。(2)SQL生成与初步验证:基于预定义的“指标-字段”映射规则和“对象-过滤条件”映射规则,将自然语言问题映射到对应的表名、字段名和查询条件,自动生成标准化SQL语句,并通过建表语句中的字段定义进行初步验证,确保生成的SQL语句符合数据模型规范。(3)异常值检测:采用IsolationForest算法检测“结果输出”字段中的异常SQL(如查询结果与业务实际偏差超10%),结合数据完整性检查,对异常语料进行标记或过滤,确保语料质量。(4)逻辑核验与业务对齐:由企业质量管理人员对生成的SQL语句及其执行结果进行最终核验,结合现场业务知识,判断SQL逻辑是否正确(如“不良率”计算是否匹配业务口径),确保语料不仅语法正确,更具备高度的业务适用性和准确性。 4.语料库迭代优化:构建“应用-反馈-优化”的闭环迭代机制。新产生的业务问题及其经核验的SQL语句定期注入语料库,同时通过分析大语言模型在实际应用中的反馈,定位语料库的薄弱环节并进行针对性补充,持续提升语料库的覆盖度和质量。
登记内容:
关于台州市路桥数字产业有限公司,浙江保镖电子有限公司,- (注:由于这两个公司并非行业知名企业,公开可查的权威信息有限,故无法提供符合要求的客观介绍。根据注意事项,对于信息不足的情况返回"-")
关于浙江省数据知识产权登记平台,浙江省知识产权公共服务平台,提供知识产权相关数据和服务。





_1769672084863.jpg)