台州市路桥数字产业有限公司,飞达科技有限公司本次登记的数据知识产权电机线缆生产制造垂类大模型问答对语料数据,该数据知识产权数据可直接用于电机行业问答对大模型训练,使其精准掌握电机领域生产制造方向专属知识结构(如定子绕制工艺参数、IGBT 模块适配术语、轴承异响故障诊断逻辑)、企业员工通用制度(生产安全操作规范、质量管控流程)及工业通用业务规则(IEC 60034、GB/T 30282 等标准要求),具备在研发设计、生产制造、运维检修、合规认证四大核心场景的文本任务处理与复杂问题推理能力,面向全球电机制造企业、研发机构及运维服务商,打造开源开放的电机行业大语言模型,通过自然语言问答即可高效了解实际业务问题,通过大模型助手工具在新能源电机国产化替代、工业电机能效升级、防爆电机安全管控中发挥关键作用,推动电机行业技术创新与知识标准化。1.数据采集 以“企业核心知识资产+行业标准体系”为双核心数据源,构建电机行业知识底座,采集电机制造企业内部核心知识,包括各工位操作手册、规章制度及历史运维案例,覆盖四大细分领域全业务链条; 2.数据清洗与筛选 (1)通过标题编号去重,筛选保留标题内容完整且非空的样本,构建电机行业基础知识库;(2)基于电机行业预训练模型(BERT-Motor),对采集数据进行结构化处理:自动提取核心实体关键词,包括“电机型号(如Y2系列异步电机)、工艺参数(绕组匝数)、标准编号、故障类型”;通过“实体重叠度算法”(Jaccard相似度)与“业务逻辑关联算法”,建立实体间关联关系,构建电机行业知识图谱,为问答生成提供逻辑支撑。(3)利用知识图谱与电机行业大模型,生成多样化问答对,设计多角色(生产、研发、运维)与多场景情况,生成“事实型”(如“GB/T30282对驱动电机功率密度的要求”)、“推理型”(如“伺服电机响应延迟过高的原因分析”)、“应用型”(如“潮湿环境下家用电机防护等级选型”)三类问题,通过“上下文关联算法”匹配准确答案,标注“关键词”“问题类型”等标签,构建初始问答对数据集。(4)领域相关性过滤:对初始问答对进行“电机行业二分类判断”,通过关键词匹配与行业标签比对,剔除偏离电机领域的边缘问题,确保数据领域纯度。 3.构建五维评价模型 结合电机行业技术特性与企业实际需求制定分级评分标准,通过精准量化筛选高质量问答对,每维度满分5分,具体规则如下: 专业度(验证答案与电机技术原理、标准规范的契合度)例如:内容完全符合标准规定问答,明确引用标准指标,且解释与标准条文完全一致,得5分; 实用性(评估内容对企业生产、研发、运维的实际操作价值)例如:5分:包含具体操作步骤或技术参数,可直接指导实践得5分; 清晰度(判断问题边界与答案逻辑的明确性、连贯性)例如:问题限定条件清晰,答案使用分点标识,结构无歧义得5分: 聚焦程度(衡量问题对电机细分领域、场景的精准限定)例如:问题含2个以上限定词,聚焦具体细分场景得5分; 前瞻性(考察内容对电机行业新技术、新趋势的覆盖度)例如:涉及近3年行业前沿技术,且有具体应用说明得5分 通过上述五维评分(单维度≥3分、总分≥12分)筛选,最终输出的高质量问答对可精准匹配电机企业实际需求。





_1769672084863.jpg)