five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据知识产权登记 / 正文

用于声音意图识别模型的训练数据已成功在浙江省数据知识产权登记平台进行登记,应用在语音识别、意图识别领域

五号数据雷达数据知识产权登记2025-09-06 15:2014
2025-09-01 , 杭州秋果计划科技有限公司 旗下 用于声音意图识别模型的训练数据 数据知识产权在 浙江省数据知识产权登记平台 完成登记 , 应用于 语音识别、意图识别 领域

杭州秋果计划科技有限公司 本次登记的数据知识产权 用于声音意图识别模型的训练数据, 本训练数据用于声音意图识别模型的训练和优化。训练好的意图识别模型能够通过分析音频内容来理解说话者的意图。在智能眼镜的人机交互场景中,训练模型通过准确理解用户的意图,智能眼镜可以提供更加自然和直观的交互方式,从而通过意图识别模型增强智能眼镜的用户体验,提高交互效率。例如,用户只需简单地注视某个物体或说出一个指令,系统就能理解其意图并执行相应的操作,如拍照、查询信息等。(1) 数据收集:人工收集和生成的文本数据【text】、文本意图数据【intent】。 (2) 数据处理:以说话人编号【speaker_audio】对应的人声特征作为TTS模型的输入,不同的说话人编号对应有不同的人声特征,分别用多个TTS模型把文本数据转换成音频数据,并存储到存储路径【audio_path】; 分别用下面四个ASR模型对音频数据进行语音识别: 用qwen的ASR模型得到的语音识别结果【text_qwen】; 用paddle的ASR模型得到的语音识别结果【text_paddle】; 用whisper的ASR模型得到的语音识别结果【text_whisper】; 用paraformer的ASR模型得到的语音识别结果【text_paraformer】; 对以上4个语音识别结果进行片段投票得到结果【text_vote】,标记投票得到的结果的不同之处【diff_spans】,计算投票结果与文本【text】的一致率。 (3) 在标注好的数据集上训练ASR深度学习模型,把语音作为模型输入,文本【text】和文本的意图【intent】作为模型输出,基于whisper或paraformer架构的asr模型进行训练,得到训练好的ASR模型。训练好的ASR模型在接收到用户输入的音频数据后,可以得到用户的意图。 (4) 超参数调优:进行超参数调优,包括学习率、批量大小、网络层数等,以优化模型性能。 (5) 模型优化与验证:根据评估结果,对模型进行剪枝、正则化等优化措施。在独立的测试集上验证模型的性能,确保模型在未见数据上也能表现良好。

查看用于声音意图识别模型的训练数据

登记内容:

 

关于 杭州秋果计划科技有限公司 , 杭州秋果计划科技有限公司是一家专注于大数据处理与分析的高科技企业,致力于为客户提供智能数据解决方案和技术服务。该公司拥有一支经验丰富的技术团队,在人工智能、云计算等领域具有核心竞争力。_simple

关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是一个专门用于登记和管理数据知识产权的官方平台。该平台允许企业和个人申请登记其数据知识产权,包括专利分类数据、客户价值评估数据等。平台提供公告功能,展示已登记、放弃或撤销的数据知识产权信息,并提供详细的申请人、申请时间和更新信息。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们