(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210278882.2 (22)申请日 2022.03.21 (71)申请人 北京博汇数据科技有限公司 地址 100000 北京市怀柔区雁栖经济开发 区雁栖大街13号3层(集群注 册) (72)发明人 赵崟江 姜卫平 李国华 郭忠武  殷松迁 张家斌 韩煜  (74)专利代理 机构 北京知呱 呱知识产权代理有 限公司 1 1577 专利代理师 张永维 (51)Int.Cl. G10L 15/10(2006.01) G10L 15/22(2006.01) G10L 15/26(2006.01) G06K 9/62(2022.01)G06F 40/194(2020.01) G06F 40/284(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于融合相似度计算的语音指令映射 方法及系统 (57)摘要 本发明公开了一种基于融合相似度计算的 语音指令映射方法及系统, 通过语音识别、 拼音 校检、 关键词提取、 融合相似度计算等手段, 大大 提升了语音指令映射准确率, 用户表达更灵活, 且支持以高性能部署端侧设备, 具有较好的应用 优越性。 将用户的口语化表达, 精准地映射到标 准指令, 使用户不拘泥于标准指令表达, 控制设 备更加智能与人性化。 同时该算法具有较高的效 率, 在端侧设备上能够以较低延迟匹配最佳指 令。 此外, 该算法通用性较强, 智能交互语音产品 中均可使用。 权利要求书2页 说明书7页 附图2页 CN 114694643 A 2022.07.01 CN 114694643 A 1.一种基于融合相似度计算的语音指令映射方法, 其特 征在于, 所述方法包括: 获取用户输入的语音指令信息并通过语音识别转换为文本信息; 对所述文本信息进行去助词和拼音校验处 理; 对处理后的文本信息进行关键词提取并计算权 重; 将文本信 息和标准指令集中的每个标准指令进行文本相似度计算, 所述相似度采用最 小编辑距离和语义向量距离的线性加权融合计算得到的融合相似度; 将得到的最高相似度值与预设阈值进行比较, 若超过预设阈值, 则将最高相似度对应 的标准指令作为目标设备 执行指令。 2.根据权利要求1所述的一种基于 融合相似度计算的语音指令映射方法, 其特征在于, 去助词处 理, 具体包括: 通过依存句法分析将识别结果中对指令映射过程无用的助词去掉。 3.根据权利要求1所述的一种基于 融合相似度计算的语音指令映射方法, 其特征在于, 拼音校验处 理, 具体包括: 将标准指令集的所有标准指令生成拼音指令集; 将去助词处 理后的文本句子转换成拼音表示; 基于所述拼音指令集对得到的拼音表示的文本句子进行校验, 将文本中被识别为标准 指令中某个字的同音字校验为 正确结果, 并将文本中缺失的字进行补全处 理。 4.根据权利要求1所述的一种基于 融合相似度计算的语音指令映射方法, 其特征在于, 对处理后的文本信息进行关键词提取并计算权 重, 具体包括: 对TF‑IDF算法进行改进, 计算文本中词汇的词频 ‑逆文档频率, 计算公式为: TF‑IDFw’=[log10(1+TFw)]1/θ*(IDFw)2; 其中, TF‑IDFw’为词频‑逆文档频率, TFw为词频, IDFw为逆文档频率, 参数θ结合短文本 实验进行确定 。 5.根据权利要求1所述的一种基于 融合相似度计算的语音指令映射方法, 其特征在于, 融合相似度的计算, 具体包括: Fsim=α EDsim+(1‑α )BERTsim 其中, Fsim为融合相似度, EDsim为基于最小编辑距离的相似度, BERTsim为基于语义向量 距离的相似度, α 为加权系数。 6.根据权利要求5所述的一种基于 融合相似度计算的语音指令映射方法, 其特征在于, 基于最小编辑距离的相似度计算, 具体包括: 其中, S1,S2为两个待比较的字符串文本, EDsim(S1,S2)为两个文本的相似度, d[s1,s2]为 整数形式的两个文本的最小编辑距离, Lmax为两个句子的最长文本 长度。 7.根据权利要求5所述的一种基于 融合相似度计算的语音指令映射方法, 其特征在于, 基于语义向量距离的相似度计算, 具体包括: 基于BERT预训练模型将提取到的关键词语转化成词向量, 然后将每个词向量与计算得 到的权重TF ‑IDFw’进行加权求和得到文本信息的句向量, 最后使用余弦相似度方法进 行相 似度计算:权 利 要 求 书 1/2 页 2 CN 114694643 A 2其中θ为两个句向量的夹角, xi, yi分别表示n维的文本信息的句向量和标准指令的句向 量在某一个维度i的分量数值。 8.一种基于融合相似度计算的语音指令映射系统, 其特 征在于, 所述系统包括: 语音识别模块, 用于获取用户输入的语音指令信息并通过语音识别转换为文本信息; 文本处理模块, 用于对所述文本信息进行去助词和拼音校验处 理; 关键词提取模块, 用于对处 理后的文本信息进行关键词提取并计算权 重; 融合相似度计算模块, 用于将文本信 息和标准指令集中的每个标准指令进行文本相似 度计算, 所述相似度采用最小编辑距离和语义向量距离的线性加权融合计算得到的融合相 似度; 阈值判断模块, 用于将得到的最高相似度值与预设阈值进行比较, 若超过预设阈值, 则 将最高相似度对应的标准指令作为目标设备 执行指令。权 利 要 求 书 2/2 页 3 CN 114694643 A 3

.PDF文档 专利 一种基于融合相似度计算的语音指令映射方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于融合相似度计算的语音指令映射方法及系统 第 1 页 专利 一种基于融合相似度计算的语音指令映射方法及系统 第 2 页 专利 一种基于融合相似度计算的语音指令映射方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。