(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210200740.4 (22)申请日 2022.03.02 (71)申请人 上海欣方智能系统有限公司 地址 201203 上海市浦东 新区碧波路690号 张江微电子 港8号4楼 申请人 上海欣方软件 有限公司 (72)发明人 郑宁 丁正 顾晓东 贺东海  贾岩峰 韩慎勇 杨亚鹏 赵学哲  (74)专利代理 机构 北京德琦知识产权代理有限 公司 11018 专利代理师 陈舒维 宋志强 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/33(2019.01) G06F 16/332(2019.01)G10L 15/26(2006.01) (54)发明名称 一种基于语音识别的电话语义分析方法 (57)摘要 本发明提供了一种基于语音识别的电话语 义分析方法, 包括: 获取通话内容, 将所述通话内 容转写为文本数据; 从所述文本数据提取关键 词, 根据提取的关键词构造关键词列表向量; 将 所述关键词列表向量分别与每个意图特征模型 进行比对, 以分别得到所述关键词列表向量与每 个意图特征模 型之间的疑似度分值, 根据多个疑 似度分值的最大值, 确定所述通话内容所表征的 意图; 其中, 不同意图特征模型分别表征不同意 图; 本发明提供的方法通过连续语音转写技术, 将通话语音转成文本内容, 再结合意图理解技 术, 让系统分析出该通话内容的意图, 提高了对 通话内容意图识别的准确率。 权利要求书2页 说明书7页 附图1页 CN 114580432 A 2022.06.03 CN 114580432 A 1.一种基于语音识别的电话语义分析 方法, 其特 征在于, 包括: 获取通话内容, 将所述 通话内容转写为文本数据; 从所述文本数据提取关键词, 根据提取的关键词构造关键词列表向量; 将所述关键词列表向量分别与每个意图特征模型进行比对, 以分别得到所述关键词列 表向量与每个意图特征模型之间的疑似度分值, 根据多个疑似度分值的最大值, 确定所述 通话内容所表征的意图, 其中, 不同意图特 征模型分别表征不同意图。 2.根据权利要求1所述的方法, 其特征在于, 将所述通话内容转写为文本数据之前, 所 述方法还 包括: 对所述通话内容进行背景高斯噪声 去除处理。 3.根据权利要求1所述的方法, 其特征在于, 所述关键词提取模块将所述文本数据转换 为关键词列表向量包括: 对所述文本数据进行分割, 得到多个文本段; 对所述文本段进行 过滤, 得到关键词节点 集; 根据所述关键词节点 集以及预设的边 集合, 得到节点权 重; 对所述节点权重进行倒序排序, 将排序最前的至少一个节点权重作为候选关键词向 量; 对所述文本数据中与 所述候选关键词相同的部分进行标记, 当多个所述候选关键词在 所述文本数据中相邻, 则将相邻的候选关键词合并作为多词关键词向量; 将多个所述多词关键词向量 合并, 得到所述关键词列表向量。 4.根据权利要求3所述的方法, 其特 征在于, 对所述文本段进行 过滤包括: 对文本段进行分词处 理, 得到分词数据; 对所述分词数据的词性进行 标注; 去除分词数据中的停用词以及 分词数据中不带有预设词性标注的分词数据, 得到关键 词节点集; 其中, 所述预设词性 为预设的关键词 词性。 5.根据权利要求3所述的方法, 其特征在于, 根据所述关键词节点集以及预设的边集 合, 得到节点权 重包括: 基于共现关系, 根据 所述关键词节点集以及预设的边集合对所述关键词节点集中的每 个关键词节点进行处理, 将一关键词节点与另一关键词节点连接形成边, 并分别根据该关 键词所连接的所述边的数量, 基于预设阈值, 去除边的数量未达到所述预设阈值的对应的 关键词节点; 根据预设的阻尼系数, 对剩余的关键词节点进行迭代计算, 得到剩余的每个关键词节 点的节点权 重。 6.根据权利要求5所述的方法, 其特征在于, 将剩余的所述关键词节点通过迭代计算, 得到所述节点权 重包括: 其中, Vi、 Vj所述关键词节点集中的任意两个节点, WS(Vi)为Vi的节点权重, d为阻尼系 数; wji、 wjk分别表示Vi、 Vj的权重系数, I n(Vi)为指向Vi的集合、 out(Vj)为指向Vj的集合。权 利 要 求 书 1/2 页 2 CN 114580432 A 27.根据权利要求1所述的方法, 其特征在于, 所述意图理解模块将所述关键词列表向量 与每个所述意图特征模型进行比对, 以得到所述关键词列表向量与每个所述意图特征模型 对应的疑似度分值包括: 分别计算所述关键词向量与每个意图特征模型的相对熵, 其中多个相对熵中的最小值 对应所述疑似度分值的最大值。 8.根据权利要求7所述的方法, 其特征在于: 所述分别计算关键词向量计算与每个所述 意图特征模型的相对熵具体包括: 其中, P(x)表示所述关键词列表向量中一关键词的概率分布, Q(x)表示所述意图特征 模型中该关键词的概率分布, x表 示所述意图特征模 型中预设的关键词字 符集, KL(P||Q)表 示P(x)与Q(x)对应的相对熵。 9.一种基于语音识别的电话语义分析系统, 其特 征在于, 包括: 语音识别模块, 用于获取通话内容, 将所述通话内容转写为文本数据, 并发送至关键词 提取模块; 关键词提取模块, 用于将所述文本数据转换为关键词列表向量, 并发送至意图理解模 块; 意图理解模块, 其特征库中包括多个表征不同意图的意图特征模型, 用于将所述关键 词列表向量与每个意图特征模型进行比对, 以得到所述关键词 列表向量与每个意图特征模 型对应的疑似度分值, 根据多个疑似度分值的最大值, 确定所述 通话内容所表征的意图。 10.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至8任 一项所述基于语音识别的电话语义分析 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114580432 A 3

.PDF文档 专利 一种基于语音识别的电话语义分析方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于语音识别的电话语义分析方法 第 1 页 专利 一种基于语音识别的电话语义分析方法 第 2 页 专利 一种基于语音识别的电话语义分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。