国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210200740.4 (22)申请日 2022.03.02 (71)申请人 上海欣方智能系统有限公司 地址 201203 上海市浦东 新区碧波路690号 张江微电子 港8号4楼 申请人 上海欣方软件 有限公司 (72)发明人 郑宁 丁正 顾晓东 贺东海 贾岩峰 韩慎勇 杨亚鹏 赵学哲 (74)专利代理 机构 北京德琦知识产权代理有限 公司 11018 专利代理师 陈舒维 宋志强 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/33(2019.01) G06F 16/332(2019.01)G10L 15/26(2006.01) (54)发明名称 一种基于语音识别的电话语义分析方法 (57)摘要 本发明提供了一种基于语音识别的电话语 义分析方法, 包括: 获取通话内容, 将所述通话内 容转写为文本数据; 从所述文本数据提取关键 词, 根据提取的关键词构造关键词列表向量; 将 所述关键词列表向量分别与每个意图特征模型 进行比对, 以分别得到所述关键词列表向量与每 个意图特征模 型之间的疑似度分值, 根据多个疑 似度分值的最大值, 确定所述通话内容所表征的 意图; 其中, 不同意图特征模型分别表征不同意 图; 本发明提供的方法通过连续语音转写技术, 将通话语音转成文本内容, 再结合意图理解技 术, 让系统分析出该通话内容的意图, 提高了对 通话内容意图识别的准确率。 权利要求书2页 说明书7页 附图1页 CN 114580432 A 2022.06.03 CN 114580432 A 1.一种基于语音识别的电话语义分析 方法, 其特 征在于, 包括: 获取通话内容, 将所述 通话内容转写为文本数据; 从所述文本数据提取关键词, 根据提取的关键词构造关键词列表向量; 将所述关键词列表向量分别与每个意图特征模型进行比对, 以分别得到所述关键词列 表向量与每个意图特征模型之间的疑似度分值, 根据多个疑似度分值的最大值, 确定所述 通话内容所表征的意图, 其中, 不同意图特 征模型分别表征不同意图。 2.根据权利要求1所述的方法, 其特征在于, 将所述通话内容转写为文本数据之前, 所 述方法还 包括: 对所述通话内容进行背景高斯噪声 去除处理。 3.根据权利要求1所述的方法, 其特征在于, 所述关键词提取模块将所述文本数据转换 为关键词列表向量包括: 对所述文本数据进行分割, 得到多个文本段; 对所述文本段进行 过滤, 得到关键词节点 集; 根据所述关键词节点 集以及预设的边 集合, 得到节点权 重; 对所述节点权重进行倒序排序, 将排序最前的至少一个节点权重作为候选关键词向 量; 对所述文本数据中与 所述候选关键词相同的部分进行标记, 当多个所述候选关键词在 所述文本数据中相邻, 则将相邻的候选关键词合并作为多词关键词向量; 将多个所述多词关键词向量 合并, 得到所述关键词列表向量。 4.根据权利要求3所述的方法, 其特 征在于, 对所述文本段进行 过滤包括: 对文本段进行分词处 理, 得到分词数据; 对所述分词数据的词性进行 标注; 去除分词数据中的停用词以及 分词数据中不带有预设词性标注的分词数据, 得到关键 词节点集; 其中, 所述预设词性 为预设的关键词 词性。 5.根据权利要求3所述的方法, 其特征在于, 根据所述关键词节点集以及预设的边集 合, 得到节点权 重包括: 基于共现关系, 根据 所述关键词节点集以及预设的边集合对所述关键词节点集中的每 个关键词节点进行处理, 将一关键词节点与另一关键词节点连接形成边, 并分别根据该关 键词所连接的所述边的数量, 基于预设阈值, 去除边的数量未达到所述预设阈值的对应的 关键词节点; 根据预设的阻尼系数, 对剩余的关键词节点进行迭代计算, 得到剩余的每个关键词节 点的节点权 重。 6.根据权利要求5所述的方法, 其特征在于, 将剩余的所述关键词节点通过迭代计算, 得到所述节点权 重包括: 其中, Vi、 Vj所述关键词节点集中的任意两个节点, WS(Vi)为Vi的节点权重, d为阻尼系 数; wji、 wjk分别表示Vi、 Vj的权重系数, I n(Vi)为指向Vi的集合、 out(Vj)为指向Vj的集合。权 利 要 求 书 1/2 页 2 CN 114580432 A 27.根据权利要求1所述的方法, 其特征在于, 所述意图理解模块将所述关键词列表向量 与每个所述意图特征模型进行比对, 以得到所述关键词列表向量与每个所述意图特征模型 对应的疑似度分值包括: 分别计算所述关键词向量与每个意图特征模型的相对熵, 其中多个相对熵中的最小值 对应所述疑似度分值的最大值。 8.根据权利要求7所述的方法, 其特征在于: 所述分别计算关键词向量计算与每个所述 意图特征模型的相对熵具体包括: 其中, P(x)表示所述关键词列表向量中一关键词的概率分布, Q(x)表示所述意图特征 模型中该关键词的概率分布, x表 示所述意图特征模 型中预设的关键词字 符集, KL(P||Q)表 示P(x)与Q(x)对应的相对熵。 9.一种基于语音识别的电话语义分析系统, 其特 征在于, 包括: 语音识别模块, 用于获取通话内容, 将所述通话内容转写为文本数据, 并发送至关键词 提取模块; 关键词提取模块, 用于将所述文本数据转换为关键词列表向量, 并发送至意图理解模 块; 意图理解模块, 其特征库中包括多个表征不同意图的意图特征模型, 用于将所述关键 词列表向量与每个意图特征模型进行比对, 以得到所述关键词 列表向量与每个意图特征模 型对应的疑似度分值, 根据多个疑似度分值的最大值, 确定所述 通话内容所表征的意图。 10.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至8任 一项所述基于语音识别的电话语义分析 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114580432 A 3
专利 一种基于语音识别的电话语义分析方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:45:58
上传分享
举报
下载
原文档
(631.6 KB)
分享
友情链接
公安部 网络安全等级保护条例 征求意见稿 .pdf
数据存储介质管理规范.pdf
GB-T 39768-2021 人类生物样本分类与编码.pdf
DB31-T 1240.2-2020 公共数据共享交换工作规范 第2部分:平台接入技术要求 上海市.pdf
GB50156-2021 2-汽车加油加气加氢站技术标准 GB 50156-2021.pdf
DB22-T 370-2014 建筑逃生缓降器设置技术规范 吉林省.pdf
R155e.pdf
GB-T 36969-2018 纳米技术 原子力显微术测定纳米薄膜厚度的方法.pdf
T-ZZB 1934—2020 超高效节能电机用高绝缘漆包铜圆线.pdf
GB-T 39205-2020 信息安全技术 轻量级鉴别与访问控制机制.pdf
GB-T 27909.3-2011 银行业务 密钥管理(零售) 第3部分:非对称密码系统及其密钥管理和生命周期.pdf
T-CESA 1208—2022 光伏组件节能量计算方法.pdf
数据安全审计制度.pdf
DB13-T 5557-2022 村庄规划技术规范 河北省.pdf
GB-T 22264.4-2022 安装式数字显示电测量仪表 第4部分:频率表的特殊要求.pdf
德勤中国 数字化时代下的网络安全战略框架系列之二.pdf
YD-T 交互式应用程序安全测试工具能力要求.pdf
SANS 应急响应处理手册 incident-handlers-handbook 英文版.pdf
GB-T 26236.1-2010 信息技术 软件资产管理 第1部分:过程.pdf
GB-T 42859-2023 航天产品质量问题三个面向分析方法实施要求.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(631.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。