(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221040846 0.2 (22)申请日 2022.04.19 (71)申请人 国家电网有限公司客户服 务中心 地址 300309 天津市东 丽区东丽湖丽湖环 路21号 (72)发明人 朱龙珠 盛妍 张明杰 宫立华  张全 刘鲲鹏 汪莉 柳薇 王祥  李铮 那辰星 赵成文 苗松  李魁雨 曾超明 吕福生 杜召  (74)专利代理 机构 西安汇智创想知识产权代理 有限公司 61247 专利代理师 李彦 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01)G06K 9/62(2022.01) G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/242(2020.01) G06F 16/33(2019.01) G06F 16/35(2019.01) (54)发明名称 一种95598客户诉求处理方法、 设备及存储 介质 (57)摘要 本发明公开了一种95598客户诉求处理方 法、 设备及存储介质, 该处理方法包括以下步骤: S101、 数据分词, 对客户的语音转译文本数据进 行预处理, 对数据进行分句, 对每句话的词, 进行 分词, 获得分词后的结果数据; S102、 数据向量 化, 分词后的结果数据生成词向量; S103、 词向量 处理, 将生成的词向量输入客户诉求识别算法模 型, 通过神经网络结构, 提取文本的核心 语义, 捕 捉整个句意中不同词/字在整句句意的语义, 根 据语义从而识别得到客户的语音转译文本数据 的诉求分类; S104、 结果输 出, 将所述诉求 分类的 结果发送至相应的处理端。 本发 明能够在较低的 计算资源下, 实现对文本语义的提取, 特征的生 成, 然后对比不同文本语义特征, 以达到判断文 本内容的目的。 权利要求书1页 说明书5页 附图3页 CN 114819072 A 2022.07.29 CN 114819072 A 1.一种95 598客户诉求处 理方法, 其特 征在于, 包括以下步骤: S101、 数据分词 对客户的语音转译文本数据进行预处理, 首先要对数据进行分句, 去掉无效句, 然后对 每句话的词, 进行分词处 理, 获得分词后的结果数据; S102、 数据向量 化 分词后的结果数据生成词向量; 具体为: 将分词后的结果数据全部进行向量化, 转化为能够被神经网络处理的一串数 字, 根据全部的词组, 对这串 数字, 建立一个向量空间, 然后用每个向量来表 示每个词和字, 获得词向量。 S103、 词向量处 理 将生成的词向量输入客户诉求识别算法模型, 通过神经网络结构, 提取文本的核心语 义, 捕捉整个句意中不同词/字在整句句意的语义, 根据语义从而识别得到客户的语音转译 文本数据的诉求分类; S104、 结果输出 将所述诉求分类的结果发送至相应的处 理端。 2.根据权利要求1所述的处理方法, 其特征在于, 步骤S101中分词的原 理是通过统计海 量的文章和文本, 来制作一个字典库的数据库, 使用trie型树的数据结构来保存所有的词 组, 然后根据t rie型树, 生成一个有相无环图的数据结构。 3.根据权利要求1所述的处理方法, 其特征在于, 步骤S101中是使用动态规划算法进行 分词的, 获得分词结果之后, 对语音转译文本格式进行调整, 去掉停用 词, 停用词包括语气 助词、 副词、 介词、 连接词。 4.根据权利要求1所述的处理方法, 其特征在于, 步骤S103中的客户诉求识别算法模型 结合了时序神经网络的记忆力, 并从字/词意、 句意和文本意三个层级提取文本的核心语 义。 5.根据权利要求1所述的处理方法, 其特征在于, 步骤S103中在提取文本的核心语义 时, 同时兼顾句全局 和文本全局的不同部分对整个文本语义的贡献。 6.根据权利要求1所述的处理方法, 其特征在于, 步骤S103中在提取文本的核心语义 时, 通过句层的注意力机制把握句意的核心词/字, 从而获取整句的语义; 通过文本层的注 意力机制, 获得不同语句的语义, 从而识别得到客户语音转译 文本数据的诉求分类。 7.根据权利 要求1所述的处理方法, 其特征在于, 步骤S101至步骤S103是基于如下网络 模型实现的: 所述网络模型是通过Tensorflow框架, 搭建双层的BiLSTM+Sel f‑Attention+ Fully Connected+Softmax的网络模型。 8.一种终端设备, 其特 征在于, 包括存 储器和处 理器: 存储器, 用于存 储计算机指令; 处理器, 用于运行所述存储器存储的计算机指令, 实现权利要求1至7任一项所述的处 理方法。 9.一种存储介质, 其特征在于, 包括可读存储介质和计算机指令, 所述计算机指令存储 在所述可读存 储介质中, 所述计算机指令用于实现权利要求1至7任一项所述的处 理方法。权 利 要 求 书 1/1 页 2 CN 114819072 A 2一种95598客户诉求处理 方法、 设备及存储介质 技术领域 [0001]本发明属于计算机通信技术领域, 涉及一种基于多模型融合的95598客户诉求处 理方法、 设备及存 储介质。 背景技术 [0002]随着社会经济 的不断发展及生活水平的日益提高, 电力客户消费意识越来越强, 传统的供电服务已经无法满足客户日常需求, 电力客户越来越需要多样化、 差异 化的服务。 同时, 由于其他各行业市场化程度提高, 社会整体服务水平日益提升, 电力客户对供电服务 的需求类型越来越多, 期望值 也越来越高。 [0003]95598热线作为国家电网有限公司的统一热线服务窗 口, 每天业务量  20‑30万通, 借由电话渠道, 客户的诉求、 情绪、 期望都集中于此过程, 对语音转译文本开展深入研究意 义巨大。 国网客服中心 致力于为客户提供更好的服务, 作为与电力客户接触的一线 单位, 对 服务风险非常重视, 同时这些风险也是公司总部、 各省(市)公司关注的问题, 在这样的服务 指导模式下, 风险的分析、 处 理、 管控显得 尤为重要。 [0004]因此, 基于海量客户服务语音数据借助人工神经网络技术, 可以全面、 深入、 准确 地了解客户需求、 客户期 望及服务情况, 能够帮助公司快速发现服务短板, 有效开展精准服 务, 不断提升客户服 务水平。 [0005]95598客服电话产生的海量语音数据蕴藏了大量的客户实际诉求和关注热点。 基 于海量客户服务语音 数据是基于统计的学习方法, 自然语言处理中越来越多地使用机器自 动学习的方法来 获取语言知识。 从充分利用数据资源, 改善供电服务质量, 增强客户粘性角 度出发, 通过建立多模融合的语义分析模型, 对海量语音通话内容进 行智能化分析归纳, 挖 掘客户原 始诉求, 辅助开展工单处 理, 提高服 务的准确性、 针对性, 推动现代服 务体系建 设。 [0006]然而, 在文本内容分类、 文本情感分析这类, 需要对文本内容进行识别的应用场景 下, 要求精确地提取, 判别文本的语义内容。 而目前传统的基于统计的技术方案, 无法做到 精确的语义分类, 进 而无法实现精准 服务的开展。 [0007]实际工程上的经验, 采用一层的BiLSTM网络对语料进行处理, 由于有些电话的对 话语句很长, 无法有效的保留全部特征, 因此分类识别效果不佳,  Self‑Attention网络对 于长句的特征提取, 有更好的性能表现, 而目前流行的做法是采用多层的Self ‑Attention 组合来做语义提取, Google的Bert就是12层的Self ‑Attention组合, 但是这种网络结构的 缺点是对计算资源占用极大, 需要专业的, 多台GPU服 务器, 才能获得理想的处 理速度。 发明内容 [0008]本发明的目的是提供一种95598客户诉求处理方法, 该方法是基于多模型融合的 处理方法, 能够在较低的计算资源下, 实现对文本语义的提取, 特征 的生成, 然后对比不同 文本语义特 征, 以达到判断文本内容的目的。 [0009]本发明采取的技 术方案如下:说 明 书 1/5 页 3 CN 114819072 A 3

.PDF文档 专利 一种95598客户诉求处理方法、设备及存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种95598客户诉求处理方法、设备及存储介质 第 1 页 专利 一种95598客户诉求处理方法、设备及存储介质 第 2 页 专利 一种95598客户诉求处理方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。