(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210451181.4
(22)申请日 2022.04.27
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 龚本玲
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 王天尧 陶海萍
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G10L 13/02(2013.01)
G10L 13/08(2013.01)
G06F 16/33(2019.01)
(54)发明名称
手机银行读屏时多 音字的处 理方法及装置
(57)摘要
本发明公开了一种手机银行读屏时多音字
的处理方法及装置, 涉及金融领域, 其中该方法
包括: 接收客户端发送的待读屏文本; 利用语义
分析算法对待读屏文本进行分词处理, 得到多个
分词; 对每一分词进行多音字判断, 确定第一分
词; 根据预设的固定组词文件, 确定与第一分词
相同的第一固定组词, 和第一固定组词的第一替
换词; 固定组词文件包括多个固定组词, 和每一
固定组词对应的替换词; 每一固定组词的替换词
是指利用与多音字在固定组词中的读音相同的
非多音字替换固定组词中的多音字的词; 将待读
屏文本中的第一分词替换为第一替换词, 得到替
换后的待读屏文本; 对替换后的待读屏文本进行
语音转换。 本发 明可以解决手机银行读屏时多音
字发音错 误的问题。
权利要求书2页 说明书8页 附图4页
CN 114781396 A
2022.07.22
CN 114781396 A
1.一种手机银 行读屏时多 音字的处 理方法, 其特 征在于, 包括:
接收客户端发送的待读屏文本, 所述待读屏文本是客户端根据客户的选择动作确定
的;
利用语义分析算法对所述待读屏文本进行分词处 理, 得到多个分词;
对每一分词进行多 音字判断, 确定第一分词, 所述第一分词为含多 音字的分词;
根据预先设置的固定组词文件, 确定与所述第一分词相同的第一固定组词, 和第一固
定组词对应的第一替换词; 所述固定组词文件包括多个固定组词, 以及每一固定组词唯一
对应的替换词; 每一固定组词包括至少一个多音字, 每一固定组词唯一对应的替换词 是指
利用与多 音字在固定组词中的读音相同的非多 音字替换固定组词中的多 音字的词;
将所述待读屏文本中的第一分词替换为第一 替换词, 得到替换后的待读屏文本;
对替换后的待读屏文本进行语音转换。
2.如权利要求1所述的方法, 其特 征在于, 还 包括:
按照以下 方式设置固定组词文件:
根据手机银 行的业务信息, 设置多个固定组词, 每一固定组词包括至少一个多 音字;
针对每一固定组词, 利用与多音字在固定组词中的读音相同的非多音字替换每一固定
组词中的多 音字, 得到每一固定组词对应的替换词;
将多个固定组词和每一固定组词对应的替换词存 储在固定组词文件中。
3.如权利要求2所述的方法, 其特 征在于, 还 包括:
在手机银行的业务信息发生变更的情况下, 根据变更后的手机银行的业务信息, 更新
固定组词文件中的固定组词及与固定组词对应的替换词。
4.如权利要求1所述的方法, 其特征在于, 对每一分词进行多音字判断, 确定第一分词
之后, 还包括:
若固定组词文件中不存在与第一分词相同的固定组词, 获取第一分词中的第一多音
字;
从多个固定组词中筛 选包含第一多 音字的固定组词, 确定为第二固定组词;
计算第一分词与每一第二固定组词之间的相似度;
将相似度最大的第二固定组词对应的替换词作为第二 替换词;
利用第二替换词中与第 一多音字对应的非多音字, 对第 一分词中的第 一多音字进行替
换, 得到第二分词;
将所述待读屏文本中的第一分词替换为第一 替换词, 得到替换后的待读屏文本, 包括:
将所述待读屏文本中的第一分词替换为第二分词, 得到替换后的待读屏文本 。
5.如权利要求 4所述的方法, 其特 征在于, 还 包括:
利用第一分词和第 二分词, 更新固定组词文件中的固定组词及与固定组词对应的替换
词。
6.一种手机银 行读屏时多 音字的处 理装置, 其特 征在于, 包括:
接收模块, 用于接收客户端发送的待读屏文本, 所述待读屏文本是客户端根据客户的
选择动作确定的;
分词模块, 用于利用语义分析算法对所述待读屏文本进行分词处 理, 得到多个分词;
多音字判断模块, 用于对每一分词 进行多音字判断, 确定第 一分词, 所述第 一分词为含权 利 要 求 书 1/2 页
2
CN 114781396 A
2多音字的分词;
替换词确定模块, 用于根据预先设置的固定组词文件, 确定与所述第一分词相同的第
一固定组词, 和第一固定组词对应的第一替换词; 所述固定组词文件包括多个固定组词, 以
及每一固定组词唯一对应的替换词; 每一固定组词包括至少一个多音字, 每一固定组词唯
一对应的替换词 是指利用与多音字在固定组词中的读音相同的非多音字替换固定组词中
的多音字的词;
替换模块, 用于将所述待读屏文本中的第一分词替换为第一替换词, 得到替换后的待
读屏文本;
语音转换模块, 用于对替换后的待读屏文本进行语音转换。
7.如权利要求6所述的装置, 其特 征在于, 还 包括固定组词 ‑替换词配置模块, 用于:
按照以下 方式设置固定组词文件:
根据手机银 行的业务信息, 设置多个固定组词, 每一固定组词包括至少一个多 音字;
针对每一固定组词, 利用与多音字在固定组词中的读音相同的非多音字替换每一固定
组词中的多 音字, 得到每一固定组词对应的替换词;
将多个固定组词和每一固定组词对应的替换词存 储在固定组词文件中。
8.如权利要求7 所述的装置, 其特 征在于, 还 包括固定组词 ‑替换词更新模块, 用于:
在手机银行的业务信息发生变更的情况下, 根据变更后的手机银行的业务信息, 更新
固定组词文件中的固定组词及与固定组词对应的替换词。
9.如权利要求6所述的装置, 其特征在于, 替换词确定模块, 还用于对每一分词进行多
音字判断, 确定第一分词之后:
若固定组词文件中不存在与第一分词相同的固定组词, 获取第一分词中的第一多音
字;
从多个固定组词中筛 选包含第一多 音字的固定组词, 确定为第二固定组词;
计算第一分词与每一第二固定组词之间的相似度;
将相似度最大的第二固定组词对应的替换词作为第二 替换词;
利用第二替换词中与第 一多音字对应的非多音字, 对第 一分词中的第 一多音字进行替
换, 得到第二分词;
将所述待读屏文本中的第一分词替换为第一 替换词, 得到替换后的待读屏文本, 包括:
将所述待读屏文本中的第一分词替换为第二分词, 得到替换后的待读屏文本 。
10.如权利要求9所述的装置, 其特 征在于, 固定组词 ‑替换词更新模块, 还用于:
利用第一分词和第 二分词, 更新固定组词文件中的固定组词及与固定组词对应的替换
词。
11.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至5任一所述方
法。
12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程
序, 所述计算机程序被处 理器执行时实现权利要求1至 5任一所述方法。
13.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序, 所述计
算机程序被处 理器执行时实现权利要求1至 5任一所述方法。权 利 要 求 书 2/2 页
3
CN 114781396 A
3
专利 手机银行读屏时多音字的处理方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:35上传分享