(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210374236.6
(22)申请日 2022.04.11
(71)申请人 深圳市银服 通企业管理咨询有限公
司
地址 518000 广东省深圳市福田区彩田路
红荔路交汇处中银花园办公楼A栋
10A、 B
(72)发明人 胡晨晴 尤伊凤
(74)专利代理 机构 深圳市中科创为专利代理有
限公司 4 4384
专利代理师 谢志龙 杨春
(51)Int.Cl.
H04M 3/493(2006.01)
H04M 3/51(2006.01)
G06F 16/55(2019.01)G06F 40/30(2020.01)
G06N 3/08(2006.01)
G10L 15/22(2006.01)
G10L 25/18(2013.01)
G10L 25/30(2013.01)
G10L 25/60(2013.01)
(54)发明名称
一种基于人工智能的呼叫系统及方法
(57)摘要
本发明提出一种基于人工智能的呼叫系统
及方法, 通过获取话务员的实时通话语音数据,
从所述实时通话语音数据中提取问候语的频谱
信息, 根据所述问候语频谱信息中的谐波特征区
配所述实时通话语音数据的音色分类, 将所述话
务员的通话语音数据输入相应音色分类的神经
网络模型中进行预分类, 当所述话务员的通话语
音数据的预分类结果为低分区间分类时, 对所述
实时通话语音数据进行实时优化处理, 将处理后
的所述实时通话语音数据发送给通话对端, 可以
提升话务员声音的亲和 力, 改善话务员的声音形
象。
权利要求书3页 说明书19页 附图2页
CN 114710592 A
2022.07.05
CN 114710592 A
1.一种基于人工智能的呼叫系统, 其特 征在于, 包括:
语音数据获取模块, 用于获取话 务员的实时通 话语音数据;
频谱信息提取模块, 用于从所述实时通 话语音数据中提取问候语的频谱信息;
音色分类模块, 用于根据所述问候语频谱信 息中的谐波特征区配所述实时通话语音数
据的音色 分类;
预分类模块, 用于将所述话务员的实时通话语音数据输入相应音色分类的神经网络模
型中进行 预分类;
通话语音优化模块, 用于当所述话务员的通话语音数据的预分类结果为低分区间分类
时, 对所述实时通 话语音数据进行实时优化处 理;
语音数据发送模块, 用于将处 理后的所述实时通 话语音数据发送给通 话对端。
2.根据权利要求2所述的基于人工智能的呼叫系统, 其特 征在于, 还 包括:
录音数据获取模块, 用于获取呼叫系统通话录音数据库中的录音数据及对应的评价信
息;
所述频谱信息提取模块还用于从每一份所述通话录音中提取相同语音内容对应的频
谱信息;
所述音色分类模块还用于提取所述频谱信息中的谐波特征以对所述录音数据执行音
色分类;
所述呼叫系统还 包括:
评价信息分类模块, 用于将所述录音数据的评价信息划分为高分区间和低分区间, 根
据所述高分区间和所述低分区间的评分数值对所述录音数据执 行评价分类;
信息关联模块, 用于将所述录音数据与对应的音色 分类、 评价分类相关联;
样本数据划分模块, 用于按照预设比例 将所述分类后的录音数据划分为训练样本数据
和测试样本数据。
3.根据权利要求3所述的基于人工智能的呼叫系统, 其特 征在于, 还 包括:
训练参数配置模块, 用于配置神经网络模型的训练参数; (合并特征信号矩阵; 配置输
入输出数据维度; 初始化网络结构和权值)
归一化处理模块, 用于对所述训练样分类据进行归一 化处理;
神经网络训练模块, 用于顺序将每一个所述训练样本数据输入所述神经网络模型中进
行训练;
误差计算模块, 用于计算每一个所述训练样本数据的误差值;
权重矩阵修正模块, 用于根据所述误差值对所述神经网络模型中的权重矩阵进行修
正。
4.根据权利要求4所述的基于人工智能的呼叫系统, 其特征在于, 所述归一化处理模块
还用于对所述测试样本数据进 行归一化处理, 所述神经网络训练模块还用于顺序将输入每
一个所述测试样本数据输入相应音色分类的神经网络模型中进行测试, 所述误差计算模块
还用于计算每一个所述测试样本数据的误差值, 所述呼叫系统还 包括:
音色分类确定模块, 用于根据所述 误差值得到训练错 误率高的音色 分类;
所述录音数据获取模块还用于从所述呼叫系统通话录音数据库中获取相应音色分类
的其它录音数据及对应的评价信息作为新的训练样本数据以继续训练相 应音色分类的神权 利 要 求 书 1/3 页
2
CN 114710592 A
2经网络模型。
5.根据权利要求2至4所述的基于人工智能的呼叫系统, 其特征在于, 所述通话语音优
化模块具体包括:
录音数据获取子模块, 用于获取与 所述实时通话语音数据的音色分类相同的高分区间
分类的录音数据;
声音特征提取子模块, 用于提取 该录音数据的声 音特征;
语音数据处 理子模块, 用于根据所述声 音特征对所述实时通 话语音数据进行处 理。
6.一种呼叫系统的语音数据处 理方法, 其特 征在于, 包括:
获取话务员的实时通 话语音数据;
从所述实时通 话语音数据中提取问候语的频谱信息;
根据所述问候语频谱信息中的谐波特 征区配所述实时通 话语音数据的音色 分类;
将所述话务员的通 话语音数据输入相应音色 分类的神经网络模型中进行 预分类;
当所述话务员的通话语音数据的预分类结果为低分区间分类时, 对所述实时通话语音
数据进行实时优化处 理;
将处理后的所述实时通 话语音数据发送给通 话对端。
7.根据权利要求6所述的语音数据处 理方法, 其特 征在于, 还 包括:
获取呼叫系统通 话录音数据库中的录音数据及对应的评价信息;
从每一份所述 通话录音中提取相同语音内容对应的频谱信息;
提取所述频谱信息中的谐波特 征以对所述录音数据执 行音色分类;
将所述录音数据的评价信 息划分为高分区间和低分区间, 根据 所述高分区间和所述低
分区间的评分数值对所述录音数据执 行评价分类;
将所述录音数据与对应的音色 分类、 评价分类相关联;
按照预设比例将所述分类后的录音数据划分为训练样本数据和 测试样本数据。
8.根据权利要求7 所述的语音数据处 理方法, 其特 征在于, 还 包括:
配置神经网络模型的训练参数; (合并特征信号矩阵; 配置输入输出数据维度; 初始化
网络结构和权值)
对所述训练样分类据进行归一 化处理;
顺序将每一个所述训练样本数据输入所述神经网络模型中进行训练;
计算每一个所述训练样本数据的误差值;
根据所述 误差值对所述神经网络模型中的权 重矩阵进行修 正。
9.根据权利要求8所述的语音数据处 理方法, 其特 征在于, 还 包括:
对所述测试样本数据进行归一 化处理;
顺序将输入每一个所述测试样本数据输入相应音色 分类的神经网络模型中进行测试;
计算每一个所述测试样本数据的误差值;
根据所述 误差值得到训练错 误率高的音色 分类;
从所述呼叫系统通话录音数据库中获取相应音色分类的其它录音数据及对应的评价
信息作为 新的训练样本数据以继续训练相应音色 分类的神经网络模型。
10.根据权利要求7至9所述的语音数据处理方法, 其特征在于, 对所述实时通话语音数
据进行实时优化处 理的步骤具体包括:权 利 要 求 书 2/3 页
3
CN 114710592 A
3
专利 一种基于人工智能的呼叫系统及方法
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:44:52上传分享