(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221028393 3.0
(22)申请日 2022.03.21
(71)申请人 北京有竹居网络技 术有限公司
地址 101299 北京市平谷区林荫北街13号
信息大厦802室
(72)发明人 邹雨巷 马泽君
(74)专利代理 机构 北京英创嘉友知识产权代理
事务所(普通 合伙) 11447
专利代理师 曹寒梅
(51)Int.Cl.
G10L 13/02(2013.01)
G10L 13/10(2013.01)
G06F 40/205(2020.01)
G06F 40/253(2020.01)
G06F 40/30(2020.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
韵律预测方法、 装置、 可读介质及电子设备
(57)摘要
本公开涉及一种韵律预测方法、 装置、 可读
介质及电子设备, 能够得到更加合适的韵律特
征。 所述方法包括: 获取待处理的目标文本; 根据
所述目标文本和预训练的韵律预测模 型, 确定所
述目标文本的韵律特征信息, 所述韵律特征信息
包括对应于多种预设韵律维度的韵律特征; 其
中, 所述韵律预测模型包括特征提取网络和多个
特征预测网络, 所述特征提取网络用于提取所述
目标文本的语 言学信息, 所述多个特征预测网络
分别与所述特征提取网络连接, 并且, 所述多个
特征预测网络各自对应一个所述预设韵律维度,
每一所述特征预测网络用于根据所述特征提取
网络提取出的语言学信息预测出对应于一种预
设韵律维度的韵律特 征。
权利要求书3页 说明书13页 附图2页
CN 114613351 A
2022.06.10
CN 114613351 A
1.一种韵律预测方法, 其特 征在于, 所述方法包括:
获取待处 理的目标文本;
根据所述目标文本和预训练的韵律预测模型, 确定所述目标文本的韵律特征信息, 所
述韵律特 征信息包括对应于多种预设韵律维度的韵律特 征;
其中, 所述韵律预测模型包括特征提取网络和多个特征预测网络, 所述特征提取网络
用于提取所述目标文本的语言学信息, 所述多个特征预测网络 分别与所述特征提取网络连
接, 并且, 所述多个特征预测网络各自对应一个所述预设韵律维度, 每一所述特征预测网络
用于根据所述特征提取网络提取出的语言学信息预测出对应于一种预设韵律维度的韵律
特征。
2.根据权利要求1所述的方法, 其特 征在于, 每一预设韵律维度包 含多种韵律类别;
所述根据所述目标文本和预训练的韵律预测模型, 确定所述目标文本的韵律特征信
息, 包括:
根据构成所述目标文本的多个单位文本和预设映射表, 将所述目标文本转换为文本标
识序列, 作为目标标识序列, 其中, 所述预设映射表用于指示单位文本与文本标识之 间的对
应关系;
将所述目标标识序列输入至所述韵律预测模型中, 得到所述韵律预测模型输出的第 一
结果, 所述第一结果用于指示所述目标标识序列中每一文本标识属于各预设韵律 维度中每
一韵律类别的概 率;
根据所述第 一结果中每一所述文本标识在各预设韵律维度对应的最大概率, 确定所述
目标标识序列中每一文本标识的韵律特 征信息, 以确定所述目标文本的韵律特 征信息。
3.根据权利要求2所述的方法, 其特 征在于, 所述韵律预测模型通过如下 方式获得:
获取多组训练数据, 每一组训练数据包括与训练文本对应的训练标识序列和韵律标签
信息, 所述训练标识序列是通过所述预设 映射表对所述训练文本进行转换得到的, 所述韵
律标签信息包括对应于所述预设韵律维度的韵律特 征;
将所述训练标识序列中的目标训练标识序列输入至本次训练的韵律预测模型, 得到本
次训练的韵律预测模型输出的第二结果, 所述第二结果用于指示所述目标训练标识序列中
每一文本标识属于各 预设韵律维度中每一韵律类别的概 率;
若满足停止训练条件, 将本次训练的韵律预测模型确定为训练完成的韵律预测模型;
若不满足所述停止训练条件, 确定本次训练的目标损 失值, 并利用所述目标损 失值更
新本次训练的韵律预测模型 的参数, 并将更新后的韵律预测模型用于下一次训练, 直至满
足所述停止训练条件, 其中, 所述 目标损失值根据所述 目标训练标识序列对应的韵律标签
信息和所述第二结果确定 。
4.根据权利要求3所述的方法, 其特征在于, 所述第 二结果包括本次训练 的韵律预测模
型中每一特 征预测网络的输出内容;
所述确定 本次训练的目标损失值, 包括:
根据所述目标训练标识序列对应的韵律标签信 息, 分别与每一所述输出内容进行损失
值计算, 得到每一特 征预测网络各自对应的损失值;
根据每一特征预测网络各自对应的计算权重, 对各特征预测网络对应的损失值进行加
权求和, 以得到所述目标损失值。权 利 要 求 书 1/3 页
2
CN 114613351 A
25.根据权利要求4所述的方法, 其特征在于, 所述根据所述目标训练标识序列对应的韵
律标签信息, 分别与每一所述输出内容进行损失值计算, 得到每一特征预测网络各自对应
的损失值, 包括:
分别将每一所述特 征预测网络作为目标 特征预测网络, 并执 行以下操作:
根据所述多组训练数据, 确定目标韵律维度包含的韵律类别各自对应的计算权重, 所
述目标韵律 维度为目标特征预测网络对应的预设韵律 维度, 且韵律类别 在所述多组训练数
据中出现的次数越多, 该韵律类别对应的计算权 重越小;
根据所述目标训练标识序列对应的韵律标签信 息、 所述目标特征预测网络的输出内容
以及所述目标韵律维度的每一韵律类别各自对应的计算权重, 确定所述目标特征网络对应
的损失值。
6.根据权利要求4所述的方法, 其特征在于, 特征预测网络对应的计算权重与 该特征预
测网络对应的损失值负相关。
7.根据权利要求2所述的方法, 其特征在于, 所述预设韵律维度包括音高重音、 短语重
音和边界调;
所述根据 所述第一结果中每一所述文本标识在各预设韵律维度对应的最大概率, 确定
所述目标标识序列中每一文本标识的韵律特征信息, 以确定所述目标文本的韵律特征信
息, 包括:
针对所述目标标识序列中的每一文本标识, 根据 该文本标识在各预设韵律维度的最大
概率, 确定该文本标识分别对应于音高重音、 短语重音和边界调的韵律特征信息, 并且, 根
据该文本标识对应于短语重音和边界调的韵律特征信息以及预设的短语重音、 边界调 与间
断指数之间的对应关系, 确定该文本标识对应于间断指数的韵律特 征信息。
8.根据权利要求2所述的方法, 其特征在于, 所述预设韵律维度包括间断指数、 音高重
音、 短语重音和边界调;
所述根据 所述第一结果中每一所述文本标识在各预设韵律维度对应的最大概率, 确定
所述目标标识序列中每一文本标识的韵律特征信息, 以确定所述目标文本的韵律特征信
息, 包括:
针对所述目标标识序列中的每一文本标识, 根据 该文本标识在各预设韵律维度的最大
概率, 确定该文本标识分别对应于间断指数、 音高重音、 短语重音和边界调的韵律特征信
息。
9.一种韵律预测装置, 其特 征在于, 所述装置包括:
第一获取模块, 用于获取待处 理的目标文本;
第一确定模块, 用于根据所述目标文本和预训练的韵律预测模型, 确定所述目标文本
的韵律特 征信息, 所述韵律特 征信息包括对应于多种预设韵律维度的韵律特 征;
其中, 所述韵律预测模型包括特征提取网络和多个特征预测网络, 所述特征提取网络
用于提取所述目标文本的语言学信息, 所述多个特征预测网络 分别与所述特征提取网络连
接, 并且, 所述多个特征预测网络各自对应一个所述预设韵律维度, 每一所述特征预测网络
用于根据所述特征提取网络提取出的语言学信息预测出对应于一种预设韵律维度的韵律
特征。
10.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 该程序被处理装置执权 利 要 求 书 2/3 页
3
CN 114613351 A
3
专利 韵律预测方法、装置、可读介质及电子设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:52:49上传分享