(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210505671.8 (22)申请日 2022.05.10 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张睿卿 张传强 何中军 李芝  吴华  (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 用于生成翻译 模型的方法、 翻译方法及装置 (57)摘要 本公开提供了用于生成翻译模 型的方法、 翻 译方法及装置, 涉及计算机技术领域, 具体为机 器翻译技术领域。 具体实现方案为: 获取样本语 料; 确定样本语料的翻译语种标签; 基于样本语 料在翻译语种标签下的当前翻译结果与整句翻 译结果, 生成样本语料的标注翻译结果; 基于样 本语料、 翻译语种标签以及标注翻译结果, 对待 训练模型进行训练, 得到训练完成的翻译模型。 本实现方式可以降低翻译 模型的建模复杂度。 权利要求书2页 说明书10页 附图5页 CN 114818748 A 2022.07.29 CN 114818748 A 1.一种用于生成翻译模型的方法, 包括: 获取样本语料; 确定所述样本语料的翻译语种标签; 基于所述样本语料在所述翻译语种标签下的当前翻译结果与整句翻译结果, 生成所述 样本语料的标注翻译结果; 基于所述样本语料、 所述翻译语种标签以及所述标注翻译结果, 对待训练模型进行训 练, 得到训练完成的翻译模型。 2.根据权利要求1所述的方法, 其中, 所述确定所述样本语料的翻译语种标签, 包括: 确定所述样本语料对应的翻译前语种和翻译后语种; 基于所述翻译前语种和所述翻译后语种, 生成所述翻译语种标签。 3.根据权利要求2所述的方法, 其中, 还 包括: 基于所述翻译语种标签, 将所述样本语料由所述翻译前语种翻译为所述翻译后语种, 得到所述当前翻译结果。 4.根据权利要求2所述的方法, 其中, 还 包括 确定所述样本语料对应的整句语料; 基于所述翻译语种标签, 将所述整句语料由所述翻译前语种翻译为所述翻译后语种, 得到所述整句翻译结果。 5.根据权利要求1所述的方法, 其中, 所述基于所述样本语料在所述翻译语种标签下的 当前翻译结果与整句翻译结果, 生成所述样本语料的标注翻译结果, 包括: 确定所述当前翻译结果与所述整句翻译结果的共同前缀信息; 基于所述共同前缀信息, 生成所述标注翻译结果。 6.根据权利要求1至5任一项所述的方法, 其中, 所述基于所述样本语料、 所述翻译语种 标签以及所述标注翻译结果, 对待训练模型进行训练, 得到训练完成的翻译模型, 包括: 将所述样本语料和所述翻译语种标签输入所述待训练模型, 得到所述待训练模型输出 的翻译结果; 基于所述待训练模型输出的翻译结果与 所述标注翻译结果, 调整所述待训练模型的模 型参数, 直至调整后的所述待训练模型满足预设的收敛 条件, 得到训练完成的翻译模型。 7.一种翻译方法, 包括: 获取目标语料; 确定所述目标语料对应的目标翻译语种标签; 将所述目标语料和所述目标翻译语种标签输入如权利要求1至6任一项所述的用于生 成翻译模型的方法所生成的翻译模型, 得到与所述目标语料对应的目标翻译结果。 8.根据权利要求7 所述的方法, 还 包括: 获取目标语音; 将所述目标语音转换为所述目标语料。 9.一种用于生成翻译模型的装置, 包括: 样本获取 单元, 被配置成获取样本语料; 语种确定单 元, 被配置成确定所述样本语料的翻译语种标签; 标注确定单元, 被配置成基于所述样本语料在所述翻译语种标签下的当前翻译结果与权 利 要 求 书 1/2 页 2 CN 114818748 A 2整句翻译结果, 生成所述样本语料的标注翻译结果; 模型训练单元, 被配置成基于所述样本语料、 所述翻译语种标签以及所述标注翻译结 果, 对待训练模型进行训练, 得到训练完成的翻译模型。 10.根据权利要求9所述的装置, 其中, 所述语种确定单 元进一步被配置成: 确定所述样本语料对应的翻译前语种和翻译后语种; 基于所述翻译前语种和所述翻译后语种, 生成所述翻译语种标签。 11.根据权利要求10所述的装置, 其中, 还 包括: 当前样本翻译单元, 被配置成基于所述翻译语种标签, 将所述样本语料由所述翻译前 语种翻译为所述翻译后语种, 得到所述当前翻译结果。 12.根据权利要求10所述的装置, 其中, 还 包括 整句样本翻译单元, 被配置成确定所述样本语料对应的整句语料; 基于所述翻译语种 标签, 将所述整句语料由所述翻译前语种翻译为所述翻译后语种, 得到所述整句翻译结果。 13.根据权利要求9所述的装置, 其中, 所述标注确定单 元进一步被配置成: 确定所述当前翻译结果与所述整句翻译结果的共同前缀信息; 基于所述共同前缀信息, 生成所述标注翻译结果。 14.根据权利要求9至13任一项所述的装置, 其中, 所述模型训练单 元进一步被配置成: 将所述样本语料和所述翻译语种标签输入所述待训练模型, 得到所述待训练模型输出 的翻译结果; 基于所述待训练模型输出的翻译结果与 所述标注翻译结果, 调整所述待训练模型的模 型参数, 直至调整后的所述待训练模型满足预设的收敛 条件, 得到训练完成的翻译模型。 15.一种翻译装置, 包括: 语料获取 单元, 被配置成获取目标语料; 标签确定单 元, 被配置成确定所述目标语料对应的目标翻译语种标签; 翻译单元, 被配置成将所述目标语料和所述目标翻译语种标签输入如权利要求1至6任 一项所述的用于生成翻译模型的方法所生成的翻译模型, 得到与所述目标语料对应的目标 翻译结果。 16.根据权利要求15所述的装置, 其中, 所述语料获取 单元进一步被配置成: 获取目标语音; 将所述目标语音转换为所述目标语料。 17.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑8中任一项所述的方法。 18.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑8中任一项所述的方法。 19.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114818748 A 3

.PDF文档 专利 用于生成翻译模型的方法、翻译方法及装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于生成翻译模型的方法、翻译方法及装置 第 1 页 专利 用于生成翻译模型的方法、翻译方法及装置 第 2 页 专利 用于生成翻译模型的方法、翻译方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。