国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210505671.8 (22)申请日 2022.05.10 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张睿卿 张传强 何中军 李芝 吴华 (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 用于生成翻译 模型的方法、 翻译方法及装置 (57)摘要 本公开提供了用于生成翻译模 型的方法、 翻 译方法及装置, 涉及计算机技术领域, 具体为机 器翻译技术领域。 具体实现方案为: 获取样本语 料; 确定样本语料的翻译语种标签; 基于样本语 料在翻译语种标签下的当前翻译结果与整句翻 译结果, 生成样本语料的标注翻译结果; 基于样 本语料、 翻译语种标签以及标注翻译结果, 对待 训练模型进行训练, 得到训练完成的翻译模型。 本实现方式可以降低翻译 模型的建模复杂度。 权利要求书2页 说明书10页 附图5页 CN 114818748 A 2022.07.29 CN 114818748 A 1.一种用于生成翻译模型的方法, 包括: 获取样本语料; 确定所述样本语料的翻译语种标签; 基于所述样本语料在所述翻译语种标签下的当前翻译结果与整句翻译结果, 生成所述 样本语料的标注翻译结果; 基于所述样本语料、 所述翻译语种标签以及所述标注翻译结果, 对待训练模型进行训 练, 得到训练完成的翻译模型。 2.根据权利要求1所述的方法, 其中, 所述确定所述样本语料的翻译语种标签, 包括: 确定所述样本语料对应的翻译前语种和翻译后语种; 基于所述翻译前语种和所述翻译后语种, 生成所述翻译语种标签。 3.根据权利要求2所述的方法, 其中, 还 包括: 基于所述翻译语种标签, 将所述样本语料由所述翻译前语种翻译为所述翻译后语种, 得到所述当前翻译结果。 4.根据权利要求2所述的方法, 其中, 还 包括 确定所述样本语料对应的整句语料; 基于所述翻译语种标签, 将所述整句语料由所述翻译前语种翻译为所述翻译后语种, 得到所述整句翻译结果。 5.根据权利要求1所述的方法, 其中, 所述基于所述样本语料在所述翻译语种标签下的 当前翻译结果与整句翻译结果, 生成所述样本语料的标注翻译结果, 包括: 确定所述当前翻译结果与所述整句翻译结果的共同前缀信息; 基于所述共同前缀信息, 生成所述标注翻译结果。 6.根据权利要求1至5任一项所述的方法, 其中, 所述基于所述样本语料、 所述翻译语种 标签以及所述标注翻译结果, 对待训练模型进行训练, 得到训练完成的翻译模型, 包括: 将所述样本语料和所述翻译语种标签输入所述待训练模型, 得到所述待训练模型输出 的翻译结果; 基于所述待训练模型输出的翻译结果与 所述标注翻译结果, 调整所述待训练模型的模 型参数, 直至调整后的所述待训练模型满足预设的收敛 条件, 得到训练完成的翻译模型。 7.一种翻译方法, 包括: 获取目标语料; 确定所述目标语料对应的目标翻译语种标签; 将所述目标语料和所述目标翻译语种标签输入如权利要求1至6任一项所述的用于生 成翻译模型的方法所生成的翻译模型, 得到与所述目标语料对应的目标翻译结果。 8.根据权利要求7 所述的方法, 还 包括: 获取目标语音; 将所述目标语音转换为所述目标语料。 9.一种用于生成翻译模型的装置, 包括: 样本获取 单元, 被配置成获取样本语料; 语种确定单 元, 被配置成确定所述样本语料的翻译语种标签; 标注确定单元, 被配置成基于所述样本语料在所述翻译语种标签下的当前翻译结果与权 利 要 求 书 1/2 页 2 CN 114818748 A 2整句翻译结果, 生成所述样本语料的标注翻译结果; 模型训练单元, 被配置成基于所述样本语料、 所述翻译语种标签以及所述标注翻译结 果, 对待训练模型进行训练, 得到训练完成的翻译模型。 10.根据权利要求9所述的装置, 其中, 所述语种确定单 元进一步被配置成: 确定所述样本语料对应的翻译前语种和翻译后语种; 基于所述翻译前语种和所述翻译后语种, 生成所述翻译语种标签。 11.根据权利要求10所述的装置, 其中, 还 包括: 当前样本翻译单元, 被配置成基于所述翻译语种标签, 将所述样本语料由所述翻译前 语种翻译为所述翻译后语种, 得到所述当前翻译结果。 12.根据权利要求10所述的装置, 其中, 还 包括 整句样本翻译单元, 被配置成确定所述样本语料对应的整句语料; 基于所述翻译语种 标签, 将所述整句语料由所述翻译前语种翻译为所述翻译后语种, 得到所述整句翻译结果。 13.根据权利要求9所述的装置, 其中, 所述标注确定单 元进一步被配置成: 确定所述当前翻译结果与所述整句翻译结果的共同前缀信息; 基于所述共同前缀信息, 生成所述标注翻译结果。 14.根据权利要求9至13任一项所述的装置, 其中, 所述模型训练单 元进一步被配置成: 将所述样本语料和所述翻译语种标签输入所述待训练模型, 得到所述待训练模型输出 的翻译结果; 基于所述待训练模型输出的翻译结果与 所述标注翻译结果, 调整所述待训练模型的模 型参数, 直至调整后的所述待训练模型满足预设的收敛 条件, 得到训练完成的翻译模型。 15.一种翻译装置, 包括: 语料获取 单元, 被配置成获取目标语料; 标签确定单 元, 被配置成确定所述目标语料对应的目标翻译语种标签; 翻译单元, 被配置成将所述目标语料和所述目标翻译语种标签输入如权利要求1至6任 一项所述的用于生成翻译模型的方法所生成的翻译模型, 得到与所述目标语料对应的目标 翻译结果。 16.根据权利要求15所述的装置, 其中, 所述语料获取 单元进一步被配置成: 获取目标语音; 将所述目标语音转换为所述目标语料。 17.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑8中任一项所述的方法。 18.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑8中任一项所述的方法。 19.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114818748 A 3
专利 用于生成翻译模型的方法、翻译方法及装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:51:47
上传分享
举报
下载
原文档
(811.7 KB)
分享
友情链接
GB-T 26145-2010 排污阀.pdf
GB-T 40087-2021 地球空间网格编码规则.pdf
DB37-T 1933—2022 氯碱安全生产技术规范 山东省.pdf
GB-T 42433-2023 珠宝玉石鉴定 红外光谱法.pdf
T-CHIA 14.4—2018 医疗健康物联网 感知设备通信数据命名表 第4部分:血氧仪.pdf
GB-T 25977-2022 除雪车.pdf
GB-T 15102-2017 浸渍胶膜纸饰面纤维板和刨花板.pdf
T-CESA 1045—2019 智能音箱技术规范.pdf
GB-T 17964-2021 信息安全技术 分组密码算法的工作模式.pdf
T-CCASC 1006—2023 氯乙烯生产企业安全风险隐患排查指南.pdf
GB-T 22918-2008 易腐食品控温运输技术要求.pdf
T-GDCKCJH 059—2022 汽车域控制器(DCU)自动化测试线接口规范.pdf
GB-T 30810-2014 水泥胶砂中可浸出重金属的测定方法.pdf
GB-T 39965-2021 节能量前评估计算方法.pdf
DB23-T 3649.8—2023 政府网站建设管理规范 第8部分:集约化平台运维 黑龙江省.pdf
Web应用安全基线.doc
DB11-T 1484-2017 固定污染源废气挥发性有机物监测技术规范 北京市.pdf
GB-T 40653-2021 信息安全技术 安全处理器技术要求.pdf
信息安全学报 社工概念演化分析 2021.pdf
GB-T 31519-2015 台风型风力发电机组.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(811.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。