国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210259679.0 (22)申请日 2022.03.16 (71)申请人 广州华多网络科技有限公司 地址 511442 广东省广州市番禺区南村镇 万达广场B1栋24层 (72)发明人 庞磊 钟裕滨 (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/30(2020.01) G06N 20/00(2019.01) (54)发明名称 文本翻译方法及其装置、 设备、 介质、 产品 (57)摘要 本申请公开一种文本翻译 方法及其装置、 设 备、 介质、 产品, 所述方法包 括: 获取待翻译文本; 采用预先训练至收敛状态的文本翻译模型对所 述待翻译文本进行翻译, 获得结果文本, 其中, 所 述文本翻译模 型的训练过程包括如下步骤: 调用 第一训练数据集中的第一训练样本对该文本翻 译模型实施迭代预训练使其收敛, 所述第一训练 样本为第一语种语料与第二语种语料构成的第 一平行语料; 调用第二训练数据集中的第二训练 样本对该文本翻译模型实施迭代微调训练使其 收敛, 所述第二训练样本为第一语种语料与第二 语种的第二方言语料构成的第二平行语料。 本申 请利用文本翻译 模型实现不同语言的精准互译。 权利要求书2页 说明书15页 附图5页 CN 114757211 A 2022.07.15 CN 114757211 A 1.一种文本翻译方法, 其特 征在于, 包括如下步骤: 获取待翻译 文本; 采用预先训练至收敛状态的文本翻译模型对所述待翻译文本进行翻译, 获得结果文 本, 其中, 所述待翻译文本为第一语种表述或第二语种的第一方言表述的文本, 相应的, 所 述结果文本为第二语种的第一方言表述或第一语种表述的文本, 所述文本翻译模型的训练 过程包括如下步骤: 调用第一训练数据集中的第 一训练样本对该文本翻译模型实施迭代预训练使其收敛, 所述第一训练样本为第一语种语料与第二语种语料构成的第一平行语料, 所述第二语种语 料为所述第一语种语料对应第二语种的第一方言的翻译文本中个别词汇被替换为第二语 种的第二方言的同义词汇的结果; 调用第二训练数据集中的第二训练样本对该文本翻译模型实施迭代微调训练使其收 敛, 所述第二训练样本为第一语种语料与第二语种的第二方言语料构成的第二平行语料。 2.根据权利要求1所述的文本翻译方法, 其特征在于, 所述文本翻译模型的训练过程之 前, 包括如下步骤: 获取与预设数据集中的各个以第一语种表述的原始文本相对应的第二语种的第一方 言的第一翻译 文本和第二方言的第二翻译 文本, 分别作为第一语料库和第二语料库; 比较第一语料库和第 二语料库中关于相同原始文本的不同翻译文本之间的同义词汇, 将所述同义词汇的不同翻译版本之间的映射关系数据构造为特殊词典; 调用语料资源库, 该语料资源库包括第一平行语料, 第一平行语料由第一语种语料与 第二语种第一方言的语料两种对应文本构成; 根据所述特殊词典的映射关系数据, 将第 一平行语料中属于第 二语种第 一方言的同义 词汇的翻译版本替换为所述特殊词典中第二方言的同义词汇的翻译版本构成第二语种语 料, 使该语料资源库构成第一训练数据集。 3.根据权利要求2所述的文本翻译方法, 其特征在于, 所述文本翻译模型的训练过程之 前, 还包括如下步骤: 将所述预设数据集中以第一语种表述的每个原始文本与其对应第二语种第二方言的 翻译文本构造为平行语料, 将所述平行语料构造为第二训练数据集。 4.根据权利要求2所述的文本翻译方法, 其特征在于, 比较第 一语料库和第 二语料库中 关于相同原始文本的不同翻译文本之 间的同义词汇, 将所述同义词汇的不同翻译版本之间 的映射关系数据构造为特殊词典, 包括如下步骤: 比较第一语料库和第二语料库中关于相同原 始文本的不同翻译 文本之间的差异文本; 采用预先训练至收敛状态的实体名词分类模型对其中第一语料库的所述差异文本进 行判断, 以判别其是否为特定类型的名词; 将属于特定类型的名词相对应的第一语料库和第二语料库中的所述差异文本确定为 同义词汇的不同翻译版本, 构造为映射关系数据, 存 储于预构造的特殊词典中。 5.根据权利要求2所述的文本翻译方法, 其特征在于, 根据 所述特殊词典的映射关系数 据, 将第一平行语料中属于第二语种第一方言的同义词汇的翻译版本替换为所述特殊词典 中第二方言的同义词汇的翻译版本构成第二语种语料, 包括如下步骤: 根据特殊词典中所述第 二语种的第 一方言对应的同义词汇的翻译版本, 检索所述语料权 利 要 求 书 1/2 页 2 CN 114757211 A 2资源库中的全量平行语料中的相应目标文本; 获取特殊词典中与 该同义词汇相对应的第 二语种的第 二方言的翻译版本, 随机选 中部 分所述的目标文本替换为所述第二方言的翻译版本 。 6.根据权利要求1中所述的文本翻译方法, 其特征在于, 采用预先训练至收敛状态的文 本翻译模型对所述待翻译 文本进行翻译, 获得 结果文本之后, 包括如下步骤: 响应作用于所述待翻译文本的文本替换指令, 在用于获取所述待翻译文本的当前界面 将该待翻译 文本替换为所述结果文本进行显示; 响应作用于所述结果文本的显示区域的指向事件, 在所述当前界面显示文本提示框, 所述文本提 示框中显示所述待翻译 文本。 7.一种文本翻译装置, 其特 征在于, 包括: 文本获取模块, 用于获取待翻译 文本; 模型翻译模块, 用于采用预先训练至收敛状态的文本翻译模型对所述待翻译文本进行 翻译, 获得 结果文本, 其中, 所述待翻译文本为第 一语种表述或第二语种的第 一方言表述的文本, 相应的, 所 述结果文本为第二语种的第一方言表述或第一语种表述的文本, 所述文本翻译模型的训练 过程包括如下步骤: 模型预训练模块, 用于调用第 一训练数据集中的第 一训练样本对该文本翻译模型实施 迭代预训练使其收敛, 所述第一训练样本为第一语种语料与第二语种语料构成的第一平行 语料, 所述第二语种语料为所述第一语种语料对应第二语种的第一方言的翻译文本中个别 词汇被替换为第二语种的第二方言的同义词汇的结果; 模型微调模块, 用于调用第 二训练数据集中的第 二训练样本对该文本翻译模型实施迭 代微调训练使其收敛, 所述第二训练样本为第一语种语料与第二语种的第二方言语料构成 的第二平行语料。 8.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用 运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的 步骤。 9.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至6中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行 时, 执行相应的方法所包括的步骤。 10.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 该计算机程序/指令被 处理器执行时实现权利要求1至 6任意一项中所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114757211 A 3
专利 文本翻译方法及其装置、设备、介质、产品
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:51:15
上传分享
举报
下载
原文档
(1.3 MB)
分享
友情链接
GB-T 30297-2013 氯碱工业用全氟离子交换膜 应用规范.pdf
岗位说明书.pdf
GB-T 40665.4-2021 中医四诊操作规范 第4部分:切诊.pdf
SY-T 0043-2020 石油天然气工程管道和设备涂色规范.pdf
GB 18384-2020 电动汽车安全要求.pdf
JRT 0271-2023 金融数字化能力成熟度指引.pdf
GB-T 22394.1-2015 机器状态监测与诊断 数据判读和诊断技术 第1部分:总则.pdf
ISO IEC 27000-2018.pdf
GB 38031-2020 电动汽车用动力蓄电池安全要求.pdf
电子认证服务密码管理办法.pdf
GB-T 6730.65-2009 铁矿石 全铁含量的测定 三氯化钛还原重铬酸钾滴定法 常规方法.pdf
GB-T 42293-2022 商品交易市场知识产权保护规范.pdf
T-CSAE 190.4—2021 汽车用轮毂电动轮总成可靠性试验方法.pdf
DB11-T 715-2018 公共汽电车场站功能设计要求 北京市.pdf
DB3311-T 76─2018 杨梅主要病虫害绿色防控技术规程 丽水市.pdf
GB-T 8905-2012 六氟化硫电气设备中气体管理和检测导则.pdf
T-ZZB 0659—2018 马丁代尔耐磨及起毛起球性能试验仪.pdf
GB-T 22522-2021 测量螺纹用米制系列量针.pdf
T-BJQC 201905-2023 智能网联汽车信息安全测试方法和判定准则.pdf
GB-T 41303-2022 塔式太阳能热发电站吸热器技术要求.pdf
1
/
3
23
评价文档
赞助2.5元 点击下载(1.3 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。