国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210414874.6 (22)申请日 2022.04.15 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 王龙跃 涂兆鹏 史树明 (74)专利代理 机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 专利代理师 李玉婷 (51)Int.Cl. G06F 40/51(2020.01) G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 40/284(2020.01) G06F 40/242(2020.01)G06N 20/00(2019.01) (54)发明名称 翻译质量评估方法、 装置、 设备和计算机存 储介质 (57)摘要 本申请公开了一种翻译质量评估方法、 装 置、 设备和计算机存储介质, 可应用于云技术等 场景。 具体的, 该翻译质量评估方法可获取源语 句及对应的候选翻译语句; 对源语句中隐藏的零 代词进行标记, 并识别标记后的待评估源语句中 零代词的目标代词位置; 确定待评估源语句与候 选翻译语句之间的对齐信息; 根据对齐信息及目 标代词位置确定候选翻译语句中与零代词对应 的正确翻译代词的数量; 获取待评估源语句对应 的零代词总数量, 并根据正确翻译代词的数量及 零代词总数量计算候选翻译语句对应的质量评 估分值。 以此, 可实现根据零代词的正确翻译情 况来评估候选翻译语句的翻译质量, 以评估翻译 译文是否与源文语义、 句法结构一致, 提高翻译 质量评估时的准确性。 权利要求书2页 说明书18页 附图4页 CN 115114936 A 2022.09.27 CN 115114936 A 1.一种翻译质量评估方法, 其特 征在于, 包括: 获取源语句及对应的候选翻译语句; 对所述源语句中隐藏的零代词进行标记, 并识别标记后的待评估源语句中所述零代词 的目标代词位置; 确定所述待评估 源语句与所述 候选翻译语句之间的对齐信息; 根据所述对齐信 息及所述目标代词位置, 确定所述候选翻译语句中与 所述零代词对应 的正确翻译代词的数量; 获取所述待评估源语句对应的代词总数量, 并根据 所述正确翻译代词的数量及所述代 词总数量计算所述 候选翻译语句对应的质量评估分值。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述对齐信 息及所述目标代词位 置, 确定所述 候选翻译语句中与所述 零代词对应的正确翻译代词的数量, 包括: 根据所述对齐信 息及所述目标代词位置, 确定所述候选翻译语句中与 所述零代词对齐 的候选翻译代词; 基于所述 零代词对齐的候选翻译代词, 确定与所述 零代词等效的正确翻译代词; 获取所述正确翻译代词的数量。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述对齐信 息及所述目标代词位 置, 确定所述 候选翻译语句中与所述 零代词对齐的候选翻译代词, 包括: 从所述对齐信息中提取 所述目标代词位置对应的代词对齐信息; 根据所述代词对齐信息, 查找所述候选翻译语句中所述零代词对齐的候选翻译词语, 得到查找结果; 基于所述 查找结果, 确定所述 零代词对齐的候选翻译代词。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述查找结果, 确定所述零代词 对齐的候选翻译代词, 包括: 若检测到所述查找结果不包含所述零代词对齐的候选翻译词语, 则根据 所述对齐信 息 和所述目标代词位置, 选定所述候选翻译语句中对应的与所述零代词关联的翻译词语区 域; 若识别到所述翻译词语区域包含翻译词语, 则将所述翻译词语确定为与所述零代词对 齐的候选翻译代词。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述对齐信 息和所述目标代词位 置, 选定所述候选翻译语句中对应的与所述 零代词关联的翻译词语区域, 包括: 确定所述待评估 源语句中与所述目标代词位置相邻的词语位置; 根据所述目标代词位置和所述词语位置确定所述待评估源语句中与所述零代词相邻 的代词区域; 根据所述对齐信息, 确定所述代词区域在所述 候选翻译语句中对应的翻译词语区域。 6.根据权利要求4或5所述的方法, 其特征在于, 所述基于所述零代词对齐的候选翻译 代词, 确定与所述 零代词等效的正确翻译代词, 包括: 从预设双语词典匹配所述 零代词对齐的候选翻译代词, 得到匹配结果; 若所述匹配结果包含与所述候选翻译代词匹配的预设代词, 则将所述候选翻译代词确 定为与所述 零代词等效的正确翻译代词。权 利 要 求 书 1/2 页 2 CN 115114936 A 27.根据权利要求 4所述的方法, 其特 征在于, 还 包括: 若检测到所述查找结果包含所述零代词对齐的候选翻译词语, 则将所述候选翻译词语 确定为所述 零代词对齐的候选翻译代词。 8.根据权利要求1所述的方法, 其特征在于, 所述获取源语句及对应的候选翻译语句, 包括: 获取待翻译源文, 并从所述待翻译源文中提取多个源语句; 通过机器翻译模型对所述多个源语句进行翻译处理, 得到每一源语句对应的候选翻译 语句。 9.一种翻译质量评估 装置, 其特 征在于, 包括: 获取单元, 用于获取源语句及对应的候选翻译语句; 标记单元, 用于对所述源语句中隐藏的零代词进行标记, 并识别标记后的源语句中所 述零代词的目标代词位置; 第一确定单 元, 用于确定所述待评估 源语句与所述 候选翻译语句之间的对齐信息; 第二确定单元, 用于根据所述对齐信息及所述目标代词位置, 确定所述候选翻译语句 中与所述 零代词对应的正确翻译代词的数量; 计算单元, 用于获取所述待评估源语句对应的零代词总数量, 并根据所述正确翻译代 词的数量及所述 零代词总数量计算所述 候选翻译语句对应的质量评估分值。 10.一种计算机设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有计算机程 序, 所述处理器用于运行所述存储器内的计算机程序实现权利要求 1至8任一项 所述的翻译 质量评估方法中的步骤。 11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有多条指 令, 所述指令适于处理器进行加载, 以执行权利要求1至8任一项所述的翻译质量评估方法 中的步骤。 12.一种计算机程序产品, 其特征在于, 包括计算机指令, 所述计算机指被执行时实现 权利要求1至8任一项所述的翻译质量评估方法中的步骤。权 利 要 求 书 2/2 页 3 CN 115114936 A 3
专利 翻译质量评估方法、装置、设备和计算机存储介质
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:52:06
上传分享
举报
下载
原文档
(943.0 KB)
分享
友情链接
GB-T 37972-2019 信息安全技术 云计算服务运行监管框架.pdf
T-SZSA 015—2017 COB LED 光源封装产品技术规范.pdf
GB-T 19766-2016 天然大理石建筑板材.pdf
腾讯安全 物联网汽车安全.pdf
T-CERS 0002—2022 民用改性甲醇燃料.pdf
信息安全技术 电信和互联网大数据安全管控分类分级实施指南.pdf
ISO 17987-7-2016.pdf
GB-T 39441-2020 公共信用信息分类与编码规范.pdf
工商银行 2021网络金融黑产研究报告.pdf
GB-T 31288-2014 铁尾矿砂.pdf
DB44-T 2389-2022 计量检测数据与结果数字化处理系统技术要求 广东省.pdf
GB-T 32102-2015 有机过氧化物含量的测定 碘量法.pdf
JR-T0197-2020 金融数据安全 数据安全分级指南.pdf
T-HAEC 003—2020 工程监理资料管理标准化与信息化工作指南 房屋建筑工程.pdf
GB-T 28637-2012 电动采光排烟天窗.pdf
GB-T 33667-2017 高校毕业生就业指导服务规范.pdf
DB45-T 2629-2023 安全培训与考试机构建设管理规范 广西壮族自治区.pdf
GB-T 34520.5-2017 连续碳化硅纤维测试方法 第5部分:单纤维拉伸性能.pdf
GB-T 39334.1-2020 机械产品制造过程数字化仿真 第1部分:通用要求.pdf
GB-T 41785-2022 磁光电混合存储系统通用规范.pdf
1
/
3
25
评价文档
赞助2.5元 点击下载(943.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。