(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210189019.X (22)申请日 2022.02.28 (71)申请人 北京京东尚科信息技 术有限公司 地址 100086 北京市海淀区知春路76号8层 (72)发明人 李浩然  (74)专利代理 机构 中国贸促会专利商标事务所 有限公司 1 1038 专利代理师 王云飞 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 40/126(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 对话生成模型的训练方法和装置、 对话生成 方法和装置 (57)摘要 本公开涉及一种对话生成模型的训练方法 和装置、 对话生成方法和装置。 该对话生成模型 的训练方法包括: 获取训练数据, 其中, 训练数据 包括历史轮次的提问语句、 历史轮次的回复语 句、 当前轮次的提问语句; 将当前轮次的回复语 句作为对话生成模型的第一输出目标进行第一 训练; 将历史轮次的提问语句和历史轮次的回复 语句作为对话生成模型的第二输出目标进行第 二训练。 本公开利用多任务学习, 不仅可 以将当 前轮的回复作为训练的目标, 同时还 可以将生成 历史轮次的提问和回复作为训练目标。 权利要求书2页 说明书8页 附图3页 CN 114547272 A 2022.05.27 CN 114547272 A 1.一种对话 生成模型的训练方法, 其特 征在于, 包括: 获取训练数据, 其中, 训练数据包括历史轮次的提问语句、 历史轮次的回复语句、 当前 轮次的提问语句; 将当前轮次的回复语句作为对话 生成模型的第一输出目标进行第一训练; 将历史轮次的提问语句和历史轮次的回复语句作为对话生成模型的第二输出目标进 行第二训练。 2.根据权利要求1所述的训练方法, 其特征在于, 所述将当前轮次的回复语句作为对话 生成模型的第一输出目标进行第一训练包括: 将训练数据作为对话生成模型的输入, 将当前轮次的回复语句作为对话生成模型的第 一输出目标; 对训练数据进行编码生成第一编码语义向量; 根据第一编码语义向量和前一次的模型输出, 确定第一 解码隐层状态; 根据第一 解码隐层状态和第一目标词, 确定第一目标词的生成概 率。 3.根据权利要求2所述的训练方法, 其特征在于, 所述将历史轮次的提问语句和历史轮 次的回复语句作为对话 生成模型的第二输出目标进行第二训练包括: 在训练数据中, 随机对一个轮次的提问语句或回复语句进行掩码, 将掩码后的训练数 据作为对话 生成模型的输入, 掩码的语句作为对话 生成模型的第二输出目标; 对掩码后的训练数据进行编码生成第二编码语义向量; 根据第二编码语义向量和前一次的模型输出, 确定第二 解码隐层状态; 根据第二 解码隐层状态和第二目标词, 确定第二目标词的生成概 率。 4.根据权利要求3所述的训练方法, 其特 征在于, 还 包括: 根据第一输出目标, 确定第一损失函数; 根据第二输出目标, 确定第二损失函数; 根据第一损失函数和第二损失函数确定总损失函数; 根据总损失函数对 对话生成模型进行优化。 5.一种对话 生成方法, 其特 征在于, 包括: 获取用户输入的当前轮次的提问语句; 将当前轮次的提问语句输入对话生成模型, 生成当前轮次的答复语句, 其中, 所述对话 生成模型为采用如权利要求1 ‑4中任一项所述的训练方法生成的对话 生成模型。 6.一种对话 生成模型的训练装置, 其特 征在于, 包括: 数据获取模块, 用于获取训练数据, 其中, 训练数据包括历史轮次的提问语句、 历史轮 次的回复语句、 当前轮次的提问语句; 第一训练模块, 用于将当前轮次的回复语句作为对话生成模型的第 一输出目标进行第 一训练; 第二训练模块, 用于将历史轮次的提问语句和历史轮次的回复语句作为对话生成模型 的第二输出目标进行第二训练。 7.根据权利要求6所述的训练装置, 其特 征在于, 第一训练模块, 用于将训练数据作为对话生成模型的输入, 将当前轮次的回复语句作 为对话生成模型 的第一输出目标; 对训练数据进行编码生成第一编码语义向量; 根据第一权 利 要 求 书 1/2 页 2 CN 114547272 A 2编码语义向量和前一次的模型输出, 确定第一解码隐层状态; 根据第一解码隐层状态和第 一目标词, 确定第一目标词的生成概 率。 8.根据权利要求7 所述的训练装置, 其特 征在于, 第二训练模块, 用于在训练数据中, 随机对一个轮次的提问语句或回复语句进行掩码, 将掩码后的训练数据作为对话生成模型的输入, 掩码的语句作为对话生成模型的第二输出 目标; 对掩码后的训练数据进行编码生成第二编码语义向量; 根据第二编码语义向量和前 一次的模 型输出, 确定第二解码隐层状态; 根据第二解码隐层状态和 第二目标词, 确定第二 目标词的生成概 率。 9.根据权利要求8所述的训练装置, 其特 征在于, 还 包括: 损失函数确定模块, 根据第一输出目标, 确定第一损失函数; 根据第二输出目标, 确定 第二损失函数; 根据第一损失函数和第二损失函数确定总损失函数; 优化模块, 用于根据总损失函数对 对话生成模型进行优化。 10.一种对话 生成装置, 其特 征在于, 包括: 语句获取模块, 用于获取用户输入的当前轮次的提问语句; 对话生成模块, 用于将当前轮次的提问语句输入对话生成模型, 生成当前轮次的答复 语句, 其中, 所述对话生成模型为采用如权利要求 1‑4中任一项 所述的训练方法生 成的对话 生成模型。 11.一种计算机装置, 其特 征在于, 包括: 存储器, 用于存 储指令; 处理器, 用于执行所述指令, 使得所述计算机装置执行实现如权利要求1 ‑4中任一项所 述的训练方法、 或如权利要求5所述的对话 生成方法的操作。 12.一种非瞬时性计算机可读存储介质, 其特征在于, 所述非瞬时性计算机可读存储介 质存储有计算机指令, 所述指令被处理器执行时实现如权利要求1 ‑4中任一项所述的训练 方法、 或如权利要求5所述的对话 生成方法。权 利 要 求 书 2/2 页 3 CN 114547272 A 3

.PDF文档 专利 对话生成模型的训练方法和装置、对话生成方法和装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对话生成模型的训练方法和装置、对话生成方法和装置 第 1 页 专利 对话生成模型的训练方法和装置、对话生成方法和装置 第 2 页 专利 对话生成模型的训练方法和装置、对话生成方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:50:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。