国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210189019.X (22)申请日 2022.02.28 (71)申请人 北京京东尚科信息技 术有限公司 地址 100086 北京市海淀区知春路76号8层 (72)发明人 李浩然 (74)专利代理 机构 中国贸促会专利商标事务所 有限公司 1 1038 专利代理师 王云飞 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 40/126(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 对话生成模型的训练方法和装置、 对话生成 方法和装置 (57)摘要 本公开涉及一种对话生成模型的训练方法 和装置、 对话生成方法和装置。 该对话生成模型 的训练方法包括: 获取训练数据, 其中, 训练数据 包括历史轮次的提问语句、 历史轮次的回复语 句、 当前轮次的提问语句; 将当前轮次的回复语 句作为对话生成模型的第一输出目标进行第一 训练; 将历史轮次的提问语句和历史轮次的回复 语句作为对话生成模型的第二输出目标进行第 二训练。 本公开利用多任务学习, 不仅可 以将当 前轮的回复作为训练的目标, 同时还 可以将生成 历史轮次的提问和回复作为训练目标。 权利要求书2页 说明书8页 附图3页 CN 114547272 A 2022.05.27 CN 114547272 A 1.一种对话 生成模型的训练方法, 其特 征在于, 包括: 获取训练数据, 其中, 训练数据包括历史轮次的提问语句、 历史轮次的回复语句、 当前 轮次的提问语句; 将当前轮次的回复语句作为对话 生成模型的第一输出目标进行第一训练; 将历史轮次的提问语句和历史轮次的回复语句作为对话生成模型的第二输出目标进 行第二训练。 2.根据权利要求1所述的训练方法, 其特征在于, 所述将当前轮次的回复语句作为对话 生成模型的第一输出目标进行第一训练包括: 将训练数据作为对话生成模型的输入, 将当前轮次的回复语句作为对话生成模型的第 一输出目标; 对训练数据进行编码生成第一编码语义向量; 根据第一编码语义向量和前一次的模型输出, 确定第一 解码隐层状态; 根据第一 解码隐层状态和第一目标词, 确定第一目标词的生成概 率。 3.根据权利要求2所述的训练方法, 其特征在于, 所述将历史轮次的提问语句和历史轮 次的回复语句作为对话 生成模型的第二输出目标进行第二训练包括: 在训练数据中, 随机对一个轮次的提问语句或回复语句进行掩码, 将掩码后的训练数 据作为对话 生成模型的输入, 掩码的语句作为对话 生成模型的第二输出目标; 对掩码后的训练数据进行编码生成第二编码语义向量; 根据第二编码语义向量和前一次的模型输出, 确定第二 解码隐层状态; 根据第二 解码隐层状态和第二目标词, 确定第二目标词的生成概 率。 4.根据权利要求3所述的训练方法, 其特 征在于, 还 包括: 根据第一输出目标, 确定第一损失函数; 根据第二输出目标, 确定第二损失函数; 根据第一损失函数和第二损失函数确定总损失函数; 根据总损失函数对 对话生成模型进行优化。 5.一种对话 生成方法, 其特 征在于, 包括: 获取用户输入的当前轮次的提问语句; 将当前轮次的提问语句输入对话生成模型, 生成当前轮次的答复语句, 其中, 所述对话 生成模型为采用如权利要求1 ‑4中任一项所述的训练方法生成的对话 生成模型。 6.一种对话 生成模型的训练装置, 其特 征在于, 包括: 数据获取模块, 用于获取训练数据, 其中, 训练数据包括历史轮次的提问语句、 历史轮 次的回复语句、 当前轮次的提问语句; 第一训练模块, 用于将当前轮次的回复语句作为对话生成模型的第 一输出目标进行第 一训练; 第二训练模块, 用于将历史轮次的提问语句和历史轮次的回复语句作为对话生成模型 的第二输出目标进行第二训练。 7.根据权利要求6所述的训练装置, 其特 征在于, 第一训练模块, 用于将训练数据作为对话生成模型的输入, 将当前轮次的回复语句作 为对话生成模型 的第一输出目标; 对训练数据进行编码生成第一编码语义向量; 根据第一权 利 要 求 书 1/2 页 2 CN 114547272 A 2编码语义向量和前一次的模型输出, 确定第一解码隐层状态; 根据第一解码隐层状态和第 一目标词, 确定第一目标词的生成概 率。 8.根据权利要求7 所述的训练装置, 其特 征在于, 第二训练模块, 用于在训练数据中, 随机对一个轮次的提问语句或回复语句进行掩码, 将掩码后的训练数据作为对话生成模型的输入, 掩码的语句作为对话生成模型的第二输出 目标; 对掩码后的训练数据进行编码生成第二编码语义向量; 根据第二编码语义向量和前 一次的模 型输出, 确定第二解码隐层状态; 根据第二解码隐层状态和 第二目标词, 确定第二 目标词的生成概 率。 9.根据权利要求8所述的训练装置, 其特 征在于, 还 包括: 损失函数确定模块, 根据第一输出目标, 确定第一损失函数; 根据第二输出目标, 确定 第二损失函数; 根据第一损失函数和第二损失函数确定总损失函数; 优化模块, 用于根据总损失函数对 对话生成模型进行优化。 10.一种对话 生成装置, 其特 征在于, 包括: 语句获取模块, 用于获取用户输入的当前轮次的提问语句; 对话生成模块, 用于将当前轮次的提问语句输入对话生成模型, 生成当前轮次的答复 语句, 其中, 所述对话生成模型为采用如权利要求 1‑4中任一项 所述的训练方法生 成的对话 生成模型。 11.一种计算机装置, 其特 征在于, 包括: 存储器, 用于存 储指令; 处理器, 用于执行所述指令, 使得所述计算机装置执行实现如权利要求1 ‑4中任一项所 述的训练方法、 或如权利要求5所述的对话 生成方法的操作。 12.一种非瞬时性计算机可读存储介质, 其特征在于, 所述非瞬时性计算机可读存储介 质存储有计算机指令, 所述指令被处理器执行时实现如权利要求1 ‑4中任一项所述的训练 方法、 或如权利要求5所述的对话 生成方法。权 利 要 求 书 2/2 页 3 CN 114547272 A 3
专利 对话生成模型的训练方法和装置、对话生成方法和装置
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:50:20
上传分享
举报
下载
原文档
(519.8 KB)
分享
友情链接
GA-T 1547-2019 信息安全技术 移动智能终端用户数据存储安全技术要求和测试评价方法.pdf
GB-T 16902.5-2017 设备用图形符号表示规则 第5部分:图标的设计指南.pdf
GB-T 23050-2022 信息化和工业化融合管理体系 供应链数字化管理指南.pdf
SN-T 4261-2015 出口中药材中苯并(a)芘残留量的测定.pdf
法律法规 中华人民共和国反恐怖主义法.pdf
GB-T 30583-2014 承压设备焊后热处理规程.pdf
GB-T 37973-2019 信息安全技术 大数据安全管理指南 .pdf
GB-T 33630-2017 海上风力发电机组 防腐规范.pdf
T-CIECCPA 010—2020 节能诊断数据结构化处理规范.pdf
GB-T 17116.3-2018 管道支吊架 第3部分:中间连接件和建筑结构连接件.pdf
DB13-T 5217-2020 河道人工湿地设计规范 河北省.pdf
GB-T 33356-2022 新型智慧城市评价指标.pdf
DL-T 711-2019 汽轮机调节保安系统试验导则.pdf
国家健康医疗大数据标准、安全和服务管理办法(试行).pdf
GB-T 37190-2018 管道腐蚀控制工程全生命周期 通用要求.pdf
GB-T 42753-2023 实时荧光定量PCR仪性能评价通则.pdf
GB-T 29718-2013 滚动轴承 风力发电机组主轴轴承.pdf
GB-T 43806-2024 资产管理系统通用技术要求.pdf
DB52-T 1636.4-2021 机关事务云 第4部分:机关后勤管理数据 贵州省.pdf
6-02-06-03 白酒酿造工.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(519.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。