(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210319488.9
(22)申请日 2022.03.29
(71)申请人 京东科技信息技 术有限公司
地址 100176 北京市北京经济技 术开发区
科创十一 街18号院2号楼6层6 01
(72)发明人 王佳
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 李敏灵 臧建明
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/35(2019.01)
G06F 40/194(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
(54)发明名称
模型训练方法、 问题应答方法、 装置和设备
(57)摘要
本申请提供一种模型训练方法、 问题应答方
法、 装置和设备, 涉及智能客服技术领域, 该方法
包括: 构建得到知 识库, 获取第一知 识点、 第一知
识点的代表问和相似问, 获取与第一知识点的相
似度大于预设相似度阈值的第二知识点 以及第
二知识点的代表问和相似问, 将第一知识点的代
表问和相似问作为正例, 第二知识点的代表问和
相似问作为负例构建得到训练样 本, 对待训练的
语义匹配模型进行训练。 该技术方案中, 通过将
第一知识点的代表问和相似问作为正例, 将第二
知识点的代表问和相似问作为负例, 构建得到的
训练样本对模型进行对比训练, 使得训练后的语
义匹配模型能够更好的识别区分知识点之间的
细微差异, 提高对用户问题的应答 准确率。
权利要求书3页 说明书14页 附图9页
CN 114637835 A
2022.06.17
CN 114637835 A
1.一种模型训练方法, 其特 征在于, 包括:
获取目标业务的业务语料, 根据所述业务语料, 构建得到知识库, 所述知识库中存储有
用于对问题进行应答的知识点;
根据所述知识库, 获取第 一知识点、 所述第一知识点应答的代表问和相似问, 所述代表
问与所述相似问的语义相同;
在所述知识库中获取与所述第一知识点的相似度大于预设相似度阈值的第二知识点
以及所述第二知识点的代 表问和相似问;
将所述第一知识点的代表问和相似问作为正例, 所述第 二知识点的代表问和相似问作
为负例, 构建得到训练样本;
根据所述训练样本对待训练的语义匹配模型进行训练, 得到训练后的语义匹配模型。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述训练样本对待训练 的语义匹
配模型进行训练, 得到训练后的语义匹配模型, 包括:
根据所述训练样本中的正例和负例, 对待训练的语义匹配模型进行对比学习训练, 得
到训练后的语义匹配模型, 所述负例的数量大于所述 正例的数量。
3.根据权利要求2所述的方法, 其特征在于, 所述根据所述训练样本中的正例和负例,
对待训练的语义匹配模型进行对比学习训练, 得到训练后的语义匹配模型, 包括:
将预设锚文本、 所述训练样本 中的正例和负例输入至待训练的语义匹配模型的语言编
码层进行编码, 得到锚文本向量、 正例 句向量和负例 句向量;
根据所述锚文本向量、 正例 句向量和负例 句向量, 计算对比损失;
根据所述对比损 失, 对所述待训练的语义匹配模型进行训练, 得到训练后的语义匹配
模型。
4.根据权利要求1所述的方法, 其特征在于, 所述根据所述业务语料, 构建得到知识库,
包括:
根据语义相似度, 对所述 业务语料进行聚类, 得到N个 类簇, N为不小于1的正整数;
对每个类簇分别进行拆分或合并, 得到M个知识点, 各个知识点之间的语义互不相同, M
为不小于1的正整数;
根据M个所述知识点, 构建得到所述知识库。
5.根据权利要求4所述的方法, 其特征在于, 所述根据M个所述知识点, 构建得到所述知
识库, 包括:
在所述业务语料中获取 各个知识点应答的代 表问, 确定所述代 表问的语义;
根据所述代表问的语义, 从所述业务语料中检索得到与所述代表问的语义匹配的问
题, 作为所述代 表问的相似问;
根据各个知识点、 各个知识点的代 表问和代 表问的相似问, 构建得到所述知识库。
6.根据权利要求1所述的方法, 其特征在于, 所述根据所述知识库, 获取第 一知识点, 包
括:
从所述知识库的知识点中选取 出至少一个知识点, 作为所述第一知识点。
7.根据权利要求1所述的方法, 其特征在于, 所述根据所述知识库, 获取第 一知识点、 所
述第一知识点应答的代 表问和相似问, 包括:
在所述知识库中获取第一知识点和所述第一知识点对应的L个提问方式, L为不小于1权 利 要 求 书 1/3 页
2
CN 114637835 A
2的正整数;
确定所述第一知识点对应的各个提问方式的类型和数量;
根据各个提问方式的类型和数量, 从L个提问方式 中确定出 所述第一知识点的代 表问;
根据所述第一知识点的代 表问, 确定所述第一知识点的相似问。
8.根据权利要求1所述的方法, 其特征在于, 所述在所述知识库中获取与所述第 一知识
点的相似度大于预设相似度阈值的第二知识点, 包括:
获取所述知识库中每个知识点的表达关键词, 所述表达关键词为在所述知识点的文本
中出现的关键词;
获取与所述第一知识点的表达关键词的相似度大于预设相似度阈值的表达关键词所
对应的知识点, 作为所述第二知识点。
9.根据权利要求1所述的方法, 其特征在于, 所述在所述知识库中获取与所述第 一知识
点相似的第二知识点、 所述第二知识点的代 表问和相似问, 包括:
在所述知识库中获取所述第 二知识点和所述第 二知识点对应的K个提问方式, K为不小
于1的正整数;
确定所述第二知识点对应的各个提问方式的类型和数量;
根据各个提问方式的类型和数量, 从K个提问方式 中确定出 所述第二知识点的代 表问;
根据所述第二知识点的代 表问, 确定所述第二知识点的相似问。
10.一种问题应答方法, 其特 征在于, 包括:
获取用户提交的目标问题;
根据预设 分类模型, 确定所述目标问题的粗 意图;
在所述粗意图对应的知识库中检索得到应答所述目标问题的至少两组应答对, 所述应
答对包括问题和应答所述问题的知识点;
利用预先训练好的语义匹配模型, 在所述至少两组应答对中确定出目标应答对, 其中
所述语义匹配模型根据正例和负例作为训练样本, 通过对比学习训练得到, 所述正例包括
第一知识点的代表问和相似问, 所述负例包括与所述第一知识 点的相似度大于预设相似度
阈值的第二知识点的代 表问和相似问;
选取所述目标应答对中的知识点, 对所述目标问题进行应答。
11.一种模型训练装置, 其特 征在于, 包括:
知识库构建模块, 用于获取目标业务的业务语料, 根据所述业务语料, 构建得到知识
库, 所述知识库中存 储有用于对问题进行应答的知识点;
问题获取模块, 用于根据 所述知识库, 获取第 一知识点、 所述第一知识点应答的代表问
和相似问, 所述代 表问与所述相似问的语义相同;
知识点获取模块, 用于在所述知识库中获取与 所述第一知识点的相似度 大于预设相似
度阈值的第二知识点以及所述第二知识点的代 表问和相似问;
样本构建模块, 用于将所述第一知识点的代表问和相似问作为正例, 所述第二知识点
的代表问和相似问作为负例, 构建得到训练样本;
训练模块, 用于根据所述训练样本对待训练的语义匹配模型进行训练, 得到训练后的
语义匹配模型。
12.一种问题应答装置, 其特 征在于, 包括:权 利 要 求 书 2/3 页
3
CN 114637835 A
3
专利 模型训练方法、问题应答方法、装置和设备
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:51:37上传分享