(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210359847.3
(22)申请日 2022.04.06
(71)申请人 网易 (杭州) 网络有限公司
地址 310056 浙江省杭州市滨江区长河街
道网商路59 9号4幢7层
(72)发明人 孙振华 汪硕芃 郭燧冰 张聪
范长杰 胡志鹏
(74)专利代理 机构 北京风雅颂专利代理有限公
司 11403
专利代理师 李翔
(51)Int.Cl.
G06F 40/35(2020.01)
G06F 40/186(2020.01)
G06F 40/30(2020.01)
G06F 16/332(2019.01)G06F 40/284(2020.01)
G06F 40/289(2020.01)
G06F 40/295(2020.01)
G06F 40/211(2020.01)
G06F 16/35(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
意图识别方法、 装置、 电子设备及存 储介质
(57)摘要
本公开提供一种意图识别方法、 装置、 电子
设备及存储介质, 该方法包括: 获取用户的当前
输入以及与所述用户相关的至少一轮历史对话,
并拼接所述 当前输入和所述历史对话, 得到拼接
的对话数据; 根据所述拼接的对话数据召回所述
用户的意图, 得到若干召回的意图, 并根据所述
召回的意图, 得到若干备选的意图; 将所述拼接
的对话数据和所述备选的意图填充入预先构建
的模板, 得到模板化的用户数据; 将所述模板化
的用户数据输入预先构建并训练的意图识别模
型, 得到确定的意图。 本公开能够识别分散在用
户分多轮输入的语句中的意图, 同时, 通过模板,
能够提高小样本场景 下的意图识别性能。
权利要求书3页 说明书14页 附图4页
CN 114626388 A
2022.06.14
CN 114626388 A
1.一种意图识别方法, 其特 征在于, 包括:
获取用户的当前输入以及与 所述用户相关的至少一轮历史对话, 并拼接所述当前输入
和所述历史对话, 得到拼接的对话数据;
根据所述拼接的对话数据召回所述用户的意图, 得到若干召回的意图, 并根据所述召
回的意图, 得到若干备选的意图;
将所述拼接的对话数据和所述备选的意图填充入预先构建的模板, 得到模板化的用户
数据;
将所述模板化的用户数据输入预 先构建并训练的意图识别模型, 得到确定的意图。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述拼接的对话数据召回所述用
户的意图, 得到若干召回的意图, 并根据所述召回的意图, 得到若干备选的意图, 包括:
根据所述拼接的对话数据, 基于词相似召回所述用户的意图, 得到若干词层面的召回
的意图;
根据所述拼接的对话数据, 基于语义相似召回所述用户的意图, 得到若干语义层面的
召回的意图;
根据所述拼接的对话数据中的所述当前输入, 基于机器学习算法召回所述用户的意
图, 得到若干 机器学习算法层面的召回的意图;
对所述词层面的召回的意图、 所述语义层面的召回的意图和所述机器学习算法层面的
召回的意图进 行融合, 得到若干融合的召回的意图, 并根据所述融合的召回的意图, 得到若
干所述备选的意图;
其中, 所述词层面的召回的意图、 所述语义层面的召回的意图和所述机器学习算法层
面的召回的意图从属于同一 意图库。
3.根据权利要求2所述的方法, 其特征在于, 所述根据所述拼接的对话数据, 基于词相
似召回所述用户的意图, 得到若干词层面的召回的意图, 包括:
从所述意图库中检索包含与所述拼接的对话数据中的词的相似度达到词相似度阈值
的词的意图, 作为所述词层面的召回的意图。
4.根据权利要求2所述的方法, 其特征在于, 所述根据所述拼接的对话数据, 基于语义
相似召回所述用户的意图, 得到若干语义层面的召回的意图, 包括:
对所述拼接的对话数据进行编码, 得到对话数据语义向量;
从所述意图库中检索与所述对话数据语义向量的相似度达到语义向量相似度阈值的
意图语义向量, 其中, 所述 意图库中的意图包 含预先编码得到的意图语义向量;
将所述意图语义向量对应的意图作为所述语义层面的召回的意图。
5.根据权利要求2所述的方法, 其特征在于, 所述根据所述拼接的对话数据中的所述当
前输入, 基于机器学习算法召回所述用户的意图, 得到若干机器学习算法层面的召回的意
图, 包括:
预先基于机器学习算法构建并训练意图召回模型;
将所述当前输入输入所述意图召回模型, 获取所述意图召回模型输出的的召回的意
图, 作为所述机器学习算法层面的召回的意图。
6.根据权利要求2所述的方法, 其特征在于, 所述对所述词层面的召回的意图、 所述语
义层面的召回的意图和所述机器学习算法层面的召回的意图进行融合, 得到若干融合的召权 利 要 求 书 1/3 页
2
CN 114626388 A
2回的意图, 并根据所述融合的召回的意图得到若干所述备选的意图, 包括:
针对每一所述召回的意图, 分别计算所述召回的意图的词层面分数、 语义层面分数和
机器学习算法层面分数, 并分别对所述词层面分数、 所述语义层面分数和所述机器学习算
法层面分数进行归一化, 将归一化后的词层面分数、 语义层面分数和机器学习算法层面分
数的平均值作为所述召回的意图的融合分数;
将所述融合分数高于融合分数阈值的所述召回的意图, 作为所述备选的意图。
7.根据权利要求6所述的方法, 其特征在于, 所述计算所述召回的意图的词层面分数、
语义层面分数和机器学习算法层面分数, 包括:
计算所述召回的意图和所述拼接的对话数据的词层面的相似度, 作为所述召回的意图
的所述词层面分数;
计算所述召回的意图对应的意图语义向量和所述对话数据语义向量的相似度, 作为所
述召回的意图的所述语义层面分数;
获取基于所述机器学习算法得到所述召回的意图的概率, 作为所述召回的意图的所述
机器学习算法层面分数。
8.根据权利要求6所述的方法, 其特征在于, 所述对所述词层面分数、 所述语义层面分
数和所述机器学习算法层面分数进行归一 化, 包括:
分别获取所述词层面分数、 所述语义层面分数和所述机器学习算法层面分数中的最高
分数;
针对对所述词层面分数、 所述语义层面分数和机器学习算法层面分数中的每一分数,
将所述分数除以其对应的层面的所述最高分数, 得到所述归一化后的词层面分数、 语义层
面分数和机器学习算法层面分数。
9.根据权利要求1所述的方法, 其特征在于, 所述模板为包含用于填充文本字符串空白
的完形填空模板;
所述将所述拼接的对话数据和所述备选的意图填充入预先构建的模板, 得到模板化的
用户数据, 包括:
确定所述拼接的对话数据对应的任务类型, 将所述拼接的对话数据和所述备选的意图
填充入所述任务类型对应的所述模板 。
10.根据权利要求1所述的方法, 其特征在于, 所述将所述模板化的用户数据输入预先
构建并训练的意图识别模型, 得到确定的意图, 包括:
对所述模板化的对话数据进行编码, 分别计算编码后的模板化的对话数据中的所述备
选的意图的分数, 对 所述分数最高的所述备选的意图进 行解码, 将解码后的备选的意图, 作
为所述确定的意图。
11.一种意图识别装置, 其特 征在于, 包括:
对话数据获取模块, 被配置为获取用户的当前输入以及与所述用户相关的至少一轮历
史对话, 并拼接所述当前输入和所述历史对话, 得到拼接的对话数据;
备选意图获取模块, 被配置为根据所述拼接的对话数据召回所述用户的意图, 得到若
干召回的意图, 并根据所述召回的意图, 得到若干备选的意图;
用户数据模板化模块, 被配置为将所述拼接的对话数据和所述备选的意图填充入预先
构建的模板, 得到模板化的用户数据;权 利 要 求 书 2/3 页
3
CN 114626388 A
3
专利 意图识别方法、装置、电子设备及存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:31上传分享