(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210293206.2
(22)申请日 2022.03.23
(71)申请人 北京快确信息科技有限公司
地址 100000 北京市西城区阜成门外大街
31号4层411D
(72)发明人 甘伟超 林远平 邹鸿岳 周靖宇
(74)专利代理 机构 广东良马律师事务所 4 4395
专利代理师 李良
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/211(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于句法增强的信息自动回复方法、 装置、
系统及介质
(57)摘要
本发明公开了基于句法增强的信息自动回
复方法、 装置、 系统及介质, 通过提取待回复文本
中的关键要素; 根据关键要素在预设数据库中获
取对应的回复元素并填充 得到初始回复文本; 对
初始回复文本进行句法解析处理, 得到各个词节
点的句法依存信息; 通过图注 意力网络对各个词
节点的句法依存信息进行编码, 得到句法依存信
息的图注 意力特征; 将初始回复文本输入至经图
注意力特征进行句法增强处理的预设转换模型
中, 转换输出与初始回复文本含义相同的转述文
本。 通过基于规则填充 得到准确初始回复文本后
进一步利用词与词之间的句法依存关系, 将初始
回复文本转换为表达更加丰富且含义相同的转
述文本, 确保自动回复准确性的同时也提高了回
复文本的灵活多样性。
权利要求书2页 说明书10页 附图3页
CN 114817491 A
2022.07.29
CN 114817491 A
1.一种基于句法增强的信息自动回复方法, 其特 征在于, 包括:
接收用户输入的待回复文本, 并提取 所述待回复文本中的关键要素;
根据所述关键要素在预设数据库中获取对应的回复元素, 并按预设表述规则进行插槽
填充后得到初始回复文本;
对所述初始回复文本进行句法解析处理, 得到所述初始回复文本 中各个词节点的句法
依存信息, 所述句法依存信息包括词性和句法依存关系;
通过图注意力网络对所述各个词节点的句法依存信 息进行编码, 得到所述句法依存信
息的图注意力特 征;
将所述初始回复文本输入至经所述图注意力特征进行句法增强处理的预设转换模型
中, 转换输出与所述初始回复文本含义相同的转 述文本。
2.根据权利要求1所述的基于句法增强的信 息自动回复方法, 其特征在于, 所述接收用
户输入的待回复文本, 并提取 所述待回复文本中的关键要素, 包括:
接收用户输入的待回复文本, 对所述待回复文本进行向量编码后得到序列向量;
对所述序列向量进行 标签预测, 得到序列向量中每 个词的标签;
将符合预设领域的标签对应的词确认为关键要素。
3.根据权利要求1所述的基于句法增强的信 息自动回复方法, 其特征在于, 所述根据 所
述关键要 素在预设数据库中获取对应的回复元素, 并按预设表述规则进 行插槽填充后得到
初始回复文本, 包括:
在预设数据库中查询获取与所述关键要素相关联的回复元 素;
根据所述 回复元素的标签按预设表述规则进行插槽填充处理, 拼接得到包含所述 回复
元素的初始回复文本 。
4.根据权利要求1所述的基于句法增强的信 息自动回复方法, 其特征在于, 所述对所述
初始回复文本进行句法解析处理, 得到所述初始 回复文本中各个词节点的句法依存信息,
包括:
通过预设NLP库对所述初始回复文本进行句法解析, 得到每个词节点的词性信息以及
各个词节点之间的句法依存关系;
根据所述各个词节点之间的句法依存关系构建相应的邻接矩阵。
5.根据权利要求4所述的基于句法增强的信 息自动回复方法, 其特征在于, 所述通过图
注意力网络对所述各个词节点的句法依存信息进 行编码, 得到所述句法依存信息的图注意
力特征, 包括:
根据所述邻 接矩阵构造对应的节点关系图, 并对所述节点关系图进行词汇嵌入和词性
嵌入后, 得到节点向量图;
通过图注意力网络对所述节点向量图进行依存关系特征提取后, 得到所述句法依存信
息的图注意力特 征。
6.根据权利要求5所述的基于句法增强的信 息自动回复方法, 其特征在于, 所述通过图
注意力网络对所述节 点向量图进 行依存关系特征提取后, 得到所述句法依存信息的图注意
力特征, 具体包括:权 利 要 求 书 1/2 页
2
CN 114817491 A
2通过公式
对所述节点向量图进行依存关系特征提
取, 得到第i层的图注意力特征, 其中, 图注意力网络第0层的图注意力特征表示为H0=Eword+
Etag, Eword为词汇嵌入, Etag为词性嵌入,
为词节点i第l+1层的输出特征,
表示词节点
i第l层的输入特征, ||表示向量的拼接操作, σ 表示激活函 数; Aij≠0表示词节点i和词节点j
有句法依存关系,
表示第k个注意力机制下词节点i, j之间的注意力权重,
表
示第k个注意力机制下的线性变换矩阵,
为F×F的矩阵空间, F为空间的维度, K为图注
意力网络中注意力机制的数目, 图注意力网络最后一层的输出 特征为HG。
7.根据权利要求5所述的基于句法增强的信 息自动回复方法, 其特征在于, 所述将所述
初始回复文本输入至经所述图注意力特征进 行句法增强处理的预设转换模 型中, 转换输出
与所述初始回复文本含义相同的转 述文本, 包括:
将所述初始回复文本输入至预设转换模型中, 通过所述预设转换模型中的嵌入层对所
述初始回复文本进行词嵌入和位置嵌入后输出相应的初始文本向量;
通过所述预设转换模型中的编码器对所述初始文本向量进行编码处理, 并在编码时通
过所述图注意力特征对所述编 码器进行句法偏置处理, 提取得到具有 所述句法依存信息的
编码信息;
通过所述预设转换模型中的解码器对所述编码信 息进行解码处理, 得到每个位置 需输
出的字后拼接得到对应的转 述文本。
8.一种基于句法增强的信息自动回复装置, 其特 征在于, 包括:
要素提取模块, 用于接收用户输入的待回复文本, 并提取所述待回复文本中的关键要
素;
填充模块, 用于根据所述关键要素在预设数据库中获取对应的回复元素, 并按预设表
述规则进行插槽填充后得到初始回复文本;
句法解析模块, 用于对所述初始回复文本进行句法解析处理, 得到所述初始回复文本
中各个词节点的句法依存信息, 所述句法依存信息包括词性和句法依存关系;
图特征提取模块, 通过图注意力网络对所述各个词节点的句法依存信息进行编码, 得
到所述句法依存信息的图注意力特 征;
转换模块, 用于将所述初始回复文本输入至经所述图注意力特征进行句法增强处理 的
预设转换模型中, 转换输出与所述初始回复文本含义相同的转 述文本。
9.一种基于句法增强的信息自动回复系统, 其特征在于, 所述系统包括至少一个处理
器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7任一项所述的基于句法增强的
信息自动回复方法。
10.一种非易失性计算机可读存储介质, 其特征在于, 所述非易失性计算机可读存储介
质存储有计算机可执行指令, 该计算机可执行指令被一个或多个处理器执行时, 可使得所
述一个或多个处 理器执行权利要求1 ‑7任一项所述的基于句法增强的信息自动回复方法。权 利 要 求 书 2/2 页
3
CN 114817491 A
3
专利 基于句法增强的信息自动回复方法、装置、系统及介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:49:03上传分享