专利基于句法增强的信息自动回复方法、装置、系统及介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210293206.2 (22)申请日 2022.03.23 (71)申请人北京快确信息科技有限公司地址 100000 北京市西城区阜成门外大街 31号4层411D (72)发明人甘伟超　林远平　邹鸿岳　周靖宇　 (74)专利代理机构广东良马律师事务所 4 4395 专利代理师李良 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/211(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于句法增强的信息自动回复方法、装置、系统及介质 (57)摘要本发明公开了基于句法增强的信息自动回复方法、装置、系统及介质，通过提取待回复文本中的关键要素；根据关键要素在预设数据库中获取对应的回复元素并填充得到初始回复文本；对初始回复文本进行句法解析处理，得到各个词节点的句法依存信息；通过图注意力网络对各个词节点的句法依存信息进行编码，得到句法依存信息的图注意力特征；将初始回复文本输入至经图注意力特征进行句法增强处理的预设转换模型中，转换输出与初始回复文本含义相同的转述文本。通过基于规则填充得到准确初始回复文本后进一步利用词与词之间的句法依存关系，将初始回复文本转换为表达更加丰富且含义相同的转述文本，确保自动回复准确性的同时也提高了回复文本的灵活多样性。权利要求书2页说明书10页附图3页 CN 114817491 A 2022.07.29 CN 114817491 A 1.一种基于句法增强的信息自动回复方法，其特征在于，包括：接收用户输入的待回复文本，并提取所述待回复文本中的关键要素；根据所述关键要素在预设数据库中获取对应的回复元素，并按预设表述规则进行插槽填充后得到初始回复文本；对所述初始回复文本进行句法解析处理，得到所述初始回复文本中各个词节点的句法依存信息，所述句法依存信息包括词性和句法依存关系；通过图注意力网络对所述各个词节点的句法依存信息进行编码，得到所述句法依存信息的图注意力特征；将所述初始回复文本输入至经所述图注意力特征进行句法增强处理的预设转换模型中，转换输出与所述初始回复文本含义相同的转述文本。 2.根据权利要求1所述的基于句法增强的信息自动回复方法，其特征在于，所述接收用户输入的待回复文本，并提取所述待回复文本中的关键要素，包括：接收用户输入的待回复文本，对所述待回复文本进行向量编码后得到序列向量；对所述序列向量进行标签预测，得到序列向量中每个词的标签；将符合预设领域的标签对应的词确认为关键要素。 3.根据权利要求1所述的基于句法增强的信息自动回复方法，其特征在于，所述根据所述关键要素在预设数据库中获取对应的回复元素，并按预设表述规则进行插槽填充后得到初始回复文本，包括：在预设数据库中查询获取与所述关键要素相关联的回复元素；根据所述回复元素的标签按预设表述规则进行插槽填充处理，拼接得到包含所述回复元素的初始回复文本。 4.根据权利要求1所述的基于句法增强的信息自动回复方法，其特征在于，所述对所述初始回复文本进行句法解析处理，得到所述初始回复文本中各个词节点的句法依存信息，包括：通过预设NLP库对所述初始回复文本进行句法解析，得到每个词节点的词性信息以及各个词节点之间的句法依存关系；根据所述各个词节点之间的句法依存关系构建相应的邻接矩阵。 5.根据权利要求4所述的基于句法增强的信息自动回复方法，其特征在于，所述通过图注意力网络对所述各个词节点的句法依存信息进行编码，得到所述句法依存信息的图注意力特征，包括：根据所述邻接矩阵构造对应的节点关系图，并对所述节点关系图进行词汇嵌入和词性嵌入后，得到节点向量图；通过图注意力网络对所述节点向量图进行依存关系特征提取后，得到所述句法依存信息的图注意力特征。 6.根据权利要求5所述的基于句法增强的信息自动回复方法，其特征在于，所述通过图注意力网络对所述节点向量图进行依存关系特征提取后，得到所述句法依存信息的图注意力特征，具体包括：权　利　要　求　书 1/2 页 2 CN 114817491 A 2通过公式对所述节点向量图进行依存关系特征提取，得到第i层的图注意力特征，其中，图注意力网络第0层的图注意力特征表示为H0＝Eword+ Etag， Eword为词汇嵌入， Etag为词性嵌入，为词节点i第l+1层的输出特征，表示词节点 i第l层的输入特征， ||表示向量的拼接操作， σ 表示激活函数； Aij≠0表示词节点i和词节点j 有句法依存关系，表示第k个注意力机制下词节点i， j之间的注意力权重，表示第k个注意力机制下的线性变换矩阵，为F×F的矩阵空间， F为空间的维度， K为图注意力网络中注意力机制的数目，图注意力网络最后一层的输出特征为HG。 7.根据权利要求5所述的基于句法增强的信息自动回复方法，其特征在于，所述将所述初始回复文本输入至经所述图注意力特征进行句法增强处理的预设转换模型中，转换输出与所述初始回复文本含义相同的转述文本，包括：将所述初始回复文本输入至预设转换模型中，通过所述预设转换模型中的嵌入层对所述初始回复文本进行词嵌入和位置嵌入后输出相应的初始文本向量；通过所述预设转换模型中的编码器对所述初始文本向量进行编码处理，并在编码时通过所述图注意力特征对所述编码器进行句法偏置处理，提取得到具有所述句法依存信息的编码信息；通过所述预设转换模型中的解码器对所述编码信息进行解码处理，得到每个位置需输出的字后拼接得到对应的转述文本。 8.一种基于句法增强的信息自动回复装置，其特征在于，包括：要素提取模块，用于接收用户输入的待回复文本，并提取所述待回复文本中的关键要素；填充模块，用于根据所述关键要素在预设数据库中获取对应的回复元素，并按预设表述规则进行插槽填充后得到初始回复文本；句法解析模块，用于对所述初始回复文本进行句法解析处理，得到所述初始回复文本中各个词节点的句法依存信息，所述句法依存信息包括词性和句法依存关系；图特征提取模块，通过图注意力网络对所述各个词节点的句法依存信息进行编码，得到所述句法依存信息的图注意力特征；转换模块，用于将所述初始回复文本输入至经所述图注意力特征进行句法增强处理的预设转换模型中，转换输出与所述初始回复文本含义相同的转述文本。 9.一种基于句法增强的信息自动回复系统，其特征在于，所述系统包括至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1 ‑7任一项所述的基于句法增强的信息自动回复方法。 10.一种非易失性计算机可读存储介质，其特征在于，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行权利要求1 ‑7任一项所述的基于句法增强的信息自动回复方法。权　利　要　求　书 2/2 页 3 CN 114817491 A 3

专利 基于句法增强的信息自动回复方法、装置、系统及介质

专利基于句法增强的信息自动回复方法、装置、系统及介质