(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210508627.2 (22)申请日 2022.05.11 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 潘荣峰 王健宗 黄章成  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 廖慧贤 (51)Int.Cl. G06F 40/258(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06F 40/216(2020.01)G06F 16/35(2019.01) G06F 16/901(2019.01) G06K 9/62(2022.01) (54)发明名称 文本摘要生 成方法和装置、 电子设备及存储 介质 (57)摘要 本申请提供了一种文本摘要生成方法和装 置、 电子设备及存储介质, 属于人工智 能技术领 域。 该方法包括: 获取目标文本集合; 对目标文本 集合进行图结构化处理, 得到初步图结构数据, 其中, 初步图结构数据包括第一图结构数据、 第 二图结构数据和第三图结构数据; 对第一图结构 数据、 第二图结构数据和第三图结构数据进行特 征拼接, 得到融合图结构特征; 对融合图结构特 征进行第一编码处理, 得到节点语义表征向量; 对节点语义表征向量进行第二编码处理, 得到图 结构表征向量; 根据预设单词对图结构表征向量 进行词概率计算, 得到每一预设单词对应的词概 率值, 并根据词概率值对预设单词进行筛选处 理, 得到目标摘要。 本申请能够提高生成文本摘 要的准确性。 权利要求书2页 说明书14页 附图6页 CN 114841146 A 2022.08.02 CN 114841146 A 1.一种文本摘要生成方法, 其特 征在于, 所述方法包括: 获取目标文本集 合; 对所述目标文本集合进行图结构化处理, 得到初步图结构数据, 其中, 所述初步图结构 数据包括第一图结构数据、 第二图结构数据和第三图结构数据; 对所述第一图结构数据、 所述第二图结构数据和所述第三图结构数据进行特征拼接, 得到融合图结构特 征; 对所述融合图结构特 征进行第一编码处 理, 得到节点语义表征向量; 对所述节点语义表征向量进行第二编码处 理, 得到图结构表征向量; 根据预设单词对所述图结构表征向量进行词概率计算, 得到每一预设单词对应的词概 率值, 并根据所述词概 率值对所述预设单词进行筛 选处理, 得到目标摘要。 2.根据权利要求1所述的文本摘要生成方法, 其特征在于, 所述目标文本集合包括至少 两个目标文本, 所述对所述目标文本集合进 行图结构化处理, 得到初步图结构数据的步骤, 包括: 通过预设算法对每一所述目标文本进行关键词提取, 得到每一所述目标文本对应的目 标关键词; 对每一所述目标关键词进行向量 化处理, 得到每一所述目标文本对应的关键词向量; 计算每两个所述关键词向量之间的相似度值, 并根据所述相似度值对对应的所述目标 文本进行图结构化处 理, 得到所述第一图结构数据。 3.根据权利要求1所述的文本摘要生成方法, 其特征在于, 所述目标文本集合包括至少 两个目标文本, 所述对所述目标文本集合进 行图结构化处理, 得到初步图结构数据的步骤, 包括: 对每一所述目标文本进行分词处 理, 得到目标词段; 通过预设公式和预设主题类型对所述目标词段进行概率计算, 得到所述目标词段属于 所述预设主题类型的分类概 率值; 根据所述分类概 率值对所述目标文本进行图结构化处 理, 得到所述第二图结构数据。 4.根据权利要求1所述的文本摘要生成方法, 其特征在于, 所述目标文本集合包括至少 两个目标文本, 所述对所述目标文本集合进 行图结构化处理, 得到初步图结构数据的步骤, 包括: 对每一所述目标文本进行节点提取, 得到目标节点, 其中, 所述目标节点包括单词节 点、 句子节点以及文本节点; 通过预设算法构建所述单词节点和所述句子节点的第一 边特征; 根据预设权 重构建所述句子节点和所述文本节点的第二 边特征; 根据所述第 一边特征和所述第 二边特征构建目标异构图, 并根据 所述目标异构图得到 所述第三图结构数据。 5.根据权利要求1所述的文本摘要生成方法, 其特征在于, 所述对所述第一图结构数 据、 所述第二图结构数据和所述第三图结构数据进行特征拼接, 得到融合图结构特征 的步 骤, 包括: 对所述第一图结构数据向量化处理, 得到第一图结构特征向量, 对所述第二图结构数 据向量化处理, 得到第二图结构特征向量, 并对所述第三图结构数据向量化处理, 得到第三权 利 要 求 书 1/2 页 2 CN 114841146 A 2图结构特 征向量; 对所述第一图结构特征向量、 所述第 二图结构特征向量以及所述第 三图结构特征向量 进行特征拼接, 得到所述融合图结构特 征。 6.根据权利要求1所述的文本摘要生成方法, 其特征在于, 所述对所述节点语义表征向 量进行第二编码处 理, 得到图结构表征向量的步骤, 包括: 通过预设的权 重矩阵对所述节点语义表征向量进行注意力计算, 得到图节点特 征; 通过预设函数对所述图节点特 征进行编码处 理, 得到所述图结构表征向量。 7.根据权利要求1至6任一项所述的文本摘要生成方法, 其特征在于, 所述根据预设单 词对所述图结构表征向量进行词概率计算, 得到每一预设单词对应的词概率值, 并根据所 述词概率值对所述预设单词进行筛 选处理, 得到目标摘要的步骤, 包括: 对所述图结构表征向量进行解码处 理, 得到图结构隐向量; 对所述图结构隐向量进行词概 率计算, 得到每一预设单词对应的词概 率值; 选取所述词概 率值大于或者 等于预设词概 率阈值的预设单词作为目标 单词; 根据预设的拼接顺序对所述目标 单词进行拼接处 理, 得到所述目标摘要。 8.一种文本摘要生成装置, 其特 征在于, 所述装置包括: 文本获取模块, 用于获取目标文本集 合; 图结构化模块, 用于对所述目标文本集合进行图结构化处理, 得到初步图结构数据, 其 中, 所述初步图结构数据包括第一图结构数据、 第二图结构数据和第三图结构数据; 特征拼接模块, 用于对所述第一图结构数据、 所述第二图结构数据和所述第三图结构 数据进行 特征拼接, 得到融合图结构特 征; 第一编码模块, 用于对所述融合图结构特征进行第一编码处理, 得到节点语义表征向 量; 第二编码模块, 用于对所述节点语义表征向量进行第二编码处理, 得到 图结构表征向 量; 摘要生成模块, 用于根据预设单词对所述图结构表征向量进行词概率计算, 得到每一 预设单词对应的词概率值, 并根据所述词概率值对所述预设单词进行筛选处理, 得到目标 摘要。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器、 处理器、 存储在所述存储器 上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通 信的数据总线, 所述程序被所述处理器执行时实现如权利要求1至7任一项所述的文本摘要 生成方法的步骤。 10.一种存储介质, 所述存储介质为计算机可读存储介质, 用于计算机可读存储, 其特 征在于, 所述存储介质存储有一个或者多个程序, 所述一个或者多个程序可被一个或者多 个处理器执行, 以实现权利要求1至7中任一项所述的文本摘要生成方法的步骤。权 利 要 求 书 2/2 页 3 CN 114841146 A 3

.PDF文档 专利 文本摘要生成方法和装置、电子设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本摘要生成方法和装置、电子设备及存储介质 第 1 页 专利 文本摘要生成方法和装置、电子设备及存储介质 第 2 页 专利 文本摘要生成方法和装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。