(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210508935.5 (22)申请日 2022.05.10 (71)申请人 电子科技大 学 地址 610041 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 林劼 白毅 梁玉龙 李赛鹏  王元芳 姜铼  (74)专利代理 机构 成都金英专利代理事务所 (普通合伙) 51218 专利代理师 郭肖凌 (51)Int.Cl. G06F 16/34(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种对话文本摘要 模型自动搜索方法 (57)摘要 本发明公开了一种对话文本摘要模型自动 搜索方法, 方法先将完整的对话文本按照主题信 息划分为若干个离散段落, 使用文本聚类算法聚 类描述相同一主题内容的段落; 基于可微的NAS 算法和生成对抗网络构建对话文本摘要生成模 型, 并分别设计生成器和判别器的搜索空间, 联 合优化对话摘要生成模型; 将聚类获得的主题段 落输入对话文本摘要模型中, 生成对应主题的子 摘要, 并对子摘要进行排序构成最后的对话摘 要。 本发明考虑了生成器和判别器在对抗过程中 的相关性和平衡性, 以可微NAS方法设计了它们 各自的搜索空间, 实现了模型参数和架构参数的 联合优化, 能够有效避免曝光偏差的积累, 能确 保其生成的文本摘要能鲜明地体现主题信息 。 权利要求书3页 说明书7页 附图2页 CN 115062139 A 2022.09.16 CN 115062139 A 1.一种对话文本摘要模型自动搜索方法, 其特 征在于, 包括以下步骤: 步骤1: 对话文本主题划分, 将完整的对话文本按照主题信息划分为若干个离散段落, 使用文本聚类算法聚类描述相同一主题内容的段落; 步骤2: 构建对话文本摘要模型, 基于可微的NAS算法和生成对抗网络构建对话文本摘 要生成模型, 并分别设计生成器和判别器的搜索空间, 联合优化对话摘要生成模型; 步骤3: 基于主题段落生成对话摘要, 将聚类获得的主题段落输入对话文本摘要模型 中, 生成对应主题的子摘要, 并对子摘要 进行排序构成最后的对话摘要。 2.根据权利要求1所述的一种 对话文本摘要模型自动搜索方法, 其特征在于, 所述步骤 1具体包括以下步骤: 步骤11: 使用句向量模型1, 将对话语句转换为同一维度的句向量特 征; 步骤12: 将对话文本分段处理, 使用双向长短期记忆网络BiLSTM捕获对话语句 之间的 上下文信息, 并用CRF输出每条对话语句对应的分段符号, 其中<S>表示段落起始语句, <M> 表示段落中间语句, < E>表示段落终结语句; 步骤13: 将分好的段落按照主题内容进行 聚类处理, 使用DBSCAN算法, 按照段落之间的 语义距离进行主题段落划分。 3.根据权利要求1所述的一种 对话文本摘要模型自动搜索方法, 其特征在于, 所述步骤 2具体包括以下步骤: 步骤21: 分别设计生成器和判别器的搜索空间, 即特征之间的待选操作集合; 其中两者 的搜索空间为一个有向无环图, 图中节点表示中间隐藏特征, 特征节点之间的连线表示可 选操作的权重大小; 对于具有N个隐藏特征的搜索 空间, 中间节点x(j)上的特征可以通过其 所有前继节点计算得到, 如下式所示: 其中O(i,j)表示从隐藏特 征x(i)到隐藏特 征x(j)的变换操作; 定义 为有向无环图中有向边上的待选操作集合, 且将搜索空间表示为连续的, 通过 softmax输出一个对 所有操作选择的概率值, 之后再通过加权求和来获得最 终结果, 具体计 算如下式所示: 其中 表示第i个特征到第j个特征之间的权重, x表示要进行变换 的特征向量, o ’表 示从待选操作集 合 中选择出来的具体操作; 步骤22: 分别设计生成器和判别器的优化目标; 步骤23: 联合优化对话摘要生成模型, 对话摘要生成模型存在四类参数, 分别是生成器 的架构参数、 生 成器的权重参数、 判别器的架构参数以及判别器的权重参数; 采用先训练判 别器再训练生成器的方式对对话摘要生成模型训练; 在对生成器和判别器进行训练时, 在 验证集上 更新架构参数, 在训练集上 更新权重参数。 4.根据权利要求3所述的一种 对话文本摘要模型自动搜索方法, 其特征在于, 所述步骤权 利 要 求 书 1/3 页 2 CN 115062139 A 221具体包括以下子步骤: 步骤211: 设计生成器的搜索空间, 生成器的可选操作集合包括标准卷积、 深度可分离 卷积、 取等、 无操作、 Transformer的多头selft ‑Attention和多头context‑Attention; 步骤212: 设计判别器的搜索空间, 判别器的可选操作集合包括标准卷积、 深度可分离 卷积、 取等、 无操作、 平均池化和最大池化。 5.根据权利要求3所述的一种 对话文本摘要模型自动搜索方法, 其特征在于, 所述步骤 22具体包括以下子步骤: 步骤221: 判别器的优化目标与原 始GAN相同, 如下式所示: 其中, φ表示判别器参数, θ表示生成器参数, pdata表示原始对 话中的数据分布, X表示输 入对话文本, Y表示对话摘要, Gθ表示生成对话摘要的过程, Dφ则表示判别器判断输入摘要 序列为真实摘要的概 率大小; 步骤222: 生成器的损失函数由两部分组成, 一部分是通过策略梯度从判别器传递过来 的反馈损失Lpg, 另一部分则是来自于自身的极大似然估计损失Lml; 生成器的损失函数如下 式所示: 其中, β 是 可控制的平 滑参数, 用于平衡Lpg和Lml; Lml的计算过程如下式所示: 其中m表示生成摘要的长度, θ表示生成器参数, 而p(yt|y1:t‑1,X; θ )则表示在给定输入 对话文本序列X和之前的生成的对话摘要序列y1:t‑1时在t时刻生成单词yt的概率; Lpg的计算过程如下式所示即可, 如下式所示: 其中, 表示acti on‑value函数, 使用判别器的输出作为该函数。 6.根据权利要求3所述的一种 对话文本摘要模型自动搜索方法, 其特征在于, 所述步骤 23包括以下子步骤: 步骤231: 固定判别器的架构参数, 在验证集上 更新判别器的权 重参数; 步骤232: 固定判别器的权 重参数, 在训练集上 更新判别器的架构参数; 步骤233: 固定生成器的架构参数, 在验证集上 更新生成器的权 重参数; 步骤234: 固定生成器的权 重参数, 在训练集上 更新生成器的架构参数。 7.根据权利要求1所述的一种 对话文本摘要模型自动搜索方法, 其特征在于, 所述步骤 3包括以下子步骤: 步骤31: 将主题段落集合Topic={t1,t2,...,tm}输入对话摘要生成模型中, 获得各个 主题段落对应的主题子摘要集 合S={s1,s2,...,sm}; 步骤32: 每个主题T由多个段落聚类形成的, 每个段落由多条对话语句构成; 以每条对权 利 要 求 书 2/3 页 3 CN 115062139 A 3

.PDF文档 专利 一种对话文本摘要模型自动搜索方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种对话文本摘要模型自动搜索方法 第 1 页 专利 一种对话文本摘要模型自动搜索方法 第 2 页 专利 一种对话文本摘要模型自动搜索方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:46:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。