专利基于重组对抗的统一机器阅读理解方法 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210407939.4 (22)申请日 2022.04.19 (71)申请人中国人民解放军国防科技大学地址 410073 湖南省长沙市开福区德雅路 109号 (72)发明人廖劲智　唐九阳　赵翔　陈子阳　谭真　黄宏斌　吴继冰　 (74)专利代理机构长沙大珂知识产权代理事务所(普通合伙) 4323 6 专利代理师伍志祥 (51)Int.Cl. G06F 40/126(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) (54)发明名称基于重组对抗的统一机器阅读理解方法 (57)摘要本发明属于自然语言处理领域，公开了基于重组对抗的统一机器阅读理解方法，获取类型多样化、候选项数目不特定的问题；重组问题和候选项形成组合候选项，并依据参考文本对新候选项进行成立与否的判断，将实际阅读理解场景中的判断题、选择题以及匹配题统一转化成单选判定问题；对重组获得的组合候选项与参考文本的共同编码，获得与参考文本及其他重组候选项交互后的重组候选项向量表示；在重组候选项向量表示中融入与其相关的参考文本信息；将每一个候选项向量视为一个单独的样本，对其成立与否进行概率判定，输出结果。本发明将多选问题转化为逐个候选项的正误判断；融合层和对抗学习两个机制提高对不同候选项的区分能力。权利要求书3页说明书15页附图1页 CN 114912419 A 2022.08.16 CN 114912419 A 1.基于重组对抗的统一机器阅读理解方法，其特征在于，包括以下步骤：获取类型多样化、候选项数目不特定的问题；重组问题和候选项形成组合候选项，并依据参考文本对新候选项进行成立与否的判断，将实际阅读理解场景中的判断题、选择题以及匹配题统一转化成单选判定问题；对重组获得的组合候选项与参考文本的共同编码，获得与参考文本及其他重组候选项交互后的重组候选项向量表示；在所述重组候选项向量表示中融入与其相关的参考文本信息，以丰富所述重组候选项向量表示中蕴含的信息；将每一个候选项向量视为一个单独的样本，对其成立与否进行概率判定，输出结果。 2.根据权利要求1所述的基于重组对抗的统一机器阅读理解方法，其特征在于，所述将实际阅读理解场景中的判断题、选择题以及匹配题统一转化成单选判定问题包括：将候选项拆分，逐个与问题进行组合，形成设问句；组合参考文本与新产生的候选项，从而将不同类型的问题转化成在参考文本的支撑下，对每个新的候选项预测其成立概率的判断题。 3.根据权利要求1所述的基于重组对抗的统一机器阅读理解方法，其特征在于，所述判断题的数学形式为：＜P,Q,A＞三元组，其中P表示参考文本，形式上是句子、段落或整篇文章； Q表示自然语言形式的问题， A＝ {a1,a2,...,an}表示与特定问题对应的候选项集合， n表示候选项的数量，当中有且只有一个正确答案。 4.根据权利要求3所述的基于重组对抗的统一机器阅读理解方法，其特征在于，对于任一输入问题，将候选项拆分串联至问题后，组成与原候选项数量相同的新候选项，具体表示为： C＝{c1， c2， ...， cn}＝{Q+a1， Q+a2， ...， Q+an} 其中， C表示重组后的候选项集合；将参考文本P作为背景知识与候选项结合以供机器判断候选项中的事实陈述是否成立，具体组合形式如下： P,c1,c2,...,cn 上式将所有候选项串联，考虑参考文本P中包含的信息，同时关注其他候选项中的关键信息，以发现不同候选项之间的关联关系。 5.根据权利要求1所述的基于重组对抗的统一机器阅读理解方法，其特征在于，所述对重组获得的组合候选项与参考文本的共同编码，包括：采用预训练语言模型RoBERTa作为分词器进行文本的分词和词表映射，得到文本与候选项的编码，具体输入形式如下： [CLS]P[SEP]c1[SEP]c2[SEP]...[SEP]cn[SEP] 其中， [CLS]表示RoBERTa中标记输入文本起始位置的特殊字符， [SEP]表示RoBERTa中不同文本之间的间隔字符， n 为文本的数量；获得参考文本和候选项的词向量表示： E＝(e1,e2,...,em)∈Rm×d 其中， E表示输入文本序列的词向量编码， em表示序列中第m个字符的词向量， R表示实数权　利　要　求　书 1/3 页 2 CN 114912419 A 2空间， m表示文本长度， d表示维度大小。 6.根据权利要求5所述的基于重组对抗的统一机器阅读理解方法，其特征在于，对于文本和候选项串联后长度超过512的数据，采用Longformer的滑窗机制、扩大的滑窗机制、融合全局信息的滑窗机制拓展输入上限到4096；或使用Bi gBird的随机注意力、窗口注意力以及全局注意力方法，将BERT中的复杂度降至线性，进而拓展输入上限到4096 。 7.根据权利要求1所述的基于重组对抗的统一机器阅读理解方法，其特征在于，所述在所述重组候选项向量表示中融入与其相关的参考文本信息，包括：设计文本与候选项之间的注意力机制： s＝softmax(a) 其中， tanh表示非线性激活函数以实现非线性映射， Wpc表示可学习的权重矩阵， Ep为参考文本向量表示，为候选项向量表示， bpc表示偏置项， j为候选项的编号， softmax实现矩阵内数值在[0,1]上归一化，最终获得候选项cj关于参考文本的注意力向量表示采用mean_po oling获取每个候选项的平均向量表示，即：其中， |·|表示特定对象的数量， su m表示线性加和，候选项平均向量表示Cj∈Rd将被用于信息融合以及最终的概率预测；在获得注意力向量表示之后，使用高速路网络机制实现信息的融合，具体如下：其中， Wr和Wg表示可学习的权重矩阵， [； ]表示串联输入的向量，表示两个矩阵对应位置元素相乘， relu表示非线性激活函数， Oj表示输入向量与中间向量的线性插值， G表示门控阈值以控制调整线性插值中各部分所占比重，是参考文本的平均向量表示；通过线性拼接得到经过融合层之后获得的候选项最终表示Mj∈R2d： 8.根据权利要求1所述的基于重组对抗的统一机器阅读理解方法，其特征在于，所述将每一个候选项向量视为一个单独的样本，对其成立与否进行概率判定包括：通过一个二分类器对候选项向量进行[0,1]之间的概率预测： P＝sigmo id(fp(M))权　利　要　求　书 2/3 页 3 CN 114912419 A 3

专利 基于重组对抗的统一机器阅读理解方法

专利基于重组对抗的统一机器阅读理解方法