专利实体别名关系获取方法、训练方法、装置及存储介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210425656.2 (22)申请日 2022.04.21 (71)申请人上海携旅信息技术有限公司地址 201803 上海市嘉定区金园一路13 31 号401室-4 (72)发明人王子奕　刘嘉伟　鞠剑勋　李健　 (74)专利代理机构上海隆天律师事务所 31282 专利代理师高彦 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称实体别名关系获取方法、训练方法、装置及存储介质 (57)摘要本公开实施例中提供实体别名关系获取方法、训练方法、装置及存储介质，应用于实体别名关系模型；基于模型的嵌入层输入文本得到文本特征向量序列；基于特征编码层得到文本语义特征向量序列；基于序列标注层得到文本预测标签序列，并得到文本中的每个实体提及片段；基于标签融合层融合文本语义特征向量序列和文本预测标签序列得到文本增强特征向量序列；基于多头选择层得到实体别名关系概率矩阵；根据所筛选的概率值所在行和列所分别对应的字位于各自所属实体提及片段中的位置，获得两个实体提及片段之间的实体别名关系获取结果。本公开实现准确高效挖掘实体别名关系的方案，利于高质量知识图谱的构建。权利要求书4页说明书17页附图6页 CN 114881014 A 2022.08.09 CN 114881014 A 1.一种实体别名关系获取方法，其特征在于，应用于实体别名关系获取模型，所述实体别名关系获取模型包括：嵌入层、特征编码层、序列标注层、标签融合层及多头选择层；所述方法包括：获取输入文本并输入所述实体别名关系获取模型；基于嵌入层处理所述输入文本以生成字级令牌序列、字级位置索引序列以及文本片段索引序列，并基于嵌入层处理所述字级令牌序列、字级位置索引序列以及文本片段索引序列所分别映射的特征向量的融合，得到文本特征向量序列；基于特征编码层处理所述文本特征向量序列，得到文本语义特征向量序列；基于序列标注层处理所述文本语义特征向量序列以得到文本预测标签序列，并根据所述文本预测标签序列得到所述文本中的每个实体提及片段；基于标签融合层融合所述文本语义特征向量序列和文本预测标签序列，以得到文本增强特征向量序列；基于多头选择层处理所述文本增强特征向量序列，得到实体别名关系概率矩阵；其中，所述实体别名关系概率矩阵中每个概率值表示输入文本中每两个字分别所属实体提及片段之间存在实体别名关系的概率；从所述实体别名关系概率矩阵筛选达到预设阈值的概率值，根据所筛选的概率值所在行和列所分别对应的字位于各自所属实体提及片段中的位置，获得两个实体提及片段之间的实体别名关系获取结果。 2.根据权利要求1所述的实体别名关系获取方法，其特征在于，所述基于所述字级令牌序列、字级位置索引序列以及文本片段索引序列所分别映射的序列向量的融合，得到文本特征向量序列，包括：对所述字级令牌序列、字级位置索引序列以及文本片段索引序列分别经编码得到各编码序列；将各所述编码序列转换为各所述序列向量；对各所述序列向量求和并归一化得到所述文本特征向量序列。 3.根据权利要求1所述的实体别名关系获取方法，其特征在于，所述特征编码层包括多头自注意力层及全连接层；所述基于特征编码层处理所述文本特征向量序列，得到文本语义特征向量序列，包括：通过多头自注意力层处理所述文本特征向量序列，得到中间特征向量序列；通过全连接层处理所述中间特征向量序列，得到所述文本语义特征向量序列。 4.根据权利要求1所述的实体别名关系获取方法，其特征在于，所述基于序列标注层处理所述文本语义特征向量序列以得到文本预测标签序列，并根据所述文本预测标签序列得到所述文本中的每个实体提及片段，包括：对文本语义特征向量序列中每个特征值所对应的字在所属实体提及片段中的位置进行预测，得到预测标签，以形成所述文本预测标签序列；基于所述文本预测标签序列所标注的实体提及边界，得到各所述实体提及片段。 5.根据权利要求1所述的实体别名关系获取方法，其特征在于，所述标签融合层包括门控神经网络层；所述基于标签融合层融合所述文本语义特征向量序列和文本预测标签序列，以得到文本增强特征向量序列，包括：权　利　要　求　书 1/4 页 2 CN 114881014 A 2通过门控神经网络层按字级位置融合所述文本语义特征向量序列及文本预测标签序列，以得到文本增强特征向量序列。 6.根据权利要求1所述的实体别名关系获取方法，其特征在于，所述根据所筛选的概率值所在行和列所分别对应的字位于各自所属实体提及片段中的位置，获得两个实体提及片段之间的实体别名关系获取结果，包括：响应于所述概率值所在行和列所分别对应的字在各自所属实体提及片段中位于相同边界位置，确定所述两个实体提及片段之间存在实体别名关系。 7.根据权利要求1所述的实体别名关系获取方法，其特征在于，还包括：生成对应所述输入文本的掩码序列；将经所述掩码序列作用后的文本特征向量序列输入至实体别名关系获取模型。 8.一种实体别名关系获取模型的训练方法，其特征在于，所述实体别名关系获取模型包括：嵌入层、特征编码层、序列标注层、标签融合层及多头选择层；所述训练方法包括：获取训练样本集并输入所述实体别名关系获取模型，所述训练样本集中的每个训练样本文本具有对应的文本真实标签序列和实体别名关系标签；基于每个训练样本文本生成字级令牌序列、字级位置索引序列以及文本片段索引序列，并基于所述字级令牌序列、字级位置索引序列以及文本片段索引序列所分别映射的序列向量的融合，得到文本特征向量序列；基于特征编码层处理所述文本特征向量序列，得到文本语义特征向量序列；基于序列标注层处理所述文本语义特征向量序列以得到文本预测标签序列，并根据所述文本预测标签序列得到所述文本中的每个实体提及片段；计算所述文本预测标签序列与文本真实标签序列之间的第一损失；基于标签融合层融合所述文本语义特征向量序列同文本预测标签序列或文本真实标签序列，以得到文本增强特征向量序列；基于多头选择层处理所述文本增强特征向量序列，得到实体别名关系概率矩阵；其中，所述实体别名关系概率矩阵中每个概率值表示文本中每两个字分别所属实体提及片段之间存在实体别名关系的概率；基于所述实体别名关系概率矩阵中各概率值与所述实体别名关系标签计算第二损失；其中，所述实体别名关系标签基于每个概率值相应的行和列所对应的两个字之间是否存在实体别名关系所确定；基于所述第一损失和第二损失的融合得到总体损失，并根据所述总体损失更新所述实体别名关系获取模型。 9.根据权利要求8所述的训练方法，其特征在于，在使用第一部分训练样本文本的训练轮次中，基于标签融合层融合所述文本语义特征向量序列同文本预测标签序列，以得到文本增强特征向量序列；在其余的第二部分训练样本文本的训练轮次中，基于标签融合层融合所述文本语义特征向量序列同文本真实标签序列，以得到文本增强特征向量序列。 10.根据权利要求9所述的训练方法，其特征在于，所述第二部分的训练样本的样本数量高于所述第一部分的训练样本。 11.根据权利要求8所述的训练方法，其特征在于，所述基于所述字级令牌序列、字级位置索引序列以及文本片段索引序列所分别映射的序列向量的融合，得到文本特征向量序权　利　要　求　书 2/4 页 3 CN 114881014 A 3

专利 实体别名关系获取方法、训练方法、装置及存储介质

专利实体别名关系获取方法、训练方法、装置及存储介质