专利训练语言表征模型的方法、查找语句的方法及装置 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210302920.3 (22)申请日 2022.03.24 (71)申请人阳光保险集团股份有限公司地址 518000 广东省深圳市福田区红荔西路7002号第一世界广场A座17层 (72)发明人韩佳　杜新凯　吕超　谷姗姗　张晗　史辉　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 专利代理师唐正瑜 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) G06F 16/335(2019.01) G06F 16/35(2019.01)G06Q 40/08(2012.01) (54)发明名称训练语言表征模型的方法、查找语句的方法及装置 (57)摘要本申请实施例提供了训练语言表征模型的方法、查找语句的方法及装置，该方法包括：获取目标训练语句，其中，所述目标训练语句是通过对语言表征模型所应用的目标领域的语句进行采集获得的；根据所述目标训练语句对预训练语言表征模型进行训练，获得目标语言表征模型，其中，所述预训练语言表征模型依次包括短语特征提取层、句法特征提取层和语义特征提取层，所述语义特征提取层中的第i层中部分节点的输入为所述短语特征提取层中的第j层的输出， i和 j为大于或等于1的整数。通过本申请的一些实施例能够提升语言表征模型的运行速度，并且能够使目标语言表征模型中的参数更适合应用于目标领域，从而提升语言表征模型的精确度。权利要求书2页说明书15页附图5页 CN 114648030 A 2022.06.21 CN 114648030 A 1.一种训练语言表征模型的方法，其特征在于，所述方法包括：获取目标训练语句，其中，所述目标训练语句是通过对语言表征模型所应用的目标领域的语句进行采集获得的；根据所述目标训练语句对预训练语言表征模型进行训练，获得目标语言表征模型，其中，所述预训练语言表征模型依次包括短语特征提取层、句法特征提取层和语义特征提取层，所述语义特征提取层中的第i层中部分节点的输入为所述短语特征提取层中的第j层的输出， i和j为大于或等于1的整数。 2.根据权利要求1所述的方法，其特征在于，所述预训练语言表征模型中的各层中均包括两类节点，其中，第一类节点用于提取文本特征，第二类节点用于提取字特征；其中，所述第i层包括的第二类节点的输入为所述第j层包括的第二类节点的输出；所述第i层包括的第一类节点的输入为第i ‑1层包括的第一类节点的输出；其中，所述文本特征用于表征所述目标训练语句的整体语义特征，所述字特征用于表征所述目标训练语句中一个字的语义特征。 3.根据权利要求1所述的方法，其特征在于，所述语义特征提取层包括L层，所述短语特征提取层包括K层，其中， L和K为大于1的整数，其中，所述语义特征提取层中的第i层为K层中的第一层；所述短语特征提取层中的第j层为 L层中的最后一层。 4.一种查找语句的方法，其特征在于，所述方法包括: 获取待匹配语句；将所述待匹配语句输入采用如权利要求1 ‑3任一项所得到的目标语言表征模型中，并通过所述目标语言表征模型得到与所述待匹配语句匹配的目标语句。 5.根据权利要求4所述的方法，其特征在于，所述通过所述目标语言表征模型得到与所述待匹配语句匹配的目标语句，包括：提取所述待匹配语句的待匹配表征向量；将所述待匹配表征向量与至少一组候选表征向量进行匹配，获得所述目标语句，其中，一组候选表征向量用于表征一个候选语句，一组候选表征向量对应一个候选语句。 6.根据权利要求5所述的方法，其特征在于，所述将所述待匹配表征向量与至少一组候选表征向量进行匹配，获得所述目标语句，包括：基于权重值计算所述待匹配表征向量与所述至少一组候选表征向量中各组候选表征向量之间的目标相似值，其中，所述目标相似值用于表征所述待匹配表征向量与所述各组候选表征向量之间的相似程度，其中，所述权重值用于调整提取的字特征与提取的文本特征之间的权重；通过所述目标相似值，从至少一个候选语句中获得所述目标语句。 7.根据权利要求6所述的方法，其特征在于，所述待匹配表征向量包括待匹配文本语义表征子向量和待匹配字语义表征子向量，与第K候选语句对应的候选表征向量包括第K候选文本语义表征子向量和第K候选字语义表征子向量，与所述第K候选语句对应的权重值包括第K文本权重值和第K字权重值，所述第K文本权重值与所述第K字权重值的和为1；所述基于权重值计算所述待匹配表征向量与所述至少一组候选表征向量中各组候选表征向量之间的目标相似值，包括：权　利　要　求　书 1/2 页 2 CN 114648030 A 2计算所述待匹配文本语义表征子向量与所述第K候选文本语义表征子向量之间的第K 文本相似值，其中， K为大于或等于1的整数；根据所述待匹配字语义表征子向量和所述第K候选字语义表征子向量，计算获得第K字相似值；计算所述第K文本相似值与所述第K文本权重值的乘积，得到第一乘积；计算所述第K字相似值与所述第K字权重值的乘积，得到第二乘积；计算所述第一乘积和第二乘积的和，得到与所述第K候选语句对应的目标相似值。 8.一种训练语言表征模型的装置，其特征在于，所述装置包括：训练语句获取模块，被配置为获取目标训练语句，其中，所述目标训练语句是通过对语言表征模型所应用的目标领域的语句进行采集获得的；模型训练模块，被配置为根据所述目标训练语句对预训练语言表征模型进行训练，获得目标语言表征模型，其中，所述预训练语言表征模型依次包括短语特征提取层、句法特征提取层和语义特征提取层，所述语义特征提取层中的第i层中部分节点的输入为所述短语特征提取层中的第j层的输出， i和j为大于或等于1的整数。 9.一种查找语句的装置，其特征在于，所述装置包括: 语句获取模块，被配置为获取待匹配语句；语句匹配模块，被配置为将所述待匹配语句输入采用如权利要求1 ‑3任一项所得到的目标语言表征模型中，并通过所述目标语言表征模型得到与所述待匹配语句匹配的目标语句。 10.一种电子设备，其特征在于，包括：处理器、存储器和总线；所述处理器通过所述总线与所述存储器相连，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，用于实现如权利要求1 ‑7任一项所述方法。权　利　要　求　书 2/2 页 3 CN 114648030 A 3

专利 训练语言表征模型的方法、查找语句的方法及装置

专利训练语言表征模型的方法、查找语句的方法及装置