专利文本处理方法、装置、设备、存储介质及产品 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210339912.6 (22)申请日 2022.04.01 (71)申请人腾讯科技（深圳）有限公司地址 518000 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人曾嘉莉　姜雨帆　吴双志　 (74)专利代理机构深圳市联鼎知识产权代理有限公司 4 4232 专利代理师徐明霞 (51)Int.Cl. G06F 40/284(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称文本处理方法、装置、设备、存储介质及产品 (57)摘要本申请的实施例公开了一种文本处理方法、装置、设备、存储介质及产品，该方法包括：生成待处理文本的词向量序列，该词向量序列表示待处理文本中包含的各个词所对应的词向量；基于待处理文本的词向量序列，获得词向量序列中的各个词向量的置信度，该置信度表示词向量对应的语义对文本处理任务的重要度；根据各个词向量的置信度和词向量序列，生成待处理文本对应的关键信息；基于待处理文本对应的关键信息，生成待处理文本针对文本处理任务的处理结果。本申请实施例的技术方案提高了文本处理结果的准确性。权利要求书3页说明书23页附图9页 CN 115114910 A 2022.09.27 CN 115114910 A 1.一种文本处理方法，其特征在于，包括：生成待处理文本的词向量序列，所述词向量序列表示所述待处理文本中包含的各个词所对应的词向量；基于所述待处理文本的词向量序列，获得所述词向量序列中的各个词向量的置信度；所述置信度表示词向量对应的语义对文本处理任务的重要度；根据所述各个词向量的置信度和所述词向量序列，生成所述待处理文本对应的关键信息；基于所述待处理文本对应的关键信息，生成所述待处理文本针对所述文本处理任务的处理结果。 2.根据权利要求1所述的方法，其特征在于，所述根据所述各个词向量的置信度和所述词向量序列，生成所述待处理文本对应的关键信息，包括：基于所述各个词向量的置信度与所述各个词对应的词向量，计算得到各个词的语义信息保留度；对所述各个词向量的置信度进行扰动处理，得到所述各个词的扰动度；根据所述各个词的语义信息保留度和所述各个词的扰动度，计算各个关键词对应的词向量，将多个关键词分别对应的词向量所生成的序列作为所述关键信息。 3.根据权利要求2所述的方法，其特征在于，基于以下公式，根据所述各个词的语义信息保留度和所述各个词的扰动度，计算各个关键词对应的词向量：其中，所述为第i个关键词对应的词向量，所述 ei为第i个词的词向量， ci为第i个词的置信度，所述ci⊙ei为第i个词的语义信息保留度， μ0为扰动项， (1 ‑ci)⊙μ0为第i个词的扰动度。 4.根据权利要求1所述的方法，其特征在于，通过文本处理模型获得所述词向量序列中的各个词向量的置信度，并根据所述各个词向量的置信度和所述词向量序列，生成所述待处理文本对应的关键信息，以及基于所述关键信息，生成所述待处理文本针对所述文本处理任务的处理结果；所述方法还包括：通过样本文本对待训练模型进行训练，以生成所述文本处理模型。 5.根据权利要求4所述的方法，其特征在于，所述通过样本文本对待训练模型进行训练，以生成所述文本处理模型，包括：将所述样本文本的样本词向量序列输入到所述待训练模型中，以获得所述待训练模型生成的所述样本文本对应的关键信息，所述待训练模型用于获得所述样本词向量序列中的各个样本词向量的置信度，并根据所述各个样本词向量的置信度和所述样本词向量序列，生成所述样本文本对应的关键信息；根据所述样本文本的样本词向量序列，生成所述样本文本对应的冗余信息；根据所述样本文本对应的关键信息和所述样本文本对应的冗余信息，构建所述待训练模型对应的第一损失；根据所述第一损失调整所述待训练模型的模型参数，以得到所述文本处理模型。 6.根据权利要求5所述的方法，其特征在于，所述根据所述第一损失调整所述待训练模权　利　要　求　书 1/3 页 2 CN 115114910 A 2型的模型参数，以得到所述文本处理模型，包括：将所述样本文本输入到所述待训练模型中，以获得所述待训练模型针对所述样本文本输出的与所述文本处理任务相对应的任务处理结果；根据所述任务处理结果和所述样本文本的期望输出结果，构建所述待训练模型的第二损失；根据所述第一损失和所述第二损失调整所述待训练模型的模型参数，以得到所述文本处理模型。 7.根据权利要求6所述的方法，其特征在于，所述根据所述第一损失和所述第二损失调整所述待训练模型的模型参数，以得到所述文本处理模型，包括：根据所述样本文本对应的关键信息和所述样本文本中各个样本词向量的置信度构建所述待训练模型的第三损失；根据所述第一损失、所述第二损失和所述第三损失，生成所述待训练模型的总损失；根据所述总损失调整所述待训练模型的模型参数，以得到所述文本处理模型。 8.根据权利要求7所述的方法，其特征在于，所述根据所述样本文本对应的关键信息和所述样本文本中各个样本词向量的置信度构建所述待训练模型的第三损失，包括：将所述样本文本对应的关键信息输入到所述待训练模型中，以获得所述待训练模型针对所述样本文本的关键信息所输出的处理结果；根据所述待训练模型针对所述样本文本的关键信息所输出的处理结果，以及所述样本文本的关键信息所对应的期望输出结果，生成关键信息处理损失；对所述样本文本中各个样本词向量的置信度进行正则化处理得到惩罚项；根据所述关键信息处理损失和所述惩罚项生成所述第三损失。 9.根据权利要求8所述的方法，其特征在于，所述根据所述关键信息处理损失和所述惩罚项生成所述第三损失，包括：将预设的超参数作为惩罚项的权重值；根据所述权重值对所述关键信息处理损失和所述惩罚项进行加权求和得到所述第三损失。 10.根据权利要求5所述的方法，其特征在于，所述根据所述样本文本对应的关键信息和所述样本文本对应的冗余信息，构建所述待训练模型对应的第一损失，包括：获取所述待训练模型针对所述样本文本所生成的第一全局向量、针对所述样本文本对应的关键信息所生成的第二全局向量，以及针对所述样本文本对应的冗余信息所生成的第三全局向量；根据所述第一全局向量和所述第二全局向量的距离、所述第三全局向量和所述第二全局向量的距离、以及所述第三全局向量和所述第一全局向量的距离，构建所述待训练模型对应的第一损失。 11.根据权利要求5所述的方法，其特征在于，所述根据所述样本文本的样本词向量序列，生成所述样本文本对应的冗余信息，包括：获取所述样本文本中各个样本词向量的置信度；根据所述样本文本中各个样本词向量的置信度与所述样本文本中各个样本词向量，生成所述样本文本中各个样本词向量所对应的冗余词向量；权　利　要　求　书 2/3 页 3 CN 115114910 A 3

专利 文本处理方法、装置、设备、存储介质及产品

专利文本处理方法、装置、设备、存储介质及产品