专利文本情感分析方法、装置、设备及存储介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210263353.5 (22)申请日 2022.03.17 (71)申请人平安科技（深圳）有限公司地址 518033 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人袁超　李敏　徐介夫　 (74)专利代理机构北京市京大律师事务所 11321 专利代理师沈克琪 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/35(2019.01) G06F 40/151(2020.01) G06F 40/194(2020.01)G06F 40/216(2020.01) G06F 40/284(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称文本情感分析方法、装置、设备及存储介质 (57)摘要本发明涉及语义识别技术领域，公开了一种文本情感分析方法、装置、设备及存储介质。通过对于待分析数据的预处理得到文本信息，判断文本信息的长度是否大于预设长度阈值；若是，则调用预设的文本摘要提取算法对文本信息进行精简处理，得到文本信息的摘要数据，将摘要数据输入至预先训练得到的情感分析模型进行情感分析，得到待分析数据中的情感信息，从而解决了现有技术中对长文本进行截断处理后，由于信息的不完整，影响情感识别的问题。权利要求书3页说明书18页附图5页 CN 114610838 A 2022.06.10 CN 114610838 A 1.一种文本情感分析方法，其特征在于，所述文本情感分析方法包括：获取待分析数据，并对所述待分析数据进行预处理，得到文本信息；判断所述文本信息的长度是否大于预设长度阈值；若是，则调用预设的文本摘要提取算法对所述文本信息进行精简处理，得到所述文本信息的摘要数据；将所述摘要数据输入至预先训练得到的情感分析模型进行情感分析，得到所述待分析数据中的情感信息。 2.根据权利要求1所述的文本情感分析方法，其特征在于，所述调用预设的文本摘要提取算法对所述文本信息进行精简处理，得到所述文本信息的摘要数据，包括：获取所述文本信息中的每个句子，提取每个句子中的特征信息，形成对应的节点；迭代计算各节点对应的特征信息与其他节点对应的特征信息的相似度；根据所述相似度，构造各节点之间的无向有权边，得到所述文本信息的节点连接图；根据所述节点连接图计算每个句子的权重；将句子按照权重排序，得到句子权重表；根据所述文本长度的设定阈值，计算句子数目；按照权重降序顺序从句子权重表中选取数目为所述句子数目的句子，按照文本中的语句顺序构建所述文本信息的摘要数据。 3.根据权利要求1所述的文本情感分析方法，其特征在于，所述将所述摘要数据输入至预先训练得到的情感分析模型进行情感分析，得到所述待分析数据中的情感信息，包括：将所述摘要数据输入至预先训练得到的情感分析模型，提取所述摘要数据的所有特征信息，并将各特征信息转换成对应的向量，得到向量集；根据所述情感分析模型对应的情感分析维度，按照所述情感分析模型的运算规则对所述向量集进行映射和归一化处理，得到在所述情感分析维度上的概率分布结果；在所述情感分析模型对应的每一个情感分析维度上，统计所述概率分布结果对应的概率分布区间，根据所述情感分析模型中各概率分布区间与所表示的情感信息之间的对应关系，得到所述待分析数据中的情感信息。 4.根据权利要求3所述的文本情感分析方法，其特征在于，所述将所述摘要数据输入至预先训练得到的情感分析模型，提取所述摘要数据的所有特征信息，并将各特征信息转换成对应的向量，得到向量集，包括：利用所述情感分析模型提取所述摘要数据的特征信息，形成对应的特征向量；利用所述情感分析模型对所述特征向量进行循环自注意力运算，得到对应的编码向量；获取所有所述编码向量，得到所述向量集。 5.根据权利要求3所述的文本情感分析方法，其特征在于，所述根据所述情感分析模型对应的情感分析维度，按照所述情感分析模型的运算规则对所述向量集进行映射和归一化处理，得到在所述情感分析维度上的概率分布结果，包括：选取所述向量集中与分类标识对应的编码向量，对所述编码向量进行面向全连接层的映射运算，得到所述编码向量在所述全连接层上对应的映射值；在每一个所述情感分析维度上，利用Softmax算法对所述映射值进行归一化处理，得到权　利　要　求　书 1/3 页 2 CN 114610838 A 2所述情感分析维度上的概率分布结果。 6.根据权利要求1 ‑5中任一项所述的文本情感分析方法，其特征在于，在所述获取待分析数据，并对所述待分析数据进行预处理，得到文本信息之前，还包括：采集文本数据；按照预设的标签标记方法对所述文本数据进行标记，使得所述文本数据都被标记上对应的标签信息，得到所述文本数据与对应标签信息的集合，记为情感分析语料集；对所述情感分析语料集中的数据按照预设的比例和分类方法进行分类，得到训练数据和验证数据；将所述训练数据输入至Ber t模型进行情感分析，得到所述训练数据中的情感信息；根据所述训练数据中的情感信息，通过交叉熵函数计算损失值，记录所述损失值和所述Bert模型的参数特征；将训练数据和验证数据按照预设的方式分别循环输入所述Bert模型进行情感分析，并根据所述训练数据中的情感信息，通过交叉熵函数计算损失值，记录所述损失值和所述 Bert模型的参数特征，直到对应的所述损失值和对应的所述Bert模型的参数特征符合预设标准，得到所述情感分析模型。 7.根据权利要求6所述的文本情感分析方法，其特征在于，所述将训练数据和验证数据按照预设的方式分别循环输入所述Bert模型进行情感分析，并根据所述训练数据中的情感信息，通过交叉熵函数计算损失值，记录所述损失值和所述Bert模型的参数特征，直到对应的所述损失值和对应的所述Bert模型的参数特征符合预设标准，得到所述情感分析模型，包括：将所述训练数据输入至所述Bert模型进行情感分析，得到所述训练数据中的情感信息；判断所述情感分析的次数是否达到预设次数；若情感分析次数未达到预设次数，则将所述训练数据数据输入至所述Bert模型进行情感分析，得到所述训练数据中的情感信息；若情感分析次数达到预设次数，则将所述验证数据输入至Bert模型进行情感分析，得到所述验证数据中的情感信息；根据所述验证数据中的情感信息，通过交叉熵函数计算损失值，记录所述损失值和所述Bert模型的参数特征；判断所述损失值以及 Bert模型的参数特征是否符合预设标准；若不满足，则继续将训练数据和验证数据按照所述预设的方式分别循环输入所述Bert 模型进行情感分析；若满足，则输出所述情感分析模型。 8.一种文本情感分析装置，其特征在于，所述文本情感分析装置包括：获取模块，用于获取待分析数据，并对所述待分析数据进行预处理，得到文本信息；判断模块，用于判断所述文本信息的长度是否大于预设长度阈值；摘要提取模块，用于在判断长度大于预设长度阈值时，调用预设的文本摘要提取算法对所述文本信息进行精简处理，得到所述文本信息的摘要数据；情感分析模块，用于将所述摘要数据输入至预先训练得到的情感分析模型进行情感分权　利　要　求　书 2/3 页 3 CN 114610838 A 3

专利 文本情感分析方法、装置、设备及存储介质

专利文本情感分析方法、装置、设备及存储介质