(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210263353.5 (22)申请日 2022.03.17 (71)申请人 平安科技 (深圳) 有限公司 地址 518033 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 袁超 李敏 徐介夫  (74)专利代理 机构 北京市京大律师事务所 11321 专利代理师 沈克琪 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/35(2019.01) G06F 40/151(2020.01) G06F 40/194(2020.01)G06F 40/216(2020.01) G06F 40/284(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 文本情感分析方法、 装置、 设备及存 储介质 (57)摘要 本发明涉及语义识别技术领域, 公开了一种 文本情感分析方法、 装置、 设备及存储介质。 通过 对于待分析数据的预处理得到文本信息, 判断文 本信息的长度是否大于预设长度阈值; 若是, 则 调用预设的文本摘要提取算法对文本信息进行 精简处理, 得到文本信息的摘要数据, 将摘要数 据输入至预先训练得到的情感分析模型进行情 感分析, 得到待分析数据中的情感信息, 从而解 决了现有技术中对长文本进行截断处理后, 由于 信息的不完整, 影响情感识别的问题。 权利要求书3页 说明书18页 附图5页 CN 114610838 A 2022.06.10 CN 114610838 A 1.一种文本情感分析 方法, 其特 征在于, 所述文本情感分析 方法包括: 获取待分析 数据, 并对所述待分析 数据进行 预处理, 得到文本信息; 判断所述文本信息的长度是否大于预设长度阈值; 若是, 则调用预设的文本摘要提取算法对所述文本信息进行精简处理, 得到所述文本 信息的摘要数据; 将所述摘要数据输入至预先训练得到的情感分析模型进行情 感分析, 得到所述待分析 数据中的情感信息 。 2.根据权利要求1所述的文本情感分析方法, 其特征在于, 所述调用预设的文本摘要提 取算法对所述文本信息进行精简处 理, 得到所述文本信息的摘要数据, 包括: 获取所述文本信息中的每 个句子, 提取每 个句子中的特 征信息, 形成对应的节点; 迭代计算各节点对应的特 征信息与其 他节点对应的特 征信息的相似度; 根据所述相似度, 构造各节点之间的无向有权边, 得到所述文本信息的节点连接图; 根据所述节点连接图计算每 个句子的权 重; 将句子按照权 重排序, 得到句子 权重表; 根据所述文本 长度的设定阈值, 计算句子数目; 按照权重降序顺序从句子权重表中选取数目为所述句子数目的句子, 按照文本 中的语 句顺序构建所述文本信息的摘要数据。 3.根据权利要求1所述的文本情感分析方法, 其特征在于, 所述将所述摘要数据输入至 预先训练得到的情感分析模型进行情感分析, 得到所述待分析 数据中的情感信息, 包括: 将所述摘要数据输入至预先训练得到的情感分析模型, 提取所述摘要数据的所有特征 信息, 并将各 特征信息转换成对应的向量, 得到向量 集; 根据所述情 感分析模型对应的情 感分析维度, 按照所述情感分析模型的运算规则对所 述向量集进行映射和归一 化处理, 得到在所述情感分析维度上的概 率分布结果; 在所述情感分析模型对应的每一个情感分析维度 上, 统计所述概率分布结果对应的概 率分布区间, 根据所述情感分析模型中各概率分布区间与所表示的情感信息之 间的对应关 系, 得到所述待分析 数据中的情感信息 。 4.根据权利要求3所述的文本情感分析方法, 其特征在于, 所述将所述摘要数据输入至 预先训练得到的情感分析模型, 提取所述摘要数据的所有特征信息, 并将各特征信息转换 成对应的向量, 得到向量 集, 包括: 利用所述情感分析模型提取 所述摘要数据的特 征信息, 形成对应的特 征向量; 利用所述情感分析模型对所述特征向量进行循环自注意力运算, 得到对应的编码向 量; 获取所有所述编码向量, 得到所述向量 集。 5.根据权利要求3所述的文本情感分析方法, 其特征在于, 所述根据所述情 感分析模型 对应的情感分析维度, 按照所述情感分析模型的运算规则对所述向量集进 行映射和归一化 处理, 得到在所述情感分析维度上的概 率分布结果, 包括: 选取所述向量集中与分类标识对应的编码向量, 对所述编码向量进行面向全连接层的 映射运算, 得到所述编码向量在所述全连接层上对应的映射 值; 在每一个所述情感分析维度上, 利用Softmax算法对所述映射值进行归一化处理, 得到权 利 要 求 书 1/3 页 2 CN 114610838 A 2所述情感分析维度上的概 率分布结果。 6.根据权利要求1 ‑5中任一项所述的文本情感分析方法, 其特征在于, 在所述获取待分 析数据, 并对所述待分析 数据进行 预处理, 得到文本信息之前, 还 包括: 采集文本数据; 按照预设的标签标记方法对所述文本数据进行标记, 使得所述文本数据都被标记上对 应的标签信息, 得到所述文本数据与对应标签信息的集 合, 记为情感分析语料集; 对所述情感分析语料集中的数据按照预设的比例和分类方法进行分类, 得到训练数据 和验证数据; 将所述训练数据输入至Ber t模型进行情感分析, 得到所述训练数据中的情感信息; 根据所述训练数据中的情感信息, 通过交叉熵函数计算损 失值, 记录所述损 失值和所 述Bert模型的参数 特征; 将训练数据和验证数据按照预设的方式分别循环输入所述Bert模型进行情 感分析, 并 根据所述训练数据中的情感信息, 通过交叉熵函数计算损失值, 记录所述损失值和所述 Bert模型的参数特征, 直到对应的所述损失值和对应的所述Bert模 型的参数特征符合预设 标准, 得到所述情感分析模型。 7.根据权利要求6所述的文本情感分析方法, 其特征在于, 所述将训练数据和验证数据 按照预设的方式分别循环输入所述Bert模型进 行情感分析, 并根据所述训练数据中的情感 信息, 通过交叉熵 函数计算损失值, 记录所述损失值和所述Bert模型的参数特征, 直到对应 的所述损失值和对应的所述Bert模型的参数特征符合预设标准, 得到所述情感分析模型, 包括: 将所述训练数据输入至所述Bert模型进行情感分析, 得到所述训练数据中的情感信 息; 判断所述情感分析的次数 是否达到预设次数; 若情感分析次数未达到预设次数, 则将所述训练数据数据输入至所述Bert模型进行情 感分析, 得到所述训练数据中的情感信息; 若情感分析次数达到预设次数, 则将所述验证数据输入至Bert模型进行情感分析, 得 到所述验证数据中的情感信息; 根据所述验证数据中的情感信息, 通过交叉熵函数计算损 失值, 记录所述损 失值和所 述Bert模型的参数 特征; 判断所述损失值以及 Bert模型的参数 特征是否符合预设标准; 若不满足, 则继续将训练数据和验证数据按照所述预设的方式分别循环输入所述Bert 模型进行情感分析; 若满足, 则输出 所述情感分析模型。 8.一种文本情感分析装置, 其特 征在于, 所述文本情感分析装置包括: 获取模块, 用于获取待分析 数据, 并对所述待分析 数据进行 预处理, 得到文本信息; 判断模块, 用于判断所述文本信息的长度是否大于预设长度阈值; 摘要提取模块, 用于在判断长度大于预设长度阈值时, 调用预设的文本摘要提取算法 对所述文本信息进行精简处 理, 得到所述文本信息的摘要数据; 情感分析模块, 用于将所述摘要数据输入至预先训练得到的情感分析模型进行情 感分权 利 要 求 书 2/3 页 3 CN 114610838 A 3

.PDF文档 专利 文本情感分析方法、装置、设备及存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本情感分析方法、装置、设备及存储介质 第 1 页 专利 文本情感分析方法、装置、设备及存储介质 第 2 页 专利 文本情感分析方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。