国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210281969.5 (22)申请日 2022.03.22 (71)申请人 山西三友和智慧信息技 术股份有限 公司 地址 030000 山西省太原市太原高新区科 技街15号A1 18室 (72)发明人 潘晓光 王小华 宋晓晨 令狐彬 张娜 (74)专利代理 机构 深圳科润知识产权代理事务 所(普通合伙) 44724 专利代理师 李小妮 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于方面的情感分析中Bert性能改进 方法 (57)摘要 本发明属于深度学习技术领域, 具体涉及一 种基于方面的情感分析中Bert性能改进方法, 包 括如下步骤: 对中文语料数据集中的多条中文语 料进行文本预处理, 以获得所述多条中文语料对 应的多个序列; 使用BERT模型提取每个序列的词 嵌入; 采用BERT、 LSTM和CNN对每个序列进行特征 提取, 以获得每个序列对应的文本深层语义特 征; 通过对损失算法进行修改; 通过使用条件随 机场替换现有BERT情感分析模型使用的交叉熵 损失; 通过使用softmax分类器对所获得的文本 深层语义特征进行分类, 来对模 型进行训练和测 试, 进而实现情感极性预测分析。 本发明通过改 进模块等方式, 极大地提高的Bert模型在基于方 面的情绪分析的性能。 权利要求书2页 说明书4页 附图1页 CN 114722799 A 2022.07.08 CN 114722799 A 1.一种基于方面的情感分析中Ber t性能改进方法, 其特 征在于: 包括如下步骤: S1、 对中文语料数据集中的多条中文语料进行文本预处理, 以获得所述多条中文语料 对应的多个序列; S2、 使用BERT模型提取每个序列的词嵌入; 采用BERT、 LSTM和CNN对每个序列进行特征 提取, 以获得每个序列对应的文本深层语义特征; 且在BERT模型添加并行聚合模块和层次 聚合模块, 所述并行聚合主要是通过整合情感分析模型最后四层中每一层的信息, 所述层 次聚合是通过在每一个隐藏层之后添加Ber t层; S3、 通过对损失算法进行修改; 通过使用条件随机场替换现有BERT情感分析模型使用 的交叉熵损失; S4、 通过使用softmax分类器对所获得的文本深层语义特征进行分类, 来对模型进行训 练和测试, 进而实现情感极性预测分析。 2.如权利 要求1所述的一种基于方面的情感分析中Bert性能改进方法, 其特征在于: S1 中, 所述对中文语料数据集中的多条中文语料进行文本预处理的步骤包括: 针对所述中文 语料数据集中的每条中文语料, 将该条中文语料中的文本字符化, 其中, 在获得的该条中文 语料对应的序列中, 用CLS作为该序列的第一个标记, 通过SEP对该序列进行分割。 3.如权利 要求2所述的一种基于方面的情感分析中Bert性能改进方法, 其特征在于: S2 中, 所述并行聚合: 深层 模型的隐藏层可以被更多地利用来提取区域的特定信息; 因此可以 通过增加一个Bert层并使用每一层 进行预测来利用Bert模 型的最后四层, 原因是所有较深 的层都包含关于任务的大部分相关信息, 因此, 从它们中的每一个中提取这些信息并组合 它们可以产生更丰富的语义表示。 4.如权利 要求3所述的一种基于方面的情感分析中Bert性能改进方法, 其特征在于: S2 中, 所述层次聚合: 通过在每个隐藏层上应用一个Bert层之后, 它们将与前一层聚合; 同时, 与并行聚合相似, 同样使用每个输出分支进行预测, 并最后对损失进行求和, 其目标是从 BERT模型的隐藏层中提取 更多的语义。 5.如权利 要求3所述的一种基于方面的情感分析中Bert性能改进方法, 其特征在于: S2 中, 采用12层的注意力机制来提取更深层次的文本语义特征, 所述CNN中的卷积层采用1维 卷积, 其中池化层 采用最大池化, 在通过LSTM处理序列形式的文本数据时, 产生序列化的输 出数据, 以将提取到的文本特征向量与CNN、 BERT中的数据拼接融合在一起, 在经过全连接 层后再进入分类 器。 6.如权利 要求5所述的一种基于方面的情感分析中Bert性能改进方法, 其特征在于: S3 中所述条件随机场所述条件随机场是一种图形模型, 提升标签的联合分发性能, 其中计算 标签的联合 概率的公式为: 其中xt, yt为状态特 征, yt‑1为转移特征, fk为特征函数, θk为权值。 7.如权利 要求6所述的一种基于方面的情感分析中Bert性能改进方法, 其特征在于: S4 中, 模型训练时, 数据沿神经网络正向传播, 所有网络在输出时进行多元特征 的融合, 反向 传播时, 通过对损失函数求偏导, 进行参数更新; 其中, 反向传播采用的方法是Adam优化算权 利 要 求 书 1/2 页 2 CN 114722799 A 2法, 在进行模式测试时, 利用训练时获得的模型和权重, 测试数据沿神经网络正向传播至 softmax分类 器, 进行情感极性分析。权 利 要 求 书 2/2 页 3 CN 114722799 A 3
专利 一种基于方面的情感分析中Bert性能改进方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:45:31
上传分享
举报
下载
原文档
(414.7 KB)
分享
友情链接
PCSA 网络空间安全管理与运营平台介绍 2021 -v1.4.pdf
山石网科《岩谈》第五期-2022年4月(数据安全专刊).pdf
GB 14052-1993 安装在设备上的同位素仪表的辐射安全性能要求.pdf
T-SZWA 001—2017 高分子益胶泥.pdf
GA-T 1996-2022 警用天通卫星移动终端及应用设备技术要求和测试方法.pdf
GB-Z 40846-2021 工程咨询 基本术语.pdf
T-CI 038—2023 污泥脱水调理剂.pdf
JR-T 0071.2—2020 金融行业网络安全等级保护实施指引 第2部分:基本要求.pdf
GB-T 36030-2018 制药机械(设备 在位清洗、灭菌通用技术要求.pdf
GB-T 35856-2018 飞机电气设备绝缘电阻和耐电压试验方法.pdf
tc260 网络安全标准实践指南 信息系统灾难备份实践指引 2022.pdf
WS-T 305-2009 卫生信息数据集元数据规范.pdf
DB51-T 2247-2016 重点用能单位节能管理规范 四川省.pdf
2023年Chau服务企业AIGC需求的大坑和大饼-v1.0-2024.pdf
DB15-T 1874—2020 公共大数据安全管理指南 内蒙古自治区.pdf
T-CSO 3.5—2023 海洋调查服装 第5部分 毛衣.pdf
T-SCGS 313002—2023 医用内窥镜 内窥镜荧光摄像系统影像质量评价规范.pdf
专利 蓝色荧光量子点制备方法及作为谷胱甘肽检测探针的应用.PDF
DB31-T 1363-2022 口腔综合治疗台水路卫生管理要求 上海市.pdf
DB44-T 2389-2022 计量检测数据与结果数字化处理系统技术要求 广东省.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(414.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。