(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210314718.2
(22)申请日 2022.03.29
(71)申请人 中国电子科技 集团公司第三十 研究
所
地址 610000 四川省成 都市高新区创业路6
号
(72)发明人 饶志宏 王海兮 吴喆熹 王效武
马军 常明芳 肖宁 周利均
杨慧
(74)专利代理 机构 成都九鼎天元知识产权代理
有限公司 51214
专利代理师 孙元伟
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/205(2020.01)G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于量化计算的舆论场趋势预测分析
方法
(57)摘要
本发明公开了一种基于量化计算的舆论场
趋势预测分析方法, 属于舆情分析技术领域, 包
括步骤: S1, 获取基础数据; S2, 基于获取的基础
数据, 进行立场检测及基于发言时机因素的立场
趋势分析, 构建舆论趋势走向判断规则生成样本
集; S3, 构建基于发言账号和发言内容的舆论趋
势走向预测神经网络模型TFNN; S4, 利用步骤S2
的构建趋势走向判断规则生成样本集得到的样
本数据, 训练步骤S3的TFNN模型, 得出舆论趋势
走向预测结果。 本发明能够对新时期网络社会的
科学治理和媒体平台舆论走向判断提供科学, 有
效的决策建议。
权利要求书2页 说明书7页 附图5页
CN 114461807 A
2022.05.10
CN 114461807 A
1.一种基于量 化计算的舆论场趋势预测分析 方法, 其特 征在于, 包括 步骤:
S1, 获取基础数据;
S2, 基于获取的基础数据进行立场检测及考虑时机因素的立场趋势分析, 构建舆论趋
势走向判断规则生成样本集;
S3, 构建舆论趋势走向预测神经网络模型TFNN, 所述舆论趋势走向预测神经网络模型
TFNN包括输入层、 表示层和输出层, 在表示层设有一层第一全连接层和第一激活层, 在输出
层设有一层第二全连接层和第二激活层;
S4, 利用步骤S2的构建舆论趋势走向判断规则生成样本集得到的样本数据, 训练步骤
S3中的所述舆论趋势走向预测 神经网络模型TFN N, 实现舆论趋势走向预测。
2.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤S1中, 根据指定的主题从社交网络平台采集主贴以及评论内容数据, 作为基础数据。
3.根据权利要求2所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤S2中, 所述进行立场检测及考虑时机因素的立场趋势分析, 包括子步骤:
S21, 评论文本立场检测: 根据评论内容对主贴
内容、 主题所持立场分析出评论文本内容对目标主题的立场倾向是 “支持”、“反对”还
是“中立”, 实现评论内容 立场检测;
S22, 立场趋势分析: 在步骤S2 1中取得评论文本内容的立场之后, 进行相应主题下所有
评论的立场趋势分析, 生成 “支持”、“反对”、“中立”三个立场集 合;
S23, 使用LSTM模型对步骤S22中立场的变化趋势进行预测, 选择立场变化中的最佳拐
点作为舆论影响时机作为判断趋势走向因素之一。
4.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤S2中, 所述构建舆论趋势走向判断规则生成样本集, 包括子步骤:
SS21, 趋势平滑: 建立各立场人数占比随总发帖量的趋势变化的趋势图曲线并进行平
滑处理, 然后使用最小二乘法将数据的一个小窗口回归到多项式上, 然后使用多项式来估
计窗口中心的点, 最后窗口向前移动一个数据点, 使用最小二乘法将数据窗口回归到多项
式, 使用多 项式来估计窗口中心点, 直到每 个点相对于邻居都进行了最佳调整;
SS22, 趋势图曲线拐点检测: 采用滑动窗口算法并将其扩展以找到多个变化点, 将两个
相邻的窗口沿着信号滑动, 计算第一窗口和第二窗口之间的差异; 当这两个窗口包含不相
似的片段时, 如果计算得到的差异 值大于设定值, 则检测得到一个拐点; 并通过在离线设置
中, 计算得到完整的差异曲线并执行峰值搜索过程以找到拐点索引, 最后对平滑后的趋势
曲线进行拐点检测标注;
SS23, 趋势段选取: 基于步骤SS22中在趋势曲线标注的拐点, 计算趋势曲线中上升幅度
最大的一段作为样本提取出来, 将与趋势曲线同立场的评论标注为正样本, 其他立场的评
论标注为负 样本, 遵循此规则给 各评论打标签, 所述标签作为趋势影响力得分的考 量;
SS24, 样本趋势走向判断规则制定: 样本的趋势走向判断机制由评论社交账户基本信
息得分与本次评论社交账户对立场趋势影响力得分的和构成;
Score_User = w_property * Score(property) + w_behavior * Score(behavior)
(1)
式 (1) 中, Score_User代表人物画像总得分, Score(propert y)代表人物账户属性得分,权 利 要 求 书 1/2 页
2
CN 114461807 A
2w_property代表基本属性权重比例, Score(behavior)代表行为属性得分, w_behavior代表
行为属性权 重比例;
Score_Fi nal = Score_User * W_User + Score_label* W_label (2)
式 (2) 中, Score_label为评论社交账户对立场 趋势的影响力得分, 且得分规则如下: 评
论成功影响了一位其他立场人员的评论, 则该评论得第一设定数值分数; 评论成功增加了
本立场人数, 该评论得第二设定数值分数; 评论未能增加本立场人数, 该评论得第三设定数
值分数; 评论使本立场人数降低, 该评论得第四设定数值分数; W_lab el代表趋势影响力得
分权重比例; W_User代表人物账户属性权重比例; Score_Final代表样本趋势走向最终得
分;
SS25, 构建样本特征, 所述样本特征包括人物账户属性特征、 评论 内容语义特征和主题
立场语义特征; 然后通过所述样本特征计算得出Score_Final, 利用该Score_Final的结果
作为预测有效影响舆论走势的结论。
5.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤S3中, 包括子步骤: 将人物账户属性特征、 评论内容语义特征和主题立场语义特征作为神
经网络模型TFN N模型的输入特 征。
6.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤S4中, 影响舆论趋势走向预测的因素包括发言时机、 发言内容、 发言账号。
7.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤SS21中, 所述平 滑处理采用Savitzky ‑Golay filter平滑处理。
8.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤SS25中, 所述评论内容语义特 征根据sentence_ber t模型输出 得到。
9.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步
骤SS25中, 通过将评论内容、 主题内容、 选定的评论文本内容对目标主题的立场倾向输入
sentence_bert模 型, 输出语义向量, 能够表征评论内容的语义、 主题以及立场, 得到所述主
题立场语义特 征。权 利 要 求 书 2/2 页
3
CN 114461807 A
3
专利 一种基于量化计算的舆论场趋势预测分析方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:46:01上传分享