(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210314718.2 (22)申请日 2022.03.29 (71)申请人 中国电子科技 集团公司第三十 研究 所 地址 610000 四川省成 都市高新区创业路6 号 (72)发明人 饶志宏 王海兮 吴喆熹 王效武  马军 常明芳 肖宁 周利均  杨慧  (74)专利代理 机构 成都九鼎天元知识产权代理 有限公司 51214 专利代理师 孙元伟 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/205(2020.01)G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于量化计算的舆论场趋势预测分析 方法 (57)摘要 本发明公开了一种基于量化计算的舆论场 趋势预测分析方法, 属于舆情分析技术领域, 包 括步骤: S1, 获取基础数据; S2, 基于获取的基础 数据, 进行立场检测及基于发言时机因素的立场 趋势分析, 构建舆论趋势走向判断规则生成样本 集; S3, 构建基于发言账号和发言内容的舆论趋 势走向预测神经网络模型TFNN; S4, 利用步骤S2 的构建趋势走向判断规则生成样本集得到的样 本数据, 训练步骤S3的TFNN模型, 得出舆论趋势 走向预测结果。 本发明能够对新时期网络社会的 科学治理和媒体平台舆论走向判断提供科学, 有 效的决策建议。 权利要求书2页 说明书7页 附图5页 CN 114461807 A 2022.05.10 CN 114461807 A 1.一种基于量 化计算的舆论场趋势预测分析 方法, 其特 征在于, 包括 步骤: S1, 获取基础数据; S2, 基于获取的基础数据进行立场检测及考虑时机因素的立场趋势分析, 构建舆论趋 势走向判断规则生成样本集; S3, 构建舆论趋势走向预测神经网络模型TFNN, 所述舆论趋势走向预测神经网络模型 TFNN包括输入层、 表示层和输出层, 在表示层设有一层第一全连接层和第一激活层, 在输出 层设有一层第二全连接层和第二激活层; S4, 利用步骤S2的构建舆论趋势走向判断规则生成样本集得到的样本数据, 训练步骤 S3中的所述舆论趋势走向预测 神经网络模型TFN N, 实现舆论趋势走向预测。 2.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤S1中, 根据指定的主题从社交网络平台采集主贴以及评论内容数据, 作为基础数据。 3.根据权利要求2所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤S2中, 所述进行立场检测及考虑时机因素的立场趋势分析, 包括子步骤: S21, 评论文本立场检测: 根据评论内容对主贴 内容、 主题所持立场分析出评论文本内容对目标主题的立场倾向是 “支持”、“反对”还 是“中立”, 实现评论内容 立场检测; S22, 立场趋势分析: 在步骤S2 1中取得评论文本内容的立场之后, 进行相应主题下所有 评论的立场趋势分析, 生成 “支持”、“反对”、“中立”三个立场集 合; S23, 使用LSTM模型对步骤S22中立场的变化趋势进行预测, 选择立场变化中的最佳拐 点作为舆论影响时机作为判断趋势走向因素之一。 4.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤S2中, 所述构建舆论趋势走向判断规则生成样本集, 包括子步骤: SS21, 趋势平滑: 建立各立场人数占比随总发帖量的趋势变化的趋势图曲线并进行平 滑处理, 然后使用最小二乘法将数据的一个小窗口回归到多项式上, 然后使用多项式来估 计窗口中心的点, 最后窗口向前移动一个数据点, 使用最小二乘法将数据窗口回归到多项 式, 使用多 项式来估计窗口中心点, 直到每 个点相对于邻居都进行了最佳调整; SS22, 趋势图曲线拐点检测: 采用滑动窗口算法并将其扩展以找到多个变化点, 将两个 相邻的窗口沿着信号滑动, 计算第一窗口和第二窗口之间的差异; 当这两个窗口包含不相 似的片段时, 如果计算得到的差异 值大于设定值, 则检测得到一个拐点; 并通过在离线设置 中, 计算得到完整的差异曲线并执行峰值搜索过程以找到拐点索引, 最后对平滑后的趋势 曲线进行拐点检测标注; SS23, 趋势段选取: 基于步骤SS22中在趋势曲线标注的拐点, 计算趋势曲线中上升幅度 最大的一段作为样本提取出来, 将与趋势曲线同立场的评论标注为正样本, 其他立场的评 论标注为负 样本, 遵循此规则给 各评论打标签, 所述标签作为趋势影响力得分的考 量; SS24, 样本趋势走向判断规则制定: 样本的趋势走向判断机制由评论社交账户基本信 息得分与本次评论社交账户对立场趋势影响力得分的和构成; Score_User  = w_property  * Score(property)  + w_behavior * Score(behavior) (1) 式 (1) 中, Score_User代表人物画像总得分, Score(propert y)代表人物账户属性得分,权 利 要 求 书 1/2 页 2 CN 114461807 A 2w_property代表基本属性权重比例, Score(behavior)代表行为属性得分, w_behavior代表 行为属性权 重比例; Score_Fi nal = Score_User  * W_User + Score_label*  W_label (2) 式 (2) 中, Score_label为评论社交账户对立场 趋势的影响力得分, 且得分规则如下: 评 论成功影响了一位其他立场人员的评论, 则该评论得第一设定数值分数; 评论成功增加了 本立场人数, 该评论得第二设定数值分数; 评论未能增加本立场人数, 该评论得第三设定数 值分数; 评论使本立场人数降低, 该评论得第四设定数值分数; W_lab el代表趋势影响力得 分权重比例; W_User代表人物账户属性权重比例; Score_Final代表样本趋势走向最终得 分; SS25, 构建样本特征, 所述样本特征包括人物账户属性特征、 评论 内容语义特征和主题 立场语义特征; 然后通过所述样本特征计算得出Score_Final, 利用该Score_Final的结果 作为预测有效影响舆论走势的结论。 5.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤S3中, 包括子步骤: 将人物账户属性特征、 评论内容语义特征和主题立场语义特征作为神 经网络模型TFN N模型的输入特 征。 6.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤S4中, 影响舆论趋势走向预测的因素包括发言时机、 发言内容、 发言账号。 7.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤SS21中, 所述平 滑处理采用Savitzky ‑Golay filter平滑处理。 8.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤SS25中, 所述评论内容语义特 征根据sentence_ber t模型输出 得到。 9.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法, 其特征在于, 在步 骤SS25中, 通过将评论内容、 主题内容、 选定的评论文本内容对目标主题的立场倾向输入 sentence_bert模 型, 输出语义向量, 能够表征评论内容的语义、 主题以及立场, 得到所述主 题立场语义特 征。权 利 要 求 书 2/2 页 3 CN 114461807 A 3

.PDF文档 专利 一种基于量化计算的舆论场趋势预测分析方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于量化计算的舆论场趋势预测分析方法 第 1 页 专利 一种基于量化计算的舆论场趋势预测分析方法 第 2 页 专利 一种基于量化计算的舆论场趋势预测分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:46:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。