(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210477541.8
(22)申请日 2022.05.04
(71)申请人 骆瑜
地址 710049 陕西省西安市碑林区咸宁西
路28号
(72)发明人 陈秉佑 骆瑜
(51)Int.Cl.
G06Q 10/04(2012.01)
G06F 40/30(2020.01)
G06F 17/18(2006.01)
G06F 17/10(2006.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于情境信息的人气值预测模型构建
与训练方法
(57)摘要
本发明公开了一种基于情境信息的网络流
行语人气值预测模型构建与训练方法, 具体包
括: 模型构建包括获取用户与网络流行语之间的
情境数据、 计算基于情境特征的网络流行语人气
值置信度、 计算整体人气值置信 度矩阵X、 根据人
气值置信度矩阵求得各个网络流行语的人气值;
模型训练包括使用回归曲线拟合的方法求得各
类人气值置信度计算公式中的参数、 使用高斯概
率线性模型得到人气值的概率分布 函数、 通过最
大化后验概率得到待优化的目标函数、 使用梯度
下降法优化目标函数。 该模型可 以从较少的、 最
新的网络用户行为数据中预测潜在的网络流行
语, 从而实现基于用户情境信息的流行语预测和
发现, 与其他方法相比具有更好的性能和更广泛
的应用范围。
权利要求书2页 说明书5页 附图2页
CN 114723172 A
2022.07.08
CN 114723172 A
1.一种基于情境信息的网络流行语人气值预测模型构建方法, 其特 征在于, 包括:
获取用户m与网络流行语i之间的情境数据;
根据情境数据计算基于情境特 征的网络流行语人气值置信度;
计算整体人气值置信度矩阵X;
根据人气值置信度矩阵X求得 各个网络流行语人气值。
2.根据权利要求1所述的网络流行语人气值预测模型构建方法, 其特征在于, 所述情境
数据包括空间距离D(m,i)、 时间距离T(m,i)、 归一化的关系 评分值NR(m,i)、 用户从该网络
流行语的社交行为中获得的归一 化情感得分值 NS(m,i)。
3.根据权利要求1所述的网络流行语人气值预测模型构建方法, 其特征在于, 基于情境
特征的网络流行语人气值置信度包括基于空间特征的置信度CS(m,i), 基于时间特征的置信
度CT(m,i), 基于用户关系特 征的置信度CNR(m,i)和基于语义特 征的置信度CNS(m,i)。
4.根据权利要求3所述的网络流行语人气值预测模型构建方法, 其特征在于, CS(m,i)、
CT(m,i)、 CNR(m,i)、 CNS(m,i)的计算公式分别如下:
其中, N是用户的总数, u,v,w是通过曲线拟合学习得到的参数。
5.根据权利要求1所述的网络流行语人气值预测模型构建方法, 其特征在于, 置信度矩
阵的计算公式如下:
X=A×CS+B×CT+J×CNR+K×CNS或
Xm,i=AS(m,i)×CS(m,i)+BT(m,i)×CT(m,i)+JNR(m,i)×CNR(m,i)+KNS(m,i)×CNS(m,i)
其中A、 B、 J、 K 是CS、 CT、 CNR、 CNS对应的系数矩阵。
6.根据权利要求1所述的网络流行语人气值预测模型构建方法, 其特征在于, 流行语i
的置信度Xi的值为流行语i对应的所有用户置信度之和, 它满足:
。
7.一种基于情境信息的网络流行语人气值预测模型训练方法, 其特 征在于, 包括:
利用已有的话题流行量和情境数据, 使用回归曲线拟合的方法求得各类人气值置信度
计算公式 中的参数;
使用高斯概率线性模型并设置适当的噪声值, 得到网络流行语人气值的概率分布函
数;
通过最大化后验概 率, 得到待优化的目标函数;权 利 要 求 书 1/2 页
2
CN 114723172 A
2利用带标记的社交媒体数据, 使用梯度下降法不断优化所述目标函数。
8.根据权利要求7所述的网络流行语人气值预测模型训练方法, 其特征在于, 待优化的
目标函数为四个情境特 征的代价 函数与系数矩阵的正则化代价之和。权 利 要 求 书 2/2 页
3
CN 114723172 A
3
专利 一种基于情境信息的人气值预测模型构建与训练方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:45:24上传分享