(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210329070.6
(22)申请日 2022.03.31
(71)申请人 贺海宁
地址 350108 福建省福州市福州高新区乌
龙江中大道创新园二期20#楼5层503
室
(72)发明人 贺海宁
(74)专利代理 机构 北京恒和顿知识产权代理有
限公司 1 1014
专利代理师 林涛
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9536(2019.01)
G06F 16/33(2019.01)
G06F 40/30(2020.01)
(54)发明名称
基于互联网热点话题的大数据处理方法及
系统
(57)摘要
本公开实施例公开了基于互联网热点话题
的大数据处理方法及系统, 在 进行热点话题捕捉
时, 通过话题细节层面在互联网社交互动数据之
间进行热点话题联合分析, 可以保障对影响范围
较大的候选热点话题的捕捉精度的捕捉质量, 通
过话题场景层面在互联网社交互动数据之间进
行热点话题联合分析, 可以保障对话题影响度较
小的候选 热点话题的捕捉质量, 并结合所述思路
整理两类联合分析思路所确定的联合分析结果
获得话题捕捉结果, 因此能够考虑到话题影响度
较大的候选热点话题和话题影响度较小的候选
热点话题, 从而保障热点话题持续性分析和捕捉
的准确性和可靠性。
权利要求书4页 说明书22页 附图1页
CN 114661998 A
2022.06.24
CN 114661998 A
1.一种基于互联网热点话题的大数据处理方法, 其中, 所述方法通过大数据处理系统
实施, 所述方法至少包括:
依次对第一互联网社交互动数据以及第 二互联网社交互动数据进行在线话题解析, 获
得所述第一互联网社交互动数据中第一候选热点话题的第一待处理社交互动数据集和所
述第二互联网社交 互动数据中第二 候选热点 话题的第二待处 理社交互动数据集;
结合所述第一待处理社交互动数据集和所述第二待处理社交互动数据集在话题细节
层面进行热点话题联合分析, 获得第一联合分析结果, 并结合所述第一待处理社交互动数
据集和所述第二待处理社 交互动数据集在话题场景层面进 行热点话题联合分析, 获得第二
联合分析结果; 以及, 整理所述第一联合分析结果和所述第二联合分析结果, 获得话题捕捉
结果; 其中, 所述话题捕捉结果包含所述第一候选热点话题与所述第二候选热点话题是否
为相同候选热点 话题。
2.如权利要求1所述的方法, 其中, 所述结合所述第 一待处理社交互动数据集和所述第
二待处理社交互动数据集在话题细节层面进行热点话题联合分析, 获得第一联合分析结
果, 包括:
依次通过各所述第 一候选热点话题的所述第 一待处理社交互动数据集, 挖掘获得各所
述第一候选热点话题的第一话题细节内容描述, 并依次通过各所述第二候选热点话题的所
述第二待处理社交互动数据集, 挖掘获得各所述第二候选热点话题的第二话题细节内容描
述;
借助所述第 一话题细节内容描述和所述第 二话题细节内容描述, 获得各所述第 一候选
热点话题与各 所述第二 候选热点 话题之间的细节共性指数;
依据各所述第 一候选热点话题与 各所述第 二候选热点话题之间的细节共性指数, 获得
所述第一联合分析 结果。
3.如权利要求2所述的方法, 其中, 所述第 一话题细节内容描述或所述第 二话题细节内
容描述的挖掘实现方式包括:
经由待处理社交互动数据集中每个社交互动信 息的词向量标签, 确定话题区分约束信
息; 其中, 所述话题 区分约束信息为所述待处理社交互动数据集所对应的候选热点话题的
约束语义;
基于所述话题区分约束信息从所述待处理社交互动数据集中提取得到局部社交互动
数据簇;
结合所述局部社交互动数据簇进行话题细节挖掘, 获得所述所对应的候选热点话题的
话题细节内容描述; 其中, 在所述待处理社交互动数据集为所述第一待处理社交互动数据
集的条件下, 所述所对应的候选热点话题为所述第一候选热点话题, 所述话题细节内容描
述为所述第一话题细节内容描述, 在所述待处理社 交互动数据集为所述第二待处理社 交互
动数据集的条件下, 所述所对应的候选热点话题为所述第二候选热点话题, 所述话题细节
内容描述 为所述第二 话题细节内容描述。
4.如权利要求1所述的方法, 其中, 所述结合所述第 一待处理社交互动数据集和所述第
二待处理社交互动数据集在话题场景层面进行热点话题联合分析, 获得第二联合分析结
果, 包括:
借助所述第二互联网社交互动数据对所述第一互联网社交互动数据进行活动变化分权 利 要 求 书 1/4 页
2
CN 114661998 A
2析, 获得所述第一互联网社交 互动数据的社交 活动变化数据;
结合所述社交活动变化数据, 对所述第 一候选热点话题的第 一待处理社交互动数据集
进行分治化解析, 获得所述第一候选热点话题在所述第二互联网社交互动数据的捕捉节点
的测试型社交互动数据集;
依据每个所述第一候选热点话题的测试型社交互动数据集分别与每个所述第二候选
热点话题的第二待处理社交互动数据集之间的异同解析结果, 获得所述第二联合分析结
果。
5.如权利要求4所述的方法, 其中, 所述结合所述社交活动变化数据, 对所述第一候选
热点话题的第一待处理社 交互动数据集进 行分治化解析, 获得所述第一候选热点话题在所
述第二互联网社交 互动数据的捕捉节点的测试 型社交互动数据集, 包括:
将所述社交活动变化数据和所述第一待处理社交互动数据集进行基于社交互动信息
的加权处 理, 获得所述第一待处 理社交互动数据集中社交 互动信息的活动状态指数;
将所述第一待处理社交互动数据集中所述社交互动信息的第一信息分布指数与所述
活动状态指数求和, 获得 所述社交 互动信息在所述捕捉节点的第二信息分布指数;
结合所述第 一待处理社交互动数据集中所述社交互动信 息的第二信息分布指数, 获得
所述测试 型社交互动数据集。
6.如权利要求1所述的方法, 其中, 所述第 一联合分析结果包含所述第 一候选热点话题
与所述第二候选热点话题之 间的第一联合评价值, 所述第二联合分析结果包含所述第一候
选热点话题与所述第二候选热点话题之 间的第二联合评价值, 所述整理所述第一联合分析
结果和所述第二联合分析 结果, 获得话题捕捉结果, 包括:
对所述第一联合分析结果中所述第 一联合评价值进行动态优化, 获得第 一已优化联合
分析结果, 并对所述第二联合分析结果中所述第二联合评价值进行动态优化, 获得第二已
优化联合分析结果; 其中, 所述第一已优化联合分析结果包含所述第一候选热点话题与所
述第二候选热点话题之 间的第一已优化联合评价值, 所述第二已优化联合分析结果包含所
述第一候选热点 话题与所述第二 候选热点 话题之间的第二已优化联合评价 值;
将所述第一已优化联合分析结果和所述第 二已优化联合分析结果进行整理, 获得目标
联合分析结果; 其中, 所述 目标联合分析结果包含所述第一候选热点话题与所述第二候选
热点话题之间的目标 联合评价 值;
结合所述目标 联合分析 结果进行话题捕捉, 获得 所述话题捕捉结果。
7.如权利要求6所述的方法, 其中, 所述话题捕捉结果是借助预设人工智能网络对所述
第一互联网社 交互动数据和所述第二互联网社 交互动数据进 行大数据处理所得的, 所述预
设人工智能网络包括数据整理层, 所述数据整理层 包括第一动态优化单元和 第二动态优化
单元, 所述第一动态优化单元用作对所述第一联合分析结果进行动态优化, 所述第二动态
优化单元用作对所述第二联合分析 结果进行动态优化。
8.如权利要求6所述的方法, 其中, 所述结合所述目标联合分析结果进行话题捕捉, 获
得所述话题捕捉结果, 包括:
将每个所述第 一候选热点话题与每个所述第 二候选热点话题的绑定结果, 依次确定为
实时候选热点 话题二元簇;
结合所述实时候选热点话题二元簇的第一引导型内容和/或第二引导型内容, 确定实权 利 要 求 书 2/4 页
3
CN 114661998 A
3
专利 基于互联网热点话题的大数据处理方法及系统
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:48:43上传分享