(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211196900.9
(22)申请日 2022.09.28
(71)申请人 中国兵器 工业计算机 应用技术研究
所
地址 100089 北京市海淀区车道沟10号
(72)发明人 彭龙 鲁东民 杜宏博 葛晋鹏
米丽媛 郭亚辉 饶雷 张帅
王乃正 邵鹏志 梁冬 王静阳
印泰桦 袁艳敏 王乐和 曾帅
(74)专利代理 机构 北京天达知识产权代理事务
所有限公司 1 1386
专利代理师 庞许倩
(51)Int.Cl.
G06F 16/903(2019.01)
G06F 16/901(2019.01)G06F 16/9038(2019.01)
G06F 16/951(2019.01)
G06F 16/9535(2019.01)
(54)发明名称
一种统一混合搜索方法及系统
(57)摘要
本发明涉及一种用于统一混合搜索系统和
方法, 属于数据处理技术领域; 解决了现有技术
中在进行关键词搜索时, 需要全方位进行搜索,
导致对于搜索资源占用过大, 搜索进度缓慢, 在
多人同时搜索是易导致搜索引擎崩溃的问题; 本
发明的方法包括获取待搜索关键词; 通过设置的
优先级, 对本地预存储的热数据关键词、 非本地
预存储的热数据关键词、 本地预存储的冷数据关
键词和非本地预存储的冷数据关键词进行对比
搜索; 当搜索得到符合的热数据或冷数据关键词
时, 则对所述关键词及关键词所对应的数据源地
址进行显示处理, 得到搜索结果; 其中, 所述数据
源地址与对应的关键词超链接 。
权利要求书2页 说明书7页 附图1页
CN 115438236 A
2022.12.06
CN 115438236 A
1.一种统一混合搜索方法, 其特 征在于, 包括以下步骤:
获取待搜索关键词;
通过设置的优先级, 对本地预存储的热数据关键词、 非本地预存储的热数据关键词、 本
地预存储的冷数据关键词和非本地预存 储的冷数据关键词进行对比搜索;
当搜索得到符合的热数据或冷数据关键词时, 则对所述关键词及 关键词所对应的数据
源地址进行显示处 理, 得到搜索结果; 其中, 所述数据源地址与对应的关键词超链接 。
2.根据权利要求1所述的统一混合搜索方法, 其特征在于, 所述本地预存储为本地磁盘
存储, 用于存储搜索文本型的热数据关键词和冷数据关键词; 所述 非本地预存储为云存储,
用于存储非文本型的热 数据关键词和冷数据关键词。
3.根据权利要求1所述的模型训练方法, 其特征在于, 所述冷数据关键词和热数据关键
词通过预定间隔时间对每个关键词的搜索频率进 行统计, 并根据搜索频率阈值和热数据存
储概率判定得到 。
4.根据权利要求3所述的统一混合搜索方法, 其特征在于,根据搜索频率阈值和热数据
存储概率判定得到冷数据关键词和热 数据关键词, 包括:
设置更新周期;
监听每一个关键词在更新周期内被检索的次数, 根据搜索频率阈值对冷、 热数据关键
词进行初步判断, 得到预存 储冷数据关键词和预存 储热数据关键词;
对预存储热数据关键词进行热数据存储概率计算, 选择存储概率大于存储概率阈值的
数据作为热数据进行存储; 存储概率小于存储概率阈值的数据与预存储冷数据关键词 作为
冷数据关键词进行存 储。
5.根据权利要求4所述的统一混合搜索方法, 其特征在于, 通过下述公式计算热数据存
储概率:
其中, P为热数据存储概率, t为当前关键词检索次数, w为所有热数据关键词的检索总
次数, R为总数据量, r为携带 热数据关键词的数据量。
6.根据权利要求1所述的统一混合搜索方法, 其特征在于, 所述数据源地址用于链接到
与关键词匹配的网页或文件; 与本地预存储关键词对应的数据源地址采用本地磁盘存储,
与非本地预存 储关键词对应的数据源地址采用云存 储。
7.一种统一混合搜索系统, 其特征在于, 包括: 中央处理器、 统一混合存储模块和数据
源地址存 储模块;
所述统一混合存储模块用于筛选和分别存储冷数据关键词和热数据关键词; 统一混合
存储模块包括冷热关键词判定单 元、 冷数据关键词存 储单元和热数据关键词存 储单元;
所述数据源地址存储模块用于存储与关键词对应的数据源地址信息和/或索引信息;
所述数据源地址与对应的关键词超链接;
所述中央处理器用于根据预先设置的冷热关键词判定流程和搜索流程, 调用冷热关键
词判定单元和关键词存储单元的数据, 进行冷、 热数据关键词判定及冷、 热数据关键词搜
索; 并且, 若搜索到符合的热数据或冷数据关键词, 则对所述关键词及关键词所对应的数据
源地址进行显示处 理, 得到搜索结果。权 利 要 求 书 1/2 页
2
CN 115438236 A
28.根据权利要求7所述的统一混合搜索系统, 其特征在于, 所述冷热关键词判定单元包
括冷热数据筛选定时单元、 关键词搜索频率统计单 元和热数据存储概率计算单 元;
所述冷热 数据筛选定时单元用于定时向中央处 理器发送冷热 数据筛选的指令;
所述关键词搜索频率统计单元用于记录并统计预定时间内每个关键词的搜索频率; 所
述中央处理单元根据统计的每个关键词的搜索频率识别热数据关键词存储单元和冷数据
关键词存储单元内冷、 热数据关键词, 并根据识别结果将冷、 热数据关键词预存储于对应的
存储单元内;
所述热数据存储概率计算单元用于计算热数据关键词的热数据存储概率; 存储概率大
于阈值的数据为最终的热数据关键词, 存储概率小于阈值的数据与预存储于冷数据存储单
元内的数据为 最终的冷数据关键词。
9.根据权利要求7所述的统一混合搜索系统, 其特征在于, 所述冷、 热数据关键词存储
单元均包括: 本地数据资源 存储模块和非本地数据资源 存储模块;
其中, 本地数据资源存储模块为本地磁盘, 用于存储搜索步骤简易的冷、 热数据关键
词; 非本地数据资源 存储模块为云存储, 用于存 储搜索步骤繁琐的冷、 热 数据关键词。
10.根据权利要求8所述的统一混合搜索系统, 其特征在于, 通过下述公式计算得到热
数据存储概率:
其中, P为热数据存储概率, t为当前关键词检索次数, w为所有热数据关键词的检索总
次数, R为总数据量, r为携带 热数据关键词的数据量。权 利 要 求 书 2/2 页
3
CN 115438236 A
3
专利 一种统一混合搜索方法及系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:34:17上传分享