国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210986810.3 (22)申请日 2022.08.17 (71)申请人 广州琪智数据科技有限公司 地址 510620 广东省广州市天河区华 旭街3 号(自编C 5栋)1580房(仅限办公用途) (72)发明人 罗杰锋 (74)专利代理 机构 广州立信 智科专利代理事务 所(特殊普通 合伙) 44812 专利代理师 张文哲 (51)Int.Cl. G06F 16/9532(2019.01) G06F 16/9535(2019.01) G06F 16/2457(2019.01) G06F 16/242(2019.01) G06F 16/28(2019.01) (54)发明名称 一种基于识别技 术的精确搜索方法 (57)摘要 本发明属于搜索方法领域, 具体的说是一种 基于识别技术的精确搜索方法, 该精确搜索方法 包括以下步骤: 第一步: 对收集的数据进行汇总, 进行标准化定义以及分类; 第二步: 对用户输入 的文字进行分析, 从中提取关键词; 第三步: 通过 关键词确定搜索与关键词相 匹配的标准化定义 以及分类; 第四步: 将与关键词匹配的结果展示 给用户, 同时将与关键词相关的其他关键词列 出; 第五步: 用户通过选择相关关键词进一步的 对结果进行筛选; 解决了 现有技术是利用关键字 进行模糊搜索和分类, 将匹配到的结果进行匹配 度优先排序, 并不能保证搜索结果与搜索目的精 准匹配也不能将搜索关键字中包含的物品特征 进行精准定义的问题。 权利要求书1页 说明书4页 附图2页 CN 115357778 A 2022.11.18 CN 115357778 A 1.一种基于识别技 术的精确搜索方法, 其特 征在于: 该精确搜索方法包括以下步骤: S1: 对收集的数据进行汇总, 进行 标准化定义以及分类; S2: 对用户输入的文字进行语义分析, 根据语义分析 结果从中提取并筛 选关键词; S3: 通过关键词确定 搜索与关键词相匹配的标准 化定义以及分类; S4: 将与关键词匹配的结果展示给用户, 同时将与关键词相关的其 他关键词列出; S5: 用户通过选择相关 关键词进一 步的对结果进行筛 选。 2.根据权利要求1所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S1具体 为数据基于分类进行逻辑存 储, 数据索引基于物品标准 化定义分类。 3.根据权利要求2所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S1中对 收集的数据进行汇总时所使用的数据库为关系数据库。 4.根据权利要求3所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S1中在 对收集的数据进 行汇总和标准化定义以及分类时采用机器学习技术, 具体主要使用决策树 算法, 并在特殊情况使用神经网络算法, 汇总为标准数据资源库。 5.根据权利要求4所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S2具体 为通过逻辑斯蒂回归分析、 支撑向量机、 神经网络算法、 提升树算法、 随机森林算法等机器 学习技术对关键词进行提取, 并使用共 轭梯度下降进行优化。 6.根据权利要求5所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S3具体 为将S2中识别出 的关键词与标准数据资源库进行精准匹配, 向用户提供精准匹配结果.同 时与<物品标准>定义进行差别对比, 可以计算出 该搜索关键 字“未包含的物品定义 ”。 7.根据权利要求6所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S4具体 为将与所搜索的关键词相关的关键词中所未包含定义的特征数值关键词作为列 表返回, 提 供给用户进行二次筛 选。 8.根据权利要求7所述的一种基于识别技术的精确搜索方法, 其特征在于: 所述S5具体 为用户将未输入的关键词选中后将该关键词从未选择列表中剔除然后返回S4对该关键词 相关数据进行检索后返回给用户, 通过S4 ‑S5的循环对搜索结果进一 步的进行缩小。权 利 要 求 书 1/1 页 2 CN 115357778 A 2一种基于识别技术的精确搜索方 法 技术领域 [0001]本发明涉及搜索方法领域, 具体是一种基于识别技 术的精确搜索方法。 背景技术 [0002]随着互联网的发展, 网络上的数据也愈发膨胀, 为了高效的对所需要的信息进行 查阅和检索, 搜索引擎应运而生。 [0003]现有的搜索引擎根据用户需求与一定算法, 运用特定策略从互联 网检索出指定信 息反馈给用户。 [0004]现有技术是利用关键字进行模糊搜索和分类, 将匹配到的结果进行匹配度优先排 序, 并不能保证搜索结果与搜索目的100%精准匹配.也不能将搜索关键字中包含的物品特 征进行精准定义作为已选条件为搜索用户提供条件取消(减法)操作; 因此, 针对上述问题 提出一种基于识别技 术的精确搜索方法。 发明内容 [0005]为了弥补现有技术的不足, 现有技术是利用关键字进行模糊搜索和 分类, 将匹配 到的结果进 行匹配度优先排序, 并不能保证搜索结果与搜索目的100%精准匹配.也不能将 搜索关键字中包含的物品特征进行精准定义作为已选条件为搜索用户提供条件取消(减 法)操作的问题, 本发明提出一种基于识别技 术的精确搜索方法。 [0006]本发明解决其技术问题所采用的技术方案是: 本发明所述的一种基于识别技术的 精确搜索方法, 该精确搜索方法包括以下步骤: [0007]S1: 对收集的数据进行汇总, 进行 标准化定义以及分类; [0008]S2: 对用户输入的文字进行分析, 从中提取关键词; [0009]S3: 通过关键词确定 搜索与关键词相匹配的标准 化定义以及分类; [0010]S4: 将与关键词匹配的结果展示给用户, 同时将与关键词相关的其 他关键词列出; [0011]S5: 用户通过选择相关 关键词进一 步的对结果进行筛 选。 [0012]优选的, 所述S1具体为数据基于分类进行逻辑存储, 数据索引基于物品标准化定 义分类。 [0013]优选的, 所述S1中对收集的数据进行汇总时所使用的数据库为关系数据库。 [0014]优选的, 所述S1中在对收集的数据进行汇总和标准化定义以及分类时采用机器学 习技术, 具体主要使用决策树算法, 并在特殊情况使用神经网络算法, 汇总为标准数据资源 库。 [0015]优选的, 所述S2具体为通过逻辑斯蒂回归分析、 支撑向量机、 神经网络算法、 提升 树算法、 随机森林算法等机器学习技 术对关键词进行提取, 并使用共 轭梯度下降进行优化。 [0016]优选的, 所述S3具体为将S2中识别出的关键词与标准数据资源库进行精准匹配, 向用户提供精准匹配结果.同时与<物品标准>定义进行差别对比, 可以计算出该搜索关键 字“未包含的物品定义 ”。说 明 书 1/4 页 3 CN 115357778 A 3
专利 一种基于识别技术的精确搜索方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:33:29
上传分享
举报
下载
原文档
(479.1 KB)
分享
友情链接
GB-T 20279-2015 信息安全技术 网络和终端隔离产权安全技术要求.pdf
T-CES 145—2022 换流变压器用振动测量仪技术规范.pdf
T-WSJD 29—2022 化妆品安全评估 毒理学关注阈值法.pdf
GB-T 38629-2020 信息安全技术 签名验签服务器技术规范.pdf
GB-T 38664.3-2020 信息技术 大数据 政务数据开放共享 第3部分:开放程度评价.pdf
GM-T 0048-2016 智能密码钥匙密码检测规范.pdf
GB-T 34120-2017 电化学储能系统储能变流器技术规范.pdf
ISO IEC 5392 2024 Information technology — Artificial intelligence — Referenc.pdf
GB-T 42131-2022 人工智能 知识图谱技术框架.pdf
DB6110-T 008-2021 天麻萌发菌、蜜环菌菌种生产技术规程 商洛市.pdf
青藤 - 2021 安全规划:三步搞定安全流程管理.pdf
GB-T 10228-2023 干式电力变压器技术参数和要求.pdf
GB-T 22374-2018 地坪涂装材料.pdf
GB-T 38249-2019 信息安全技术 政府网站云计算服务安全指南.pdf
GM T 0011-2023 可信计算 可信密码支撑平台功能与接口规范.pdf
T-CESA 1045—2019 智能音箱技术规范.pdf
GB-T 43004-2023 发制品 柔顺性试验方法.pdf
GB-T 28435-2012 地面数字电视广播发射机技术要求和测量方法.pdf
T-CSAE 75.2—2021 汽车防锈包装规程 第2部分:动力总成及其主要零部件.pdf
GB 6819-2004 溶解乙炔.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(479.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。