(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210399188.6 (22)申请日 2022.04.15 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 韩钊 王晓元 姜杰 李玉婷  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 马迪 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 分类信息获取、 分类方法、 装置、 电子设备和 存储介质 (57)摘要 本公开提供了一种分类信息获取、 分类方 法、 装置、 电子设备和存储介质, 涉及数据处理技 术领域, 具体为大数据和人工智 能技术领域。 具 体实现方案为: 获取第一词语; 在查询语句中, 确 定与所述第一词语对应的第二词语, 并建立所述 第一词语与所述第二词语 之间的相关关系; 将所 述相关关系、 所述第一词语和所述第二词语, 确 定为查询分类信息, 用于对查询语句进行分类。 本公开实施例可以增加分类信息, 提高分类准确 性。 权利要求书3页 说明书15页 附图4页 CN 114706956 A 2022.07.05 CN 114706956 A 1.一种分类信息获取 方法, 包括: 获取第一词语; 在查询语句中, 确定与所述第一词语对应的第二词语, 并建立所述第一词语与所述第 二词语之间的相关 关系; 将所述相关关系、 所述第 一词语和所述第二词语, 确定为查询分类信 息, 用于对查询语 句进行分类。 2.根据权利要求1所述的方法, 其中, 所述在查询语句中, 确定与所述第一词语对应的 第二词语, 包括: 在查询语句中识别第一实体; 根据所述第一实体, 获取与所述第一词语对应的目标关键词; 根据所述目标关键词, 确定第二词语。 3.根据权利要求2所述的方法, 其中, 所述 根据所述目标关键词, 确定第二词语, 包括: 在所述查询语句中提取与所述目标关键词对应的第二实体; 根据所述目标关键词和所述第二实体, 确定第二词语。 4.根据权利要求3所述的方法, 其中, 所述建立所述第 一词语与 所述第二词语之间的相 关关系, 包括: 建立所述第一词语与所述目标关键词之间的第一级相关 关系; 建立所述目标关键词与对应的第二实体之间的第二级相关 关系。 5.根据权利要求2所述的方法, 其中, 所述根据所述第一实体, 获取与所述第一词语对 应的目标关键词, 包括: 对所述第一词语进行扩展, 得到相似语句; 分别对所述第一词语和所述相似语句进行 特征提取, 形成第一特 征向量; 根据各所述第一特 征向量, 得到平均特 征向量; 对所述第一实体进行 特征提取, 形成第二特 征向量; 根据所述平均特征向量与各所述第二特征向量, 在各所述第一实体中, 筛选得到与所 述第一词语对应的目标关键词。 6.一种分类方法, 包括: 获取用户输入的输入语句; 在查询分类信 息中, 查询与 所述输入语句对应的目标词语以及所述目标词语相关的词 语, 确定所述输入语句的类型, 所述查询分类信息根据如权利要求 1‑5任一项所述的分类信 息获取方法获取。 7.根据权利要求6所述的方法, 还 包括: 根据所述输入语句的类型, 对所述用户进行分类。 8.根据权利要求6所述的方法, 其中, 所述查询分类信 息包括词语和词语之间的相关关 系; 所述查询与所述输入语句对应的目标词语以及所述目标词语相关的词语, 包括: 根据词语长短和词语 语义, 在所述 查询分类信息包括的词语中确定待更新词语; 根据所述词语之间的相关关系, 在所述待更新词语中添加相关的词语, 更新所述待更 新词语;权 利 要 求 书 1/3 页 2 CN 114706956 A 2将所述输入语句输入预先训练 的分类模型中, 并根据更新后的待更新词语输出所述输 入语句对应的目标词语。 9.一种分类信息获取装置, 包括: 第一词语获取模块, 用于获取第一词语; 词语及关系确定模块, 用于在查询语句中, 确定与 所述第一词语对应的第 二词语, 并建 立所述第一词语与所述第二词语之间的相关 关系; 查询分类信 息生成模块, 用于将所述相关关系、 所述第 一词语和所述第 二词语, 确定为 查询分类信息, 用于对查询语句进行分类。 10.根据权利要求9所述的装置, 其中, 所述词语及关系确定模块, 包括: 第一实体获取 单元, 用于在查询语句中识别第一实体; 关键词筛 选单元, 用于根据所述第一实体, 获取与所述第一词语对应的目标关键词; 第二词语确定单 元, 用于根据所述目标关键词, 确定第二词语。 11.根据权利要求10所述的装置, 其中, 所述第二词语确定单 元, 包括: 第二实体获取 单元, 用于在所述 查询语句中提取与所述目标关键词对应的第二实体; 第二词语生成子单 元, 用于根据所述目标关键词和所述第二实体, 确定第二词语。 12.根据权利要求1 1所述的装置, 其中, 所述词语及关系确定模块, 包括: 第一级相关关系建立单元, 用于建立所述第 一词语与 所述目标关键词之间的第 一级相 关关系; 第二级相关关系建立单元, 用于建立所述目标关键词与对应的第 二实体之间的第 二级 相关关系。 13.根据权利要求10所述的装置, 其中, 所述关键词筛 选单元, 包括: 第一词语扩展子单 元, 用于对所述第一词语进行扩展, 得到相似语句; 第一特征提取子单元, 用于分别对所述第一词语和所述相似语句进行特征提取, 形成 第一特征向量; 平均向量计算子单 元, 用于根据各 所述第一特 征向量, 得到平均特 征向量; 第二特征提取子单 元, 用于对所述第一实体进行 特征提取, 形成第二特 征向量; 目标关键词确定子单元, 用于根据所述平均特征向量与各所述第二特征向量, 在各所 述第一实体中, 筛 选得到与所述第一词语对应的目标关键词。 14.一种分类装置, 包括: 输入语句获取模块, 用于获取用户输入的输入语句; 输入语句分类模块, 用于在查询分类信息中, 查询与所述输入语句对应的目标词语以 及所述目标词语相关的词语, 确定所述输入语句的类型, 所述查询分类信息根据如权利要 求1‑5任一项所述的分类信息获取 方法获取。 15.根据权利要求14所述的装置, 还 包括: 用户分类模块, 用于根据所述输入语句的类型, 对所述用户进行分类。 16.根据权利要求14所述的装置, 其中, 所述查询分类信 息包括词语和词语之间的相关 关系; 所述输入语句分类模块, 包括: 待更新词语获取单元, 用于根据词语长短和词语语义, 在所述查询分类信息包括的词权 利 要 求 书 2/3 页 3 CN 114706956 A 3

.PDF文档 专利 分类信息获取、分类方法、装置、电子设备和存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 分类信息获取、分类方法、装置、电子设备和存储介质 第 1 页 专利 分类信息获取、分类方法、装置、电子设备和存储介质 第 2 页 专利 分类信息获取、分类方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:48:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。