(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210469016.1 (22)申请日 2022.04.28 (71)申请人 东云睿连 (武汉) 计算 技术有限公司 地址 430000 湖北省武汉市东湖新 技术开 发区金融港四路18号普天物 联网创新 研发基地 (一期) 6A栋4层-2室 (72)发明人 徐驰 林健  (74)专利代理 机构 武汉智正诚专利代理事务所 (普通合伙) 42278 专利代理师 李卫 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06F 40/30(2020.01) (54)发明名称 数据查询方法、 装置、 设备及存 储介质 (57)摘要 本发明属于数据处理技术领域, 公开了一种 数据查询方法、 装置、 设备及存储介质。 该方法包 括根据用户输入的数据查询请求确定自然语言 问题文本; 通过预设文本分类模 型确定自然语言 问题文本对应的目标数据源; 查找目标数据源对 应的目标数据平台类型, 确定对应的目标查询范 式; 根据目标查询范式和自然语言问题文本生成 目标查询语句; 获取与目标查询语句匹配的查询 结果并显示。 本发明基于自然语言的异构大数据 平台, 支持多种异构大数据后端, 并且查找目标 数据源对应的目标数据平台类型从而确定对应 的目标查询范式, 支持多种数据查询范式。 有利 于实现便捷的数据查询, 解决了不同种类的数据 平台的查询接口不同, 数据查询的难度高的问 题。 权利要求书2页 说明书13页 附图6页 CN 114756655 A 2022.07.15 CN 114756655 A 1.一种数据查询方法, 其特 征在于, 所述数据查询方法, 包括: 响应于用户输入的数据查询请求, 根据所述数据查询请求确定自然语言问题文本; 通过预设文本分类模型确定所述自然语言问题文本对应的目标 数据源; 查找所述目标数据源对应的目标数据平台类型, 并根据 所述目标数据平台类型确定对 应的目标查询范式; 根据所述目标查询范式和所述自然语言问题文本生成目标查询语句; 获取与所述目标查询语句匹配的查询结果, 并显示所述 查询结果。 2.如权利要求1所述的数据查询方法, 其特征在于, 所述通过预设文本分类模型确定所 述自然语言问题文本对应的目标 数据源之前, 所述方法还 包括: 构建自然语言 问题文本与对应数据源的数据集合, 并将所述数据集合作为预设文本分 类算法的训练样本数据集; 根据所述训练样本数据集对文本分类模型进行训练, 并将训练后的文本分类模型作为 预设文本分类模型。 3.如权利要求1所述的数据查询方法, 其特征在于, 所述通过预设文本分类模型确定所 述自然语言问题文本对应的目标 数据源, 包括: 对所述自然语言问题文本进行 特征提取, 得到特 征向量; 通过预设分类器对所述特 征向量进行分类, 得到若干分类 类别的概 率值; 将所述概率值按照从大到小的顺序进行排序, 将第 一排序对应的概率值作为目标概率 值; 将所述目标概率值对应的分类类别作为所述自然语言问题文本的目标分类类别; 其 中, 所述目标分类 类别为目标 数据源。 4.如权利要求1所述的数据查询方法, 其特征在于, 所述查找所述目标数据源对应的目 标数据平台类型, 并根据所述 目标数据平台类型确定对应的目标查询范式之前, 所述方法 还包括: 获取数据源和数据平台类型; 建立所述数据源和所述数据平台类型的对应关系并存 储所述对应关系。 5.如权利要求1所述的数据查询方法, 其特征在于, 所述根据所述目标查询范式和所述 自然语言问题文本生成目标查询语句之后, 还 包括: 确定所述目标查询语句的置信度值; 判断所述置信度值是否满足预设置信度值阈值条件; 在所述置信度值满足所述预设置信度值阈值条件时, 则执行所述获取与所述目标查询 语句匹配的查询结果, 并显示所述 查询结果的步骤。 6.如权利要求5所述的数据查询方法, 其特征在于, 所述判断所述置信度值是否满足预 设置信度值阈值条件之后, 还 包括: 在判断所述置信度值不满足所述预设置信度值阈值条件时, 执行多轮次对话并获取与 所述多轮次对话对应的应答数据; 根据所述应答数据更新所述自然语言 问题文本的语义信 息, 获得更新后的自然语言 问 题文本; 执行通过预设文本分类模型确定所述更新后的自然语言问题文本对应的目标 数据源。权 利 要 求 书 1/2 页 2 CN 114756655 A 27.如权利要求6所述的数据查询方法, 其特征在于, 所述根据所述应答数据更新所述自 然语言问题文本的语义信息, 获得 更新后的自然语言问题文本, 包括: 对所述应答数据进行文本分析, 获得意图数据; 其中, 所述意图数据包括所述应答数据 关联的语义特 征值; 基于所述意图数据的语义特征值更新所述自然语言 问题文本, 获得更新后的自然语言 问题文本 。 8.一种数据查询装置, 其特 征在于, 所述数据查询装置, 包括: 响应模块, 用于响应于用户输入的数据查询请求, 根据所述数据查询请求确定自然语 言问题文本; 确定模块, 用于通过预设文本分类模型确定所述自然语言问题文本对应的目标数据 源; 查找模块, 用于查找所述目标数据源对应的目标数据平台类型, 并根据所述目标数据 平台类型确定对应的目标查询范式; 生成模块, 用于根据所述目标查询范式和所述自然语言问题文本生成目标查询语句; 匹配模块, 用于获取与所述目标查询语句匹配的查询结果, 并显示所述 查询结果。 9.一种数据查询设备, 其特征在于, 所述数据查询设备包括: 存储器、 处理器及存储在 所述存储器上并可在所述处理器上运行的数据查询程序, 所述数据查询程序配置为 实现如 权利要求1至7中任一项所述的数据查询方法的步骤。 10.一种计算机存储介质, 其特征在于, 其上存储有数据查询程序, 所述数据查询程序 被处理器执行时实现如权利要求1至7中任一项所述的数据查询方法的步骤。权 利 要 求 书 2/2 页 3 CN 114756655 A 3

.PDF文档 专利 数据查询方法、装置、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据查询方法、装置、设备及存储介质 第 1 页 专利 数据查询方法、装置、设备及存储介质 第 2 页 专利 数据查询方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:50:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。