国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221019581 1.6 (22)申请日 2022.03.01 (71)申请人 深圳TCL新技术有限公司 地址 518052 广东省深圳市南 山区西丽 街 道中山园路10 01号国际E城D4栋9 楼 (72)发明人 孙瑜希 (74)专利代理 机构 深圳紫藤知识产权代理有限 公司 44570 专利代理师 张惠 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 40/30(2020.01) (54)发明名称 基于语音数据的搜索方法、 装置、 计算机设 备及存储介质 (57)摘要 本申请实施例提供了一种基于语音数据的 搜索方法、 装置、 计算机设备及存储介质, 该方法 先对待处理语音数据进行文本转换, 得到初始文 本数据, 然后, 对初始文本 数据进行语义 分析, 确 定对应的领域类型及初始槽位值, 接着, 根据领 域类型获取对应的槽位改写索引表, 槽位改写索 引表记录了对应的领域类型的未经改写的第一 槽位值和改写后的第二槽位值, 再根据槽位改写 索引表, 对初始槽位值进行调整, 得到目标槽位 值, 最后, 基于目标槽位值进行搜索, 得到搜索结 果, 通过槽位改写索引表对初始槽位值进行调 整, 使得目标槽位值更加准确, 从而改善了通过 初始槽位值进行搜索导致的关键词无法召回的 情况, 提高了 搜索结果的召回率和准确性。 权利要求书2页 说明书10页 附图4页 CN 114661862 A 2022.06.24 CN 114661862 A 1.一种基于语音数据的搜索方法, 其特 征在于, 包括: 获取待处 理语音数据, 并对所述待处 理语音数据进行文本转换, 得到初始文本数据; 对所述初始文本数据进行语义分析, 确定对应的领域类型及 初始槽位 值; 根据所述领域类型获取对应的槽位改写索引表, 所述槽位改写索引表记录了对应的领 域类型的未 经改写的第一槽位 值和改写后的第二槽位 值; 根据所述槽位改写索引表, 对所述初始槽位 值进行调整, 得到目标槽位 值; 基于所述目标槽位 值进行搜索, 得到 搜索结果。 2.如权利要求1所述的基于语音数据的搜索方法, 其特征在于, 在所述根据所述领域类 型获取对应的槽位改写索引表的步骤之前, 还 包括: 针对每个所述领域类型, 采用预设的匹配方式生成所述槽位改写索引表。 3.如权利要求1所述的基于语音数据的搜索方法, 其特征在于, 所述针对每个所述领域 类型, 采用预设的匹配方式生成所述槽位改写索引表的步骤, 包括: 从预设样本数据库中获取所述领域类型对应的所述第 一槽位值, 并从预设搜索数据库 中获取所述领域类型对应的标准槽位 值, 其中, 所述第二槽位 值为所述标准槽位 值的子集; 针对每个所述第一槽位值, 采用第一距离计算方法, 计算每个所述第一槽位值与各个 所述标准槽位值的语义相似度, 得到第一相似度, 并采用第二距离计算方法, 计算每个所述 第一槽位 值与各个所述标准槽位 值的语义相似度, 得到第二相似度; 选取前K个所述第一相似度对应的标准槽位值确定为第 一候选槽位值, 并选取前L个所 述第二相似度对应的标准槽位 值确定为第二 候选槽位值, 其中, K和L均为大于1的自然数; 按照预设的评分规则, 分别确定各个所述第 一候选槽位值和各个所述第 二候选槽位值 的评分; 根据各个所述评分, 从所述第 一候选槽位值和所述第 二候选槽位值中确定所述第 一槽 位值对应的所述第二槽位 值。 4.如权利要求3所述的基于语音数据的搜索方法, 其特征在于, 所述针对每个所述第 一 槽位值, 采用第一距离计算方法, 计算每个所述第一槽位值与各个所述标准槽位值的语义 相似度, 得到第一相似度的步骤, 包括: 利用拼音插件将所述第 一槽位值转换为第 一拼音文本, 并将各个所述标准槽位值转换 为标准拼音文本; 计算所述第 一拼音文本与 各个所述标准拼音文本的欧式距离, 根据所述欧式距离确定 所述第一相似度。 5.如权利要求3所述的基于语音数据的搜索方法, 其特征在于, 所述并采用第 二距离计 算方法, 计算每个所述第一槽位值与各个所述标准槽位值的语义相似度, 得到第二相似度 的步骤, 包括: 将所述第一槽位值输入已训练的文本分析模型, 得到第一嵌入, 并将各个所述标准槽 位值分别输入所述已训练的文本分析模型, 得到各个标准嵌入; 计算所述第 一嵌入与 各个所述标准嵌入的余弦距离, 根据 所述余弦距离确定所述第 二 相似度。 6.如权利要求3所述的基于语音数据的搜索方法, 其特征在于, 所述按照预设的评分规 则, 分别确定各个所述第一 候选槽位值和各个所述第二 候选槽位值的评分的步骤, 包括:权 利 要 求 书 1/2 页 2 CN 114661862 A 2根据各个所述第一候选槽位值、 所述第二候选槽位值的使用频率, 确定各个所述第一 候选槽位值、 第二候选槽位值的使用频率评分; 根据各个所述第一候选槽位值、 所述第二候选槽位值的热度, 确定各个所述第一候选 槽位值、 第二候选槽位值的热度评分; 将各个所述第 一候选槽位值分别输入预设验证分类器中, 确定各个所述第 一候选槽位 值的第一验证结果, 根据所述第一验证结果, 得到第一准确率, 并将各个所述第二候选槽位 值分别输入预设验证分类器中, 确定各个所述第二候选槽位值的第二验证结果, 根据所述 第二验证结果, 得到第二 准确率; 根据所述第一准确率、 各个所述第 一候选槽位值的第 一相似度、 使用频率评分、 所述使 用频率对应的频率权重及所述热度对应的热度权重确定所述各个所述第一候选槽位值的 评分, 并根据所述第二准确 率、 各个所述第二候选槽位值的第二相似度、 使用频率评分、 所 述使用频率对应的频率权重及所述热度对应的热度权重确定所述各个所述第二候选槽位 值的评分。 7.如权利要求6所述的基于语音数据的搜索方法, 其特征在于, 所述基于所述目标槽位 值进行搜索, 得到 搜索结果的步骤, 包括: 根据所述目标槽位 值在预设搜索资源库中进行搜索; 若搜索到与所述目标槽位 值对应的搜索信息, 则将所述搜索信息作为所述搜索结果; 若未搜索到与所述目标槽位值对应的搜索信息, 则基于所述目标槽位值, 采用预设的 推荐方法获取对应的推荐信息, 并将所述推荐信息确定为所述搜索结果。 8.一种基于语音数据的搜索装置, 其特 征在于, 包括: 转换模块, 用于获取待处理语音数据, 并对所述待处理语音数据进行文本转换, 得到初 始文本数据; 分析模块, 用于对所述初始文本数据进行语义分析, 确定对应的领域类型及初始槽位 值; 获取模块, 用于根据所述领域类型获取对应的槽位改写索引表, 所述槽位改写索引表 记录了对应的领域类型的未 经改写的第一槽位 值和改写后的第二槽位 值; 改写模块, 用于根据 所述槽位改写索引表, 对所述初始槽位值进行调整, 得到目标槽位 值; 搜索模块, 用于基于所述目标槽位 值进行搜索, 得到 搜索结果。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7任一项所述基于语音数据的搜索方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述基于语音 数据的搜索 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114661862 A 3
专利 基于语音数据的搜索方法、装置、计算机设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:49:56
上传分享
举报
下载
原文档
(789.9 KB)
分享
友情链接
GB-T 34095-2017 信息安全技术 用于电子支付的基于近距离无线通信的移动终端安全技术要求.pdf
ISO IEC 27000-2020.pdf
T-CACM 1352—2021 慢性溃疡气虚毒滞证诊断标准.pdf
GB-T 17000-2009 全息防伪产品通用技术条件.pdf
信通院 数据安全技术与产业发展研究报告-2021年.pdf
T-SHSSW 002—2024 长江口咸潮入侵应急监测技术导则.pdf
T-ZACA 010—2019 审核员服务行为规范.pdf
GB-T 17116.3-2018 管道支吊架 第3部分:中间连接件和建筑结构连接件.pdf
GB-T 21062.3-2007 政务信息资源交换体系 第3部分:数据接口规范.pdf
JR-T 0071.4—2020 金融行业网络安全等级保护实施指引 第4部分:培训指引.pdf
DB63-T372-2018 气象灾害分级指标 青海省.pdf
GB-T 18005-1999 中国森林公园风景资源质量等级评定.pdf
国测 王欣 软件供应链安全现状与分析.pdf
DB52-T 1626-2021 水利工程调整概算报告编制导则 贵州省.pdf
中国信创产业发展白皮书.pdf
GB-T 38561-2020 信息安全技术 网络安全管理支撑系统技术要求.pdf
GB-T 23561.9-2009 煤和岩石物理力学性质测定方法 第9部分:煤和岩石三轴强度及变形参数测定方法.pdf
GB-T 33008.1-2016 工业自动化和控制系统网络安全 可编程序控制器 PLC 第1部分:系统要求.pdf
GB-T 29362-2023 法庭科学 电子数据搜索检验规程.pdf
专利 渗透测试攻击路径规划方法、装置、电子设备及存储介质.PDF
1
/
3
17
评价文档
赞助2.5元 点击下载(789.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。