国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210272951.9 (22)申请日 2022.03.18 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 杨世辉 (74)专利代理 机构 北京国昊天诚知识产权代理 有限公司 1 1315 专利代理师 许振新 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/194(2020.01) G06F 16/33(2019.01) G06F 16/332(2019.01) G10L 15/18(2013.01) (54)发明名称 一种人机交 互方法、 装置及电子设备 (57)摘要 本说明书实施例提供一种人机交互方法、 装 置及电子设备。 方法包括: 基于流式的语音识别 技术, 对用户在人机交互输入的语音内容进行识 别, 其中, 所述人机交互对应所述用户的语音输 入通道和对应机器人的语音播放通道相互独立。 在识别得到第一语音内容时, 将所述第一语音内 容的语义意图和所述用户相对所述第一语音内 容的历史语义意图进行融合, 得到目标语义意 图。 如果所述目标语义意图属于可执行语义意 图, 则基于所述目标语义意图执行对应的语义执 行操作。 如果目标语义意图属于不可执行语义意 图, 则对所述目标语义意图进行缓存, 以作为相 对下次识别到的第二语音内容的历史语义 意图。 权利要求书2页 说明书10页 附图2页 CN 114662500 A 2022.06.24 CN 114662500 A 1.一种人机交 互方法, 包括: 基于流式的语音识别技 术, 对用户在人机交 互输入的语音内容进行识别; 在识别得到第 一语音内容 时, 将所述第 一语音内容的语义意图和所述用户相对所述第 一语音内容的历史语义 意图进行融合, 得到目标语义 意图; 如果所述目标语义意图属于可执行语义意图, 则基于所述目标语义意图执行对应的语 义执行操作; 如果目标语义意图属于不可执行语义意图, 则对所述目标语义意图进行缓存, 以作为 相对下次识别到的第二语音内容的历史语义 意图。 2.根据权利要求1所述的方法, 所述可执行语义意图包括: 最终语义 意图和完整语义 意图; 其中, 所述最终语义意图是指被所述语音识别技术断句时所识别的语义意图, 所述完 整语义意图是指在被所述语音识别技术断句前, 提前体现出用户完整意图的语义意图, 所 述目标语义对应所述最终语义意图和所述完整语义意图的语义执行操作为: 基于所述目标 语义意图对应的回复内容进行语音播报, 所述人机交互对应所述用户的语音输入通道和对 应机器人的语音播 放通道相互独立。 3.根据权利要求1所述的方法, 所述可执行语义意图还包括: 播报打断意图; 其中, 所述目标语义对应所述 播报打断意图的语义执 行操作为: 停止语音播报。 4.根据权利要求3所述的方法, 若所述目标语义 意为播报打断意图, 则所述方法还 包括: 将所述用户相对所述第一语音内容的历史语义意图沿用为相对所述第二语音内容的 历史语义 意图。 5.根据权利要求1所述的方法, 将所述第一语音内容的语义意图和所述用户相对所述第一语音内容的历史语义意图 进行意图融合, 得到目标语义 意图, 包括: 基于所述用户相对所述第一语音内容的历史语音内容与所述第一语音内容之间的文 本内容差异度和/或文本长度差异度, 确定所述用户相对所述第一语音内容的历史语音内 容是否满足融合标准, 其中, 所述用户相对第一语音内容的历史语音内容是指所述语音识 别技术在上一次断句后到获得 所述第一语音内容前 所得到的语音内容; 若所述用户相对所述第 一语音内容的历史语音内容满足所述预设融合标准, 则将所述 第一语音内容的语义意图和所述用户相对所述第一语音内容的历史语音内容进行意图融 合, 得到目标语义 意图。 6.根据权利要求5所述的方法, 还 包括 若所述用户相对所述第 一语音内容的历史语音内容不满足所述预设融合标准, 则将所 述第一语音内容的语义 意图作为所述目标语义 意图。 7.根据权利要求5所述的方法, 还 包括: 基于之前的可执行语义意图与 所述目标语意意图之间的意图关联关系, 和/或, 之前的 可执行语义意图所对应的语音内容与所述第一语音内容之 间的上下文关联关系, 评估所述 目标语义意图的置信度, 其中, 若所述目标语义意图的评估结果满足预设置信度标准, 则对权 利 要 求 书 1/2 页 2 CN 114662500 A 2所述目标语义 意图进行 可执行语义意图和不可 执行语义意图的判断。 8.一种人机交 互装置, 包括: 语音识别模块, 基于流式的语音识别技术, 对用户在人机交互输入的语音内容进行识 别; 语义意图融合模块, 在识别得到第一语音内容时, 将所述第一语音内容的语义意图和 所述用户相对所述第一语音内容的历史语义 意图进行融合, 得到目标语义 意图; 语义意图执行模块, 如果所述目标语义意图属于可执行语义意图, 则基于所述目标语 义意图执行对应的语义执 行操作; 语义意图缓存模块, 如果目标语义意图属于不可执行语义意图, 则对所述目标语义意 图进行缓存, 以作为相对下次识别到的第二语音内容的历史语义 意图。 9.一种电子设备包括: 存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 所述计算机程序被所述处 理器执行: 基于流式的语音识别技 术, 对用户在人机交 互输入的语音内容进行识别; 在识别得到第 一语音内容 时, 将所述第 一语音内容的语义意图和所述用户相对所述第 一语音内容的历史语义 意图进行融合, 得到目标语义 意图; 如果所述目标语义意图属于可执行语义意图, 则基于所述目标语义意图执行对应的语 义执行操作; 如果目标语义意图属于不可执行语义意图, 则对所述目标语义意图进行缓存, 以作为 相对下次识别到的第二语音内容的历史语义 意图。 10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 所述计 算机程序被处 理器执行时实现如下步骤: 基于流式的语音识别技 术, 对用户在人机交 互输入的语音内容进行识别; 在识别得到第 一语音内容 时, 将所述第 一语音内容的语义意图和所述用户相对所述第 一语音内容的历史语义 意图进行融合, 得到目标语义 意图; 如果所述目标语义意图属于可执行语义意图, 则基于所述目标语义意图执行对应的语 义执行操作; 如果目标语义意图属于不可执行语义意图, 则对所述目标语义意图进行缓存, 以作为 相对下次识别到的第二语音内容的历史语义 意图。权 利 要 求 书 2/2 页 3 CN 114662500 A 3
专利 一种人机交互方法、装置及电子设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:44:23
上传分享
举报
下载
原文档
(525.4 KB)
分享
友情链接
GB-T 37138-2018 电力信息系统安全等级保护实施指南.pdf
DB37-T 4221.9-2020 政务信息资源 数据集 人口 第9部分 生育保险信息.pdf
LY-T 1738-2020 实木复合地板用胶合板.pdf
T-ACEF 110—2023 公民绿色低碳行为温室气体减排量化指南 行:机动车停驶.pdf
DB-T 39-2010 地震台网设计技术要求 重力观测网.pdf
GB-T 37401-2019 电子商务平台服务保障技术要求.pdf
T-HJAITISA 02—2020 重熔用精铝锭.pdf
GB-T 42688-2023 船舶有毒液体物质残余物排放处理要求.pdf
GB-T 32064-2015 建筑用材料导热系数和热扩散系数瞬态平面热源测试法.pdf
中国移动 量子“Q波”技术白皮书 2022 .pdf
DB52-T 1239.2-2017 政府数据 核心元数据 第2部分:法人单位基础数据 贵州省.pdf
GB-T 23020-2013工业企业信息化和工业化融合评估规范.pdf
GB-T 14049-2008 额定电压10kV架空绝缘电缆.pdf
GB-T 16251-2023 工作系统设计的人类工效学原则.pdf
GM-T 0082-2020 可信密码模块保护轮廓.pdf
T-SDWL 0002—2023 智慧物流园区停车系统功能要求.pdf
绿盟 软件供应链安全技术白皮书.pdf
GB-T 13298-2015 金属显微组织检验方法.pdf
GB-T 39717-2020 水处理用陶瓷膜板.pdf
DB6110-T 008-2021 天麻萌发菌、蜜环菌菌种生产技术规程 商洛市.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(525.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。