(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210375013.1 (22)申请日 2022.04.11 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310052 浙江省杭州市滨江区长河街 道网商路69 9号4号楼5楼5 08室 (72)发明人 林廷恩 武玉川 李永彬 孙健  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 专利代理师 孙明子 刘戈 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/211(2020.01) G06K 9/62(2022.01) G06F 16/33(2019.01) G06F 16/332(2019.01)G06F 16/35(2019.01) (54)发明名称 人机交互方法、 智能机 器人和存 储介质 (57)摘要 本发明实施例提供一种人机交互方法、 智能 机器人和存储介质, 该方法包括: 获取用户产生 的第一语音信号 以及此第一语音信号对应的第 一文本信息。 然后, 根据第一语音信号和第一文 本信息各自的特征向量, 得到融合特征向量。 根 据此融合特征向量确定反映第一语音信号的语 义是否完整的分类结果, 并根据分类结果对第一 语音信号进行响应。 其中, 第一语音信号的特征 向量反映用户的说话状态; 第一文本信息的特征 向量用户的语义, 则融合特征向量中会同时包含 上述的说话状态和语义, 因此, 能够提高识别语 义是否完整的准确性, 也即是提高智能机器人的 断句准确性, 降低出现由于断句错误而导致第一 语音信号响应失败的情况, 保证人机交互的流畅 性。 权利要求书2页 说明书12页 附图4页 CN 114936560 A 2022.08.23 CN 114936560 A 1.一种人机交 互方法, 其特 征在于, 应用于智能机器人, 包括: 获取用户产生的第一语音信号和所述第一语音信号对应的第一文本信息; 根据所述第一语音信号和所述第一文本信息各自特 征向量, 确定融合特 征向量; 根据所述融合特 征向量, 确定反映所述第一语音信号是否语义完整的分类结果; 根据所述分类结果响应所述第一语音信号。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取所述智能机器人产生的第 二语音信号对应的第 二文本信 息, 所述第 二语音信号在 所述第一语音信号之前产生; 所述根据所述第一语音信号和所述第一文本信息各自特征向量, 确定融合特征向量, 包括: 根据所述第一文本信息和所述第二文本信息各自的特征向量, 确定融合文本特征向 量; 根据所述融合文本特征向量和所述第一语音信号的特征向量, 确定所述融合特征向 量。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述第 一文本信 息和所述第 二文 本信息各自的特 征向量, 确定融合文本特 征向量之后, 所述方法还 包括: 根据所述融合文本特征向量, 调整所述第一语音信号的特征向量的信息量, 以得到第 一调整结果; 根据所述第一语音信号的特征向量, 调整所述融合文本特征向量的信息量, 以得到第 二调整结果; 所述根据融合文本特征向量和所述第一语音信号的特征向量, 确定所述融合特征向 量, 包括: 根据所述第一调整结果和所述第二调整结果, 确定所述融合特 征向量。 4.根据权利要求1所述的方法, 其特征在于所述根据所述第一语音信号和所述第一文 本信息各自特 征向量, 确定融合特 征向量, 包括: 根据所述第 一文本信 息的特征向量, 调 整所述对所述第 一语音信号的特征向量的信 息 量, 以得到第三调整结果; 根据所述第一语音信号的特征向量, 调整所述第一文本信息的特征向量的信息量, 以 得到第四调整结果; 根据所述第三调整结果和所述第四调整结果, 确定所述融合特 征向量。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述分类结果响应所述第 一语音 信号, 包括: 若所述分类结果 为语义完整, 则对所述第一语音信号进行语义识别; 根据识别结果, 输出 所述第一语音信号对应的应答成功语音信号。 6.根据权利要求1所述的方法, 其特征在于, 所述根据所述分类结果响应所述第 一语音 信号, 包括: 若分类结果为语义不完整, 则根据所述用户是否在预设时长内产生第三语音信号, 确 定所述第一语音信号的响应结果。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述用户是否在预设时长内产生权 利 要 求 书 1/2 页 2 CN 114936560 A 2第三语音信号, 确定所述第一语音信号的响应结果, 包括: 若所述用户未在所述预设时长内产生所述第 三语音信号, 则 输出所述第 一语音信号对 应的应答失败语音信号。 8.根据权利要求6所述的方法, 其特征在于, 所述根据所述用户是否在预设时长内产生 第三语音信号, 确定所述第一语音信号的响应结果, 包括: 若所述用户在所述预设时长 内产生所述第 三语音信号, 则拼接所述第 一语音信号和所 述第三语音信号, 以得到拼接语音信号; 若所述拼接语音信号的分类结果 为语义完整, 则对所述 拼接语音信号进行语义识别; 根据识别结果, 输出 所述第一语音信号对应的应答成功语音信号。 9.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 若所述第一文本信息中预设位置的词语为预设词语, 确定所述分类结果为语义不完 整。 10.一种智能机器人, 其特征在于, 包括: 存储器、 处理器; 其中, 所述存储器上存储有可 执行代码, 当所述可执行代码被所述处理器执行时, 使所述处理器执行如权利要求1至9中 任一项所述的人机交 互方法。 11.一种非暂时性机器可读存储介质, 其特征在于, 所述非暂时性机器可读存储介质上 存储有可执行代码, 当所述可执行代码被电子设备 的处理器执行时, 使所述处理器执行如 权利要求1至9中任一项所述的人机交 互方法。权 利 要 求 书 2/2 页 3 CN 114936560 A 3

.PDF文档 专利 人机交互方法、智能机器人和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 人机交互方法、智能机器人和存储介质 第 1 页 专利 人机交互方法、智能机器人和存储介质 第 2 页 专利 人机交互方法、智能机器人和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:48:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。