专利人机交互方法、智能机器人和存储介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210375013.1 (22)申请日 2022.04.11 (71)申请人阿里巴巴（中国）有限公司地址 310052 浙江省杭州市滨江区长河街道网商路69 9号4号楼5楼5 08室 (72)发明人林廷恩　武玉川　李永彬　孙健　 (74)专利代理机构北京太合九思知识产权代理有限公司 1 1610 专利代理师孙明子　刘戈 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/211(2020.01) G06K 9/62(2022.01) G06F 16/33(2019.01) G06F 16/332(2019.01)G06F 16/35(2019.01) (54)发明名称人机交互方法、智能机器人和存储介质 (57)摘要本发明实施例提供一种人机交互方法、智能机器人和存储介质，该方法包括：获取用户产生的第一语音信号以及此第一语音信号对应的第一文本信息。然后，根据第一语音信号和第一文本信息各自的特征向量，得到融合特征向量。根据此融合特征向量确定反映第一语音信号的语义是否完整的分类结果，并根据分类结果对第一语音信号进行响应。其中，第一语音信号的特征向量反映用户的说话状态；第一文本信息的特征向量用户的语义，则融合特征向量中会同时包含上述的说话状态和语义，因此，能够提高识别语义是否完整的准确性，也即是提高智能机器人的断句准确性，降低出现由于断句错误而导致第一语音信号响应失败的情况，保证人机交互的流畅性。权利要求书2页说明书12页附图4页 CN 114936560 A 2022.08.23 CN 114936560 A 1.一种人机交互方法，其特征在于，应用于智能机器人，包括：获取用户产生的第一语音信号和所述第一语音信号对应的第一文本信息；根据所述第一语音信号和所述第一文本信息各自特征向量，确定融合特征向量；根据所述融合特征向量，确定反映所述第一语音信号是否语义完整的分类结果；根据所述分类结果响应所述第一语音信号。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述智能机器人产生的第二语音信号对应的第二文本信息，所述第二语音信号在所述第一语音信号之前产生；所述根据所述第一语音信号和所述第一文本信息各自特征向量，确定融合特征向量，包括：根据所述第一文本信息和所述第二文本信息各自的特征向量，确定融合文本特征向量；根据所述融合文本特征向量和所述第一语音信号的特征向量，确定所述融合特征向量。 3.根据权利要求2所述的方法，其特征在于，所述根据所述第一文本信息和所述第二文本信息各自的特征向量，确定融合文本特征向量之后，所述方法还包括：根据所述融合文本特征向量，调整所述第一语音信号的特征向量的信息量，以得到第一调整结果；根据所述第一语音信号的特征向量，调整所述融合文本特征向量的信息量，以得到第二调整结果；所述根据融合文本特征向量和所述第一语音信号的特征向量，确定所述融合特征向量，包括：根据所述第一调整结果和所述第二调整结果，确定所述融合特征向量。 4.根据权利要求1所述的方法，其特征在于所述根据所述第一语音信号和所述第一文本信息各自特征向量，确定融合特征向量，包括：根据所述第一文本信息的特征向量，调整所述对所述第一语音信号的特征向量的信息量，以得到第三调整结果；根据所述第一语音信号的特征向量，调整所述第一文本信息的特征向量的信息量，以得到第四调整结果；根据所述第三调整结果和所述第四调整结果，确定所述融合特征向量。 5.根据权利要求1所述的方法，其特征在于，所述根据所述分类结果响应所述第一语音信号，包括：若所述分类结果为语义完整，则对所述第一语音信号进行语义识别；根据识别结果，输出所述第一语音信号对应的应答成功语音信号。 6.根据权利要求1所述的方法，其特征在于，所述根据所述分类结果响应所述第一语音信号，包括：若分类结果为语义不完整，则根据所述用户是否在预设时长内产生第三语音信号，确定所述第一语音信号的响应结果。 7.根据权利要求6所述的方法，其特征在于，所述根据所述用户是否在预设时长内产生权　利　要　求　书 1/2 页 2 CN 114936560 A 2第三语音信号，确定所述第一语音信号的响应结果，包括：若所述用户未在所述预设时长内产生所述第三语音信号，则输出所述第一语音信号对应的应答失败语音信号。 8.根据权利要求6所述的方法，其特征在于，所述根据所述用户是否在预设时长内产生第三语音信号，确定所述第一语音信号的响应结果，包括：若所述用户在所述预设时长内产生所述第三语音信号，则拼接所述第一语音信号和所述第三语音信号，以得到拼接语音信号；若所述拼接语音信号的分类结果为语义完整，则对所述拼接语音信号进行语义识别；根据识别结果，输出所述第一语音信号对应的应答成功语音信号。 9.根据权利要求1所述的方法，其特征在于，所述方法还包括：若所述第一文本信息中预设位置的词语为预设词语，确定所述分类结果为语义不完整。 10.一种智能机器人，其特征在于，包括：存储器、处理器；其中，所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1至9中任一项所述的人机交互方法。 11.一种非暂时性机器可读存储介质，其特征在于，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1至9中任一项所述的人机交互方法。权　利　要　求　书 2/2 页 3 CN 114936560 A 3

专利 人机交互方法、智能机器人和存储介质

专利人机交互方法、智能机器人和存储介质