(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210447421.3
(22)申请日 2022.04.26
(71)申请人 心行者科技 (杭州) 有限责任公司
地址 311215 浙江省杭州市萧 山区经济技
术开发区启迪路198号B座3F- 003室
(72)发明人 丹尼尔·吴 安德鲁·吴
(74)专利代理 机构 杭州运酬专利代理事务所
(特殊普通 合伙) 33429
专利代理师 李百玲
(51)Int.Cl.
G10L 15/26(2006.01)
H04R 1/10(2006.01)
G06F 40/30(2020.01)
G06F 40/205(2020.01)
G06F 40/253(2020.01)
(54)发明名称
一种基于智能耳机的交 互方法
(57)摘要
一种基于智能耳机的交互方法, 所述方法包
括以下步骤: 步骤1)、 用户使用唤醒词句或者某
种无线装置激活智能耳机, 主要通过自然的语言
去激活智能耳机; 所述的唤醒词句包括非通用的
唤醒词句和通用的唤醒词句; 步骤2)、 智能耳机
被激活后, 识别唤醒词句, 推测用户意图, 并通过
用户说的词句查询并返回相关信息; 步骤3)、 智
能耳机的声音控制和播放模块根据不同的用户
意图确定信息播放方式和速度。 本发 明提供了一
种基于智能耳机的交互方法, 使用非通用的唤醒
词句或者某种无线装置, 减少用户在有听众情景
下的尴尬, 形成自然的语言流, 针对不同的用户
意图改变智能耳机的播 放方式和速度。
权利要求书4页 说明书11页 附图1页
CN 114822551 A
2022.07.29
CN 114822551 A
1.一种基于智能耳机的交 互方法, 其特 征在于: 所述方法包括以下步骤:
步骤1)、 用户使用唤醒词句 或者某种无线装置激活智能耳机, 主要通过自然的语言去
激活智能耳机; 所述的唤醒词句包括非通用的唤醒词句和 通用的唤醒词句; 所述自然的语
言是指用户在有听众的情况下通过非通用的唤醒词句来激活智能耳机, 避免用户在有听众
情况下使用通用唤醒词而形成尴尬;
步骤2)、 智能耳机被激活后, 识别唤醒词句, 推测用户意图, 并通过用户说的词句查询
并返回相关信息;
步骤2.1)、 当智能耳机被激活后, 通过智能耳机的语音激活和识别模块识别这些唤醒
词句, 并且记录唤醒方式, 即通过语音激活还是通过某种无线设备激活, 同时智能耳机的声
音控制和播放模块将反馈声音或者反馈语音播放给用户, 提示用户智能耳机已经收到用户
的唤醒词句并等待用户输入词句;
步骤2.2)、 用户说出含有关键词的词句;
步骤2.3)、 语音激活和识别模块识别用户的词句, 并提取用户所说的词句中的关键词;
步骤2.4)、 智能耳机的用户意图推测和信息库服务交互模块根据步骤2.3)获得的关键
词查找相关的信息库内容, 包括已有的信息库或者用户自建的信息库,同时播放反馈声音
或反馈语音; 如果能够查询到, 则 返回查询到的内容和激活的信息库; 如果没有查到, 则 反
馈用户未查询到该信息的反馈; 智能耳机的用户意图推测和信息库服务交互模块会根据用
户的关键词来激活并查询 相关的信息库, 并返回查询内容和被激活的信息库的名称;
步骤2.5)、 该步骤和步骤2.4)同时进行, 智能耳机的用户意图推测和信息库服务交互
模块根据用户的唤醒智能耳机的方式和唤醒词句, 来推测用户的意图;
步骤3)、 智能耳机的声音控制和播放模块根据不同的用户意图和被激活的信 息库确定
信息播放方式和速度。
2.如权利要求1所述的一种基于智能耳机的交互方法, 其特征在于: 所述非通用的唤醒
词句包括以下五类:
第1类: 用户用第一人称说的需要 思考或者回忆的词句;
第2类: 用户用第一人称说的自己可能知道的词句;
第3类: 用户询问他人的词句;
第4类: 用户用第一人称说自己将要开始说话或者想告诉他人的词句;
第5类: 用户自定义唤醒词句。
3.如权利要求2所述的一种基于智能耳机的交互方法, 其特征在于: 所述步骤2.5)中还
包括以下步骤: 所述用户的意图包括以下两种:
意图1: 如果用户说出非通用唤醒词句或者按动某种无线装置, 则推测用户的意图是要
提取已有的或者自建的信息库的内容来讲给听众听或者给听众唱歌; 用户意图推测和信息
库服务交互模块将把该意图发送给声 音控制和播 放模块;
意图2: 如果用户说出的是通用的唤醒词句, 则推测用户的意图是用户自己查询信 息给
自己听; 用户意图推测 和信息库服 务交互模块将把该意图发送给声 音控制和播 放模块。
4.如权利要求3所述的一种基于智能耳机的交互方法, 其特征在于: 所述步骤3)中还包
括以下步骤: 根据步骤2.5)的结果, 如果是意图1: 用户是要说或者唱给听众, 则进入步骤
3.1); 如果是意图2, 则进入步骤3.4);权 利 要 求 书 1/4 页
2
CN 114822551 A
2步骤3.1)、 通过步骤2.4)用户的关键词来判断被激活的信息库是歌曲库还是非歌曲
库; 如果是非歌曲库被激活, 进入步骤3.2); 如果是歌曲库被激活, 则进入步骤3.3);
步骤3.2)如果是非歌曲库激活, 则根据步骤2.4)返回的查询到的内容, 智能耳机的声
音控制和播 放模块将按照以下步骤进行处 理:
第1步, 根据文本中标点符号作为切分小句的标记, 将段落和句子切分成多个小句;
第2步, 检查每个小句的长度, 如果某一个小句的长度超过单个小句最长字数限制参数
X, 那么就分析该句子的语法结构并自动将该小句切分成多个小句子, 并保证切分后的小句
子满足以下要求: 1)主谓宾尽量完整; 2)代词、 名词、 动词、 形容词、 副词、 词组不被切开; 3)
总字数小于最长 字数限制参数 X;
第3步, 播放每小句话后有意停顿N秒, 其中N=该句话的字数 ×C; 其中参数C为单个小
句播放后有意停顿的时间参数, 单位是字/秒, 用户第一次使用智能耳机的时候, 该参数C有
一个缺省值, 用户也可以通过自然的语言或者智能耳机的用户自定义和输入模块修改该参
数的值。
步骤3.3)、 如果是歌曲库被激活, 通过步骤2.4)获得的用户词句的和歌曲库中查询的
结果, 分为两种情况:
情况1: 如果能够查询到该歌曲的音频, 则播 放音频;
情况2: 如果只能查询到该歌曲的歌词: 情况2A)若智能耳机的语音激活和识别模块可
以准确识别用户当前 的歌唱进度, 则声音控制和播放模块将提前M秒向用户播放该首歌的
下一句歌词, M为播放歌词的提前时间, 单位是秒, 智能耳机出厂时有缺省值, 用户可以通过
智能耳机的用户自定义和输入模块进行调整; 情况2B)若智能耳机无法识别用户的歌唱进
度或者识别错 误较高, 则根据该歌曲的歌词播 放表含每句歌词的播 放时间来 播放歌词;
步骤3.4): 如果用户的唤醒词句是本智能耳机的名称, 即通用的唤醒词, 则推测用户的
意图是用户自己查询信息给自己听; 智能耳机将用正常速度播放这些声音: 如果是非歌曲
库被激活, 单个小句播放后有意停顿的时间参数C为0; 如果是播放歌曲库中的歌词, 则M=
0。
5.如权利要求4所述的一种基于智能耳机的交互方法, 其特征在于: 所述交互方法还包
括以下步骤: 步骤4)、 用户通过关键词对智能耳机的播 放进行控制:
用户可以通过以下的比较自然的语音交 互方式来控制智能耳机的播 放;
情况1: 如果对用户对智能耳机播放的内容不满意, 想更换内容或者进入下一个信 息或
者下一首歌曲:
步骤4.1.1): 用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线
装置, 重新激活智能耳机;
步骤4.1.2): 用户嘴巴说含有需要信息库的关键词,或者说出 换一个的意思的同义词;
步骤4.1.3): 语音激活和识别模块获得这些词句的关键词后, 智能耳机将重复上面的
步骤2)和步骤3);
情况2: 如果对用户觉得智能耳机播放的各句子之间停顿时间过短, 即智能耳机的播放
速度过快:
步骤4.2.1): 用户可以使用第1类至第5类中的任意一类非通用的激活词或者某种无线
装置, 重新激活智能耳机; ;权 利 要 求 书 2/4 页
3
CN 114822551 A
3
专利 一种基于智能耳机的交互方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:45:31上传分享