专利语音消息交互方法、装置、设备及存储介质 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210227932.4 (22)申请日 2022.03.07 (71)申请人深圳创维-RGB电子有限公司地址 518057 广东省深圳市南山区粤海街道深南大道南创维大厦A座13-16楼 (仅限办公) (72)发明人段洁斐　 (74)专利代理机构深圳市世纪恒程知识产权代理事务所 4 4287 专利代理师黄廷山 (51)Int.Cl. H04N 21/44(2011.01) H04N 21/4415(2011.01) H04N 21/466(2011.01) H04N 21/488(2011.01)G10L 15/26(2006.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称语音消息交互方法、装置、设备及存储介质 (57)摘要本发明公开了一种语音消息交互方法、装置、设备及存储介质，该方法包括：获取正在播放的视频文件，解析所述视频文件的视频文件信息；采集用户语音信息，将所述用户语音信息转化为初始文本信息；基于所述视频文件信息和所述初始文本信息，获取用户语音意图；若所述用户语音意图为交互意图，则将所述初始文本信息转换为目标文本信息，并显示所述目标文本信息。本发明实现了在电视观影过程中，简化弹幕发送流程的技术效果。权利要求书2页说明书9页附图3页 CN 114598922 A 2022.06.07 CN 114598922 A 1.一种语音消息交互方法，其特征在于，所述语音消息交互方法应用于电视设备，所述语音消息交互方法包括以下步骤：获取正在播放的视频文件，解析所述视频文件的视频文件信息；采集用户语音信息，将所述用户语音信息转化为初始文本信息；基于所述视频文件信息和所述初始文本信息获取用户语音意图；若所述用户语音意图为交互意图，则将所述初始文本信息转换为目标文本信息，并显示所述目标文本信息。 2.如权利要求1所述的语音消息交互方法，其特征在于，在所述获取正在播放的视频文件的步骤之前，还包括：检测到开始播放视频后，识别正在播放的视频的信号源；根据所述信号源的信号类型，判断所述视频是否支持消息交互；若判断到是，则执行所述获取正在播放的视频文件，解析所述视频文件的视频文件信息的步骤。 3.如权利要求1所述的语音消息交互方法，其特征在于，所述采集用户语音信息，将所述用户语音信息转化为初始文本信息的步骤包括：采集所述电视设备所处远场范围内的混合音频信息；提取出所述混合音频信息中的用户语音信息，并将所述用户语音信息转化为初始文本信息。 4.如权利要求1所述的语音消息交互方法，其特征在于，在所述基于所述视频文件信息和所述初始文本信息获取用户语音意图的步骤之前，还包括：将所述视频文件信息发送至预设的服务器作为所述服务器中初始意图预测模型的训练集，以建立训练后的目标意图预测模型。 5.如权利要求4所述的语音消息交互方法，其特征在于，所述基于所述视频文件信息和所述初始文本信息获取用户语音意图的步骤包括：提取所述初始文本信息中的关键文本信息；将所述关键文本信息发送至所述服务器，以供所述服务器通过所述目标意图预测模型预测得到预测结果并返回；根据所述预测结果确定用户语音意图。 6.如权利要求5所述的语音消息交互方法，其特征在于，在所述根据所述预测结果确定用户语音意图的步骤之后，还包括：若识别到所述初始文本信息中，相同文本内容连续出现的次数超过预设次数，则显示交互常用语设置页面；基于所述交互常用语设置页面，接收设置指令，将所述相同文本内容设置为交互常用语，以作为所述关键文本信息的提取依据之一。 7.如权利要求1 ‑6任一项所述的语音消息交互方法，其特征在于，所述若所述用户语音意图为交互意图，则将所述初始文本信息转换为目标文本信息，并显示所述目标文本信息的步骤包括：判断所述用户语音意图为交互意图后，获取所述初始文本信息，识别所述初始文本信息中是否包含预设的敏感词；权　利　要　求　书 1/2 页 2 CN 114598922 A 2若所述用户文本信息中不包含预设的敏感词，则将所述初始文本信息作为目标文本信息，并显示所述目标文本信息；若所述用户文本信息中包含预设的敏感词，则对所述初始文本信息进行过滤，将过滤后的初始文本信息作为目标文本信息，并显示所述目标文本信息。 8.一种语音消息交互装置，其特征在于，所述语音消息交互装置包括：视频文件解析模块，用于获取正在播放的视频文件，解析所述视频文件的视频文件信息；语音识别解析模块，用于采集用户语音信息，将所述用户语音信息转化为初始文本信息；用户意图获取模块，用于基于所述视频文件信息和所述初始文本信息，获取用户语音意图；文本信息显示模块，用于若所述用户语音意图为交互意图，则将所述初始文本信息转换为目标文本信息，并显示所述目标文本信息。 9.一种电子设备，其特征在于，所述电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音消息交互程序，所述语音消息交互程序配置为实现如权利要求1至7中任一项所述的语音消息交互方法的步骤。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有语音消息交互程序，所述语音消息交互程序被处理器执行时实现如权利要求 1至7任一项所述的语音消息交互方法的步骤。权　利　要　求　书 2/2 页 3 CN 114598922 A 3

专利 语音消息交互方法、装置、设备及存储介质

专利语音消息交互方法、装置、设备及存储介质