国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210470807.6 (22)申请日 2022.04.28 (71)申请人 广州市百果园信息技 术有限公司 地址 511451 广东省广州市番禺区市桥 街 兴泰路274 号C栋西塔5-13层 (72)发明人 李益永 温偲 陈建强 陈德健 项伟 (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06F 40/216(2020.01) G06F 40/30(2020.01) G10L 15/26(2006.01) G10L 25/51(2013.01) (54)发明名称 语音房质量评估 方法及其装置、 设备、 介质、 产品 (57)摘要 本申请涉及即时通信技术领域中一种语音 房质量评估方法及其装置、 设备、 介质、 产品, 所 述方法包括: 获取单位时间段内语音房中的语音 流, 从所述语音流中识别出说话文本; 构造所述 说话文本的编码向量, 该编码向量包含所述语音 流的音源对象数量统计特征、 发言总次数统计特 征、 所述说话文本中有效名词数量的统计特征; 根据所述编码向量确定所述语音房的质量类别。 本申请能够准确判别语音房所产生的语音流的 质量类别, 能够提升为平台用户推荐语音房的准 确度, 有助于活跃平台用户流量, 提升平台用户 驻存率。 权利要求书2页 说明书15页 附图8页 CN 114841143 A 2022.08.02 CN 114841143 A 1.一种语音房质量评估方法, 其特 征在于, 包括如下步骤: 获取单位时间段内语音房中的语音流, 从所述语音流中识别出说话文本; 构造所述说话文本的编码向量, 该编码向量包含所述语音流的音源对象数量统计特 征、 发言总次数统计特 征、 所述说话文本中有效名词数量的统计特 征; 根据所述编码向量确定所述语音房的质量类别。 2.根据权利要求1所述的语音房质量评估方法, 其特征在于, 所述构造所述说话文本的 编码向量, 包括如下步骤: 获取所述单位时间段的语音流中的音源 对象数量构成相应的统计特 征; 获取所述单位时间段的语音流中的发言总次数构成相应的统计特 征; 根据多个预设维度统计所述说话文本中的有效名词的数量构成相应的统计特 征; 按预设顺序将所述各个统计特 征构造为编码向量。 3.根据权利要求2所述的语音房质量评估方法, 其特征在于, 所述根据多个预设维度获 取所述说话文本中的名词的数量构成相应的统计特 征, 包括如下步骤: 提取所述说话文本中的名词, 获得名词集; 根据预设的停用词表过 滤所述名词集以获得有效名词集; 根据预设的不同维度相应提供的匹配规则, 确定每种匹配规则下有 效名词集命中预设 的基础名词表的名词命中数量, 作为相应维度的统计特 征。 4.根据权利要求3所述的语音房质量评估方法, 其特征在于, 所述提取所述说话文本中 的名词, 包括如下步骤: 对所述说话文本进行分词, 获得分词集; 将分词集中的分词编码为嵌入向量; 对所述嵌入向量提取深层语义信息, 根据深层语义信息进行词性识别, 确定各个分词 相对应的词性; 抽取其中词性 为名词的分词构造为所述名词集。 5.根据权利要求3所述的语音房质量评估方法, 其特征在于, 所述根据 预设的不同维度 相应提供的匹配规则, 确定每种匹配规则下有效名词集命中预设的基础名词表的名词命中 数量, 作为相应维度的统计特 征, 包括如下步骤: 根据精准匹配规则, 统计有效名词集中有效名词精准命中所述基础名词表中的基础名 词相对应的名词命中数量, 作为综合维度的统计特 征; 根据所述基础名词表中基础名词的预设分类, 细分统计所述精准匹配规则下, 精准命 中各个预设 分类相对应的名词命中数量, 作为各个预设 分类维度相对应的统计特 征; 根据模糊匹配规则, 统计有效名词集中有效名词未精准命中、 而模糊命中所述基础名 词表中的基础名词的名词命中数量, 作为相似维度的统计特 征。 6.根据权利要求5所述的语音房质量评估方法, 其特征在于, 所述根据模糊匹配规则, 统计有效名词集中有效名词未精准命中、 而模糊命中所述基础名词表中的基础名词的名词 命中数量, 作为相似维度的统计特 征, 包括如下步骤: 获取所述有效名词集中未精准命中所述基础名词表的有效名词构成冗余子集; 计算所述冗余子集内每个有效名词的向量与所述基础名词表中的每个基础名词的向 量两两之间的语义相似度;权 利 要 求 书 1/2 页 2 CN 114841143 A 2对存在最高语义相似度超过预设阈值的有效名词进行计数, 统计出模糊命中所述基础 名词表的名词命中数量。 7.根据权利要求1至6中任意一项所述的语音房质量评估方法, 其特征在于, 所述根据 所述编码向量确定所述语音房的质量类别的步骤之后, 包括如下步骤: 响应终端设备提交 的语音房推荐请求, 根据 预设推荐算法确定多个候选语音房及其相 应的基础推荐评分; 根据每个候选语音房相对应确定的所述质量类别的预设权重, 调整相应的基础推荐评 分而获得推荐 展示评分; 根据推荐 展示评分对各个候选语音房进行倒排序, 获得语音房推荐列表; 应答语音房推荐请求, 将所述语音房推荐列表推送至所述终端设备显示。 8.一种语音房质量评估 装置, 其特 征在于, 包括: 语音识别模块, 用于获取单位时间段内语音房中的语音流, 从所述语音流中识别出说 话文本; 文本编码模块, 用于构造所述说话文本的编码向量, 该编码向量包含所述语音流的音 源对象数量统计特 征、 发言总次数统计特 征、 所述说话文本中有效名词数量的统计特 征; 质量识别模块, 用于根据所述编码向量确定所述语音房的质量类别。 9.一种语音房识别设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于 调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方 法的步骤。 10.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至7中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行 时, 执行相应的方法所包括的步骤。 11.一种计算机程序产品, 其特征在于, 包括计算机程序/指令, 该计算机程序/指令被 处理器执行时实现权利要求1至7中任意 一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114841143 A 3
专利 语音房质量评估方法及其装置、设备、介质、产品
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:52:35
上传分享
举报
下载
原文档
(1.2 MB)
分享
友情链接
GB-T 40429-2021 汽车驾驶自动化分级.pdf
T-CHIDA 203.3—2021 内河湖库环保疏浚污染土分类分级标准.pdf
民航 MH-T 6123.4-2023 行李处理系统 第4部分:托盘式分拣机.pdf
GB-T 3198-2020 铝及铝合金箔.pdf
T-IMCPNT 001—2024 中国马奶之乡特色产业示范旗建设与管理指南.pdf
GB-T 39256-2020 绿色制造 制造企业绿色供应链管理 信息化管理平台规范.pdf
T-GHDQ 88.2—2022 车辆无线通信信息安全测试规范 第2部分:车载WLAN安全测试规范.pdf
GB-T 32064-2015 建筑用材料导热系数和热扩散系数瞬态平面热源测试法.pdf
中山市市容和环境卫生管理条例.pdf
T-GDAEPI 17—2023 有色金属矿区地下水污染调查技术规范.pdf
JR-T0213-2021 金融网络安全 Web 应用服务安全测试通用 规范.pdf
GB-T 41013-2021 电机系统能效评价.pdf
GB-T 21709.20-2009 针灸技术操作规范 第20部分:毫针基本刺法.pdf
GB-T 30276-2020 信息安全技术 网络安全漏洞管理规范.pdf
GB-T 20507-2018 球形氢氧化镍.pdf
信息安全技术 重要数据识别规则.pdf
TB-T 3504-2018 列车接近预警地面设备.pdf
GB-T 15007-2017 耐蚀合金牌号.pdf
DB31-T 862-2021 “一网通办”政务服务中心建设和运行规范 上海市.pdf
T-ACEF 071—2023 燃煤电厂耦合处理城镇污水处理厂污泥污染物控制要求.pdf
1
/
3
26
评价文档
赞助2.5元 点击下载(1.2 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。