国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210861312.6 (22)申请日 2022.07.20 (71)申请人 聚好看科技股份有限公司 地址 266100 山东省青岛市崂山区松岭路 399号 (72)发明人 刘帅 朱新升 杨智远 吴连朋 (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 任嘉文 (51)Int.Cl. G06K 9/62(2022.01) G06V 10/80(2022.01) G06V 40/16(2022.01) G10L 25/63(2013.01) (54)发明名称 基于情绪识别的模型驱动方法及设备 (57)摘要 本申请涉及三 维重建技术领域, 提供一种基 于情绪识别的模 型驱动方法及设备, 对获取的目 标对象的人脸图像和语音数据进行了完整性判 断, 当人脸图像和语音数据只有一个数据完整 时, 基于完整的人脸图像或语音数据进行情绪识 别, 从而解决由于面部遮挡或语音数据传输失 败, 导致的面部情绪识别准确率较低或者无法识 别出面部情绪的问题; 当人脸图像和语音数据两 个均完整时, 基于完整的人脸图像和语音数据进 行情绪识别, 提高情绪识别的准确性, 进而用 情 绪识别得到的情绪参数优化参数化头部模型的 初始驱动参数, 从而将面部情绪引入目标驱动参 数中, 使得基于目标驱动参数进行参数化头部模 型的重建和驱动时, 能够提高模 型的真实感和重 建精度。 权利要求书2页 说明书12页 附图6页 CN 115049016 A 2022.09.13 CN 115049016 A 1.一种基于情绪识别的模型驱动方法, 其特 征在于, 包括: 获取目标对象的人脸图像和语音数据; 分别确定所述人脸图像和所述语音数据是否 完整; 若所述人脸图像不完整, 但所述语音数据完整, 则对所述语音数据进行情绪识别, 得到 情绪参数; 若所述人脸图像完整, 但所述语音数据不完整, 则对所述人脸图像进行情绪识别, 得到 情绪参数; 若所述人脸图像完整, 且所述语音数据完整, 则分别对所述人脸图像和所述语音数据 进行情绪识别, 得到融合后的情绪 参数; 根据情绪参数调整预先构建的所述目标对象对应的参数化头部模型的初始驱动 参数, 得到目标驱动参数; 将所述目标驱动参数传输给渲染终端, 以使所述渲染终端根据所述目标驱动参数, 驱 动所述参数化头 部模型。 2.如权利要求1所述的方法, 其特 征在于, 通过以下 方式确定所述人脸图像是否 完整: 从所述人脸图像中提取 人脸特征点; 若所述人脸特 征点的数量大于预设数量阈值, 则确定所述人脸图像完整; 若所述人脸特 征点的数量小于等于所述预设数量阈值, 则确定所述人脸图像不完整。 3.如权利要求1所述的方法, 其特 征在于, 通过以下 方式确定所述语音数据是否 完整: 确定所述语音数据的时长; 若所述时长大于设定时长阈值, 则确定所述语音数据完整; 若所述时长小于等于所述设定时长阈值, 则确定所述语音数据不完整。 4.如权利要求1所述的方法, 其特征在于, 分别对所述人脸图像和所述语音数据进行情 绪识别, 得到融合后的情绪 参数, 包括: 从所述人脸图像中提取第一子情绪参数, 以及从所述语音数据中提取第二子情绪参 数; 按照预设权重, 对所述第一子情绪参数和所述第二子情绪参数进行加权, 得到融合后 的情绪参数。 5.如权利要求4所述的方法, 其特征在于, 所述从所述人脸图像中提取第一子情绪参 数, 以及从所述语音数据中提取第二子情绪 参数, 包括: 从所述人脸图像中提取图像特 征, 并根据所述图像特 征进行情绪分类; 根据所述人脸图像对应的各类情绪的特 征向量, 生成第一子情绪 参数; 从所述语音数据中提取声 音特征, 并根据所述声 音特征进行情绪分类; 根据所述语音数据对应的各类情绪的特 征向量, 生成第二子情绪 参数。 6.如权利要求1所述的方法, 其特 征在于, 得到所述目标驱动参数后, 所述方法还 包括: 对所述人脸图像进行语义分割, 得到 头部的各个组件; 从所述目标驱动参数中, 选择 出与各个组件分别关联的局部驱动参数; 所述将所述目标驱动参数传输给渲染终端, 以使所述渲染终端根据所述目标驱动参 数, 驱动所述 参数化头 部模型, 包括: 将所述各个组件分别关联的局部驱动 参数传输给渲染终端, 以使所述渲染终端根据 所权 利 要 求 书 1/2 页 2 CN 115049016 A 2述各局部驱动参数, 分别驱动所述目标对象对应的参数化头 部模型中的相应组件。 7.如权利要求1所述的方法, 其特征在于, 当所述人脸图像为深度图像时, 所述方法还 包括: 从所述深度图像中提取所述目标对象头部的几何数据, 并将所述几何数据传输给所述 渲染终端, 以使所述 渲染终端根据所述几何数据校正所述 参数化头 部模型。 8.如权利要求1 ‑7中任一项所述的方法, 其特征在于, 所述目标驱动参数包括目标姿态 参数和目标表情参数。 9.一种重建设备, 其特征在于, 包括相机、 麦克风, 图形工作站, 所述图形工作站包括处 理器、 存储器和通信接口, 所述 通信接口、 所述存 储器和所述处 理器通过总线连接; 所述存储器包括数据存储单元和程序存储单元, 所述程序存储单元存储有计算机程 序, 所述处 理器根据所述计算机程序, 执 行以下操作: 通过所述通信接口, 获取所述相机采集的目标对象的人脸图像, 以及所述麦克风采集 的所述目标对象的语音数据, 并将获取的人脸图像和语音数据存 储至所述数据存 储单元; 分别确定所述人脸图像和所述语音数据是否 完整; 若所述人脸图像不完整, 但所述语音数据完整, 则对所述语音数据进行情绪识别, 得到 情绪参数; 若所述人脸图像完整, 但所述语音数据不完整, 则对所述人脸图像进行情绪识别, 得到 情绪参数; 若所述人脸图像完整, 且所述语音数据完整, 则分别对所述人脸图像和所述语音数据 进行情绪识别, 得到融合后的情绪 参数; 根据情绪参数调整预先构建的所述目标对象对应的参数化头部模型的初始驱动 参数, 得到目标驱动参数; 通过所述通信接口, 将所述目标驱动参数传输给渲染终端, 以使所述渲染终端根据所 述目标驱动参数, 驱动所述 参数化头 部模型。 10.如权利要求9所述的重建设备, 其特征在于, 所述处理器分别对所述人脸图像和所 述语音数据进行情绪识别, 得到融合后的情绪 参数, 具体操作为: 从所述人脸图像中提取第一子情绪参数, 以及从所述语音数据中提取第二子情绪参 数; 按照预设权重, 对所述第一子情绪参数和所述第二子情绪参数进行加权, 得到融合后 的情绪参数。权 利 要 求 书 2/2 页 3 CN 115049016 A 3
专利 基于情绪识别的模型驱动方法及设备
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:30:06
上传分享
举报
下载
原文档
(1.0 MB)
分享
友情链接
GB-T 25067-2020 信息技术 安全技术 信息安全管理体系审核和认证机构要求.pdf
GB-T 38674-2020 信息安全技术 应用软件安全编程指南.pdf
GB-T 36630.2-2018 信息安全技术 信息技术产品安全可控评价指标 第2部分:中央处理器.pdf
GB-T 36993-2018 环槽铆钉连接副 技术条件.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
GB-T 42606-2023 固定式压力容器修理导则.pdf
GB-T 33562-2017 信息安全技术 安全域名系统实施指南.pdf
GB-T 21720-2022 农贸市场管理技术规范.pdf
GB-T 42048-2022 载人航天空间科学与应用项目遴选要求.pdf
GB-T 12754-2019 彩色涂层钢板及钢带.pdf
2023中国智驾大模型应用研究报告-2023-10-智能网联.pdf
GM-T 0039-2015 密码模块安全检测要求.pdf
GB-T 38548.5-2020 内容资源数字化加工 第5部分:质量控制.pdf
SY-T 7466-2020 陆上石油天然气开采水基钻井废弃物处理处置及资源化利用技术规范.pdf
SC-T 4001-2021 渔具基本术语.pdf
DB33-T 2349-2021 数字化改革 公共数据目录编制规范 浙江省.pdf
GB-T 40171-2021 磁珠法DNA提取纯化试剂盒检测通则.pdf
T-CACM 1437—2023 膝骨关节炎针刀临床诊疗指南.pdf
GB-T 42866-2023 煤化工废水处理与回用技术导则.pdf
GB-T 25055-2010 信息安全技术 公钥基础设施安全支撑平台技术框架.pdf
1
/
3
21
评价文档
赞助2.5元 点击下载(1.0 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。