国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210249545.0 (22)申请日 2022.03.14 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 邓文超 (74)专利代理 机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 专利代理师 李玉婷 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 一种主题模 型的更新方法、 系统及存储介质 和服务器 (57)摘要 本发明实施例公开了一种主题模型的更新 方法、 系统及存储介质和服务器, 应用于基于人 工智能的信息处理技术领域。 主题模 型系统会获 取第一主题模型中多个旧主题标签与第二主题 模型中多个新主题模型分别对应的第一标签语 义特征和第二标签语义特征, 并基于第一标签语 义特征和第二标签语义标签, 在旧主题标签与新 主题标签 之间建立映射关系, 进而基于该映射关 系更新第一主题模型中的旧主题标签。 实现了自 动地对系统中已有的第一主题模 型的更新, 提高 了主题模型的效率, 还可以应用于对较大维数的 主题模型进行更新, 且对第一主题模 型的更新不 会受到主题模型获取方式的限制。 权利要求书2页 说明书11页 附图5页 CN 114661888 A 2022.06.24 CN 114661888 A 1.一种主题模型的更新方法, 其特 征在于, 包括: 获取第一主题模型中多个旧主题标签分别对应的第 一标签语义特征; 所述第 一标签语 义特征用于描述相应旧主题标签所表示主题的语义信息; 获取第二主题模型中多个新主题标签分别对应的第 二标签语义特征; 所述第 二标签语 义特征用于描述相应新主题标签所表示主题的语义信息; 根据所述第 一标签语义特征和第 二标签语义特征, 在所述多个旧主题标签与多个新主 题标签之间建立映射关系; 根据所述映射关系, 更新所述第一主题模型中的旧主题标签。 2.如权利要求1所述的方法, 其特 征在于, 所述获取第一主题模型中多个旧主题标签分别对应的第一标签语义特征, 具体包括: 确定所述旧主题 标签对应的至少一个第一信息流, 获取所述至少一个第一信息流的语义信 息, 根据所述至少一个第一信息流的语义信息获取 所述第一标签 语义特征; 所述获取第二主题模型中多个新主题标签分别对应的第二标签语义特征, 具体包括: 确定所述新主题 标签对应的至少一个第二信息流, 获取所述至少一个第二信息流的语义信 息, 根据所述至少一个第二信息流的语义信息获取 所述第二标签 语义特征。 3.如权利要求2所述的方法, 其特征在于, 所述获取所述至少一个第 一信息流的语义信 息, 具体包括: 若所述第一信息流为文本格式的信息流, 对第一信息流进行分词, 将所述第一信息流 中各个分词的特 征进行融合得到所述第一信息流的语义信息; 若所述第一信 息流为非文本格式的信 息流, 将所述第 一信息流转化为文本格式的信 息 流, 得到转换后的信息流, 对所述转换后的信息流进 行分词, 将所述转化后的信息流中各个 分词的特 征进行融合得到所述第一信息流的语义信息 。 4.如权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 获取所述第一信息流的第一非语义信息, 及获取 所述第二信息流的第二非语义信息; 所述根据所述至少一个第一信息流的语义信息获取所述第一标签语义特征, 具体包 括: 根据所述至少一个第一信息流的语义信息及第一 非语义信息获取所述第一标签语义特 征; 所述根据所述至少一个第二信息流的语义信息获取所述第二标签语义特征, 具体包 括: 根据所述至少一个第二信息流的语义信息及第二 非语义信息获取所述第二标签语义特 征。 5.如权利要求1至4任一项所述的方法, 其特征在于, 所述根据所述第一标签语义特征 和第二标签语义特征, 在所述多个旧主题标签与多个新主题标签之间建立映射关系, 具体 包括: 若某一旧主题标签的第一标签语义特征与某一新主题标签的第二标签语义特征相匹 配, 建立某一旧主题标签与某一 新主题标签之间的映射关系。 6.如权利要求1至4任一项所述的方法, 其特征在于, 所述根据 所述映射关系, 更新所述 第一主题模型中的旧主题标签, 具体包括: 若所述新主题标签在所述映射关系中具有对应的旧主题标签, 用所述新主题标签替换 对应的旧主题标签;权 利 要 求 书 1/2 页 2 CN 114661888 A 2若所述新主题标签在所述映射关系中没有对应的旧主题标签, 将所述新主题标签添加 到所述第一主题模型中。 7.一种主题模型系统, 其特 征在于, 包括: 第一特征获取单元, 用于获取第 一主题模型中多个旧主题标签分别对应的第 一标签语 义特征; 所述第一标签 语义特征用于描述相应旧主题标签所表示主题的语义信息; 第二特征获取单元, 用于获取第 二主题模型中多个新主题标签分别对应的第 二标签语 义特征; 所述第二标签 语义特征用于描述相应新主题标签所表示主题的语义信息; 映射单元, 用于根据所述第一标签语义特征和第二标签语义特征, 在所述多个旧主题 标签与多个新主题标签之间建立映射关系; 更新单元, 用于根据所述映射关系, 更新所述第一主题模型中的旧主题标签。 8.如权利要求7 所述的系统, 其特 征在于, 所述更新单元, 具体用于若所述新主题标签在所述映射关系中具有对应的旧主题标 签, 用所述新主题标签替换对应的旧主题标签; 若所述新主题标签在所述映射关系中没有 对应的旧主题标签, 将所述 新主题标签添加到所述第一主题模型中。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质储存多个计算机 程序, 所述计算机程序适于由处理器加载并执行如权利要求 1至6任一项 所述的主题模型的 更新方法。 10.一种服 务器, 其特 征在于, 包括处 理器和存 储器; 所述存储器用于储存多个计算机程序, 所述计算机程序用于由处理器加载并执行如权 利要求1至6任一项所述的主题模型 的更新方法; 所述处理器, 用于实现所述多个计算机程 序中的各个 计算机程序。权 利 要 求 书 2/2 页 3 CN 114661888 A 3
专利 一种主题模型的更新方法、系统及存储介质和服务器
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:44:17
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 41831-2022 项目管理专业人员能力评价要求.pdf
绿盟 SecXOps安全智能分析技术白皮书.pdf
GB-T 27513-2011 载人低压舱.pdf
GB-T 23981.2-2023 色漆和清漆 遮盖力的测定 第2部分:黑白格板法.pdf
GB-Z 20986-2007 信息安全技术 信息安全事件分类分级指南.pdf
GB-T 34349-2017 输气管道内腐蚀外检测方法.pdf
GB-T 30269.807-2018 信息技术 传感器网络 第807部分:测试:网络传输安全.pdf
GB-T 3220-2011 集装箱吊具.pdf
GB-T 18238.1-2000 信息技术 安全技术 散列函数 第1部分 概述.pdf
GB-T 24252-2019 蚕丝被.pdf
腾讯安全 浅谈勒索病毒场景下零信任技术应用.pdf
GB-T 14174-2012 大口径液氮容器.pdf
T-CIECCPA 007—2020 工业企业节能诊断服务通则.pdf
GB/T 33850-2017 信息技术服务 质量评价指标体系.pdf
GB-T 30558-2014 产业用纺织品分类.pdf
GB-T 16571-2012 博物馆和文物保护单位安全防范系统要求.pdf
GB-T 42467.5-2023 中医临床名词术语 第5部分:骨伤科学.pdf
GB-T 36618-2018 信息安全技术 金融信息服务安全规范.pdf
JR-T 0072-2012 金融行业信息系统信息安全等级保护测评指南.pdf
GB-T 34346-2017 基于风险的油气管道安全隐患分级导则.pdf
1
/
3
19
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。