(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433355.4 (22)申请日 2022.04.24 (71)申请人 润联软件系统 (深圳) 有限公司 地址 518000 广东省深圳市福田区梅林街 道梅都社区中康路136号深圳新一代 产业园2栋801 (72)发明人 王伟 张黔 陈焕坤 郑毅  (74)专利代理 机构 深圳市世联合知识产权代理 有限公司 4 4385 专利代理师 杨晖琼 (51)Int.Cl. G06F 16/35(2019.01) G06N 3/08(2006.01) G06F 40/30(2020.01) G06F 40/216(2020.01) (54)发明名称 基于强化学习的文本分类方法、 装置、 计算 机设备及 介质 (57)摘要 本申请实施例属于人工智能技术领域, 涉及 一种基于强化学习的文本分类方法, 包括获取训 练文本语料, 对训练文本语料进行语义特征提 取, 得到语义特征向量; 将语义特征向量输入训 练好的聚类模型, 输出语义簇; 对所有语义簇进 行关键词提取, 根据提取的关键词形成每个语义 簇对应的语义特征队列; 从每个语义特征队列中 选取关键词作为目标关键词, 基于目标关键词生 成词语义向量; 将词语义向量输入 预构建的初始 分类模型进行训练, 得到训练好的目标分类模 型; 获取待分类文本, 将待分类文本输入目标分 类模型, 输出文本分类结果。 本申请还提供一种 基于强化学习的文本分类装置、 计算机设备及介 质。 本申请可以提高文本分类的精确度。 权利要求书2页 说明书11页 附图4页 CN 114780727 A 2022.07.22 CN 114780727 A 1.一种基于强化学习的文本分类方法, 其特 征在于, 包括下述 步骤: 获取训练文本语料, 对所述训练文本语料进行语义特 征提取, 得到语义特 征向量; 将所述语义特 征向量输入训练好的聚类模型, 输出语义簇; 对所有所述语义簇进行关键词提取, 根据提取的关键词形成每个所述语义簇对应的语 义特征队列; 从每个所述语义特征队列中选取关键词作为目标关键词, 基于所述目标关键词生成词 语义向量; 将所述词语义向量输入预构建的初始分类模型进行训练, 得到训练好的目标分类模 型; 获取待分类文本, 将所述待分类文本 输入所述目标分类模型, 输出文本分类结果。 2.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 在所述将所述语 义特征向量输入训练好的聚类模型, 输出语义簇的步骤之前还 包括: 将所述语义特 征向量输入预构建的神经网络模型, 输出聚类结果; 根据所述聚类结果确定聚类损失函数; 基于所述聚类损失函数调整所述神经网络模型的模型参数; 当满足迭代结束条件时, 根据所述模型参数生成聚类模型。 3.根据权利要求2所述的基于强化学习的文本分类方法, 其特征在于, 所述根据 所述聚 类结果确定聚类损失函数的步骤 包括: 计算所述聚类结果中每 个聚类簇的轮廓系数; 根据所述轮廓系数 得到训练奖励分数; 基于所述聚类结果和所述训练奖励分数 得到所述聚类损失函数。 4.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 所述根据提取的 关键词形成每 个所述语义簇对应的语义特 征队列的步骤 包括: 计算每个所述语义簇的关键词之间的相似度; 根据所述相似度对所述关键词进行排序, 得到排序结果; 基于所述 排序结果 生成每个所述语义簇对应的语义特 征队列。 5.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 所述基于所述目 标关键词生成词语义向量的步骤 包括: 对所述目标关键词进行 特征提取, 得到关键词向量; 将所述关键词向量和所述语义特 征向量进行拼接, 得到词语义向量。 6.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 所述将所述词语 义向量输入预构建的初始分类模型进行训练, 得到训练好的目标分类模型的步骤 包括: 将所述词语义向量输入预构建的初始分类模型中, 得到预测分类结果; 根据所述预测分类结果确定分类损失函数; 根据所述分类损失函数调整所述初始分类模型的模型参数; 当满足迭代结束条件时, 基于所述模型参数生成目标分类模型。 7.根据权利要求6所述的基于强化学习的文本分类方法, 其特征在于, 所述根据 所述预 测分类结果确定分类损失函数的步骤 包括: 根据所述预测分类结果计算得到分类奖励值;权 利 要 求 书 1/2 页 2 CN 114780727 A 2基于所述分类奖励值和所述预测分类结果得到分类损失函数。 8.一种基于强化学习的文本分类装置, 其特 征在于, 包括: 语义特征提取模块, 用于获取训练文本语料, 对所述训练文本语料进行语义特征提取, 得到语义特 征向量; 聚类模块, 用于将所述语义特 征向量输入训练好的聚类模型, 输出语义簇; 关键词提取模块, 用于对所有所述语义簇进行关键词提取, 根据提取的关键词形成每 个所述语义簇对应的语义特 征队列; 向量生成模块, 用于从每个所述语义特征队列中选取关键词作为目标关键词, 基于所 述目标关键词生成词语义向量; 训练模块, 用于将所述词语义向量输入预构建的初始分类模型进行训练, 得到训练好 的目标分类模型; 分类模块, 用于获取待分类文本, 将所述待分类文本输入所述目标分类模型, 输出文本 分类结果。 9.一种计算机设备, 包括存储器和处理器, 所述存储器中存储有计算机可读指令, 所述 处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于强化学习的 文本分类方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 可读指令, 所述计算机可读指 令被处理器执行时实现如权利要求 1至7中任一项 所述的基于 强化学习的文本分类方法的步骤。权 利 要 求 书 2/2 页 3 CN 114780727 A 3

.PDF文档 专利 基于强化学习的文本分类方法、装置、计算机设备及介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于强化学习的文本分类方法、装置、计算机设备及介质 第 1 页 专利 基于强化学习的文本分类方法、装置、计算机设备及介质 第 2 页 专利 基于强化学习的文本分类方法、装置、计算机设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:49:23上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。