国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433355.4 (22)申请日 2022.04.24 (71)申请人 润联软件系统 (深圳) 有限公司 地址 518000 广东省深圳市福田区梅林街 道梅都社区中康路136号深圳新一代 产业园2栋801 (72)发明人 王伟 张黔 陈焕坤 郑毅 (74)专利代理 机构 深圳市世联合知识产权代理 有限公司 4 4385 专利代理师 杨晖琼 (51)Int.Cl. G06F 16/35(2019.01) G06N 3/08(2006.01) G06F 40/30(2020.01) G06F 40/216(2020.01) (54)发明名称 基于强化学习的文本分类方法、 装置、 计算 机设备及 介质 (57)摘要 本申请实施例属于人工智能技术领域, 涉及 一种基于强化学习的文本分类方法, 包括获取训 练文本语料, 对训练文本语料进行语义特征提 取, 得到语义特征向量; 将语义特征向量输入训 练好的聚类模型, 输出语义簇; 对所有语义簇进 行关键词提取, 根据提取的关键词形成每个语义 簇对应的语义特征队列; 从每个语义特征队列中 选取关键词作为目标关键词, 基于目标关键词生 成词语义向量; 将词语义向量输入 预构建的初始 分类模型进行训练, 得到训练好的目标分类模 型; 获取待分类文本, 将待分类文本输入目标分 类模型, 输出文本分类结果。 本申请还提供一种 基于强化学习的文本分类装置、 计算机设备及介 质。 本申请可以提高文本分类的精确度。 权利要求书2页 说明书11页 附图4页 CN 114780727 A 2022.07.22 CN 114780727 A 1.一种基于强化学习的文本分类方法, 其特 征在于, 包括下述 步骤: 获取训练文本语料, 对所述训练文本语料进行语义特 征提取, 得到语义特 征向量; 将所述语义特 征向量输入训练好的聚类模型, 输出语义簇; 对所有所述语义簇进行关键词提取, 根据提取的关键词形成每个所述语义簇对应的语 义特征队列; 从每个所述语义特征队列中选取关键词作为目标关键词, 基于所述目标关键词生成词 语义向量; 将所述词语义向量输入预构建的初始分类模型进行训练, 得到训练好的目标分类模 型; 获取待分类文本, 将所述待分类文本 输入所述目标分类模型, 输出文本分类结果。 2.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 在所述将所述语 义特征向量输入训练好的聚类模型, 输出语义簇的步骤之前还 包括: 将所述语义特 征向量输入预构建的神经网络模型, 输出聚类结果; 根据所述聚类结果确定聚类损失函数; 基于所述聚类损失函数调整所述神经网络模型的模型参数; 当满足迭代结束条件时, 根据所述模型参数生成聚类模型。 3.根据权利要求2所述的基于强化学习的文本分类方法, 其特征在于, 所述根据 所述聚 类结果确定聚类损失函数的步骤 包括: 计算所述聚类结果中每 个聚类簇的轮廓系数; 根据所述轮廓系数 得到训练奖励分数; 基于所述聚类结果和所述训练奖励分数 得到所述聚类损失函数。 4.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 所述根据提取的 关键词形成每 个所述语义簇对应的语义特 征队列的步骤 包括: 计算每个所述语义簇的关键词之间的相似度; 根据所述相似度对所述关键词进行排序, 得到排序结果; 基于所述 排序结果 生成每个所述语义簇对应的语义特 征队列。 5.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 所述基于所述目 标关键词生成词语义向量的步骤 包括: 对所述目标关键词进行 特征提取, 得到关键词向量; 将所述关键词向量和所述语义特 征向量进行拼接, 得到词语义向量。 6.根据权利要求1所述的基于强化学习的文本分类方法, 其特征在于, 所述将所述词语 义向量输入预构建的初始分类模型进行训练, 得到训练好的目标分类模型的步骤 包括: 将所述词语义向量输入预构建的初始分类模型中, 得到预测分类结果; 根据所述预测分类结果确定分类损失函数; 根据所述分类损失函数调整所述初始分类模型的模型参数; 当满足迭代结束条件时, 基于所述模型参数生成目标分类模型。 7.根据权利要求6所述的基于强化学习的文本分类方法, 其特征在于, 所述根据 所述预 测分类结果确定分类损失函数的步骤 包括: 根据所述预测分类结果计算得到分类奖励值;权 利 要 求 书 1/2 页 2 CN 114780727 A 2基于所述分类奖励值和所述预测分类结果得到分类损失函数。 8.一种基于强化学习的文本分类装置, 其特 征在于, 包括: 语义特征提取模块, 用于获取训练文本语料, 对所述训练文本语料进行语义特征提取, 得到语义特 征向量; 聚类模块, 用于将所述语义特 征向量输入训练好的聚类模型, 输出语义簇; 关键词提取模块, 用于对所有所述语义簇进行关键词提取, 根据提取的关键词形成每 个所述语义簇对应的语义特 征队列; 向量生成模块, 用于从每个所述语义特征队列中选取关键词作为目标关键词, 基于所 述目标关键词生成词语义向量; 训练模块, 用于将所述词语义向量输入预构建的初始分类模型进行训练, 得到训练好 的目标分类模型; 分类模块, 用于获取待分类文本, 将所述待分类文本输入所述目标分类模型, 输出文本 分类结果。 9.一种计算机设备, 包括存储器和处理器, 所述存储器中存储有计算机可读指令, 所述 处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于强化学习的 文本分类方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 可读指令, 所述计算机可读指 令被处理器执行时实现如权利要求 1至7中任一项 所述的基于 强化学习的文本分类方法的步骤。权 利 要 求 书 2/2 页 3 CN 114780727 A 3
专利 基于强化学习的文本分类方法、装置、计算机设备及介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:49:23
上传分享
举报
下载
原文档
(656.4 KB)
分享
友情链接
GB-T 39853.1-2021 供电系统中的电能质量测量 第1部分:电能质量监测设备(PQI).pdf
汽车数据安全管理若干规定(试行).pdf
GA-T 460.3-2020 居民身份证卡体材料及打印薄膜技术规范 第3部分:制卡用保护层PETG薄膜.pdf
DB4401-T 184—2022 文化和旅游市场主体信用评价规范 广州市.pdf
GB-T 14337-2022 化学纤维 短纤维拉伸性能试验方法.pdf
T-CEC 607—2022 电压互感器计量性能监测规范.pdf
T-CCPITCSC 119—2023 企业税务风险管理指南.pdf
GB-T 33131-2016 信息安全技术 基于IPSec的IP存储网络安全技术要求.pdf
DB35-T 1771-2018 印度豇豆栽培与利用技术规范 福建省.pdf
GB-T 32926-2016 信息安全技术 政府部门信息技术服务外包信息安全管理规范.pdf
GB-T 41339.2-2022 海洋生态修复技术指南 第2部分:珊瑚礁生态修复.pdf
DB61-T 1155-2018 建筑消防设施检测规范 陕西省.pdf
专利 基于人工智能的人脸识别方法、装置、设备及存储介质.PDF
T-CISA 045—2020 铬—锰—镍—氮系奥氏体不锈钢热轧钢板和钢带.pdf
信息系统密码应用高风险判定指引.pdf
GB-T 14926.3-2001 实验动物 耶尔森菌检测方法.pdf
GB-T 43686-2024 电化学储能电站后评价导则.pdf
T-SDWL 0002—2023 智慧物流园区停车系统功能要求.pdf
GB 11174-2011 液化石油气.pdf
GB-T 17798-2007 地理空间数据交换格式.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(656.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。