(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210373762.0 (22)申请日 2022.04.11 (71)申请人 湖南工商大 学 地址 410205 湖南省长 沙市岳麓区岳麓 大 道569号 (72)发明人 陈晓红 胡东滨 付震坤 梁伟  曹文治  (74)专利代理 机构 深圳众鼎汇成知识产权代理 有限公司 4 4566 专利代理师 朱业刚 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 50/18(2012.01) (54)发明名称 案件分类方法、 装置、 计算机设备及存储介 质 (57)摘要 本发明涉及人工智能和司法领域, 公开了一 种案件分类方法、 装置、 计算机设备及存储介质, 所述方法包括: 获取待预测案件数据; 将所述待 预测案件数据输入ERNIE ‑CNN分类模型, 其中, 所 述ERNIE‑CNN分类模型是指基于ERNIE算法对案 件进行分类的模型, 所述ERNIE ‑CNN分类模型包 括CNN层; 基于所述ERNIE ‑CNN分类模型, 对所述 待预测案件 数据进行文本向量化, 得到词向量矩 阵; 基于所述CNN层, 对所述词向量矩阵进行局部 特征提取, 得到局部特征矩阵; 基于所述ERNIE ‑ CNN分类模型的全连接层, 对所述局部特征矩阵 进行全连接和分类处理, 得到所述待预测案件数 据对应的分类结果, 采用本发明提高对案件分类 的处理效率。 权利要求书2页 说明书8页 附图3页 CN 114780724 A 2022.07.22 CN 114780724 A 1.一种案件分类方法, 其特 征在于, 所述案件分类方法包括: 获取待预测案件数据; 将所述待预测案件数据输入ERNIE ‑CNN分类模型, 其中, 所述ERNIE ‑CNN分类模型是指 基于ERNIE算法对案件进行分类的模型, 所述ERN IE‑CNN分类模型包括CN N层; 基于所述ERNIE ‑CNN分类模型, 对所述待预测案件数据进行文本向量化, 得到词向量矩 阵; 基于所述CN N层, 对所述词向量矩阵进行局部特 征提取, 得到局部特 征矩阵; 基于所述ERNIE ‑CNN分类模型的全连接层, 对所述局部特征矩阵进行全连接和分类处 理, 得到所述待预测案件数据对应的分类结果。 2.如权利要求1所述的案件分类方法, 其特征在于, 所述获取待预测案件数据的步骤包 括: 获取案件文档和所述案件文档对应的文本模板; 基于预设的要素抽取 方式, 对所述文本模板进行要素抽取, 得到抽取规则; 基于所述抽取规则, 对所述案件文档进行字段提取, 得到关键 字段; 对所述关键 字段进行 预处理, 得到待预测案件数据。 3.如权利要求1所述的案件分类方法, 其特征在于, 所述基于所述ERNIE ‑CNN分类模型 的全连接层, 对所述局部特征矩阵进行全连接和分类处理, 得到所述待预测案件数据对应 的分类结果的步骤 包括: 将所述局部特 征矩阵依次输入所述ERN IE‑CNN分类模型的dropout层和全连接层; 基于所述ERNIE ‑CNN分类模型的dropout层和全连接层, 对所述局部特征矩阵进行全连 接和分类处 理, 得到所述待预测案件数据对应的分类结果。 4.如权利要求1至3任一项所述的案件分类方法, 其特征在于, 在所述将所述待预测案 件数据输入ERN IE‑CNN分类模型之前, 所述方法还 包括: 基于DiceL oss损失函数, 训练ERN IE‑CNN分类模型; 按照以下公式计算所述DiceL oss损失函数: 其中, |A|表示样本预测值 中元素的个数,|B|表示样本真实值中元素的个数, |A∩B|表 示样本预测值和样本真实值之间的共同元 素。 5.一种案件分类装置, 其特 征在于, 所述案件分类装置包括: 数据获取模块, 用于获取待预测案件数据; 输入模块, 用于将所述待预测案件数据输入ERNIE ‑CNN分类模型, 其中, 所述ERNIE ‑CNN 分类模型 是指基于 ERNIE算法对案件进行分类的模型, 所述ERN IE‑CNN分类模型包括CN N层; 文本向量化模块, 用于基于所述ERNIE ‑CNN分类模型, 对所述待预测案件数据进行文本 向量化, 得到词向量矩阵; 特征提取模块, 用于基于所述CNN层, 对所述词向量矩阵进行局部特征提取, 得到局部 特征矩阵; 分类结果获取模块, 用于基于所述ERNIE ‑CNN分类模型的全连接层, 对所述局部特征矩 阵进行全连接和分类处 理, 得到所述待预测案件数据对应的分类结果。权 利 要 求 书 1/2 页 2 CN 114780724 A 26.如权利要求1所述的案件分类装置, 其特 征在于, 所述数据获取模块包括: 案件文档获取 单元, 用于获取案件文档和所述案件文档对应的文本模板; 抽取规则获取单元, 用于基于预设的要素抽取方式, 对所述文本模板进行要素抽取, 得 到抽取规则; 关键字段获取单元, 用于基于所述抽取规则, 对所述案件文档进行字段提取, 得到关键 字段; 预处理单元, 用于对所述关键 字段进行 预处理, 得到待预测案件数据。 7.如权利要求1所述的案件分类装置, 其特 征在于, 所述分类结果获取模块包括: 输入单元, 用于将所述局部特征矩阵依次输入所述ERNIE ‑CNN分类模型的dropout层和 全连接层; 分类单元, 用于基于所述ERNIE ‑CNN分类模型的dropout层和全连接层, 对所述局部特 征矩阵进行全连接和分类处 理, 得到所述待预测案件数据对应的分类结果。 8.如权利要求6至7任一项所述的案件分类装置, 其特征在于, 在所述输入模块之前, 所 述装置还 包括: 训练模块, 用于基于DiceL oss损失函数, 训练ERN IE‑CNN分类模型; 按照以下公式计算所述DiceL oss损失函数: 其中, |A|表示样本预测值 中元素的个数,|B|表示样本真实值中元素的个数, |A∩B|表 示样本预测值和样本真实值之间的共同元 素。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 4任一项所述的案件分类方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至4任一项所述的案件分类方法。权 利 要 求 书 2/2 页 3 CN 114780724 A 3

.PDF文档 专利 案件分类方法、装置、计算机设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 案件分类方法、装置、计算机设备及存储介质 第 1 页 专利 案件分类方法、装置、计算机设备及存储介质 第 2 页 专利 案件分类方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。