(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210373762.0
(22)申请日 2022.04.11
(71)申请人 湖南工商大 学
地址 410205 湖南省长 沙市岳麓区岳麓 大
道569号
(72)发明人 陈晓红 胡东滨 付震坤 梁伟
曹文治
(74)专利代理 机构 深圳众鼎汇成知识产权代理
有限公司 4 4566
专利代理师 朱业刚
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06Q 50/18(2012.01)
(54)发明名称
案件分类方法、 装置、 计算机设备及存储介
质
(57)摘要
本发明涉及人工智能和司法领域, 公开了一
种案件分类方法、 装置、 计算机设备及存储介质,
所述方法包括: 获取待预测案件数据; 将所述待
预测案件数据输入ERNIE ‑CNN分类模型, 其中, 所
述ERNIE‑CNN分类模型是指基于ERNIE算法对案
件进行分类的模型, 所述ERNIE ‑CNN分类模型包
括CNN层; 基于所述ERNIE ‑CNN分类模型, 对所述
待预测案件 数据进行文本向量化, 得到词向量矩
阵; 基于所述CNN层, 对所述词向量矩阵进行局部
特征提取, 得到局部特征矩阵; 基于所述ERNIE ‑
CNN分类模型的全连接层, 对所述局部特征矩阵
进行全连接和分类处理, 得到所述待预测案件数
据对应的分类结果, 采用本发明提高对案件分类
的处理效率。
权利要求书2页 说明书8页 附图3页
CN 114780724 A
2022.07.22
CN 114780724 A
1.一种案件分类方法, 其特 征在于, 所述案件分类方法包括:
获取待预测案件数据;
将所述待预测案件数据输入ERNIE ‑CNN分类模型, 其中, 所述ERNIE ‑CNN分类模型是指
基于ERNIE算法对案件进行分类的模型, 所述ERN IE‑CNN分类模型包括CN N层;
基于所述ERNIE ‑CNN分类模型, 对所述待预测案件数据进行文本向量化, 得到词向量矩
阵;
基于所述CN N层, 对所述词向量矩阵进行局部特 征提取, 得到局部特 征矩阵;
基于所述ERNIE ‑CNN分类模型的全连接层, 对所述局部特征矩阵进行全连接和分类处
理, 得到所述待预测案件数据对应的分类结果。
2.如权利要求1所述的案件分类方法, 其特征在于, 所述获取待预测案件数据的步骤包
括:
获取案件文档和所述案件文档对应的文本模板;
基于预设的要素抽取 方式, 对所述文本模板进行要素抽取, 得到抽取规则;
基于所述抽取规则, 对所述案件文档进行字段提取, 得到关键 字段;
对所述关键 字段进行 预处理, 得到待预测案件数据。
3.如权利要求1所述的案件分类方法, 其特征在于, 所述基于所述ERNIE ‑CNN分类模型
的全连接层, 对所述局部特征矩阵进行全连接和分类处理, 得到所述待预测案件数据对应
的分类结果的步骤 包括:
将所述局部特 征矩阵依次输入所述ERN IE‑CNN分类模型的dropout层和全连接层;
基于所述ERNIE ‑CNN分类模型的dropout层和全连接层, 对所述局部特征矩阵进行全连
接和分类处 理, 得到所述待预测案件数据对应的分类结果。
4.如权利要求1至3任一项所述的案件分类方法, 其特征在于, 在所述将所述待预测案
件数据输入ERN IE‑CNN分类模型之前, 所述方法还 包括:
基于DiceL oss损失函数, 训练ERN IE‑CNN分类模型;
按照以下公式计算所述DiceL oss损失函数:
其中, |A|表示样本预测值 中元素的个数,|B|表示样本真实值中元素的个数, |A∩B|表
示样本预测值和样本真实值之间的共同元 素。
5.一种案件分类装置, 其特 征在于, 所述案件分类装置包括:
数据获取模块, 用于获取待预测案件数据;
输入模块, 用于将所述待预测案件数据输入ERNIE ‑CNN分类模型, 其中, 所述ERNIE ‑CNN
分类模型 是指基于 ERNIE算法对案件进行分类的模型, 所述ERN IE‑CNN分类模型包括CN N层;
文本向量化模块, 用于基于所述ERNIE ‑CNN分类模型, 对所述待预测案件数据进行文本
向量化, 得到词向量矩阵;
特征提取模块, 用于基于所述CNN层, 对所述词向量矩阵进行局部特征提取, 得到局部
特征矩阵;
分类结果获取模块, 用于基于所述ERNIE ‑CNN分类模型的全连接层, 对所述局部特征矩
阵进行全连接和分类处 理, 得到所述待预测案件数据对应的分类结果。权 利 要 求 书 1/2 页
2
CN 114780724 A
26.如权利要求1所述的案件分类装置, 其特 征在于, 所述数据获取模块包括:
案件文档获取 单元, 用于获取案件文档和所述案件文档对应的文本模板;
抽取规则获取单元, 用于基于预设的要素抽取方式, 对所述文本模板进行要素抽取, 得
到抽取规则;
关键字段获取单元, 用于基于所述抽取规则, 对所述案件文档进行字段提取, 得到关键
字段;
预处理单元, 用于对所述关键 字段进行 预处理, 得到待预测案件数据。
7.如权利要求1所述的案件分类装置, 其特 征在于, 所述分类结果获取模块包括:
输入单元, 用于将所述局部特征矩阵依次输入所述ERNIE ‑CNN分类模型的dropout层和
全连接层;
分类单元, 用于基于所述ERNIE ‑CNN分类模型的dropout层和全连接层, 对所述局部特
征矩阵进行全连接和分类处 理, 得到所述待预测案件数据对应的分类结果。
8.如权利要求6至7任一项所述的案件分类装置, 其特征在于, 在所述输入模块之前, 所
述装置还 包括:
训练模块, 用于基于DiceL oss损失函数, 训练ERN IE‑CNN分类模型;
按照以下公式计算所述DiceL oss损失函数:
其中, |A|表示样本预测值 中元素的个数,|B|表示样本真实值中元素的个数, |A∩B|表
示样本预测值和样本真实值之间的共同元 素。
9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器
上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至
4任一项所述的案件分类方法。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处 理器执行时实现如权利要求1至4任一项所述的案件分类方法。权 利 要 求 书 2/2 页
3
CN 114780724 A
3
专利 案件分类方法、装置、计算机设备及存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:51:30上传分享