(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210365513.7
(22)申请日 2022.04.07
(71)申请人 海信集团控股 股份有限公司
地址 266555 山东省青岛市经济技 术开发
区前湾港路218号
(72)发明人 张淯易 黄继超 陈维强
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
专利代理师 刘彩红
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/35(2019.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)G06Q 50/18(2012.01)
(54)发明名称
一种量刑预测方法及装置
(57)摘要
本申请公开了一种量刑预测方法及装置, 用
以解决现有技术中判别结果不全面 以及准确性
地的问题。 本申请提出的方法包括: 获取案件相
关信息以及犯罪事实描述文本; 对 犯罪事实描述
文本的多个篇章包括的分词进行向量化处理得
到每个分词对应第一词向量, 对案件相关信息包
括的分词进行向量化处理得到每个分词对应的
第二词向量; 对多个篇章包括的第一词向量进行
特征提取得到多个篇章中每个篇章的第一特征
向量, 并根据每个篇章的第一特征向量确定所述
每个篇章的预测类别; 对案件相关信息包括的第
二词向量进行特征提取得到案件相关信息的第
二特征向量; 根据多个篇章对应的多个第一特征
向量的预测类别以及第二特征向量进行法条预
测、 罪名预测 和刑期预测。
权利要求书3页 说明书23页 附图5页
CN 114860900 A
2022.08.05
CN 114860900 A
1.一种量刑预测方法, 其特 征在于, 包括:
获取案件相关信 息以及犯罪事实描述文本, 所述案件相关信 息包括人证、 物证、 被告人
信息、 证词、 嫌疑人口供以及笔录中至少一项; 所述犯罪事实描述文本包括多个篇章, 所述
多个篇章中每个篇章包括多个分句, 所述多个句中每 个分句包括多个分词;
对所述多个篇章包括的分词进行向量化处理以得到每个分词对应第 一词向量, 以及对
所述案件相关信息包括的分词进行向量 化处理以得到每 个分词对应的第二词向量;
对所述多个篇章包括的第一词向量进行特征提取得到多个篇章中每个篇章的第一特
征向量, 并根据每个篇章的第一特征向量确定所述每个篇章的预测类别, 所述预测类别为
法条类别或者 罪名类别或刑期类别;
对所述案件相关信息包括的第二词向量进行特征提取得到所述案件相关信息的第二
特征向量;
根据所述多个篇章对应的多个第一特征向量的预测类别以及所述第二特征向量进行
法条预测、 罪名预测 和刑期预测。
2.如权利要求1所述的方法, 其特征在于, 对所述多个篇章包括的第 一词向量进行特征
提取得到多个篇 章中每个篇章的第一特 征向量, 包括:
基于第一篇章包括的第一词向量对所述第一篇章中的分词进行过滤处理得到经过滤
第一篇章, 所述经过滤第一篇章包括的多个分句中的第一词向量均与量刑 预测相关, 所述
第一篇章为所述多个篇 章中的任一个篇 章;
将所述经过滤第 一篇章包括的多个分句进行组合得到多个分句组合, 所述多个分句组
合中每个分句组合包括至少两个分句;
通过第一语义向量编码器对每个分句组合进行特征提取, 以得到每个分句组合的词级
特征向量;
对多个分句组合的词级特征向量进行特征拼接, 以得到每个分句组合的语句向量表
示;
通过第二语义向量编码器每个分句组合的语句向量进行特征提取, 以得到每个分句组
合的分句级特 征向量;
对多个分句组合的分句级特 征向量进行 特征拼接以得到所述第一特 征向量。
3.如权利要求2所述的方法, 其特 征在于, 所述方法还 包括:
编码所述经过滤第 一篇章包括的多个第 一词向量对应的位置向量, 所述第 一词向量对
应的位置向量用于表征 所述第一词向量对应的分词在所述第一 篇章对应的文本中的位置;
将所述经过滤第一篇章包括的多个分词的第一词向量与对应的位置向量进行融合得
到第一篇章中多个分词的融合词向量;
所述通过第 一语义向量编码器对每个分句组合进行特征提取, 以得到每个分句组合的
词级特征向量, 包括:
根据第一分句组合包括的多个分词的融合词向量采用第一语义向量编码器对第一分
句组合进行特征提取, 以得到所述第一分句组合的词级特征向量, 所述第一分句组合为所
述多个分句组合中的任一个分句组合。
4.如权利要求2所述的方法, 其特 征在于, 所述方法还 包括:
编码所述经过滤第 一篇章包括的多个第 一语句向量对应的位置向量, 所述第 一语句向权 利 要 求 书 1/3 页
2
CN 114860900 A
2量对应的位置 向量用于表征所述第一语句向量对应的分句在所述第一篇章对应的文本中
的位置;
将所述经过滤第一篇章包括的多个第一语句向量与对应的位置向量进行融合得到第
一篇章中多个分句的融合句向量;
所述通过第 二语义向量编码器对每个分句组合的语句向量进行特征提取, 以得到每个
分句组合的分句级特 征向量, 包括:
根据第一分句组合包括的多个分句的融合句向量采用第二语义向量编码器对第一分
句组合进行特征提取, 以得到所述第一分句组合的分句级特征向量, 所述第一分句组合为
所述多个分句组合中的任一个分句组合。
5.如权利要求1 ‑4任一项所述的方法, 其特征在于, 所述根据 所述多个篇章对应的多个
第一特征向量的预测类别以及所述第二特征向量进行法条预测、 罪名预测和刑期预测, 包
括:
对所述第二特征向量和所述多个篇章对应的多个第一特征向量中预测类别为法条类
别的第一特征向量进 行非线性变换获得法条预测向量, 根据所述法条预测向量进 行法条预
测;
对所述第二特征向量、 所述多个篇章对应的多个第 一特征向量中预测类别为罪名类别
的第一特征向量以及所述法条预测向量进 行非线性变换获得罪名预测向量, 根据所述罪名
预测向量进行罪名预测;
对所述第二特征向量、 所述多个篇章对应的多个第 一特征向量中预测类别为刑期类别
的第一特征向量、 所述法条预测向量以及所述罪名预测向量进行非线性变换获得刑期预测
向量, 根据所述刑期预测向量进行刑期预测。
6.如权利要求1 ‑4任一项所述的方法, 其特征在于, 所述案件相关信 息包括第 一数据和
第二数据; 其中, 所述第一数据包括证词、 嫌疑人口供以及笔录中的至少一项, 所述第二数
据包括人证、 物证、 被告 人信息中的至少一项; 所述对所述案件相关信息包括的分词进行向
量化处理以得到每 个分词对应的第二词向量, 包括:
对所述第一数据包括的分词进行向量化处理以得到第一数据中每个分词对应第二词
向量;
确定所述第 二数据包括的每个分词所属的类别, 从数据向量表中确定所述第 二数据包
括的每个分词所属的类别对应的类别 向量; 所述数据向量表包括多个类别对应的类别 向
量; 将所述第二数据包括的每个分词所属的类别对应的类别向量确定所述每个分词对应的
所述第二词向量。
7.如权利要求1 ‑4任一项所述的方法, 其特征在于, 所述基于第一篇章包括的第 一词向
量对所述第一 篇章中的分词进行 过滤处理得到经 过滤第一篇章, 包括:
通过卷积神经网络对所述第一篇章包括的多个第一词向量进行过滤处理以获得所述
经过滤的第一 篇章。
8.一种量刑预测装置, 其特 征在于, 包括获取 单元和处理单元;
所述获取单元, 用于获取案件相关信息以及犯罪事实描述文本, 所述案件相关信息包
括人证、 物证、 被告 人信息、 证词、 嫌疑人口供以及笔录中至少一项; 所述犯罪事实描述文本
包括多个篇章, 所述多个篇章中每个篇章包括多个分句, 所述多个句中每个分句包括多个权 利 要 求 书 2/3 页
3
CN 114860900 A
3
专利 一种量刑预测方法及装置
文档预览
中文文档
32 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:47:40上传分享