专利一种量刑预测方法及装置 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210365513.7 (22)申请日 2022.04.07 (71)申请人海信集团控股股份有限公司地址 266555 山东省青岛市经济技术开发区前湾港路218号 (72)发明人张淯易　黄继超　陈维强　 (74)专利代理机构北京同达信恒知识产权代理有限公司 1 1291 专利代理师刘彩红 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06Q 50/18(2012.01) (54)发明名称一种量刑预测方法及装置 (57)摘要本申请公开了一种量刑预测方法及装置，用以解决现有技术中判别结果不全面以及准确性地的问题。本申请提出的方法包括：获取案件相关信息以及犯罪事实描述文本；对犯罪事实描述文本的多个篇章包括的分词进行向量化处理得到每个分词对应第一词向量，对案件相关信息包括的分词进行向量化处理得到每个分词对应的第二词向量；对多个篇章包括的第一词向量进行特征提取得到多个篇章中每个篇章的第一特征向量，并根据每个篇章的第一特征向量确定所述每个篇章的预测类别；对案件相关信息包括的第二词向量进行特征提取得到案件相关信息的第二特征向量；根据多个篇章对应的多个第一特征向量的预测类别以及第二特征向量进行法条预测、罪名预测和刑期预测。权利要求书3页说明书23页附图5页 CN 114860900 A 2022.08.05 CN 114860900 A 1.一种量刑预测方法，其特征在于，包括：获取案件相关信息以及犯罪事实描述文本，所述案件相关信息包括人证、物证、被告人信息、证词、嫌疑人口供以及笔录中至少一项；所述犯罪事实描述文本包括多个篇章，所述多个篇章中每个篇章包括多个分句，所述多个句中每个分句包括多个分词；对所述多个篇章包括的分词进行向量化处理以得到每个分词对应第一词向量，以及对所述案件相关信息包括的分词进行向量化处理以得到每个分词对应的第二词向量；对所述多个篇章包括的第一词向量进行特征提取得到多个篇章中每个篇章的第一特征向量，并根据每个篇章的第一特征向量确定所述每个篇章的预测类别，所述预测类别为法条类别或者罪名类别或刑期类别；对所述案件相关信息包括的第二词向量进行特征提取得到所述案件相关信息的第二特征向量；根据所述多个篇章对应的多个第一特征向量的预测类别以及所述第二特征向量进行法条预测、罪名预测和刑期预测。 2.如权利要求1所述的方法，其特征在于，对所述多个篇章包括的第一词向量进行特征提取得到多个篇章中每个篇章的第一特征向量，包括：基于第一篇章包括的第一词向量对所述第一篇章中的分词进行过滤处理得到经过滤第一篇章，所述经过滤第一篇章包括的多个分句中的第一词向量均与量刑预测相关，所述第一篇章为所述多个篇章中的任一个篇章；将所述经过滤第一篇章包括的多个分句进行组合得到多个分句组合，所述多个分句组合中每个分句组合包括至少两个分句；通过第一语义向量编码器对每个分句组合进行特征提取，以得到每个分句组合的词级特征向量；对多个分句组合的词级特征向量进行特征拼接，以得到每个分句组合的语句向量表示；通过第二语义向量编码器每个分句组合的语句向量进行特征提取，以得到每个分句组合的分句级特征向量；对多个分句组合的分句级特征向量进行特征拼接以得到所述第一特征向量。 3.如权利要求2所述的方法，其特征在于，所述方法还包括：编码所述经过滤第一篇章包括的多个第一词向量对应的位置向量，所述第一词向量对应的位置向量用于表征所述第一词向量对应的分词在所述第一篇章对应的文本中的位置；将所述经过滤第一篇章包括的多个分词的第一词向量与对应的位置向量进行融合得到第一篇章中多个分词的融合词向量；所述通过第一语义向量编码器对每个分句组合进行特征提取，以得到每个分句组合的词级特征向量，包括：根据第一分句组合包括的多个分词的融合词向量采用第一语义向量编码器对第一分句组合进行特征提取，以得到所述第一分句组合的词级特征向量，所述第一分句组合为所述多个分句组合中的任一个分句组合。 4.如权利要求2所述的方法，其特征在于，所述方法还包括：编码所述经过滤第一篇章包括的多个第一语句向量对应的位置向量，所述第一语句向权　利　要　求　书 1/3 页 2 CN 114860900 A 2量对应的位置向量用于表征所述第一语句向量对应的分句在所述第一篇章对应的文本中的位置；将所述经过滤第一篇章包括的多个第一语句向量与对应的位置向量进行融合得到第一篇章中多个分句的融合句向量；所述通过第二语义向量编码器对每个分句组合的语句向量进行特征提取，以得到每个分句组合的分句级特征向量，包括：根据第一分句组合包括的多个分句的融合句向量采用第二语义向量编码器对第一分句组合进行特征提取，以得到所述第一分句组合的分句级特征向量，所述第一分句组合为所述多个分句组合中的任一个分句组合。 5.如权利要求1 ‑4任一项所述的方法，其特征在于，所述根据所述多个篇章对应的多个第一特征向量的预测类别以及所述第二特征向量进行法条预测、罪名预测和刑期预测，包括：对所述第二特征向量和所述多个篇章对应的多个第一特征向量中预测类别为法条类别的第一特征向量进行非线性变换获得法条预测向量，根据所述法条预测向量进行法条预测；对所述第二特征向量、所述多个篇章对应的多个第一特征向量中预测类别为罪名类别的第一特征向量以及所述法条预测向量进行非线性变换获得罪名预测向量，根据所述罪名预测向量进行罪名预测；对所述第二特征向量、所述多个篇章对应的多个第一特征向量中预测类别为刑期类别的第一特征向量、所述法条预测向量以及所述罪名预测向量进行非线性变换获得刑期预测向量，根据所述刑期预测向量进行刑期预测。 6.如权利要求1 ‑4任一项所述的方法，其特征在于，所述案件相关信息包括第一数据和第二数据；其中，所述第一数据包括证词、嫌疑人口供以及笔录中的至少一项，所述第二数据包括人证、物证、被告人信息中的至少一项；所述对所述案件相关信息包括的分词进行向量化处理以得到每个分词对应的第二词向量，包括：对所述第一数据包括的分词进行向量化处理以得到第一数据中每个分词对应第二词向量；确定所述第二数据包括的每个分词所属的类别，从数据向量表中确定所述第二数据包括的每个分词所属的类别对应的类别向量；所述数据向量表包括多个类别对应的类别向量；将所述第二数据包括的每个分词所属的类别对应的类别向量确定所述每个分词对应的所述第二词向量。 7.如权利要求1 ‑4任一项所述的方法，其特征在于，所述基于第一篇章包括的第一词向量对所述第一篇章中的分词进行过滤处理得到经过滤第一篇章，包括：通过卷积神经网络对所述第一篇章包括的多个第一词向量进行过滤处理以获得所述经过滤的第一篇章。 8.一种量刑预测装置，其特征在于，包括获取单元和处理单元；所述获取单元，用于获取案件相关信息以及犯罪事实描述文本，所述案件相关信息包括人证、物证、被告人信息、证词、嫌疑人口供以及笔录中至少一项；所述犯罪事实描述文本包括多个篇章，所述多个篇章中每个篇章包括多个分句，所述多个句中每个分句包括多个权　利　要　求　书 2/3 页 3 CN 114860900 A 3

专利 一种量刑预测方法及装置

专利一种量刑预测方法及装置