(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210341025.2
(22)申请日 2022.04.02
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 洪敏 何长安 虞樱
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 薛平 周晓飞
(51)Int.Cl.
G06F 16/335(2019.01)
G06F 16/34(2019.01)
G06F 16/332(2019.01)
G06F 16/33(2019.01)
G06F 40/211(2020.01)G06F 40/284(2020.01)
G06F 40/30(2020.01)
(54)发明名称
审计程序数据处 理方法及装置
(57)摘要
本申请实施例提供一种审计程序数据处理
方法及装置, 可用于金融领域, 方法包括: 根据各
审计程序的标题数据和正文数据, 确定对应的审
计程序特征; 根据当前用户的历史审计程序查询
数据和对应的所述审计程序特征, 确定用户特
征; 根据所述审计程序特征和所述用户特征确定
所述用户对 各审计程序的查询可能性, 并根据所
述各审计程序的查询可能性生成审计程序推荐
列表至所述用户处; 本申请能够 有效提高审计效
率和准确率。
权利要求书3页 说明书13页 附图7页
CN 114661889 A
2022.06.24
CN 114661889 A
1.一种审计程序数据处 理方法, 其特 征在于, 所述方法包括:
根据各审计程序的标题数据和正文数据, 确定对应的审计程序特 征;
根据当前用户的历史审计程序查询数据和对应的所述审计程序特 征, 确定用户特 征;
根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性, 并
根据所述各审计程序的查询可能性 生成审计程序推荐列表至所述用户处。
2.根据权利要求1所述的审计程序数据处理方法, 其特征在于, 所述根据 各审计程序的
标题数据和正文数据, 确定对应的审计程序特 征, 包括:
根据预设词嵌入方法对各审计程序的标题数据和正文数据进行低维空间表示, 得到对
应的语义向量;
根据各所述语义向量的相关性权值和重要性权值, 确定所述审计程序的审计程序特
征。
3.根据权利要求2所述的审计程序数据处理方法, 其特征在于, 在所述根据各所述语义
向量的相关性权值和重要性权值之前, 包括:
根据各所述语义向量之间的上 下文语义关系, 确定对应的相关性权值;
根据各所述语义向量传递的信息量大小, 确定对应的重要性权值。
4.根据权利要求2所述的审计程序数据处理方法, 其特征在于, 在所述根据预设词嵌入
方法对各审计程序的标题数据和正文数据进行低 维空间表示, 得到对应的语义向量之前,
包括:
使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成具有概括性含义的
文本摘要, 其中, 所述原始 正文数据包括业务范围、 控制目标、 应有的控制措施、 测试要点以
及测试方法中的至少一种;
将所述文本摘要设定为所述审计程序的正文数据。
5.根据权利要求4所述的审计程序数据处理方法, 其特征在于, 所述使用抽取式文本摘
要方法将所述审计程序的原 始正文数据转变成具有概 括性含义的文本摘要, 包括:
将所述审计程序的原始正文数据进行整合, 将经过整合后的原始正文数据进行语句分
割, 得到各句子的词向量;
计算各所述词向量之间的相似性, 得到相似性矩阵;
根据所述相似性矩阵中各句子的相似度, 确定各句子的重要性数值, 将重要性数值大
于阈值的句子确定为所述原 始正文数据的文本摘要。
6.根据权利要求2所述的审计程序数据处理方法, 其特征在于, 所述根据 各所述语义向
量的相关性权值和重要性权值, 确定所述审计程序的审计程序特 征, 还包括:
确定所述标题数据和所述 正文数据的视图重要性权值;
根据所述视 图重要性权值、 各所述语义向量的相关性权值和重要性权值, 确定所述审
计程序的审计程序特 征。
7.根据权利要求1所述的审计程序数据处理方法, 其特征在于, 在所述根据各审计程序
的标题数据和正文数据, 确定对应的审计程序特 征之前, 包括:
对各审计程序的标题数据和正文数据进行文本预处理, 得到经过文本预处理后的标题
数据和正文 数据, 其中, 所述文本预 处理包括切词处理、 设定停用词过滤 处理以及设定非重
要词过滤处理中的至少一种。权 利 要 求 书 1/3 页
2
CN 114661889 A
28.根据权利要求1所述的审计程序数据处理方法, 其特征在于, 所述根据当前用户的历
史审计程序查询数据和对应的所述审计程序特 征, 确定用户特 征, 包括:
确定当前用户的历史审计程序查询数据对应查询到的审计程序;
根据该审计程序的相关性权值和重要性权值, 确定用户特 征。
9.根据权利要求1所述的审计程序数据处理方法, 其特征在于, 所述根据 所述审计程序
特征和所述用户特 征确定所述用户对各审计程序的查询可能性, 包括:
根据所述审计程序特 征和所述用户特 征计算所述用户对各审计程序的点击预测值;
根据预设非线性激活函数将所述 点击预测值映射 为查询可能性数值。
10.一种审计程序数据处 理装置, 其特 征在于, 包括:
审计程序特征确定模块, 用于根据各审计程序的标题数据和正文数据, 确定对应的审
计程序特 征;
用户特征确定模块, 用于根据当前用户的历史审计程序查询数据和对应的所述审计程
序特征, 确定用户特 征;
查询推荐模块, 用于根据所述审计程序特征和所述用户特征确定所述用户对各审计程
序的查询可能性, 并根据所述各审计程序的查询可能性生成审计程序推荐列 表至所述用户
处。
11.根据权利要求10所述的审计程序 数据处理装置, 其特征在于, 所述审计程序 特征确
定模块包括:
语义向量确定单元, 用于根据 预设词嵌入方法对各审计程序的标题数据和正文数据进
行低维空间表示, 得到对应的语义向量;
程序特征计算单元, 用于根据各所述语义向量的相关性权值和重要性权值, 确定所述
审计程序的审计程序特 征。
12.根据权利要求11所述的审计程序 数据处理装置, 其特征在于, 所述审计程序 特征确
定模块还 包括:
相关性确定单元, 用于根据各所述语义向量之间的上下文语义关系, 确定对应的相关
性权值;
重要性确定单元, 用于根据各所述语义向量传递的信息量大小, 确定对应的重要性权
值。
13.根据权利要求11所述的审计程序 数据处理装置, 其特征在于, 所述审计程序 特征确
定模块还 包括:
文本摘要单元, 用于使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成
具有概括性含义的文本摘要, 其中, 所述原始正文数据包括业务范围、 控制目标、 应有的控
制措施、 测试要点以及测试 方法中的至少一种;
正文确定单 元, 用于将所述文本摘要设定为所述审计程序的正文数据。
14.根据权利要求13所述的审计程序 数据处理装置, 其特征在于, 所述文本摘要单元包
括:
词向量分割子单元, 用于将所述审计程序的原始正文数据进行整合, 将经过整合后的
原始正文数据进行语句分割, 得到各句子的词向量;
相似性矩阵构建子单 元, 用于计算各 所述词向量之间的相似性, 得到相似性矩阵;权 利 要 求 书 2/3 页
3
CN 114661889 A
3
专利 审计程序数据处理方法及装置
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:18上传分享