(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210504856.7
(22)申请日 2022.05.10
(71)申请人 兴业银行股份有限公司
地址 350000 福建省福州市湖东路154 号
申请人 兴业数字金融服 务(上海)股份有限
公司
(72)发明人 张琦 赵学锋 杨红卫
(74)专利代理 机构 上海段和段律师事务所
31334
专利代理师 郭国中
(51)Int.Cl.
G06F 16/242(2019.01)
G06F 40/253(2020.01)
G06F 40/30(2020.01)
(54)发明名称
用于描述数据检核逻辑的系统及方法
(57)摘要
本发明提供了一种用于描述数据检核逻辑
的系统及方法, 涉及数据处理技术领域, 该方法
包括: 数据源分析模块: 基于数据检核三要素的
概念划分, 提供在线实时数据源定义、 合法性检
查及相关分析功能, 将元数据加工提取为数据源
知识, 供后续模块使用; 编译模块: 接收数据源分
析模块提供的数据源知识, 进行联合分析, 并进
行逻辑优化工作, 生成最终逻辑表示, 之后交由
具体的系统、 框架或平台完成计算, 实现三要素
的松耦合。 本发明能够实现数据源、 检核逻辑、 检
核输出三要素的完全解耦, 显著简化开发、 测试、
部署流程, 提高检核逻辑可维护性。
权利要求书2页 说明书12页 附图9页
CN 115033589 A
2022.09.09
CN 115033589 A
1.一种用于描述数据检核逻辑的系统, 其特 征在于, 包括:
数据源分析模块: 基于数据检核三要素的概念划分, 提供在线实时数据源定义、 合法性
检查及相关 分析功能, 将元 数据加工提取为数据源知识, 供后续模块使用;
编译模块: 提供在线实时检核逻辑描述编辑、 检查及分析功能; 编译过程中, 接收数据
源分析模块提供 的数据源知识开展联合分析, 并进行逻辑优化工作, 之后生成最终逻辑表
示, 再交由具体的系统、 框架或平台完成计算, 实现三要素的松耦合。
2.根据权利要求1所述的用于描述数据检核逻辑的系统, 其特征在于, 所述数据源分析
模块包括SQL解析器, 在线编辑、 提交的ANSI SQL交由SQL解析器做解析, 通过后, 生成一个
合法的数据源定义;
SQL解析器负责对提交的SQ L进行第一轮 检查, 履行以下四类职能:
安全性检查: 在语法层面禁止任何非select语句编译通过, 确保任何SQL语句无法改
变、 删除系统现有数据,保障数据安全;
可用性检查: 检查提交的语句是否符合select子句语法规则, 且作为源定义的合规描
述;
SQL规范化: 将提交的语句调整为语义相同, 且易于后续检核规则定义的规范化SQ L;
数据源知识提取: 待上述SQL规范化完成后, 从语句中提取数据源知识, 包括引用名、 引
用类型、 名字空间信息, 为后续模块 提供元数据信息支持。
3.根据权利要求2所述的用于描述数据检核逻辑的系统, 其特征在于, 所述SQL解析器
还包括元数据提取单元, 与后端 具体的数据库产品联机交互, 取得与SQL语句相关的所有 元
数据, 支持语义分析, 使安全性检查、 可用性检查更加完善; 同时, SQL解析器将元数据加工
提取为数据源知识, 供后续模块使用。
4.根据权利要求3所述的用于描述数据检核逻辑的系统, 其特征在于, 所述元数据提取
单元在履行基本职能的基础上, 屏蔽后端数据库产品的技术差异, 统一关系 型元数据的表
达形式, 对外提供一 致的接口。
5.根据权利要求1所述的用于描述数据检核逻辑的系统, 其特征在于, 以数据检核逻辑
描述替代SQL, 所述编译模块包括:
词法分析子模块: 从检核逻辑描述的词法层面出发, 将检核规则 定义进行分词处理, 从
字符流加工转换为标记流, 供语法分析子模块进行分析;
语法分析子模块: 接到词法分析子模块提供的标记流后, 按照检核语言的语法规则, 基
于LL(*)算法构建具体语法树, 之后再生 成抽象语法树, 最 终将抽象语法树提交给语义分析
子模块;
语义分析子模块: 接收数据源分析子模块提供的数据源知识, 进行联合分析, 对检核规
则中提及的名字引用进行类型和逻辑检查;
优化及逻辑生成子模块: 通过语义分析子模块后, 进行逻辑优化工作, 每一轮优化, 优
化器均接受一个中间表示, 经 过计算后得 出一个逻辑 等同但更加优化的中间表示;
待优化器完成多轮优化后, 生成一份最优的中间表示, 去掉中间过程结果, 修整数据 结
构后, 生成最终逻辑表示, 作为 通用接口与具体的计算系统、 框架或平台适配。
6.一种用于描述数据检核逻辑的方法, 其特 征在于, 包括:
数据源分析步骤: 基于数据检核三要素的概念划分, 进行在线实时数据源定义、 合法性权 利 要 求 书 1/2 页
2
CN 115033589 A
2检查及相关 分析, 将元 数据加工提取为数据源知识, 供后续 步骤使用;
编译步骤: 进行在线实时检核逻辑描述编辑、 检查及分析; 在编译过程中, 接收数据源
分析步骤提供的数据源知识 开展联合分析, 并开展逻辑优化, 生成最终逻辑表 示, 再交由具
体的系统、 框架或平台完成计算并输出检核结果, 实现三要素的松耦合。
7.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述数据源分析
步骤包括SQL解析器, 在线编辑、 提交的ANSI SQL交由SQL解析器做解析, 通过后, 生成一个
合法的数据源定义;
SQL解析器负责对提交的SQ L进行检查, 主 要履行以下四类职能:
安全性检查: 在语法层面禁止任何非select语句编译通过, 确保任何SQL语句无法改
变、 删除系统现有数据,保障数据安全;
可用性检查: 检查提交的语句是否符合select子句语法规则,且作为源定义的合规描
述;
SQL规范化: 将提交的语句调整为语义相同, 且易于后续检核规则定义的规范化SQ L;
数据源知识提取: 待上述SQL规范化完成后, 从语句中提取数据源知识, 包括引用名、 引
用类型及名字空间信息, 为后续编译步骤提供 元数据信息支持。
8.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述SQL解析器
还包括元数据提取单元, 与后端 具体的数据库产品联机交互, 取得与SQL语句相关的所有 元
数据, 支持语义分析, 使安全性检查、 可用性检查更加完善; 同时, SQL解析器将元数据加工
提取为数据源知识, 供后续 步骤使用。
9.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述元数据提取
单元在履行基本职能的基础上, 屏蔽后端数据库产品的技术差异, 统一关系 型元数据的表
达形式, 对外提供一 致的接口。
10.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述编译步骤
包括:
词法分析子步骤: 从检核逻辑描述的词法层面出发, 将检核规则 定义进行分词处理, 从
字符流加工转换为标记流, 供语法分析子步骤进行分析;
语法分析子步骤: 接到词法分析子步骤提供的标记流后, 按照检核逻辑描述的语法规
则, 基于LL(*)算法构建具体语法树, 之后再生成抽象语法树, 最终将抽象语法树提交给语
义分析子步骤;
语义分析子步骤: 接收数据源分析步骤提供的数据源知识, 进行联合分析, 对检核规则
中提及的名字引用进行类型和逻辑检查;
优化及逻辑生成子步骤: 通过语义分析子步骤后, 进行逻辑优化工作, 每一轮优化, 优
化器均接受一个中间表示, 经 过计算后得 出一个逻辑 等同但更加优化的中间表示;
待优化器完成多轮优化后, 生成一份最优的中间表示, 去掉中间过程结果, 修整数据 结
构后, 生成最终逻辑表示, 作为 通用接口与具体的计算系统、 框架或平台适配。权 利 要 求 书 2/2 页
3
CN 115033589 A
3
专利 用于描述数据检核逻辑的系统及方法
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:51:47上传分享