(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210504856.7 (22)申请日 2022.05.10 (71)申请人 兴业银行股份有限公司 地址 350000 福建省福州市湖东路154 号 申请人 兴业数字金融服 务(上海)股份有限 公司 (72)发明人 张琦 赵学锋 杨红卫  (74)专利代理 机构 上海段和段律师事务所 31334 专利代理师 郭国中 (51)Int.Cl. G06F 16/242(2019.01) G06F 40/253(2020.01) G06F 40/30(2020.01) (54)发明名称 用于描述数据检核逻辑的系统及方法 (57)摘要 本发明提供了一种用于描述数据检核逻辑 的系统及方法, 涉及数据处理技术领域, 该方法 包括: 数据源分析模块: 基于数据检核三要素的 概念划分, 提供在线实时数据源定义、 合法性检 查及相关分析功能, 将元数据加工提取为数据源 知识, 供后续模块使用; 编译模块: 接收数据源分 析模块提供的数据源知识, 进行联合分析, 并进 行逻辑优化工作, 生成最终逻辑表示, 之后交由 具体的系统、 框架或平台完成计算, 实现三要素 的松耦合。 本发明能够实现数据源、 检核逻辑、 检 核输出三要素的完全解耦, 显著简化开发、 测试、 部署流程, 提高检核逻辑可维护性。 权利要求书2页 说明书12页 附图9页 CN 115033589 A 2022.09.09 CN 115033589 A 1.一种用于描述数据检核逻辑的系统, 其特 征在于, 包括: 数据源分析模块: 基于数据检核三要素的概念划分, 提供在线实时数据源定义、 合法性 检查及相关 分析功能, 将元 数据加工提取为数据源知识, 供后续模块使用; 编译模块: 提供在线实时检核逻辑描述编辑、 检查及分析功能; 编译过程中, 接收数据 源分析模块提供 的数据源知识开展联合分析, 并进行逻辑优化工作, 之后生成最终逻辑表 示, 再交由具体的系统、 框架或平台完成计算, 实现三要素的松耦合。 2.根据权利要求1所述的用于描述数据检核逻辑的系统, 其特征在于, 所述数据源分析 模块包括SQL解析器, 在线编辑、 提交的ANSI  SQL交由SQL解析器做解析, 通过后, 生成一个 合法的数据源定义; SQL解析器负责对提交的SQ L进行第一轮 检查, 履行以下四类职能: 安全性检查: 在语法层面禁止任何非select语句编译通过, 确保任何SQL语句无法改 变、 删除系统现有数据,保障数据安全; 可用性检查: 检查提交的语句是否符合select子句语法规则, 且作为源定义的合规描 述; SQL规范化: 将提交的语句调整为语义相同, 且易于后续检核规则定义的规范化SQ L; 数据源知识提取: 待上述SQL规范化完成后, 从语句中提取数据源知识, 包括引用名、 引 用类型、 名字空间信息, 为后续模块 提供元数据信息支持。 3.根据权利要求2所述的用于描述数据检核逻辑的系统, 其特征在于, 所述SQL解析器 还包括元数据提取单元, 与后端 具体的数据库产品联机交互, 取得与SQL语句相关的所有 元 数据, 支持语义分析, 使安全性检查、 可用性检查更加完善; 同时, SQL解析器将元数据加工 提取为数据源知识, 供后续模块使用。 4.根据权利要求3所述的用于描述数据检核逻辑的系统, 其特征在于, 所述元数据提取 单元在履行基本职能的基础上, 屏蔽后端数据库产品的技术差异, 统一关系 型元数据的表 达形式, 对外提供一 致的接口。 5.根据权利要求1所述的用于描述数据检核逻辑的系统, 其特征在于, 以数据检核逻辑 描述替代SQL, 所述编译模块包括: 词法分析子模块: 从检核逻辑描述的词法层面出发, 将检核规则 定义进行分词处理, 从 字符流加工转换为标记流, 供语法分析子模块进行分析; 语法分析子模块: 接到词法分析子模块提供的标记流后, 按照检核语言的语法规则, 基 于LL(*)算法构建具体语法树, 之后再生 成抽象语法树, 最 终将抽象语法树提交给语义分析 子模块; 语义分析子模块: 接收数据源分析子模块提供的数据源知识, 进行联合分析, 对检核规 则中提及的名字引用进行类型和逻辑检查; 优化及逻辑生成子模块: 通过语义分析子模块后, 进行逻辑优化工作, 每一轮优化, 优 化器均接受一个中间表示, 经 过计算后得 出一个逻辑 等同但更加优化的中间表示; 待优化器完成多轮优化后, 生成一份最优的中间表示, 去掉中间过程结果, 修整数据 结 构后, 生成最终逻辑表示, 作为 通用接口与具体的计算系统、 框架或平台适配。 6.一种用于描述数据检核逻辑的方法, 其特 征在于, 包括: 数据源分析步骤: 基于数据检核三要素的概念划分, 进行在线实时数据源定义、 合法性权 利 要 求 书 1/2 页 2 CN 115033589 A 2检查及相关 分析, 将元 数据加工提取为数据源知识, 供后续 步骤使用; 编译步骤: 进行在线实时检核逻辑描述编辑、 检查及分析; 在编译过程中, 接收数据源 分析步骤提供的数据源知识 开展联合分析, 并开展逻辑优化, 生成最终逻辑表 示, 再交由具 体的系统、 框架或平台完成计算并输出检核结果, 实现三要素的松耦合。 7.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述数据源分析 步骤包括SQL解析器, 在线编辑、 提交的ANSI  SQL交由SQL解析器做解析, 通过后, 生成一个 合法的数据源定义; SQL解析器负责对提交的SQ L进行检查, 主 要履行以下四类职能: 安全性检查: 在语法层面禁止任何非select语句编译通过, 确保任何SQL语句无法改 变、 删除系统现有数据,保障数据安全; 可用性检查: 检查提交的语句是否符合select子句语法规则,且作为源定义的合规描 述; SQL规范化: 将提交的语句调整为语义相同, 且易于后续检核规则定义的规范化SQ L; 数据源知识提取: 待上述SQL规范化完成后, 从语句中提取数据源知识, 包括引用名、 引 用类型及名字空间信息, 为后续编译步骤提供 元数据信息支持。 8.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述SQL解析器 还包括元数据提取单元, 与后端 具体的数据库产品联机交互, 取得与SQL语句相关的所有 元 数据, 支持语义分析, 使安全性检查、 可用性检查更加完善; 同时, SQL解析器将元数据加工 提取为数据源知识, 供后续 步骤使用。 9.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述元数据提取 单元在履行基本职能的基础上, 屏蔽后端数据库产品的技术差异, 统一关系 型元数据的表 达形式, 对外提供一 致的接口。 10.根据权利要求6所述的用于描述数据检核逻辑的方法, 其特征在于, 所述编译步骤 包括: 词法分析子步骤: 从检核逻辑描述的词法层面出发, 将检核规则 定义进行分词处理, 从 字符流加工转换为标记流, 供语法分析子步骤进行分析; 语法分析子步骤: 接到词法分析子步骤提供的标记流后, 按照检核逻辑描述的语法规 则, 基于LL(*)算法构建具体语法树, 之后再生成抽象语法树, 最终将抽象语法树提交给语 义分析子步骤; 语义分析子步骤: 接收数据源分析步骤提供的数据源知识, 进行联合分析, 对检核规则 中提及的名字引用进行类型和逻辑检查; 优化及逻辑生成子步骤: 通过语义分析子步骤后, 进行逻辑优化工作, 每一轮优化, 优 化器均接受一个中间表示, 经 过计算后得 出一个逻辑 等同但更加优化的中间表示; 待优化器完成多轮优化后, 生成一份最优的中间表示, 去掉中间过程结果, 修整数据 结 构后, 生成最终逻辑表示, 作为 通用接口与具体的计算系统、 框架或平台适配。权 利 要 求 书 2/2 页 3 CN 115033589 A 3

.PDF文档 专利 用于描述数据检核逻辑的系统及方法

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于描述数据检核逻辑的系统及方法 第 1 页 专利 用于描述数据检核逻辑的系统及方法 第 2 页 专利 用于描述数据检核逻辑的系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。