(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202110643996.8 (22)申请日 2021.06.09 (65)同一申请的已公布的文献号 申请公布号 CN 113283174 A (43)申请公布日 2021.08.20 (73)专利权人 中国石油天然气股份有限公司 地址 100000 北京市东城区东 直门北大街9 号中国石油大厦 (72)发明人 周长林 乐宏 刘飞 张华礼  周朗 陈伟华 付艳 吕泽飞  曾嵘 张曦 王茜  (74)专利代理 机构 成都行之专利代理事务所 (普通合伙) 51220 专利代理师 林菲菲(51)Int.Cl. G06F 30/27(2020.01) G06F 119/22(2020.01) 审查员 高宇峰 (54)发明名称 基于算法集成与自控制的储层产能预测方 法、 系统及终端 (57)摘要 本发明公开了基于算法集成与自控制的储 层产能预测方法、 系统及终端, 涉及储层开发技 术领域, 其技术方案要点是: 对产能测试数据预 处理得到第一特征集; 采用两种可解释智能算法 分别对第一特征集进行排序后得到第二特征集, 并采用第一流形降维方法、 第二流形降维方法对 第一特征集进行特征降维后得到第三特征集、 第 四特征集; 特征集划分成训练集和测试集; 基于 感应学习算法、 基于可解释提升机、 基于 LightGBM建立最终预测模型; 预测单因素下的预 测产量, 并结合部分依赖图得到储层产能。 本发 明可充分挖掘特征与预测目标之间的潜在关系, 最大程度上避免误差的扩大; 对 特征集进行增强 和模型的自组织控制, 有效地提升模 型的泛化能 力及鲁棒 性。 权利要求书2页 说明书9页 附图3页 CN 113283174 B 2022.08.30 CN 113283174 B 1.基于算法集成与自控制的储层产能预测方法, 其特 征是, 包括以下步骤: 获取目标储层的产能测试 数据, 并对产能测试 数据预处 理后得到第一特 征集; 采用可解释提升机和LightGBM两种可解释智能算法分别对第一特征集进行排序后得 到由主控因素构成的第二特征集, 并采用第一流形降维方法对第一特征集进 行特征降维后 得到第三特征集, 以及 采用第二流形降维方法对第一特征集进行特征降维后得到第四特征 集; 对第一特征集、 第二特征集、 第三特征集、 第四特征集分别进行数据划分, 融合得到训 练集和测试集; 根据训练集依次建立基于感应学习算法的第 一预测模型、 基于可解释提升机的第 二预 测模型、 基于LightGBM的第三预测模型, 并基于权值分配对第一预测模型、 第二预测模型、 第三预测模型处 理后得到最终预测模型; 基于可解释智能算法绘制主控因素与储层产能之间的部分依赖图; 根据测试集和最终预测模型预测得到单因素下的预测产量, 并结合部分依赖图得到储 层产能。 2.根据权利要求1所述的基于算法集成与自控制的储层产能预测方法, 其特征是, 所述 第一特征集的获取 过程具体为: 获取已完成产能测试产层的相关参数和产能数据; 对获取的相关参数和产能数据进行标准化处理后存储至目标数据库, 并将标准化处理 后的特征组合作为第一特 征集; 采用生成对抗网络对获取 数据中的缺失数据进行填补。 3.根据权利要求1所述的基于算法集成与自控制的储层产能预测方法, 其特征是, 所述 第二特征集的获取 过程具体为: 采用可解释提升机和LightGBM两种可解释智能算法分别拟合第一特征集划分的训练 集, 并根据拟合效果分别对第一特 征集进行排序; 分别计算两种可解释模型下第 一特征集中各个特征的重要性得分, 并采取性 能加权方 式对各个特征进行重要性再排序, 以及依据再排序结果识别出影响岩层产能的主控因素, 得到第二特 征集。 4.根据权利要求1所述的基于算法集成与自控制的储层产能预测方法, 其特征是, 所述 第一流形降维方法采用分布领域嵌入算法, 第三特 征集的获取 过程具体为: 计算样本集在观测空间的相似度, 并将观测空间中两样本间的欧氏距离转化为条件概 率; 用对应的条件概 率分布表征同一空间下的数据点间联合 概率分布; 最小化高维样本相似度与低维样本相似度之间的差异, 得到最优降维后的第三特征 集。 5.根据权利要求1所述的基于算法集成与自控制的储层产能预测方法, 其特征是, 所述 第二流形降维方法采用局部线性嵌入算法, 第四特 征集的获取 过程具体为: 计算样本集中每 个样本的k个最近邻; 对于每个样本计算出对应的局部方差矩阵, 并求出对应的权 重系数向量; 将每个样本的权 重系数向量组合成权 重系数矩阵, 计算得 出矩阵M;权 利 要 求 书 1/2 页 2 CN 113283174 B 2计算矩阵M的前N个特 征值, 并计算前N个特 征值所对应的特 征向量; 抽取第二个特 征向量到第N个特 征向量所组成的矩阵, 得到低维样本集矩阵。 6.根据权利要求1 ‑5任意一项所述的基于算法集成与自控制的储层产能预测方法, 其 特征是, 所述第一特征集、 第二特征集、 第三特征集、 第四特征集采取K折交叉验证方法划分 为相应的训练集和 测试集。 7.根据权利要求1 ‑5任意一项所述的基于算法集成与自控制的储层产能预测方法, 其 特征是, 所述最终预测模型的获取 过程具体为: 根据训练集中的数据针对第 一特征集、 第二特征集、 第 三特征集、 第四特征集四种特征 组合分别构建第一预测模型、 第二预测模型、 第三预测模型; 分别获取第 一预测模型、 第二预测模型、 第三预测模型训练过程的12损失值, 并基于性 能加权法依据损失值 为12个基学习器分配权值; 根据基学习器的权值分配结果计算得到各个预测模型所对应的权重, 将各个预测模型 和对应的权 重集成计算后得到最终预测模型。 8.根据权利要求1 ‑5任意一项所述的基于算法集成与自控制的储层产能预测方法, 其 特征是, 所述部分依赖图选取可解释提升机、 LightGBM两种可解释智能算法中拟合效果最 好的可解释智能算法进行绘制。 9.基于算法集成与自控制的储层产能预测系统, 其特 征是, 包括: 数据获取模块, 用于获取目标储层的产能测试数据, 并对产能测试数据预处理后得到 第一特征集; 数据处理模块, 用于采用可解释提升机和LightGBM两种可解释智能算法分别对第一特 征集进行排序后得到由主控因素构成的第二特征集, 并采用第一流形降维方法对第一特征 集进行特征降维后得到第三特征集, 以及 采用第二流形降维方法对第一特征集进 行特征降 维后得到第四特 征集; 数据划分模块, 用于对第一特征集、 第二特征集、 第三特征集、 第四特征集分别进行数 据划分, 融合得到训练集和 测试集; 模型构建模块, 用于根据训练集依次建立基于感应学习算法的第一预测模型、 基于可 解释提升机的第二预测模型、 基于LightGBM的第三预测模型, 并基于权值分配对第一预测 模型、 第二预测模型、 第三预测模型处 理后得到最终预测模型; 绘图模块, 用于基于可解释智能算法绘制主控因素与储层产能之间的部分依赖图; 预测模块, 用于根据测试集和最终预测模型预测得到单因素下的预测产量, 并结合部 分依赖图得到储层产能。 10.一种计算机终端, 包含存储器、 处理器及存储在存储器并可在处理器上运行的计算 机程序, 其特征是, 所述处理器执行所述程序时实现如权利要求 1‑7中任意一项 所述的基于 算法集成与自控制的储层产能预测方法。权 利 要 求 书 2/2 页 3 CN 113283174 B 3

.PDF文档 专利 基于算法集成与自控制的储层产能预测方法、系统及终端

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于算法集成与自控制的储层产能预测方法、系统及终端 第 1 页 专利 基于算法集成与自控制的储层产能预测方法、系统及终端 第 2 页 专利 基于算法集成与自控制的储层产能预测方法、系统及终端 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:57:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。