1、第30卷第1期油气地质与采收率Vol.30,No.12023年1月Petroleum Geology and Recovery EfficiencyJan.2023收稿日期:2022-03-15。作者简介:盖建(1990),女,黑龙江双城人,工程师,硕士,从事油气田开发理论、大数据与人工智能工作。E-mail:。基金项目:国家科技重大专项“大庆长垣特高含水油田提高采收率示范工程”(2016ZX05054),中国石油天然气集团有限公司重大科技专项“大庆油气持续有效发展关键技术研究与应用特高含水后期水驱高效精准挖潜技术研究与规模应用”(2016E-0205)。文章编号:1009-9603(2023
2、)01-0161-10DOI:10.13673/37-1359/te.202203015基于自动机器学习的采油井压裂效果预测方法盖建1,2(1.国家能源陆相砂岩老油田持续开采研发中心,黑龙江 大庆 163712;2.中国石油大庆油田有限责任公司 勘探开发研究院,黑龙江 大庆 163712)摘要:目前大庆油田采油井压裂效果预测时多是凭借经验或者多元线性回归等简单模型,存在着预测结果稳定性差且预测精度不高的问题。以大庆油田N23区块为例,借助数理统计方法对采油井压裂效果与各项影响因素开展了相关性分析,并采用随机森林算法研究了各影响因素对N23区块采油井压裂效果的影响程度;阐述了自动机器学习中元学习
3、、贝叶斯优化和模型集成这三项关键技术的原理以及实现方法,并利用自动机器学习建立了基于数据驱动的采油井压裂效果预测模型;同时,将自动机器学习预测模型与随机森林、支持向量机和神经网络这3种常见机器学习算法的预测性能进行了对比,并利用该自动机器学习预测模型对N23区块的水力压裂进行设计与优化。结果表明,压裂前的生产参数对预测采油井压裂效果有着重要的影响;自动机器学习预测模型比其他算法的精度更高,模型在测试集上的决定系数为0.695,预测结果相对误差的平均值为18.96%,比目前水平降低了57.53%;经过模型优化的压裂方案较原方案增加经济效益约3.210427.4104元/井次。关键词:水力压裂;自
4、动机器学习;元学习;贝叶斯优化;模型集成;大庆油田中图分类号:TE357.1文献标识码:APrediction method for hydraulic fracturing effect of oil productionwell based on automatic machine learning technologyGAI Jian1,2(1.R&D Center of Sustainable Development of Continental Sandstone Mature Oilfield,Daqing City,HeilongjiangProvince,163712,Chin
5、a;2.Exploration and Development Research Institute of DaqingOilfield Co.,Ltd.,PetroChina,Daqing City,Heilongjiang Province,163712,China)Abstract:At present,the prediction of the hydraulic fracturing effect of oil production wells in Daqing Oilfield mostly relies on experience or simple models such a
6、s multiple linear regression,which leads to poor stability of prediction resultsand low prediction accuracy.With Block N23 of Daqing Oilfield as an example,the correlation between the fracturing effectof oil production wells and influencing factors is analyzed by the mathematical statistics.The infl
7、uence of those factors onthe hydraulic fracturing effect in Block N23 is studied by a random forest algorithm.Additionally,the principles and implementation methods of meta learning,Bayesian optimization,and model ensemble in automatic machine learning are presented,and a prediction model of a data-
8、driven hydraulic fracturing effect based on the automatic machine learning technologyis constructed.Meanwhile,the model is compared with three common machine learning algorithms:random forest,supportvector machine and neural network.The proposed model is employed to design and optimize the hydraulic
9、 fracturing ofBlock N23.The results show that the production parameters before fracturing exert an important influence on predicting theeffect of oil production well after fracturing.The model constructed by the automatic machine learning algorithm has higheraccuracy than other algorithms.The determ
10、ination coefficient on the test set is 0.695,and the average relative prediction error is 18.96%,which is 57.53%lower than the current level.Compared with the original one,the fracturing scheme opti 162 油气地质与采收率2023年1月mized by the model can increase the economic benefit by about 3.2104-27.4104yuan p
11、er well.Key words:hydraulic fracturing;automatic machine learning;meta learning;Bayesian optimization;model ensemble;Daqing Oilfield水力压裂是大庆油田开发过程中一种非常重要的增产方式1-4。水力压裂有着较为高额的成本,压裂后的产油效果直接决定了其经济效益。因此,亟需通过较为精确的预测模型对压裂后的产油效果进行提前预判,以达到压裂方案优化设计的目的。目前,对大庆油田压裂后产油效果的预测大部分是凭借经验或者多元线性回归等简单模型,导致了预测结果的不确定性强和准确度低。
12、机器学习是建立高精度预测模型的一种有效方法,正逐渐被应用到油气田勘探开发的各个领域5-14。诸多研究人员用机器学习来评估完井和增产措施的效果15-18。目前,机器学习在压裂中的应用多是针对致密油7与页岩气19-21等非常规储层;文献 22 利用机器学习对大庆油田油井压裂效果进行预测并取得了较高的精度,但存在一些问题:第一,在影响因素分析时,考虑因素不够全面,没有将可能影响压裂效果的压裂液、压裂类型等工程因素,以及沉积相、目的层深度等地质因素考虑在内。第二,在影响因素相关性分析与模型特征选择中,虽然采用了神经网络等方式,但仍局限于每个影响因素与目标变量之间的单因素分析,没有考虑影响因素之间的关联
13、,导致特征选择不够客观。第三,研究中采用的基础数据集中样本数量少,可能造成预测模型的普适性与推广性不足。机器学习算法的种类较多,每种算法适宜解决的问题不同。目前在使用机器学习算法解决问题时,会遇到以下2个问题:第一,没有一种机器学习算法能在所有数据集上都有最好的表现。第二,大部分机器学习算法性能的优劣在很大程度上依赖于超参数优化。以上2个问题会造成即使花费大量时间和精力去进行机器学习建模,仍然无法达到更高的精度。自动机器学习满足了不同数据集对不同机器学习流程的需求,能够较好地解决上述2个问题。目前流行的自动机器学习系统包括 Auto-WEKA,Hyperopt-sklean,Auto-skle
14、arn,TPOT和Auto-Keras等,它们能在不同的预处理器、分类器、超参数设置等流程之间执行组合优化,从而大大减少用户的工作量,并且降低机器学习使用者的门槛。应用自动机器学习建立了大庆油田N23区块的采油井压裂效果预测模型,并且利用研究成果指导了N23区块采油井压裂参数的优化设计。1数据准备压裂措施数据来自大庆油田N23区块,该区块主要发育萨尔图、葡萄花和高台子3个油层。萨、萨和葡是区块的主力开发油层组,为河流-三角洲沉积。密闭取心资料显示,油层中的孔隙大部分互相连通,平均孔隙度为 26.6%,平均渗透率为1 184.8 mD,以细砂岩为主,含量为47.3%,粒度中值为0.13 mm,分
15、选系数为3.4。该区块采用5点法面积井网布井,开发井均为直井,通过向地层注水补充能量。收集整理了该区块采油井压裂措施数据共887井次。数据集包含采油井的地质特征、措施前生产数据、压裂工程参数和措施效果。地质特征包括采油井坐标、措施目的层厚度、平均深度、渗透率、孔隙度、破裂压力和沉积相类型;措施前生产数据包括日产油量、含水率、日产液量以及沉没度;压裂工程参数包括压裂方式、压裂液体积、加砂量、压裂液类型、混砂比和裂缝条数。措施效果采用采油井压裂后稳定的日产油量,将该指标作为目标值开展研究。2研究方法2.1自动机器学习自动机器学习工作流程(图1)包括3个主要部分,分别是元学习(meta learni
16、ng)、贝叶斯优化(Bayesian optimization)和 模 型 集 成(build ensemble)。贝叶斯优化自动机器学习系统机器学习框架元学习数据预处理特征工程机器学习算法模型集成X训 练 集Y训 练 集X测 试 集测 试 集图1自动机器学习工作流程示意Fig.1Automatic machine learning process2.1.1元学习为了提高效率,自动机器学习采用元学习23来第30卷第1期盖建.基于自动机器学习的采油井压裂效果预测方法 163 预热贝叶斯优化流程。元学习可以实现从以前的任务中获得知识,应用该技术选择可能在目标数据集上表现良好的机器学习框架实例。从已有数据集库中选择与新数据集相似的数据集,将相似数据集的机器学习框架作为初始参数传递给贝叶斯优化流程,具体实现方法如下:收集OpenML存储库24的开源数据集,对于每一个数据集,评估一组包括常规、信息论相关和统计相关的元特征25。然后,在2/3的数据上采用k折交叉验证进行贝叶斯优化,将剩余的1/3数据作为测试集,将能使测试集获得最佳性能的机器学习框架作为最优实例储存。同时,计算本研究目标数据集Dfr