一种数据驱动的油井套损深度智能预测方法与流程

专利2022-05-09  66



1.本发明属于智能油田技术领域,具体来说是一种数据驱动的油井套损深度智能预测方法。


背景技术:

2.目前,套损问题是我国老油田面临的棘手问题之一,大庆油田在2018年后油田年新增套损井数均在1000口井以上;大港油田的套损井数正以年均80口左右的速度逐年递增等等,多个老油田套损井数逐年增加,严重影响油田正常生产。因此,套损治理是保证油田正常生产的关键。
3.套管损坏本质是力的变化和时间共同作用于套管的结果。影响力的变化因素主要包括地质、工程等因素,如流体性质、生产参数、地层性质、增产措施等等多种因素的影响。目前对套损防治主要采用检测技术和物理模型计算分析。一方面传统的测井技术与成像技术结合等检测技术只能进行停产检测或者事后分析,无法进行套损趋势以及状态实时在线预测、分析。另一方面基于物理模型的套损预测采用了简化、假设等条件,模型建立过程复杂,准确率不高,也未考虑时间变量累计对套损产生的影响,无法满足智能油田实时优化的要求。国内油田经过几十年的数字化建设,每个油田都积累了大量套损井数据,这些数据里包含了各种套损规律。采用数据驱动为主的智能化套损预测方法,可以根据生产参数的变化实时分析套损趋势,根据分析结果实时采取调整措施预防套损,提高油井生产时率和油井寿命。对于智能油田建设、降低油田开采成本,提高油气田开发效益具有重要意义。
4.综上所述,目前对套损的研究主要是在套损发生后进行分析,不能实现对套损发展过程的提前预测,结合机器学习方法对油田套损智能预测方面的研究还处于空白阶段。


技术实现要素:

5.有鉴于此,为了实现对套损发展过程的实时预测,增强油田的套损治理能力,提高油气田开发的经济效益,本发明公开一种数据驱动的油井套损深度智能预测方法。
6.本发明的具体技术方案如下:
7.一种数据驱动的油井套损深度智能预测方法,其特征在于,包括步骤如下:
8.步骤1、建立油井套损智能预测模型,预测在给定的参数条件如下:
9.油井套管不发生套损,表示为0;发生套管变形,表示为1;套管错断,表示为2;套管破裂,表示为3;
10.步骤2、建立套损深度智能预测模型,当步骤1的模型预测结果非0时,预测发生套损的深度;
11.步骤3、运用上述模型对油田实际套损状况进行预测。
12.以下对上述步骤进行详细说明:
13.步骤1所述的建立油田套损智能预测模型包括:
14.s1.1、获取套损预测的特征参数,包括:从油田数据库中直接获取与套损发生相关
的原始参数数据,但不限于,固井质量、套管壁厚、套管外径、防砂次数、压裂次数、酸化次数、孔径、沉没度、井斜角、渗透率、钻遇断层数、泥质含量、开发时间、含水率、矿化度、对应水井的月注入量、月产液量;
15.用开发时间、含水率、矿化度、对应水井的月注入量、月产液量构建采出离子总数和注采差异量;
16.其中,采出离子总数的计算方法表示为:
[0017][0018]
上述公式中,n为总采出矿化度,104g;λ为含水率;k为矿化度,mg/l;q
i
为月产液量104m3;n为累计生产月数;本发明中考虑采出离子总数的原因在于:腐蚀是造成套管破裂的主要因素之一,是高矿化度流体和时间共同作用的结果,由于矿化度随时间变化,因此将矿化度k和时间n共同构建采出离子总数,用以反映地层流体对套管的腐蚀作用,采出离子总数越大,表明腐蚀作用越强,对套损影响越大,因此,将采出离子总数作为套损预测的特征参数。
[0019]
注采差异量为累注量与累产液量的差值绝对值,用以反映地应力平衡状态:
[0020]
计算方法表示为:
[0021][0022]
上述公式中,q
wj
为月注入量,104m3;q
oj
为月产液量,104m3;h
i
为油井的地层厚度,m;k
i
为渗透率,μm
‑2;n为累计生产月数;s为油井小层数;注入量与采出量相同时地层会维持原有地应力状态。当注入和采出不一致时会影响地应力发生变化,从而改变井筒的原始受力状态致使套管发生变形,是影响套损的主要因素之一,也是数据层面反映套损的特征参数,将其作为智能模型输入参数之一。
[0023]
s1.2、特征参数数值化处理,由于样本集中有字符型数据,为了方便计算采用数值替换,其中定义如下:
[0024]
固井质量为:未胶结—1,差—2,中等—3,好—4,优—5;
[0025]
套损类型为:套管不发生套损—0,套管变形—1,套管错断—2,套管破裂—3;
[0026]
s1.3、对各特征参数x与套损类型y之间进行相关性分析,其中,所述各特征参数x包括固井质量、套管壁厚、套管外径、防砂次数、压裂次数、酸化次数、井斜角、孔径、沉没度、采出离子总数、注采差异量、钻遇断层数和泥质含量;所述套损类型y包括套管不发生套损—0、套管变形—1、套管错断—2、套管破裂—3;
[0027]
统计数据间相关系数计算公式表示为:
[0028][0029]
上述公式中,和为样本方差,是描述数据分散程度大小的变量;为样本协方差,是度量x和y间线性
相关程度的变量,其中,x
i
为特征参数对应的样本变量,y
i
为x
i
对应的套损类型,为x
i
的平均值,为y
i
的平均值;x和y两变量之间的相关系数为:
[0030][0031]
分别计算各特征参数与套损趋势的相关系数,选取相关系数较大的特征参数构成输入集,以油井套损类型作为输出集,输入集和输出集共同构成样本集;
[0032]
s1.4、建立油井套损模型:随机从所述样本集抽取样本作为训练集,优选的此处所述的抽取样本的数量占样本集的80%,计算在训练样本中各种套损类型所占的比例:不发生套损p(y0)、套管变形p(y1)、套管错断p(y2)和套管破裂p(y3);对于特征参数为连续型变量时,其概率分布大部分都满足高斯分布,假设套损特征参数也满足高斯分布,则在各种套损类型的条件下,变量为x
i
的概率为:
[0033][0034]
其中,j=0,1,2,3,则y
j
代表各种套损类型,不发生套损y0,套管变形y1,套管错断y2,套管破裂y3;分别为各套损类型样本的均值;分别为各套损类型样本的标准差;
[0035]
利用公式得出计算各种套损类型的条件概率p(y0|x)、p(y1|x)、p(y2|x)和p(y3|x),通过比较上述条件概率,其中概率最大值即为当前条件下发生的套损类型;
[0036]
所述步骤2的建立套损深度智能预测模型包括:
[0037]
首先,按照步骤1的方法对套损深度与其特征参数进行相关性分析后,选取孔径、压裂次数、射孔中深、孔隙度、泵深、固井质量、套管外径和套管壁厚等特征参数构成输入集,以套损深度构成输出集,确定输入集和输出集共同构成样本集;
[0038]
其次,从样本集中划分出训练集后,将训练集每个特征所包含的值作为该特征的切分点,遍历所述切分点,计算切分之后各子集的均方误差,依据均方误差最小化原则,选取其中最小的均方误差对应的值作为该特征的分界值;
[0039]
步骤3所述的运用上述模型对油田实际套损状况进行预测为:
[0040]
将步骤1中的油田实际特征参数整理后代入套损智能预测模型,当其中最大概率对应的结果是发生套损时,再将步骤2中相应的特征参数分别输入套损深度智能预测模型,得出套损发生的部位。
[0041]
根据本发明优选的,步骤2中所述均方误差计算公式为:
[0042][0043]
其中,h
i
为样本x
i
对应的深度值,n1和n2分别为节点处两个类别的数量;
[0044]
选取mse值最小的特征作为第一个节点,按照其分界值将样本数据划分为两个子
集。
[0045]
根据本发明优选的,按照其分界值将样本数据划分为两个子集后,还包括:再依次将其他特征参数作为后续节点,不断迭代划分,计算末端节点区域内套损深度的平均值。例如,先将固井质量作为第一个节点进行二分类,选定其中一种类别依照套管壁厚再次进行二分类,之后不断依照其他特征参数分类,最后计算末端类别的套损深度的平均值。
[0046]
本发明可以实现以下效果:
[0047]
(1)本发明可基于套损大数据建立油井套损深度预测模型,无需进行实际条件的简化、假设等,形成一种新的油田套损预测方法,能够实现全方位的油田套损状况预测。
[0048]
(2)利用本发明建立的模型,输入现场实际数据,可以实时的得出油井发生套损的概率,对于大概率发生套损的井预测其套损的深度,结果准确度较高,计算方法高效便利,成本较低。
附图说明
[0049]
图1是本发明油田套损智能预测方法流程图。
[0050]
图2是本发明相关性分析热力图。
[0051]
图3是本发明套损类型预测模型准确率验证统计图。
[0052]
图4是本发明套损深度预测值与实际值比较曲线。
[0053]
图5是本发明应用例1中现场套损预测结果曲线。
[0054]
图6是本发明应用例2中现场套损预测结果曲线。
具体实施方式
[0055]
下面结合实施例和说明书附图做详细的说明,但不限于此。
[0056]
一种数据驱动的油井套损深度智能预测方法,如图1所示,包括步骤如下:
[0057]
步骤1、建立油井套损智能预测模型,预测在给定的参数条件如下:
[0058]
油井套管不发生套损,表示为0;发生套管变形,表示为1;套管错断,表示为2;套管破裂,表示为3;
[0059]
步骤2、建立套损深度智能预测模型,当步骤1的模型预测结果非0时,预测发生套损的深度;
[0060]
步骤3、运用上述模型对油田实际套损状况进行预测。
[0061]
以下对上述步骤进行详细说明:
[0062]
步骤1所述的建立油田套损智能预测模型包括:
[0063]
s1.1、获取套损预测的特征参数,包括:从油田数据库中直接获取与套损发生相关的原始参数数据,但不限于,固井质量、套管壁厚、套管外径、防砂次数、压裂次数、酸化次数、孔径、沉没度、井斜角、渗透率、钻遇断层数、泥质含量、开发时间、含水率、矿化度、对应水井的月注入量、月产液量;
[0064]
用开发时间、含水率、矿化度、对应水井的月注入量、月产液量构建采出离子总数和注采差异量;
[0065]
其中,采出离子总数的计算方法表示为:
[0066][0067]
上述公式中,n为总采出矿化度,104g;λ为含水率;k为矿化度,mg/l;q
i
为月产液量104m3;n为累计生产月数;本发明中考虑采出离子总数的原因在于:腐蚀是造成套管破裂的主要因素之一,是高矿化度流体和时间共同作用的结果,由于矿化度随时间变化,因此将矿化度k和时间n共同构建采出离子总数,用以反映地层流体对套管的腐蚀作用,采出离子总数越大,表明腐蚀作用越强,对套损影响越大,因此,将采出离子总数作为套损预测的特征参数。
[0068]
注采差异量为累注量与累产液量的差值绝对值,用以反映地应力平衡状态:
[0069]
计算方法表示为:
[0070][0071]
上述公式中,q
wj
为月注入量,104m3;q
oj
为月产液量,104m3;h
i
为油井的地层厚度,m;k
i
为渗透率,μm
‑2;n为累计生产月数;s为油井小层数;注入量与采出量相同时地层会维持原有地应力状态。当注入和采出不一致时会影响地应力发生变化,从而改变井筒的原始受力状态致使套管发生变形,是影响套损的主要因素之一,也是数据层面反映套损的特征参数,将其作为智能模型输入参数之一。
[0072]
s1.2、特征参数数值化处理,由于样本集中有字符型数据,为了方便计算采用数值替换,其中定义如下:
[0073]
固井质量为:未胶结—1,差—2,中等—3,好—4,优—5;
[0074]
套损类型为:套管不发生套损—0,套管变形—1,套管错断—2,套管破裂—3;
[0075]
s1.3、对各特征参数x与套损类型y之间进行相关性分析,其中,所述各特征参数x包括固井质量、套管壁厚、套管外径、防砂次数、压裂次数、酸化次数、井斜角、孔径、沉没度、采出离子总数、注采差异量、钻遇断层数和泥质含量;所述套损类型y包括套管不发生套损—0、套管变形—1、套管错断—2、套管破裂—3;
[0076]
统计数据间相关系数计算公式表示为:
[0077][0078]
上述公式中,和为样本方差,是描述数据分散程度大小的变量;为样本协方差,是度量x和y间线性相关程度的变量,其中,x
i
为特征参数对应的样本变量,y
i
为x
i
对应的套损类型,和分别为二者的平均值;x和y两变量之间的相关系数为:
[0079][0080]
图2所示,分别计算各特征参数与套损类型的相关系数,其中各个特征参数的注释
说明如表1所示。选取其中相关系数较大的特征参数构成输入集,以油井套损类型作为输出集,输入集和输出集共同构成样本集。
[0081]
表1套损特征参数说明
[0082][0083]
处理后的套损类型特征参数样本数据如表2所示:
[0084]
表2油田套损类型特征参数数据
[0085][0086]
s1.4、建立油井套损模型:随机从所述样本集抽取样本作为训练集,优选的此处所述的抽取样本的数量占样本集的80%,计算在训练样本中各种套损类型所占的比例:不发生套损p(y0)、套管变形p(y1)、套管错断p(y2)和套管破裂p(y3);对于特征参数为连续型变量时,其概率分布大部分都满足高斯分布,假设套损特征参数也满足高斯分布,则在各种套损类型的条件下,变量为x
i
的概率为:
[0087][0088]
其中,j=0,1,2,3,则y
j
代表各种套损类型,不发生套损y0,套管变形y1,套管错断y2,套管破裂y3;分别为各套损类型样本的均值;分别为各套损类型样本的标准差;
[0089]
利用公式得出计算各种套损类型的条件概率p(y0|x)、p(y1|x)、p(y2|x)和p(y3|x),通过比较上述条件概率,其中概率最大值即为当前条件下发生的套损类型;
[0090]
本实例中,选取400个样本,以8:2划分训练集和测试集,根据上述步骤建立油田套损智能预测模型。
[0091]
使用交叉验证方法计算模型准确率如表3所示:
[0092]
表3准确率验证结果
[0093][0094]
结合图3,经过多次验证,模型的准确率最大可达到100%,计算得出平均准确率为0.944,可以看出模型预测准确率高,模型泛化能力较强,可以利用模型进行油田实际套损类型预测。
[0095]
所述步骤2的建立套损深度智能预测模型包括:
[0096]
首先,按照步骤1的方法对套损深度与特征参数进行相关性分析后,选取孔径、压裂次数、射孔中深、孔隙度、泵深、固井质量、套管外径和套管壁厚等特征参数构成输入集,以套损深度构成输出集,确定输入集和输出集共同构成样本集。
[0097]
其次,从样本集中划分出训练集后,将训练集每个特征所包含的值作为该特征的切分点,遍历所述切分点,计算切分之后各子集的均方误差,依据均方误差最小化原则,选取其中最小的均方误差对应的值作为该特征的分界值;
[0098]
步骤2中所述均方误差计算公式为:
[0099][0100]
其中,h
i
为样本x
i
对应的深度值,n1和n2分别为节点处两个类别的数量;
[0101]
选取mse值最小的特征作为第一个节点,按照其分界值将样本数据划分为两个子
集。
[0102]
按照其分界值将样本数据划分为两个子集后,还包括:再依次将其他特征参数作为后续节点,不断迭代划分,计算末端节点区域内套损深度的平均值。
[0103]
本实例中,选取220个样本,然后以8:2划分训练集和测试集,按照上述步骤训练套损深度预测模型,使用r2决定系数来反映模型拟合程度:
[0104][0105]
其中,h
i
和分别表示预测深度和真实深度,表示样本深度平均值。计算测试集的r2决定系数如表4所示:
[0106]
表4决策树回归模型r2系数
[0107][0108]
r2系数的平均值为0.863,结合图4,预测深度和实际深度曲线基本重合,拟合程度较好,满足工程要求,可用于对油田套损深度进行智能预测。
[0109]
步骤3所述的运用上述模型对油田实际套损状况进行预测为:
[0110]
将步骤1中的油田实际特征参数整理后代入套损智能预测模型,当其中最大概率对应的结果是发生套损时,再将步骤2中相应的特征参数分别输入套损深度智能预测模型,得出套损发生的部位。
[0111]
应用例1、
[0112]
选取一组油田实际样本进行模型的测试,该样本套损类型特征参数描述如表5所示:
[0113]
表5应用例1套损类型特征参数
[0114][0115]
将上述特征参数数据输入油井套损智能预测模型中,得出各个套损类型的概率如图5所示,不发生套损的概率为94%,远高于其他套损类型的概率,因此在该特征条件下,套管不会发生套损,对比实际套损情况,与本模型预测结果一致。
[0116]
应用例2、
[0117]
再次选取油田实际样本数据,如表6所示:
[0118]
表6实施案例2套损类型特征参数
[0119][0120]
输入油井套损智能预测模型后,得出如图6所示结果,在当前条件下,套管有90.7%的可能性发生变形。因此,套损类型预测完成之后需要获取实际套损深度预测的特征参数,如表7所示:
[0121]
表7实施案例2套损深度特征参数
[0122][0123]
将上述套损深度特征参数输入套损深度智能预测,得出套损深度为1011.26米,实际套损深度为1058.37米,二者误差为4.66%。
[0124]
最后说明,以上案例仅用于解释发明方案,但不用于限制本发明,在不脱离本发明精神和原则的前提下,本领域技术人员所做的形式和细节上的改变,均包含在本发明的保护范围之内。

技术特征:
1.一种数据驱动的油井套损深度智能预测方法,其特征在于,包括步骤如下:步骤1、建立油井套损智能预测模型,预测在给定的参数条件如下:油井套管不发生套损,表示为0;发生套管变形,表示为1;套管错断,表示为2;套管破裂,表示为3;步骤2、建立套损深度智能预测模型,当步骤1的模型预测结果非0时,预测发生套损的深度;步骤3、运用上述模型对油田实际套损状况进行预测。2.根据权利要求1所述的一种数据驱动的油井套损深度智能预测方法,其特征在于,该方法中步骤详细内容包括:步骤1所述的建立油田套损智能预测模型包括:s1.1、获取套损预测的特征参数,包括:从油田数据库中直接获取与套损发生相关的原始参数数据,但不限于,固井质量、套管壁厚、套管外径、防砂次数、压裂次数、酸化次数、孔径、沉没度、井斜角、渗透率、钻遇断层数、泥质含量、开发时间、含水率、矿化度、对应水井的月注入量、月产液量;用开发时间、含水率、矿化度、对应水井的月注入量、月产液量构建采出离子总数和注采差异量;其中,采出离子总数的计算方法表示为:上述公式中,n为总采出矿化度,104g;λ为含水率;k为矿化度,mg/l;q
i
为月产液量104m3;n为累计生产月数;注采差异量为累注量与累产液量的差值绝对值,用以反映地应力平衡状态:计算方法表示为:上述公式中,q
wj
为月注入量,104m3;q
oj
为月产液量,104m3;h
i
为油井的地层厚度,m;k
i
为渗透率,μm
‑2;n为累计生产月数;s为油井小层数;s1.2、特征参数数值化处理,其中定义如下:固井质量为:未胶结—1,差—2,中等—3,好—4,优—5;套损类型为:套管不发生套损—0,套管变形—1,套管错断—2,套管破裂—3;s1.3、对各特征参数x与套损类型y之间进行相关性分析,其中,所述各特征参数x包括固井质量、套管壁厚、套管外径、防砂次数、压裂次数、酸化次数、井斜角、孔径、沉没度、采出离子总数、注采差异量、钻遇断层数和泥质含量;所述套损类型y包括套管不发生套损—0、套管变形—1、套管错断—2、套管破裂—3;统计数据间相关系数计算公式表示为:
上述公式中,和为样本方差,是描述数据分散程度大小的变量;为样本协方差,是度量x和y间线性相关程度的变量,其中,x
i
为特征参数对应的样本变量,y
i
为x
i
对应的套损类型,为x
i
的平均值,为y
i
的平均值;x和y两变量之间的相关系数为:分别计算各特征参数与套损趋势的相关系数,选取相关系数较大的特征参数构成输入集,以油井套损类型作为输出集,输入集和输出集共同构成样本集;s1.4、建立油井套损模型:随机从所述样本集抽取样本作为训练集,计算在训练样本中各种套损类型所占的比例:不发生套损p(y0)、套管变形p(y1)、套管错断p(y2)和套管破裂p(y3);对于特征参数为连续型变量时,假设套损特征参数也满足高斯分布,则在各种套损类型的条件下,变量为x
i
的概率为:其中,j=0,1,2,3,则y
j
代表各种套损类型,不发生套损y0,套管变形y1,套管错断y2,套管破裂y3;分别为各套损类型样本的均值;分别为各套损类型样本的标准差;利用公式得出计算各种套损类型的条件概率p(y0|x)、p(y1|x)、p(y2|x)和p(y3|x),通过比较上述条件概率,其中概率最大值即为当前条件下发生的套损类型;所述步骤2的建立套损深度智能预测模型包括:首先,按照步骤1的方法对套损深度与其特征参数进行相关性分析后,确定输入集和输出集共同构成样本集;其次,从样本集中划分出训练集后,将训练集每个特征所包含的值作为该特征的切分点,遍历所述切分点,计算切分之后各子集的均方误差,依据均方误差最小化原则,选取其中最小的均方误差对应的值作为该特征的分界值;步骤3所述的运用上述模型对油田实际套损状况进行预测为:将步骤1中的油田实际特征参数整理后代入套损智能预测模型,当其中最大概率对应的结果是发生套损时,再将步骤2中相应的特征参数分别输入套损深度智能预测模型,得出套损发生的部位。3.根据权利要求2所述的一种数据驱动的油井套损深度智能预测方法,其特征在于,步骤2中所述均方误差计算公式为:
其中,h
i
为样本x
i
对应的深度值,n1和n2分别为节点处两个类别的数量;选取mse值最小的特征作为第一个节点,按照其分界值将样本数据划分为两个子集。4.根据权利要求3所述的一种数据驱动的油井套损深度智能预测方法,其特征在于,按照其分界值将样本数据划分为两个子集后,还包括:再依次将其他特征参数作为后续节点,不断迭代划分,计算末端节点区域内套损深度的平均值。
技术总结
一种数据驱动的油井套损深度智能预测方法,包括步骤如下:步骤1、建立油井套损智能预测模型;步骤2、建立套损深度智能预测模型,当步骤1的模型预测结果非0时,预测发生套损的深度;步骤3、运用上述模型对油田实际套损状况进行预测。本发明可基于套损大数据建立油井套损深度预测模型,无需进行实际条件的简化、假设等,形成一种新的油田套损预测方法,能够实现全方位的油田套损状况预测。全方位的油田套损状况预测。全方位的油田套损状况预测。


技术研发人员:隋义勇 吴亚洲 廖正毅 孙辉 王维强
受保护的技术使用者:中国石油大学(华东)
技术研发日:2021.03.18
技术公布日:2021/6/29

转载请注明原文地址:https://doc.8miu.com/read-13737.html

最新回复(0)