一种基于混合神经网络的地应力曲线预测方法与流程

专利2022-05-10 34

1.本发明涉及一种基于混合神经网络的地应力曲线预测方法。

背景技术：

2.地应力是指存在于地壳中的应力，其来源主要包括上覆岩层重力、构造应力、水压附加应力、地温附加应力、化学附加应力等，通常采用垂向地应力、最大水平地应力、最小水平地应力三个参数来表征。地应力是井壁稳定模型求解的边界条件，其大小直接决定了稳定井壁所需的临界井筒压力或钻井液当量密度，而地应力方向直接影响水平井钻井方位，因此，地应力是井壁稳定分析最为关键的基础参数之一。地应力也是进行水力压裂增产施工重要的基础依据。
3.目前，石油工程领域获取地应力的方法较多，可以分为室内测试、矿场测试、测井解释以及其它方法等四个大类：
①
室内测试主要包括差应变测试、kaiser声发射测试、波速各向异性测试、古地磁定向测试等；
②
矿场测试主要包括地破实验、水压致裂法、应力解除法、应力恢复法等；
③
测井解释主要包括声波测井解释、井壁崩落法、井壁诱导缝解释等；
④
而其它方法包括地质资料分析、地震资料预测、地应力数值模拟等。其中，矿场测试和室内测试的精度最高、测井解释次之、其它方法最低。但是，矿场测试和室内测试成本高、耗时长，而且只能获得取芯深度点的地应力大小和方向，所测得的数据十分有限；而测井解释具有纵向分辨率高、测井资料相对连续的特点，可以解释得到沿井深相对连续分布的地应力剖面，再结合多种方法和数据进行测井解释剖面的刻度，在一定程度上提升了地应力计算精度，这使得该方法被现场广泛采用。但是，目前的测井成本较高，而且利用测井资料求取地应力需要下入相应的声波测井工具，进一步增加了钻井作业的金钱和时间成本。近年来随着机器学习方法在科学和工程领域的广泛应用，大量学者利用支持向量机、模糊逻辑模型、人工神经网络等方法来估计地质参数、判别岩性、确定地层界限等。其中，人工神经网络能够近似模拟输入和输出变量之间的非线性函数关系，因此很多学者利用人工神经网络方法生成测井曲线以及根据测井曲线预测相应的岩石物理参数。
4.目前利用混合神经网络预测地应力曲线的研究尚未见报道。因此，发明了一种基于混合神经网络的地应力曲线预测方法，从而为地应力评价、井壁稳定分析和水力压裂改造设计提供基础依据。

技术实现要素：

5.为了克服现有技术中的问题，本发明提供一种基于混合神经网络的地应力曲线预测方法，可根据几条常规测井曲线快速预测地应力曲线。
6.本发明解决上述技术问题所提供的技术方案是：一种基于混合神经网络的地应力曲线预测方法，包括以下步骤：
7.s1、收集目标层位的测井数据集，并对测井数据集进行删除异常值的清洗；
8.s2、对清洗后的测井数据集进行降噪处理；
9.s3、根据降噪处理后的测井数据集确定模型的输入参数和输出参数；
10.s4、根据输入参数、输出参数分别构造特征样本和标签样本，以及构造总样本集；
11.s5、将总样本集划分为训练集和测试集；
12.s6、构建cnn
‑
bilstm
‑
attention混合神经网络模型，所述cnn
‑
bilstm
‑
attention混合神经网络模型包括卷积神经网络层、丢弃层、循环神经网络层、注意力机制层、拉直层、全连接层；
13.s7、根据训练集对cnn
‑
bilstm
‑
attention混合神经网络模型进行训练，得到训练好的模型；
14.s8、根据测试集测试训练好的模型的预测精度；
15.s9、最后根据根据几条常规测井曲线以及训练好的模型快速预测地应力曲线。
16.进一步的技术方案是，所述测井数据集包括深度、补偿密度、补偿中子、声波时差、井径、自然伽马和最大水平主地应力、垂直主应力、最小水平主地应力。
17.进一步的技术方案是，所述步骤s2中通过卡尔曼滤波算法对清洗后的测井数据集进行降噪。
18.进一步的技术方案是，所述步骤s3中输入参数包括深度、补偿密度、补偿中子、声波时差、井径和自然伽马；所述输出参数包括最大水平主地应力、垂直主应力和最小水平主地应力。
19.进一步的技术方案是，所述步骤s4的具体过程为：
20.s41、对输入参数进行归一化；
21.s42、将归一化的数据按照深度顺序依次排列，组成二维数组的形式，以滑动窗口的形式构造特征样本，同时每一个特征样本对应的标签样本为该特征样本后一个深度点上输出参数中所对应的数据；
22.s43、每一特征样本对应一个标签样本即构成一个完整的样本，滑窗走完所有步长即构造一个总样本集。
23.进一步的技术方案是，所述步骤s5中将总样本集按照8:2的比例划分训练集和测试集。
24.进一步的技术方案是，所述步骤s7的具体过程为：
25.步骤s71、将训练集输入到一维卷积层中，让滤波器按照指定步长沿着序列长度方向进行卷积操作，然后采用sigmoid激励函数对卷积后的输出值进行非线性映射；
26.步骤s72、将上层卷积层的输出作为池化层的输入，通过最大池化操作取得对应位置的最大值；
27.步骤s73、构建相同的卷积层和池化层，按照相同的逻辑进行同样的操作；
28.步骤s74、将上一层的输出输入到丢弃层，每次迭代忽略一部分网络，减少节点间的相互依赖；
29.步骤s75、将经过丢弃层的输出送入到双向长短期记忆神经网络中，进行一个维度变换，然后根据样本的输入维度，初始化隐状态和细胞态，将输入值、隐状态及细胞态一并送入双向长短期神经网络，并且在数据的循环流动过程中通过门控单元进行选择性遗忘和记忆，然后采用tanh激励函数对神经网络的输出值进行非线性映射；
30.步骤s76、够建相同的双向长短期记忆神经网络，继承上一层最后时刻对应的隐状
态和细胞态，然后按照同样的逻辑进行相同的操作；
31.步骤s77、将上一层双向长短期记忆神经网络的输出进行维度变换，然后将其作为输入输送到由全连接层和softmax激励函数组成的注意机制层并用softmax激励函数进行激活，在指定轴上求平均值再沿该轴进行重复，由此计算出对应权重系数，使得多维共享一个注意力机制，再将权重系数乘以全连接层的层输入，进而得到重新分配权重的输出值；
32.步骤s78、将上层输出值进行拉直，即多维变成一维，然后输入到一层全连接层通过tanh激励函数将从以上多层网络结构中所学到的分布式特征表示映射到样本标记空间。
33.进一步的技术方案是，所述步骤s8中将测试集带入模型进行预测，并计算真实值与预测值的误差。
34.进一步的技术方案是，所述步骤s8中衡量误差的公式如下所示：
35.均方误差：
36.均方根误差：
37.平均绝对误差：
38.平均预测精度：
39.式中：n为评测样本总数；y
i
为第i实际样本值；为第i个样本的预测值；mse为均方误差；rmse为均方根误差；mae为平均绝对误差；acc为平均预测精度。
40.本发明具有以下有益效果：本发明采用混合神经网络根据几条常规测井曲线预测地应力曲线，其特点在于特征样本构造方式上更符合地质学思想，模型本身强大的特征提取能力可以更好的进行特征提取，其次是该模型生成的地应力曲线不仅融合了测井曲线的内在联系，同时兼顾了测井信息在深度序列上的变化特征和前后关联。对于地应力评价、井壁稳定分析和水力压裂等具有十分重要的作用。
附图说明
41.图1为本发明流程图；
42.图2为x1井测井解释及地应力预测结果图。
具体实施方式
43.下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
44.如图1所示，一种基于混合神经网络的地应力曲线预测方法，包括以下步骤：
45.s1、收集目标层位的测井数据集；所述测井数据集包括：深度(md)、补偿密度(den)、补偿中子(cnl)、声波时差(ac)、井径(cal)、自然伽马(gr)和最大水平主地应力
(sh)、垂直主应力(sv)、最小水平主地应力(sh)；
46.s2、对s1收集的测井数据集进行清洗删除异常值；
47.s3、对s2清洗后的测井数据集通过卡尔曼滤波算法对数据进行降噪；
48.其中卡尔曼滤波算法如下：
49.先验状态估计：
50.先验估计的不确定性：
51.卡尔曼增益：
52.最优估计值：
53.最优估计值的不确定性：
54.式中：a为状态转移矩阵；为t
‑
1时刻的状态；p
t
‑1为t
‑
1时刻的协方差矩阵；q为过程噪声的协方差矩阵；r为测量过程的协方差矩阵；h为测量矩阵；z
t
为测量值；
55.给定先验信息q、r和初始值p就可以通过迭代计算后续的值；
56.s4、从s3测井数据集中选取模型的输入参数和输出参数；
57.其中输入参数包括：深度(md)、补偿密度(den)、补偿中子(cnl)、声波时差(ac)、井径(cal)和自然伽马(gr)；
58.输出参数包括：最大水平主地应力(sh)、垂直主应力(sv)和最小水平主地应力(sh)；
59.s5、从s4中的输入参数和输出参数分别构造特征样本和标签样本；
60.首先，对输入参数进行归一化，归一化数学表达式如下所示，由于涉及到对多个维进行归一化，采用多维归一化，这可以通过循环实现。
[0061][0062]
然后，将归一化的数据按照深度顺序依次排列，组成二维数组的形式，以滑动窗口的形式构造特征样本，滑动窗口为一个30
×
6的方阵，步长为1，每滑动一个步长即构造一个特征样本，同时每一个特征样本对应的标签样本为该特征样本后一个深度点上输出参数中所对应的数据；
[0063]
每一特征样本对应一个标签样本即构成一个完整的样本，滑窗走完所有步长即构造一个总样本集；
[0064]
s6、从s4所构造的总样本集中划分训练集和测试集；
[0065]
将总样本集按照8:2的比例划分训练集和测试集，为防止在模型训练中形成偏见，将训练集按照一定顺序进行打乱，虽然样本的顺序产生了变化，但是特征样本和标签样本还是呈一一对应的关系；训练集用于构建模型，测试集用于测试模型的预测精度；
[0066]
s7、构建cnn
‑
bilstm
‑
attention混合神经网络模型；
[0067]
本发明的深度学习网络分层结构包括：卷积神经网络层、丢弃层、循环神经网络层、注意力机制层、拉直层、全连接层；
[0068]
其中，卷积神经网络由两组卷积层和池化层构成，卷积神经网络的本质是构建多个能够提取数据特征的滤波器，通过对输入数据进行逐层卷积和池化操作来提取数据之间隐藏的拓扑结构特征；通过卷积核对原始数据进行卷积操作来提取特征的过程发生在卷积层，卷积层是cnn网络的核心层，其过程的数学表达式如下：
[0069][0070]
式中：σ为激活函数；为卷积操作；w
i
为权值矩阵；b为偏置矩阵；
[0071]
dropout层在每个训练批次中，适当忽略部分特征检测器，减少相互作用，因此在网络运行过程中不会太过依赖某些局部特征，有效降低模型过拟合，从而增强模型的泛化能力；
[0072]
循环神经网络由两个双向长短时记忆神经网络(bilstm)构成，每个bilstm由正反两个lstm互连组成，该模型可以增强处理非线性序列的能力，对数据进行更加充分的训练；lstm由输入层、隐含层和输出层构成，设输入序列为x，t为当前时刻，则各单元的状态可用如下公式表示：
[0073]
输入单元(候选态)，在更新记忆单元m(t)之前，会产生临时的记忆单元g(t)，g(t)是由当前时刻t输入的深层特征g(t
‑
1)，以及上一时刻t
‑
1的隐藏层单元输出状态h(t
‑
1)共同作用，分别与各自的权重矩阵线性组合，得到当前时刻的候选态记忆单元值，并将其作为输入数据：
[0074]
g(t)＝tanh(w
xg
g(t
‑
1) w
hg
h(t
‑
1) b
g
)
[0075]
门控单元由输入门、遗忘门、输出门构成：
[0076]
输入门：i(t)＝σ(w
xi
i(t
‑
1) w
hi
h(t
‑
1) b
i
)
[0077]
遗忘门：f(t)＝σ(w
xf
i(t
‑
1) w
hf
h(t
‑
1) b
f
)
[0078]
输出门：o(t)＝σ(w
xo
i(t
‑
1) w
ho
h(t
‑
1) b
o
)
[0079]
记忆单元(细胞态)，通过遗忘门对上一时刻的输入进行选择性遗忘，通过输入门对当前时刻的输入进行选择性记忆：
[0080]
m(t)＝f(t)m(t
‑
1) i(t)g(t)
[0081]
状态输出单元(记忆体)，通过输入门决定当前时刻哪些数据会被当成当前状态输出：
[0082]
h(t)＝o(t)tanh(m(t))
[0083]
其中，σ为sigmoid激活函数；w和b(下标省略)分别表示待训练的权重矩阵和偏置向量。
[0084]
训练过程中跟踪损失函数值的表现，以及训练集和验证集的准确率，调整上述模型的学习率、迭代次数、网络结构、激励函数、滑窗步长等超参数；
[0085]
注意力机制层(attention)由一个激励函数softmax和全连接层实现，本质上是一个加权求和的过程，其具体计算过程如下：
[0086]
x＝dense(m)
[0087]
a＝softmax(x)
[0088][0089]
其中：m为双向循环神经网络的输出值；x为全连接层的输出值；a为注意力权重系
数；为在指定轴上经过平均及重复的注意力权重系数；y为重新分配权重后的输出值。
[0090]
拉直层(flatten)为一个过渡层，其目的是将输入特征有多维拉直成一维，以减少参数的使用量，避免过度拟合。
[0091]
全连接层(dense)用于整合特征，将特征映射到样本标记空间，并通过tanh激励函数，实现分类；
[0092]
s8、对s7构建的模型进行训练；
[0093]
模型的计算过程依次为：1)将训练样本输入到一维卷积层中，让给定大小的滤波器按照指定步长沿着序列长度方向进行卷积操作，同时定义多个滤波器使神经网络能在第一层中学到更多的特征，然后采用sigmoid激励函数对卷积后的输出值进行非线性映射；2)为了减少输出的复杂度和防止数据过度拟合，定义了一个最大池化层，将上层卷积层的输出作为池化层的输入，通过最大池化操作取得对应位置的最大值；3)构建相同的卷积层和池化层，按照相同的逻辑进行同样的操作；4)为强化模型的泛化能力引入丢弃层，将上一层的输出输入到丢弃层，每次迭代忽略一部分网络，减少节点间的相互依赖；5)将经过丢弃层的输出送入到双向长短期记忆神经网络中，由于卷积神经网络和双向长短期记忆神经网络对于数据输入的维度要求不一样，所以在这里进行一个维度变换，然后根据样本的输入维度，初始化隐状态和细胞态，将输入值、隐状态及细胞态一并送入双向长短期神经网络，并且在数据的循环流动过程中通过门控单元进行选择性遗忘和记忆，然后采用tanh激励函数对神经网络的输出值进行非线性映射；6)够建相同的双向长短期记忆神经网络，只不过不再对隐状态和细胞态进行初始化，而是继承上一层最后时刻对应的隐状态和细胞态，然后按照同样的逻辑进行相同的操作；7)接下来便是注意机制层，其由全连接层和softmax激励函数组成，首先将上一层双向长短期记忆神经网络的输出进行维度变换，然后将其作为输入输送到全连接层并用softmax激励函数进行激活，并在指定轴上求平均值再沿该轴进行重复，由此计算出对应权重系数，使得多维共享一个注意力机制，再将权重系数乘以全连接层的层输入，进而得到重新分配权重的输出值；8)将上层输出值进行拉直，即多维变成一维，然后输入到一层全连接层通过tanh激励函数将从以上多层网络结构中所学到的“分布式特征表示”映射到样本标记空间。至此，则完成了模型计算图的构建，下一步则设置损失函数和优化器，首先是前向传播，通过上述的计算图得到预测值，然后是反向传播，计算预测值与真实值之间的损失函数，并在传播过程中通过优化器指引损失函数进行更新，使得更新后的各个参数让损失函数值不断逼近全局最小；
[0094]
s9、根据测试集对训练好的模型进行预测；
[0095]
将上述训练好的模型进行保存，将测试集带入模型进行预测，并计算真实值与预测值的误差；
[0096]
衡量误差的公式如下所示：
[0097]
均方误差：
[0098]
均方根误差：
[0099]
平均绝对误差：
[0100]
平均预测精度：
[0101]
式中：n为评测样本总数；y
i
为第i实际样本值；为第i个样本的预测值；mse为均方误差；rmse为均方根误差；mae为平均绝对误差；acc为平均预测精度；
[0102]
s10、最后根据根据几条常规测井曲线以及训练好的模型快速预测地应力曲线。
[0103]
以longan1井3566～4670m井段为例：
[0104]
将上述混合神经网络中卷积神经网络部分卷积层的滤波器大小设置为6，卷积步长设置为1，分配64个滤波器，池化层的大小设置为2，池化步长设置为1；丢弃层丢弃率设置为0.1；长短期记忆神经网络部分隐藏层神经元个数设置为64；滑窗步长设置为1，滑窗长度设置为30。测井解释结果如图2所示，以3566～4400m井段的测井数据作为训练数据集，4400～4670m井段的测井数据作为测试数据集。常规测井曲线为第一道至第六道，依次为深度(md)、声波时差(ac)、井径(cal)、补偿中子(cnl)、自然伽马(gr)、补偿密度(den)。最大水平地应力(sh)位于第七道，垂直主应力(sv)位于第八道，最小水平主应力(sh)位于第九道，其中，实线是根据偶极横波测井资料间接计算得到，虚线是根据上述混合神经网络模型预测得到的。混合神经网络模型地应力预测值与通过偶极横波测井资料计算得到的地应力值的误差如表1所示。
[0105]
表1
[0106][0107]
以上所述，并非对本发明作任何形式上的限制，虽然本发明已通过上述实施例揭示，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，可利用上述揭示的技术内容作出些变动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

转载请注明原文地址:https://doc.8miu.com/read-1719032.html

专利

最新回复(0)