一种基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法

未命名 10-19 阅读:200 评论:0


1.本发明属于石油工程领域,具体涉及一种基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法。


背景技术:

2.随着大数据、机器学习和深度学习技术的不断发展,将机器学习和深度学习方法应用到地球物理勘探领域当中已经成为研究热点,利用测井数据进行储层地质描述的应用中,经常出现部分测井曲线失真或缺失的问题。为此,测井曲线复原一直以来都是相关研究领域的研究热点和难点。
3.测井资料是认识地质构造的重要方法,是进行油气资源勘探与开发过程中最主要的油藏描述基础数据。通过测井曲线不仅可以识别地质的岩层、裂缝、储层和断裂带,还对地下的碳资源、地热能、石油与天然气的勘探具有重要的价值。然而,在实际工程中由于井筒扩径、仪器故障等因素,会出现已测井部分测井段的测井曲线出现失真甚至缺失的情况,为后期的测井资料解释带来了一定的困难。重新测井不仅价格昂贵,且对于已经完井的井眼甚至不可能实现。因此,准确的重构缺失的测井曲线,对目标油藏描述及油藏区域相态变化分析等应用都具有重要意义。
4.目前,传统的测井曲线生成技术,包含了交叉图法、多元线性回归法、支持向量机法、分性重构法等,大多方法是从测井曲线间直接非线性映射关系分析的角度出发进行缺失测井曲线复原。该方法没有充分考虑储层非均质地质变化造成的测井曲线本质关联关系的变化,从而造成局部过拟合及全局欠拟合的问题,极大地限制了测井曲线复原精度。虽然,如今已有较多的基于神经网络的测井曲线预测方法,但大多网络结构简单且网络层数较浅,对于复杂的回归问题缺少泛化能力,也不利于复杂测井数据的处理,从而导致预测结果果精度低,缺乏可靠性。因此,需要一种新的测井曲线重构法即可以充分发挥测井数据的时序信息对失真或缺失井段的测井数据进行重构。


技术实现要素:

5.本发明的目的是为了解决由于测井数据失真或缺失造成的测井曲线不准确导致测井资料解释困难的问题,提供一种基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,它包括如下步骤:
6.步骤一:采用平均替代法和散点图可视化法丢弃测井数据中离群值和噪声信息并对数据进行标准化和规范化;
7.步骤二:通过对每条测井曲线进行纵向上局部多尺度纹理特征提取,实现多测井曲线间的结构不变性特征提取;
8.步骤三:采用三层长短期记忆网络lstm(long short-term memory)和两层卷积神经网络cnn(convolutional neural networks)分别作为生成对抗网络模型中的生成器和
判别器;
9.步骤四:通过逐步的迭代训练,最大化判别器的目标函数和最小化生成器的目标函数来更新判别器和生成器的相关参数;
10.步骤五:将原始输入曲线和其对应的lbp特征输入到训练好的生成对抗网络模型中,对缺失的测井曲线进行重构;
11.步骤六:利用复原评价指标对测井曲线重构结果进行可视化评估。
12.本发明有益效果
13.本发明的优点在于,提出了一种改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,搭建了一个测井重构曲线机器学习模型,成功解决了没有充分考虑储层非均质地质变化造成的测井曲线本质关联关系的变化情况,进而造成预测精度过低的问题,实现了将数据挖掘和深度学习方法应用到地球物理勘探领域当中。所述方法通过利用长短期记忆网络lstm和卷积神经网络cnn搭建生成对抗网络(generative adversarial network,gan)模型,并从多个尺度对测并曲线进行纹理特征的提取,然后,将多尺度纹理特征输入到gan预测模型中,最终实现测井曲线重构。与其他常用的预测方法相比,改进的gan网络模型与纹理特征的结合,增加了对测井曲线隐藏物理信息的挖掘,大大增强了模型外推能力和预测精度。
附图说明
14.图1为本发明所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的流程示例图;
15.图2为本发明具体实施方式三所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的某井测井曲线多尺度纹理特征的示例图;
16.图3为本发明具体实施方式四所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的构建gan模型的最优网络组合示例图;
17.图4为本发明方法所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法与cnn模型在优化过程中的损失函数对比示例图;
18.图5为本发明方法所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的gan模型对某井自然电位测井曲线sp(spontaneous potential)的预测结果与原数据对比示例图。
具体实施方式
19.实施方式一:
20.结合图1说明本实施方式,本实施方式所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,它包括如下步骤:
21.步骤一:采用平均替代法和散点图可视化法丢弃测井数据中离群值和噪声信息并对数据进行标准化和规范化;
22.步骤二:通过对每条测井曲线进行纵向上局部多尺度纹理特征提取,实现多测井曲线间的结构不变性特征提取;
23.步骤三:采用三层长短期记忆网络lstm(long short-term memory)和两层卷积神
经网络cnn(convolutional neural networks)分别作为生成对抗网络模型中的生成器和判别器;
24.步骤四:通过逐步的迭代训练,最大化判别器的目标函数和最小化生成器的目标函数来更新判别器和生成器的相关参数;
25.步骤五:将原始输入曲线和其对应的lbp特征输入到训练好的生成对抗网络模型中,对缺失的测井曲线进行重构;
26.步骤六:利用复原评价指标对测井曲线重构结果进行可视化评估。
27.实施方式二:
28.本实施方式是对具体实施方式一的所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的进一步限定,
29.步骤一中对测井数据中离群值和噪声信息进行标准化和规范化方法为:
30.采用平均替代法和散点图可视化法,将其曲线缺失的数据进行补充矫正以及对离散偏差大的噪声值与离群值进行消除,使其数据进行训练与预测有着更为准确得结果。
31.平均替代法即是以变量中未缺失观察值的均数估计该变量中存在的缺失值。
32.散点图可视化法即在图表上绘制观测值坐标,其中每个观测值都由两个数值组成,分别表示自变量和因变量的值,通过观察散点图,可以获得关于两个变量之间关系的一些信息,如它们是否呈线性关系、是否存在异常值、是否存在趋势等等,通过这些特征可以判断出数据中的离群值和噪声值。
33.实施方式三:
34.本实施方式是对具体实施方式一的所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的进一步限定,
35.步骤二中对测井曲线进行多尺度纹理特征提取的方法为:
36.结构性不变特征是指对局部结构的检测或描述对于几何变换等保持不变的特征,本发明所涉及的结构不变特征主要是局部二值模式纹理特征,针对每条测井曲线的局部纵向结构的不变性,利用局部二值模式对信号的局部结构进行不变性编码,对于给定的每条测井曲线,其局部二值模式特征可通过如下公式进行计算:
[0037][0038]
其中,lbpi为局部二值模式特征,ni为该测井曲线第i个深度样点的局部邻域,fj为二值编码值。
[0039]
再对于给定的某条曲线进行不同尺度下的编码求和,得到的局部多尺度lbp纹理特征,为更好的说明对测井曲线结构不变性特征的提取,图2给出了某井声波时差测井曲线ac(acoustic)、自然伽马测井曲线gr(natural gamma ray)、深侧向电阻率测井曲线lld(deep lateral resistivity)、井径测井曲线cal(caliper)、浅侧向电阻率lls(shallow lateral resistivity)和密度测井曲线den(density)等6条常规测井曲线特征提取后的结果与原数据对比示例图。
[0040]
实施方式四:
[0041]
本实施方式是对具体实施方式一的所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的进一步限定,
[0042]
步骤三中生成对抗网络模型的搭建具体如下:
[0043]
在进行gan预测模型的最优网络层数寻找实验中,将长短期记忆网络lstm每层的单元个数设置为256,卷积神经网络cnn的卷积核个数设为128,卷积核的大小设为3*1的矩阵。在进行寻找最优lstm层数实验时,判别器cnn的层数设置为3;在进行寻找最优cnn层数的实验时,lstm的层数设置为3。
[0044]
通过多组实验,当长短期记忆网络lstm的层数为3、卷积神经网络cnn的层数为2时,预测出的自然电位测井曲线sp的走势与真实曲线更加接近,同时误差值也是最小的。所以在进行后续的试验时,我们将长短期记忆网络lstm的层数设置为3,卷积神经网络cnn层数设置为2。构建的最优gan模型的网络组合结果如图3所示。
[0045]
实施方式五:
[0046]
本实施方式是对具体实施方式一的所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的进一步限定,
[0047]
步骤四中通过迭代训练,更新判别器和生成器的相关参数方法为:
[0048]
生成对抗网络的通用公式为:
[0049][0050]
其中,v(g,d)表示生成对抗网络的通用公式,d(x)表示判别器判断真实图片是否真实的概率,e表示期望。
[0051]
训练gan的主要目标是最大化判别器的目标函数,最小化生成器的目标函数,通过迭代训练,总是需要最小化损失函数才能得到更好的结果。在进行数据真假判别时,首先固定生成器g,训练判别器。将gan的目标函数改为:
[0052]
f(d)=p
data
(x)logd(x)+pg(χ)log(1-d(x))
ꢀꢀꢀ
(3)
[0053]
其中,f(d)为gan的目标函数,p
data
(χ)表示真实数据分布,pg(χ)表示生成数据分布。
[0054]
最大化判别器的目标函数:
[0055][0056]
其中,d
*
(χ)为最大化后的判别器的目标函数。
[0057]
给定输入χ,其中损失函数是js divergence散度,得到最优的判别器d
*

[0058][0059]
当p
data
(x)=pg(x)时,判别器的损失函数最小,此时g生成的结果最优。
[0060]
然后固定判别器,再最小化生成器的目标函数:
[0061][0062]
其中,为生成器的目标函数,m表示样本个数,z为生成器的输入数据,x为真实数据,为生成器生成的假数据。
[0063]
实施方式六:
[0064]
本实施方式是对具体实施方式一的所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的进一步限定,
[0065]
步骤五中将原始输入曲线和其对应的lbp特征输入到训练好的生成对抗网络模型中,对缺失的测井曲线进行重构方法为:
[0066]
构建测井曲线重构机器学习模型进行超参数优化,将原始数据与特征提取的数据相结合,经过预测模型算出其损失函数值,其损失函数值越趋于平稳其预测效果越好,同时通过图像观察真实值与预测值之间得差距判断模型效果是否准确。
[0067]
实施方式七:
[0068]
本实施方式是对具体实施方式一的所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法的进一步限定,
[0069]
步骤六中利用复原评价指标对测井曲线重构结果进行可视化评估的方法为:
[0070]
通过平均绝对误差(meanabsolute error,mae),平均绝对百分比误差(mean absolute percentage error,mape),均方根误差(root mean square error,rmse)来判断模型的预测性能,皮尔逊相关系数(pccs)来判断复原曲线的贴合程度。其中,mae可以描述预测值和实际测量值之间的平均差异,rmse表示模型的预测与实际对数之间的标准差,mape利用百分比来表示准确性误差,pccs可以描述测井的预测和实际测量之间的线性依赖关系。在这些指标中,mae、rmse和mape的值越小,模型的预测性能越好,pccs的值越接近1,模型的预测效果越好。通过rmse、mae、mape、pccs进行综合定量评价,
[0071]
计算公式如下:
[0072][0073][0074][0075][0076]
其中,n为测井曲线中的点数,χ为测量数据,为χ的均值,χ'为预测数据,为χ'的均值。
[0077]
为了验证本发明方法的有效性,采用中国大庆油田金区的10口井的测井数据作为研究对象,对所提出的测井曲线重构方法进行了方法验证。实验结果表明,本发明方法即使在高度复杂异质性的储层结构下,预测出的测井曲线基本可以捕获到原始数据的变化趋势,这对于后续的地质应用及油气勘探提供了非常有价值的信息。
[0078]
测井曲线选择上,选取声波时差测井曲线ac、自然伽马测井曲线gr和深侧向电阻率测井曲线lld等6条常规测井曲线进行多尺度局部二值模式lbp纹理特征提取,图2给出了特征提取后的结果与原数据对比示例图。
[0079]
本发明针对没有充分考虑储层非均质地质变化造成的测井曲线本质关联关系的变化情况,进而造成局部过拟合及全局欠拟合的问题,通过提出了一种基于改进gan网络与多尺度纹理特征的测井曲线重构方法。很好的捕捉了不同曲线之间以及曲线上下文之间的非线性关系,同时,为了更好的挖掘出测井曲线之间的非线性关系,对测并曲线数据进行多尺度lbp特征提取,利用集成机器学习模型实现精准的测井曲线重构。为此,本发明所述方
法通过搭建一个gan网络,将长短期记忆网络lstm构成生成器,卷积神经网络cnn构成判别器,并用损失函数rmse进行生成器约束。经过大量的实验与模型优化,在保持高相关性的同时,还可以提高离散数据重构模型的泛化能力,该方法可以扩展到其他区域油井的预测问题上,因为训练过的预测模型通过调整超参数,可以用来生成任何有用区域的测井数据。测井数据的精确预测使地质工程师能够更好地了解地层的物理属性,改进钻井和完井策略的设计,从而降低油气开发的成本和生产力,为油气勘探的后续进程提供了有力的数据保证。
[0080]
本发明方法在更好的挖掘出测井曲线之间的非线性关系同时,还利用长短期记忆网络lstm与卷积神经网络cnn各自的优势,来处理离散的时序数据,适合测井数据的生成问题。具体来说,通过长短期记忆网络lstm做为生成器,不仅可以很好的捕捉不同曲线之间以及曲线上下文之间的非线性关系,还可以提高离散数据重构模型的泛化能力。而选取卷积神经网络cnn作为判别器,可以更好的捕捉生成数据与真实数据之间的分布差异,使模型的收敛速度更快。与其他常用的预测方法相比,本发明方法有更好的重构效果,同时泛化能力更好、精度更高。
[0081]
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所给出的技术范围内,可理解想到的变换或替换,都应该涵盖在本发明的权利要求书的保护范围之内。

技术特征:
1.一种基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,它包括如下步骤:步骤一:采用平均替代法和散点图可视化法丢弃测井数据中离群值和噪声信息并对数据进行标准化和规范化;步骤二:通过对每条测井曲线进行纵向上局部多尺度纹理特征提取,实现多测井曲线间的结构不变性特征提取;步骤三:采用三层长短期记忆网络lstm(long short-term memory)和两层卷积神经网络cnn(convolutional neural networks)分别作为生成对抗网络模型中的生成器和判别器;步骤四:通过逐步的迭代训练,最大化判别器的目标函数和最小化生成器的目标函数来更新判别器和生成器的相关参数;步骤五:将原始输入曲线和其对应的lbp特征输入到训练好的生成对抗网络模型中,对缺失的测井曲线进行重构;步骤六:利用复原评价指标对测井曲线重构结果进行可视化评估。2.根据权利要求1所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,步骤一中对测井数据进行离群值与噪声值的剔除,同时补充缺失的值的方法为:式中,val表示补充的缺失值,r表示要补充的位置,k表示选取数据的个数。3.根据权利要求1所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,步骤二中多尺度lbp纹理特征提取方法为:对于第i条曲线的第j个测井点,它的水平方向梯度g
x
(i,j)和垂直方向梯度g
y
(i,j)分别为:g
x
(i,j)=x(i+1,j)-x(i-1,j)g
y
(i,j)=x(i,j+1)-x(i,j-1)则测井点x(i,j)处的梯度幅值g(i,j)和梯度方向α(i,j)分别为:则测井点x(i,j)处的梯度幅值g(i,j)和梯度方向α(i,j)分别为:对于给定的某条曲线进行不同尺度下的编码求和,得到的局部多尺度lbp纹理特征计算公式如下:dim=2
n
,(n∈[0,7],n∈z
+
)式中,lbp(x
i
,j)为局部多尺度lbp纹理特征,code
m
为编码值,dim代表不同的尺度;其编码规则如下:code1和code2利用曲线的均值x
mean
和中值x
medi
进行编码:
code3和code4分别利用曲线的局部峰值和进行编码:进行编码:code5、code6和code7分别利用曲线的梯度方向α(i)进行编码:code5、code6和code7分别利用曲线的梯度方向α(i)进行编码:code5、code6和code7分别利用曲线的梯度方向α(i)进行编码:code0=0。4.根据权利要求1所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,步骤三中生成对抗网络模型的搭建方法为:采用长短期记忆网络lstm作为生成对抗网络(generative adversarial network,gan)模型中的生成器,lstm的运算过程如下所示:h
t
=σ[w
o
(h
t-1
,x
t
)+b
o
]f(t)=σ[w
f
(h
t-1
,x
t
)+b
f
]g
t
=σ[w
i
(h
t-1
,x
t
)+b
i
]o
t
=σ[w
i
(h
t-1
,x
t
)+b
i
]式中,h
t
为短期的状态,为输入门输出的候选值,f(t)为遗忘门,g
t
为输入门,o
t
为输出门,σ为sigmoid激活函数,tanh为双曲正切激活函数,x
t
为当前时刻的样本输入,w
f
、w
i

w
c
、w
o
为权重矩阵,b
f
、b
i
、b
c
、b
o
为参数矩阵;某时刻的数据输入后,对前一个的单元状态c
t-1
进行更新,产生了当前的单元状态c
t
和最终的输出为:p
t
=o
t
×
tanh(c
t
)式中,i
t
为输入门,c
t
为当前的单元状态,c
t-1
为前一个的单元状态,p
t
为生成器的最终的输出;采用卷积神经网络cnn作为判别器,将生成器的输出作为卷积层的输入:式中,y
i
表示卷积后提取的生成数据与真实数据的内部特征,表示为卷积操作,σ为激活函数,ω为权重,b为偏置。5.根据权利要求1所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,步骤四中的迭代训练,更新判别器和生成器的相关参数方法为:将生成对抗网络的目标函数设为:f(d)=p
data
(x)logd(x)+p
g
(x)log(1-d(x))式中,f(d)表示gan的目标函数,p
data
(x)表示真实数据分布,d(x)表示判别器判断真实图片是否真实的概率,p
g
(x)表示生成数据分布;训练判别器,更新判别器的相关参数,使鉴别器的目标函数θ
d
最大化:式中,表示判别器的损失函数,θ
d
表示判别器的目标函数,m表示样本个数,x表示真实数据,表示生成器生成的假数据;训练生成器,更新生成器的相关参数,使生成器的目标函数θ
g
最小化,将生成器的损失函数调整为:式中,表示生成器的损失函数,m表示样本个数,θ
g
表示生成器的目标函数,z
i
表示噪声样本,g(z
i
)表示噪声样本输入生成器后得到了生成样本。6.根据权利要求1所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,步骤五中对缺失的测井曲线进行重构方法为:将原始输入曲线和其对应的lbp特征输入到训练好的生成对抗网络模型中,经过预测模型算出其损失函数值,其损失函数值越趋于平稳其预测效果越好。7.根据权利要求1所述的基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,其特征在于,步骤六中对重构效果进行评估的评价指标为平均绝对误差(mean absolute error,mae),平均绝对百分比误差(mean absolute percentage error,mape),均方根误差(root mean square error,rmse)和皮尔逊相关系数(pccs),计算公式如下:
其中,n为测井曲线中的点数,y为测量数据,为y的均值,y

为预测数据,为y

的均值。

技术总结
本发明提出一种测井曲线重构方法,具体是涉及一种基于改进生成对抗网络与多尺度纹理特征的测井曲线重构方法,主要是为了解决在实际测井勘探工程中,由于井壁垮塌、仪器故障、成本限制等因素造成的部分测井数据失真或缺失的问题。该方法是通过搭建一个GAN网络,并对测井曲线进行局部多尺度LBP纹理特征的提取,在实现测井曲线复原的同时,将测井曲线局部多尺度LBP纹理特征嵌入到测井曲线重构的机器学习模型中,从而对失真或缺失井段的测井数据进行校正或重构,不仅增加了测井解释的准确性,还大大增强了泛化能力和预测精度。大大增强了泛化能力和预测精度。大大增强了泛化能力和预测精度。


技术研发人员:韩建 邓宇 姜晓岚 全星慧 牟海维 曹志民
受保护的技术使用者:东北石油大学三亚海洋油气研究院
技术研发日:2023.04.04
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文