一种页岩气产能主控因素量化分析方法及电子设备与流程

未命名 08-05 阅读:85 评论:0


1.本发明属于页岩气勘探开发技术领域,更具体地,涉及一种页岩气产能主控因素量化分析方法及电子设备。


背景技术:

2.页岩气在世界范围内储量丰富,是一种重要的战略资源,推动页岩气勘探开发对于保障能源安全、改善能源结构、助力“碳达峰,碳中和”等具有重大战略意义。产能是页岩气资源开发潜力的综合体现,同时受到地质条件、工程措施、生产制度等多因素耦合影响,不同因素与产能之间关系十分复杂。量化分析产能的主控因素并确定各因素影响范围,对于优化页岩气勘探开发、提升资源利用效率具有重要意义。
3.现有技术中通常通过绘制产能与各单一因素的散点交汇图,观察趋势或拟合曲线来研究各因素对产能影响。这类方法操作简单,视觉直观,但是偏向定性分析,对于现象的解读受主观因素影响较大,且无法区分多重因数的影响和互动效应,因此会产生非常局限性和误导性的认知。另一种常见方法是,通过计算pearson、spearman等相关性系数,根据相关性系数大小来评价影响产能的主控因素及其权重。这类方法虽然能给出半定量计算结果作为参考,但是只能考虑单因素对产能的影响,无法衡量复杂多因素的耦合效应。因此分析结果并不精确,局限性较大,而且通过不同方法得到的结论会出现相互矛盾的现象。由于现有主控因素分析方法无法给出精确的定量分析结果,难以为分析结论提供有力支撑,导致了对产能主控因素及其变化规律认识不清,且缺乏精确量化表征。针对这些问题,尚未提出有效的解决方案。
4.因此,期待发明一种页岩气产能主控因素量化分析方法,能够解决现有技术中对于产能主控因素及其变化规律认识不清,且缺乏精确量化表征的问题。


技术实现要素:

5.本发明的目的是提出一种页岩气产能主控因素量化分析方法,以解决现有技术中对于产能主控因素及其变化规律认识不清,且缺乏精确量化表征的问题。
6.为了实现上述目的,本发明提供一种页岩气产能主控因素量化分析方法,包括:
7.获取多个单井对应的数据集(x,y),其中,x为多个单井对应的地质、工程数据集,y为多个单井对应的产能表征数据集;
8.从所述多个单井对应的数据集(x,y)中提取预设比例的数据作为训练数据集(x1,y1),并从所述数据集(x,y)中提取剩余比例的数据作为测试数据集(x2,y2);
9.基于所述训练数据集(x1,y1)和所述测试数据集(x2,y2),应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型;
10.基于所述机器学习模型,应用shap分析方法得到shap值函数和shap交互值函数;
11.基于所述多个单井对应的地质工程数据集x、所述shap值函数和所述shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、
产能随地质工程参数的变化规律以及影响产能差异性对应的参数。
12.可选地,所述基于所述训练数据集(x1,y1)和所述测试数据集(x2,y2),应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型包括:
13.建立所述集合决策树机器学习模型框架f(x,ξ,θ),其中,f表征所述地质工程参数和所述产能之间的映射关系,x=(x1,

,xm),且表征m个地质工程参数,ξ表征通过训练更新的模型参数,θ表征控制模型结构的超参数;
14.确定所述超参数θ,并基于所述超参数θ,确定最优模型框架f
*
(x,ξ,θ);
15.将所述训练数据集(x1,y1)中的输入训练数据集x1输入到所述最优模型框架f
*
(x,ξ,θ)中以对所述最优模型框架f
*
(x,ξ,θ)进行训练,得到输出训练预测集y3,根据优化目标函数更新所述模型参数ξ,从而得到表征所述地质工程参数和所述产能之间映射关系的所述机器学习模型;
16.将所述测试数据集(x2,y2)中的输入测试数据集x2输入到所述机器学习模型中,得到输出测试预测集y4,根据决定系数函数确定所述机器学习模型是否达到预期精度。
17.可选地,所述优化目标函数为
[0018][0019]
其中,oov为优化目标函数,y
3i
为所述输出训练预测集y3中的数据,y
1i
为所述输出训练数据集y1中的数据,即真实产能数据,表征模型复杂度,n1为所述训练数据集(x1,y1)中包含的单井个数。
[0020]
所述决定系数函数为
[0021][0022]
其中r2为决定系数函数,y
4i
为所述输出测试预测集y4中的数据,y
2i
为所述输出测试数据集y2中的数据,n2为所述测试数据集(x2,y2)中包含的单井个数。
[0023]
可选地,所述shap值函数为
[0024][0025]
所述shap交互值函数为
[0026][0027]
其中,
[0028]
φi为每个参数对应数据集{xi}的shap值,φ
j,k
为每个参数对应数据集{xj}的shap
交互值且j≠k,为所述地质工程数据集x中排除一个参数对应数据集{xi}的任意数据子集,|s|为该数据子集中的所述地质工程参数个数,m为所述地质工程数据集x中的所述地质工程参数个数。
[0029]
可选地,所述基于多个单井对应的地质工程数据集x、所述shap值函数和所述shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能的参数的差异性包括:
[0030]
从所述多个单井对应的地质工程数据集x中分别提取每个单井对应的数据集xi和每个参数对应的数据集xj;
[0031]
基于所述每个单井对应的数据集xi和所述每个参数对应的数据集xj,依次应用所述shap值函数和总量化表征函数,得到每个参数对产能影响的总量化表征数值,从而得到产能主控因素排序;
[0032]
从所述多个单井对应的地质工程数据集x中选取每两个参数对应的数据集,并依次应用所述shap交互值函数和shap主效应函数,得到在剔除其他参数干扰情况下,每个参数对产能影响的数值,从而得到产能随地质工程参数的变化规律;
[0033]
从每个所述单井对应的数据集xi中提取每个参数对应的数据集,并依次应用所述shap值函数和shap可加性函数,得到每个单井中每个参数对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数。
[0034]
可选地,所述从所述多个单井对应的地质工程数据集x中分别提取每个单井对应的数据集xi和每个参数对应的数据集xj包括:
[0035]
从所述多个单井对应的地质工程数据集x中提取每个单井对应的数据集xi,其中,x={x1,

,xi,

,xn}且xi为所述多个单井对应的地质工程数据集x中第i个单井对应的数据集,n为单井个数,且为第i个单井对应的数据集xi中第α个参数对应的数据;
[0036]
从所述多个单井对应的地质工程数据集x中提取每个参数对应的数据集xj,其中,且为第j个参数对应的数据集xj中第i个单井对应的数据。
[0037]
可选地,所述基于所述每个单井对应的数据集xi和所述每个参数对应的数据集xj,依次应用所述shap值函数和总量化表征函数,得到每个参数对产能影响的总量化表征数值,从而得到产能主控因素排序包括:
[0038]
将所述每个参数对应的数据集xj代入所述shap值函数,得到每个参数对应的shap值数据集
[0039]
基于所述每个单井对应的数据集xi,应用所述总量化表征函数得到每个参数对产能影响的总量化表征数值集{φ1,

,φm},其中,所述总量化表征函数为:
[0040][0041]
φj为第j个参数对产能影响的总量化表征值,n为单井个数,为所述shap值数据集中第i个所述shap值;
[0042]
对每个参数对产能影响的总量化表征数值集{φ1,

,φm}进行排序,得到产能主控因素排序。
[0043]
可选地,所述从所述多个单井对应的地质工程数据集x中选取每两个参数对应的数据集,并依次应用所述shap交互值函数和shap主效应函数,得到在剔除其他参数干扰情况下,每个参数对产能影响的数值,从而得到产能随地质工程参数的变化规律包括:
[0044]
从所述多个单井对应的地质工程数据集x中选取每两个参数对应的数据集{(xj,xk)};
[0045]
基于每两个参数对应的数据集{(xj,xk)},应用所述shap交互值函数得到第j个参数对应数据集xj与第k个参数对应数据集xk的shap交互值φ
j,k

[0046]
基于所述shap交互值φ
j,k
,应用所述shap主效应函数得到每个参数对产能影响的数值,所述shap主效应函数为:
[0047][0048]
其中,φ
j,j
为第j个参数对应的shap主效应值,φj为第j个参数对应的shap值;
[0049]
将所有单井对应的数据集x代入所述shap主效应函数中,得到数据集从而得到产能随地质工程参数的变化规律,其中,
[0050]
可选地,所述从每个所述单井对应的数据集xi中提取每个参数对应的数据集,并依次应用所述shap值函数和shap可加性函数,得到对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数包括:
[0051]
对于所述每个单井对应的数据集xi,应用所述shap值函数得到每个所述地质工程参数对应的shap值数据集
[0052]
将所述shap值数据集代入所述shap可加性函数中,得到每个单井中每个参数对产能影响的shap值矩阵,其中,所述shap可加性函数为:
[0053][0054]
其中,其中,为第i个单井对应的预测产能,,yi为第i个单井对应的真实产能,为第i个单井的第j个参数对应的shap值;
[0055]
基于每个单井中每个参数对产能影响的数值,得到对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数。
[0056]
一种电子设备,所述电子设备包括:
[0057]
存储器,存储有可执行指令;
[0058]
处理器,所述处理器运行所述存储器中的所述可执行指令,以实现所述的页岩气产能主控因素量化分析方法。
[0059]
本发明的有益效果在于:
[0060]
本发明的页岩气产能主控因素量化分析方法首先获取多个单井对应的数据集,然
后建立机器学习模型,最后基于机器学习模型,引入博弈论shap分析理论,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能差异性对应的参数;本发明的页岩气产能主控因素量化分析方法能够根据页岩气勘探开发和生产数据,精确评估各地质工程参数对产能影响,实现对产能主控因素的合理排序,对产能变化规律的量化分析,对单井产能差异性的定量表征。这些信息可以大大加深对页岩气勘探开发规律的认识,为今后的勘探开发方案设计优化,提供精细化、定量化的理论基础和科学依据,有效解决了现有技术中对于产能主控因素及其变化规律认识不清,且缺乏精确量化表征的问题。
[0061]
本发明的其它特征和优点将在随后具体实施方式部分予以详细说明。
附图说明
[0062]
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
[0063]
图1示出了根据本发明的一个实施例的一种页岩气产能主控因素量化分析方法的流程图。
[0064]
图2示出了根据本发明的一个实施例的一种页岩气产能主控因素量化分析方法的某页岩气区块产能主控因素排序图。
[0065]
图3示出了根据本发明的一个实施例的一种页岩气产能主控因素量化分析方法的某页岩气区块无阻流量和破裂压力的散点交汇图。
[0066]
图4示出了根据本发明的一个实施例的一种页岩气产能主控因素量化分析方法的某页岩气区块无阻流量在破裂压力单因素影响下的shap主效应值变化曲线图。
[0067]
图5示出了根据本发明的一个实施例的一种页岩气产能主控因素量化分析方法的某页岩气区块中某两口单井分析对比图。
具体实施方式
[0068]
下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
[0069]
根据本发明的一种页岩气产能主控因素量化分析方法,包括:
[0070]
获取多个单井对应的数据集(x,y),其中,x为多个单井对应的地质、工程数据集,y为多个单井对应的产能表征数据集;
[0071]
从多个单井对应的数据集(x,y)中提取预设比例的数据作为训练数据集(x1,y1),并从数据集(x,y)中提取剩余比例的数据作为测试数据集(x2,y2);
[0072]
基于训练数据集(x1,y1)和测试数据集(x2,y2),应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型;
[0073]
基于机器学习模型,应用shap分析方法得到shap值函数和shap交互值函数;
[0074]
基于多个单井对应的地质工程数据集x、shap值函数和shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、产能随地质工程
参数的变化规律以及影响产能差异性对应的参数。
[0075]
具体地,本发明的页岩气产能主控因素量化分析方法首先获取多个单井对应的数据集,然后建立机器学习模型,最后基于机器学习模型,引入博弈论shap分析理论,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能差异性对应的参数;本发明的页岩气产能主控因素量化分析方法能够根据页岩气勘探开发和生产数据,精确评估各地质工程参数对产能影响,实现对产能主控因素的合理排序,对产能变化规律的量化分析,对单井产能差异性的定量表征。这些信息可以大大加深对页岩气勘探开发规律的认识,为今后的勘探开发方案设计优化,提供精细化、定量化的理论基础和科学依据,有效解决了现有技术中对于产能主控因素及其变化规律认识不清,且缺乏精确量化表征的问题。
[0076]
进一步地,与传统分析方法相比,本发明从真实数据角度出发进行定量计算,分析结论更加科学、严谨、客观、透明。另一方面,本发明无需人为干预,可以高效、快捷地进行批量分析,具有较高的落地推广可行性。
[0077]
进一步地,获取多个单井对应的数据集(x,y)之前包括:获取多个单井对应的历史数据集(x

,y

),具体包括:收集与页岩气勘探开发相关的参数,包括但不限于埋深、地层压力系数、孔隙度、含气量等地质参数,以及试气段长、段数、簇数、加砂强度、用液强度等工程参数。收集生产数据作为表征页岩气产能的指标,通常包括无阻流量、最高测试产量、累计产量、技术可采储量等;对多个单井对应的历史数据集(x

,y

)进行清洗,具体包括:首先剔除缺失数据。然后针对每类地质、工程参数,基于数据分布和离群值分析算法剔除离群数据点。计算各参数两两间的pearson、spearman等相关性系数,剔除相关性较强的重复参数。最后,建立包含完整地质工程参数和产能表征数据的高质量数据集。
[0078]
在一个示例中,基于训练数据集(x1,y1)和测试数据集(x2,y2),应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型包括:
[0079]
建立集合决策树机器学习模型框架f(x,ξ,θ),其中,f表征地质工程参数和产能之间的映射关系,x=(x1,

,xm),且表征m个地质工程参数,ξ表征通过训练更新的模型参数;θ表征控制模型结构的超参数;
[0080]
确定超参数θ,并基于超参数θ,确定最优模型框架f
*
(x,ξ,θ);
[0081]
将训练数据集(x1,y1)中的输入训练数据集x1输入到最优模型框架f
*
(x,ξ,θ)中以对最优模型框架f
*
(x,ξ,θ)进行训练,得到输出训练预测集y3,根据优化目标函数更新模型参数ξ,从而得到表征地质工程参数和产能之间映射关系的机器学习模型;
[0082]
将测试数据集(x2,y2)中的输入测试数据集x2输入到机器学习模型中,得到输出测试预测集y4,根据决定系数函数确定机器学习模型是否达到预期精度。
[0083]
具体地,集合决策树机器学习模型框架f(x,ξ,θ)为随机森林、梯度提升决策树和极致梯度提升中的一个,在实际应用中,集合决策树机器学习模型框架f(x,ξ,θ)包括但不限于随机森林、梯度提升决策树和极致梯度提升。
[0084]
进一步地,初步确定超参数θ的分布范围,如决策树个数、决策树深度、最大叶子结点个数等模型结构超参数,以及学习率、最大迭代次数等模型训练超参数。结合交叉检验和随机搜索(算法,在分布范围内搜索得到最优超参数组合,从而确定最优模型框架f
*
(x,ξ,θ)。
[0085]
在一个示例中,优化目标函数为
[0086][0087]
其中,oov为优化目标函数,y
3i
为输出训练预测集y3中的数据,y
1i
为输出训练数据集y1中的数据,即真实产能数据,表征模型复杂度,n1为训练数据集(x1,y1)中包含的单井个数。
[0088]
决定系数函数为
[0089][0090]
其中r2为决定系数函数,y
4i
为输出测试预测集y4中的数据,y
2i
为输出测试数据集y2中的数据,n2为测试数据集(x2,y2)中包含的单井个数。
[0091]
在一个示例中,shap值函数为
[0092][0093]
shap交互值函数为
[0094][0095]
其中,
[0096]
φi为每个参数对应数据集{xi}的shap值,φ
j,k
为每个参数对应数据集{xj}的shap交互值且j≠k,为地质工程数据集x中排除一个参数对应数据集{xi}的任意数据子集,|s|为该数据子集中的地质工程参数个数,m为地质工程数据集x中的地质工程参数个数。
[0097]
具体地,在实际应用中,为提高计算效率,针对树模型问题使用shap方法进行近似计算。
[0098]
在一个示例中,基于多个单井对应的地质工程数据集x、shap值函数和shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能的参数的差异性包括:
[0099]
从多个单井对应的地质工程数据集x中分别提取每个单井对应的数据集xi和每个参数对应的数据集xj;
[0100]
基于每个单井对应的数据集xi和每个参数对应的数据集xj,依次应用shap值函数和总量化表征函数,得到每个参数对产能影响的总量化表征数值,从而得到产能主控因素排序;
[0101]
从多个单井对应的地质工程数据集x中选取每两个参数对应的数据集,并依次应用shap交互值函数和shap主效应函数,得到在剔除其他参数干扰情况下,每个参数对产能
影响的数值,从而得到产能随地质工程参数的变化规律;
[0102]
从每个单井对应的数据集xi中提取每个参数对应的数据集,并依次应用shap值函数和第二shap可加性函数,得到每个单井中每个参数对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数。
[0103]
在一个示例中,从多个单井对应的地质工程数据集x中分别提取每个单井对应的数据集xi和每个参数对应的数据集xj包括:
[0104]
从多个单井对应的地质工程数据集x中提取每个单井对应的数据集xi,其中,x={x1,

,xi,

,xn}且xi为多个单井对应的地质工程数据集x中第i个单井对应的数据集,n为单井个数,且为第i个单井对应的数据集xi中第α个参数对应的数据;
[0105]
从多个单井对应的地质工程数据集x中提取每个参数对应的数据集xj,其中,且为第j个参数对应的数据集xj中第i个单井对应的数据。
[0106]
在一个示例中,基于每个单井对应的数据集xi和每个参数对应的数据集xj,并依次应用shap值函数和总量化表征函数,得到每个参数对产能影响的总量化表征数值,从而得到产能主控因素排序包括:
[0107]
将每个参数对应的数据集xj代入shap值函数,得到每个参数对应的shap值数据集
[0108]
基于每个单井对应的数据集xi,应用总量化表征函数得到每个参数对产能影响的总量化表征数值集{φ1,

,φm},其中,总量化表征函数为:
[0109][0110]
φj为第j个参数对产能影响的总量化表征值,n为单井个数,为shap值数据集中第i个所述shap值;
[0111]
对每个参数对产能影响的总量化表征数值集{φ1,

,φm}进行排序,得到产能主控因素排序。
[0112]
在一个示例中,从多个单井对应的地质工程数据集x中选取每两个参数对应的数据集,并依次应用shap交互值函数和shap主效应函数,得到在剔除其他参数干扰情况下,每个参数对产能影响的数值,从而得到产能随地质工程参数的变化规律包括:
[0113]
从多个单井对应的地质工程数据集x中选取每两个参数对应的数据集{(xj,xk)};
[0114]
基于每两个参数对应的数据集{(xj,xk)},应用shap交互值函数得到第j个参数对应数据集xj与第k个参数对应数据集xk的shap交互值φ
j,k

[0115]
基于shap交互值φ
j,k
,应用shap主效应函数得到每个参数对产能影响的数值,shap主效应函数为:
[0116][0117]
其中,φ
j,j
为第j个参数对应的shap主效应值,φj为第j个参数对应的shap值;
[0118]
将所有单井对应的数据集x代入所述shap主效应函数中,得到数据集从而得到产能随地质工程参数的变化规律,其中,
[0119]
具体地,shap主效应函数以具体数值的形式反映参数xj在剔除其他参数干扰的情况下,对产能产生的定量影响;而根据得到的数据集绘制产能随参数xj的变化曲线,量化表征产能在该参数影响下的变化规律。
[0120]
在一个示例中,从每个单井对应的数据集xi中提取每个参数对应的数据集,并依次应用shap值函数和shap可加性函数,得到对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数包括:
[0121]
对于每个单井对应的数据集xi,应用shap值函数得到每个地质工程参数对应的shap值数据集
[0122]
将shap值数据集代入shap可加性函数中,得到每个单井中每个参数对产能影响的shap值矩阵,其中,shap可加性函数为:
[0123][0124]
其中,其中,为第i个单井对应的预测产能,yi为第i个单井对应的真实产能,为第i个单井的第j个参数对应的shap值;
[0125]
基于每个单井中每个参数对产能影响的数值,得到对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数。
[0126]
具体地,通过shap可加性函数可以直接表征该单井中的有利因素给产能带来的提升量,以及不利因素给产能造成的下降量。对所有单井进行运算,得到n
×
m大小的shap值矩阵。该矩阵中每行对应每口单井,每列对应每一地质工程参数。任意抽出某两行,即可对比某两口井的产能量化分析结果,从而定位到产能差异性来源对应的具体地质工程参数,并给出定量表征。
[0127]
一种电子设备,所述电子设备包括:
[0128]
存储器,存储有可执行指令;
[0129]
处理器,处理器运行所述存储器中的所述可执行指令,以实现所述的页岩气产能主控因素量化分析方法。
[0130]
实施例1
[0131]
如图1所示,一种页岩气产能主控因素量化分析方法,包括:
[0132]
步骤1:获取多个单井对应的数据集(x,y),其中,x为多个单井对应的地质、工程数据集,y为多个单井对应的产能表征数据集;
[0133]
步骤2:从多个单井对应的数据集(x,y)中提取预设比例的数据作为训练数据集(x1,y1),并从数据集(x,y)中提取剩余比例的数据作为测试数据集(x2,y2);
[0134]
步骤3:基于训练数据集(x1,y1)和测试数据集(x2,y2),应用集合决策树机器学习
模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型;
[0135]
步骤4:基于机器学习模型,应用shap分析方法得到shap值函数和shap交互值函数;
[0136]
步骤5:基于多个单井对应的地质工程数据集x、shap值函数和shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能差异性对应的参数。
[0137]
具体实施方式为:
[0138]
以某页岩气区块为例,基于该区块勘探开发和生产数据,量化分析影响产能的主控因素。
[0139]
按照本发明实施流程,首先收集该区块内各页岩气水平井数据,形成多个单井对应的数据集,包括地层压力、埋深、含气量等地质参数,试气长度、用液强度、加砂强度等工程参数,以及无阻流量、技术可采储量、累计产量等生产数据。剔除缺失值、离群值,并开展相关性分析后剔除重复数据,最终筛选出181口单井,10个地质工程参数,并选用无阻流量作为产能表征指标。整理形成数据集,部分内容如表1所示,表1为某页岩气区块收集整理的水平井地质、工程和生产数据。
[0140]
表1
[0141][0142]
构建xgboost机器学习模型,随机划分出145口单井数据用于训练,其余36口单井用于测试。训练后的模型平均测试精度保持在75%以上。基于机器学习模型进行shap分析,计算各参数对应shap值。
[0143]
应用本发明的页岩气产能主控因素量化分析方法进行产能主控因素排序,该区块分析结果如附图2所示,纵向表示各参数影响程度由高到低排序,横向表示各参数基于无阻流量计算的shap值。图2中某一参数对应的点横向散布越广,表明该参数对产能的影响范围越大。其中某一点的横坐标shap值代表该参数对某口单井产能影响的具体大小,根据该数值的分布情况对各主控因素进行排序。该排序有精确的计算结果支撑,与现场认识符合程度高,验证了该发明方法的可信度与可行性。
[0144]
应用本发明的页岩气产能主控因素量化分析方法进行产能变化规律量化分析,以该区块无阻流量随破裂压力的变化规律为例进行展示。附图3展示了传统交汇图分析结果,该方法数据点分布混乱,只能进行模糊的定性分析。附图4展示了本发明的页岩气产能主控因素量化分析方法的分析结果,该方法通过精确的定量分析,得到了清晰明确的无阻流量随破裂压力的变化曲线。针对该曲线可进一步总结多种量化规律,具有重要指导意义。
[0145]
应用本发明方法进行单井产能差异性定量表征,以该区块某两口水平井为例进行展示,结果如附图5所示。根据分析结果,可直接定位出对单井产能提升有利的地质工程因素,以及可能造成单井产能下降的不利因素。对比这两口井分析结果,可以快速找到造成它们产能差异的主要地质工程原因。同时可以进一步针对甜点区低产井、非甜点区高产井等
情况开展分析,具有很强的可拓展性。
[0146]
实施例2
[0147]
本公开提供一种电子设备包括,该电子设备包括:存储器,存储有可执行指令;处理器,处理器运行存储器中的可执行指令,以实现上述一种页岩气产能主控因素量化分析方法。
[0148]
根据本公开实施例的电子设备包括存储器和处理器。
[0149]
该存储器用于存储非暂时性计算机可读指令。具体地,存储器可以包括一个或多个计算机程序产品,该计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。
[0150]
该处理器可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中,该处理器用于运行该存储器中存储的该计算机可读指令。
[0151]
本领域技术人员应能理解,为了解决如何获得良好用户体验效果的技术问题,本实施例中也可以包括诸如通信总线、接口等公知的结构,这些公知的结构也应包含在本公开的保护范围之内。
[0152]
有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
[0153]
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

技术特征:
1.一种页岩气产能主控因素量化分析方法,其特征在于,包括:获取多个单井对应的数据集(x,y),其中,x为多个单井对应的地质、工程数据集,y为多个单井对应的产能表征数据集;从所述多个单井对应的数据集(x,y)中提取预设比例的数据作为训练数据集(x1,y1),并从所述数据集(x,y)中提取剩余比例的数据作为测试数据集(x2,y2);基于所述训练数据集(x1,y1)和所述测试数据集(x2,y2),应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型;基于所述机器学习模型,应用shap分析方法得到shap值函数和shap交互值函数;基于所述多个单井对应的地质工程数据集x、所述shap值函数和所述shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能差异性对应的参数。2.根据权利要求1所述的页岩气产能主控因素量化分析方法,其特征在于,所述基于所述训练数据集(x1,y1)和所述测试数据集(x2,y2),应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型包括:建立所述集合决策树机器学习模型框架f(x,ξ,θ),其中,f表征所述地质工程参数和所述产能之间的映射关系,x=(x1,

,x
m
),且表征m个地质工程参数,ξ表征通过训练更新的模型参数,θ表征控制模型结构的超参数;确定所述超参数θ,并基于所述超参数θ,确定最优模型框架f
*
(x,ξ,θ);将所述训练数据集(x1,y1)中的输入训练数据集x1输入到所述最优模型框架f
*
(x,ξ,θ)中以对所述最优模型框架f
*
(x,ξ,θ)进行训练,得到输出训练预测集y3,根据优化目标函数更新所述模型参数ξ,从而得到表征所述地质工程参数和所述产能之间映射关系的所述机器学习模型;将所述测试数据集(x2,y2)中的输入测试数据集x2输入到所述机器学习模型中,得到输出测试预测集y4,根据决定系数函数确定所述机器学习模型是否达到预期精度。3.根据权利要求2所述的页岩气产能主控因素量化分析方法,其特征在于,所述优化目标函数为其中,oov为优化目标函数,y
3i
为所述输出训练预测集y3中的数据,y
1i
为所述输出训练数据集y1中的数据,即真实产能数据,表征模型复杂度,n1为所述训练数据集(x1,y1)中包含的单井个数。所述决定系数函数为
其中r2为决定系数函数,y
4i
为所述输出测试预测集y4中的数据,y
2i
为所述输出测试数据集y2中的数据,n2为所述测试数据集(x2,y2)中包含的单井个数。4.根据权利要求1所述的页岩气产能主控因素量化分析方法,其特征在于,所述shap值函数为所述shap交互值函数为其中,φ
i
为每个参数对应数据集{x
i
}的shap值,φ
j,k
为每个参数对应数据集{x
j
}的shap交互值且j≠k,为所述地质工程数据集x中排除一个参数对应数据集{x
i
}的任意数据子集,|s|为该数据子集中的所述地质工程参数个数,m为所述地质工程数据集x中的所述地质工程参数个数。5.根据权利要求4所述的页岩气产能主控因素量化分析方法,其特征在于,所述基于多个单井对应的地质工程数据集x、所述shap值函数和所述shap交互值函数,应用总量化表征函数、shap主效应函数和shap可加性函数,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能的参数的差异性包括:从所述多个单井对应的地质工程数据集x中分别提取每个单井对应的数据集x
i
和每个参数对应的数据集x
j
;基于所述每个单井对应的数据集x
i
和所述每个参数对应的数据集x
j
,依次应用所述shap值函数和总量化表征函数,得到每个参数对产能影响的总量化表征数值,从而得到产能主控因素排序;从所述多个单井对应的地质工程数据集x中选取每两个参数对应的数据集,并依次应用所述shap交互值函数和shap主效应函数,得到在剔除其他参数干扰情况下,每个参数对产能影响的数值,从而得到产能随地质工程参数的变化规律;从每个所述单井对应的数据集x
i
中提取每个参数对应的数据集,并依次应用所述shap值函数和shap可加性函数,得到每个单井中每个参数对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数。6.根据权利要求5所述的页岩气产能主控因素量化分析方法,其特征在于,所述从所述多个单井对应的地质工程数据集x中分别提取每个单井对应的数据集x
i
和每个参数对应的数据集x
j
包括:从所述多个单井对应的地质工程数据集x中提取每个单井对应的数据集x
i
,其中,x={x1,

,x
i
,

,x
n
}且x
i
为所述多个单井对应的地质工程数据集x中第i个单井对应的数据集,n为单井个数,且为第i个单井对应的数据集x
i
中第α个参数对应的数据;
从所述多个单井对应的地质工程数据集x中提取每个参数对应的数据集x
j
,其中,且为第j个参数对应的数据集x
j
中第i个单井对应的数据。7.根据权利要求6所述的页岩气产能主控因素量化分析方法,其特征在于,所述基于所述每个单井对应的数据集x
i
和所述每个参数对应的数据集x
j
,依次应用所述shap值函数和总量化表征函数,得到每个参数对产能影响的总量化表征数值,从而得到产能主控因素排序包括:将所述每个参数对应的数据集x
j
代入所述shap值函数,得到每个参数对应的shap值数据集基于所述每个单井对应的数据集x
i
,应用所述总量化表征函数得到每个参数对产能影响的总量化表征数值集{φ1,


m
},其中,所述总量化表征函数为:φ
j
为第j个参数对产能影响的总量化表征值,n为单井个数,为所述shap值数据集中第i个所述shap值;对每个参数对产能影响的总量化表征数值集{φ1,


m
}进行排序,得到产能主控因素排序。8.根据权利要求5所述的页岩气产能主控因素量化分析方法,其特征在于,所述从所述多个单井对应的地质工程数据集x中选取每两个参数对应的数据集,并依次应用所述shap交互值函数和shap主效应函数,得到在剔除其他参数干扰情况下,每个参数对产能影响的数值,从而得到产能随地质工程参数的变化规律包括:从所述多个单井对应的地质工程数据集x中选取每两个参数对应的数据集{(x
j
,x
k
)};基于每两个参数对应的数据集{(x
j
,x
k
)},应用所述shap交互值函数得到第j个参数对应数据集x
j
与第k个参数对应数据集x
k
的shap交互值φ
j,k
;基于所述shap交互值φ
j,k
,应用所述shap主效应函数得到每个参数对产能影响的数值,所述shap主效应函数为:其中,φ
j,j
为第j个参数对应的shap主效应值,φ
j
为第j个参数对应的shap值;将所有单井对应的数据集x代入所述shap主效应函数中,得到数据集从而得到产能随地质工程参数的变化规律,其中,9.根据权利要求5所述的页岩气产能主控因素量化分析方法,其特征在于,所述从每个所述单井对应的数据集x
i
中提取每个参数对应的数据集,并依次应用所述shap值函数和shap可加性函数,得到对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数包括:对于所述每个单井对应的数据集x
i
,应用所述shap值函数得到每个所述地质工程参数对应的shap值数据集
将所述shap值数据集代入所述shap可加性函数中,得到每个单井中每个参数对产能影响的shap值矩阵,其中,所述shap可加性函数为:其中,其中,为第i个单井对应的预测产能,,y
i
为第i个单井对应的真实产能,为第i个单井的第j个参数对应的shap值;基于每个单井中每个参数对产能影响的数值,得到对产能影响的shap值矩阵,从而得到影响产能差异性对应的参数。10.一种电子设备,其特征在于,所述电子设备包括:存储器,存储有可执行指令;处理器,所述处理器运行所述存储器中的所述可执行指令,以实现根据权利要求1-9中任一项所述的页岩气产能主控因素量化分析方法。

技术总结
本发明公开了一种页岩气产能主控因素量化分析方法,包括:获取多个单井对应的数据集(X,Y);从多个单井对应的数据集(X,Y)中提取预设比例的数据作为训练数据集(X1,Y1),并从数据集(X,Y)中提取剩余比例的数据作为测试数据集(X2,Y2);应用集合决策树机器学习模型框架得到表征地质工程参数和产能之间映射关系的机器学习模型;应用SHAP分析方法得到SHAP值函数和SHAP交互值函数;应用总量化表征函数、SHAP主效应函数和SHAP可加性函数,得到产能主控因素排序、产能随地质工程参数的变化规律以及影响产能差异性对应的参数。本发明的页岩气产能主控因素量化分析方法为今后的勘探开发方案设计优化,提供精细化理论基础和科学依据。据。据。


技术研发人员:孟晋 周钰杰 叶天睿 肖倚天 韩萌 王惠勇 张宝森
受保护的技术使用者:中国石油化工股份有限公司石油勘探开发研究院
技术研发日:2022.01.25
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐