全波形反演梯度场归约方法、装置、介质及设备与流程

未命名 10-09 阅读:55 评论:0


1.本发明属于石油勘探应用领域中的地震成像技术,具体涉及一种全波形反演中多进程协作的梯度场归约方法、装置、介质及电子设备。


背景技术:

2.全波形反演(full waveform inversion,fwi)充分利用叠前地震波场中的运动学和动力学信息估计地球内部介质的弹性参数,是一种高精度速度建模的方法(virieux and operto,2009;刘国峰等,2012)和油藏描述的手段(王西文等,2013)。fwi计算涉及模型参数化、正演模拟、误差泛函构建、数据预处理、优化方法的选取、正则化约束、迭代终止条件、子波估计等多个计算步骤。需要反复多次迭代/循环反演计算,如图1所示。每次反演迭代包含计算梯度、线性搜索、梯度场归约、更新速度模型等计算。计算量巨大,通常需要依赖cpu/gpu异构高性能计算机集群的并行计算来实现。实际生产项目中,全波形反演往往需要在几十个集群节点上连续运行几周甚至几个月的时间。如何充分利用集群硬件资源,保证计算运行稳定性的同时,提高计算运行速度是目前急需研究解决的难题。
3.当前全波形反演计算性能优化主要采用mpi的方式,通过大规模异构并行优化,引入随机边界来反传、重建震源波场,充分发挥gpu的计算能力,从而实现反演梯度的高效计算,大幅减少了数据存储和数据交换的开销,具有计算效率高和存储量小的优点。这种技术的梯度场归约是跨节点运算,需要在集群各节点间做数据通信与数据归约,采用主从方式的通信环,由主进程收集处理其它从进程的梯度场,完成计算更新后,将更新结果广播给各从进程。使用mpi并行计算方式实现,指定某进程(rank)为主进程,该rank负责完成如上操作,其它rank被动等待主进程的计算结果(魏哲枫,朱成宏,陈业全,2017)。这种实现方式在大规模集群节点长时间运行时稳定性差,容错率低,单点故障会导致整个计算的失败。
[0004]“全波形反演计算方法及系统”专利号(cn107656307b):公开了一种全波形反演计算方法及系统。该方法可包括:基于所采集的地震资料,获取炮点数据,进而获取记录炮点数据的计算状态的并行状态文件,通过多个计算节点分布式并行计算炮点数据的全波形反演项目;对多个计算节点计算的全波形反演项目进行叠加,获得全波形反演项目结果;以及基于炮点数据的全波形反演项目结果更新速度模型,获得全波形反演模型,其中,对多个计算节点计算的全波形反演项目进行叠加包括:将多个计算节点分组,对每组内的计算节点计算的炮点数据的全波形反演项目进行叠加,获得叠加数据;在叠加数据的数量等于一的情况下,将获得的叠加数据作为炮点数据的全波形反演项目结果。
[0005]
综上,上述方法不能解决单点故障异常导致的全局计算失败问题。
[0006]
因此,需要研究一种方法能解决单点故障异常导致的全局计算失败问题。


技术实现要素:

[0007]
本发明的目的是提出一种能解决单点故障异常导致的全局计算失败问题的全波形反演中多进程协作的梯度场归约方法。
[0008]
本发明提供一种全波形反演中多进程协作的梯度场归约方法,包括:步骤1:初始化计算梯度场的令牌;步骤2:多个节点争抢所述令牌的控制权;步骤3:获得令牌控制权的节点作为主节点,其它节点作为从节点;步骤4:主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;步骤5:从节点未接收到任务完成指令时,根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常,当所述主节点出现异常时,返回步骤2。
[0009]
可选的,所述主节点向状态控制文件输入更新的计数具体包括:初始化所述状态控制文件,启动心跳计数线程;根据所述心跳计数线程的计数,向状态控制文件输入更新的计数。
[0010]
可选的,所述计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收所述从节点的梯度文件;根据所述梯度文件,计算并更新所述梯度场;向从节点发送更新后的梯度场及任务完成指令。
[0011]
可选的,所述从节点根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常具体包括:所述从节点获取每次状态控制文件更新计数的间隔时间;比较所述间隔时间与预设时间,当所述间隔时间大于或等于预设时间时,则主节点出现异常。
[0012]
可选的,所述从节点接收来自所述主节点的梯度收集操作指令后,将梯度文件发送至所述主节点,并接收来自所述主节点的更新后的梯度场及任务完成指令。
[0013]
本发明还提供一种电子设备,所述电子设备包括:存储器,存储有可执行指令;处理器,所述处理器运行所述存储器中的所述可执行指令,以实现上述全波形反演中多进程协作的梯度场归约方法。
[0014]
本发明还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述全波形反演中多进程协作的梯度场归约方法。
[0015]
本发明还提供一种全波形反演中多进程协作的梯度场归约装置,包括:令牌初始化模块,初始化计算梯度场的令牌;控制权获得模块,多个节点争抢所述令牌的控制权;节点分配模块,获得令牌控制权的节点作为主节点,其它节点作为从节点;梯度场计算更新模块,主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;主节点异常判断模块,从节点未接收到任务完成指令时,根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常,当所述主节点出现异常时,其它节点再次争抢所述令牌的控制权。
[0016]
可选的,所述主节点向状态控制文件输入更新的计数具体包括:初始化所述状态控制文件,启动心跳计数线程;根据所述心跳计数线程的计数,向状态控制文件输入更新的计数。
[0017]
可选的,所述计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收所述从节点的梯度文件;根据所述梯度文件,计算并更新所述梯度场;向从节点发送更新后的梯度场及任务完成指令。
[0018]
可选的,所述从节点根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常具体包括:所述从节点获取每次状态控制文件更新计数的间隔时间;比较所述间隔时间与预设时间,当所述间隔时间大于或等于预设时间时,则主节点出现异常。
[0019]
可选的,所述从节点接收来自所述主节点的梯度收集操作指令后,将梯度文件发
送至所述主节点,并接收来自所述主节点的更新后的梯度场及任务完成指令。
[0020]
本发明的有益效果在于:本发明的全波形反演中多进程协作的梯度场归约方法在主节点异常时,由从节点继续进行梯度场规约,解决了单点故障异常导致的全局计算失败问题,提高了大规模集群节点长时间运行时的稳定性和鲁棒性。
[0021]
本发明具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施例中将是显而易见的,或者将在并入本文中的附图和随后的具体实施例中进行详细陈述,这些附图和具体实施例共同用于解释本发明的特定原理。
附图说明
[0022]
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
[0023]
图1示出了根据本发明的一个实施例的一种全波形反演中多进程协作的梯度场归约方法的流程图。
[0024]
图2示出了根据本发明的一个实施例的一种全波形反演中多进程协作的梯度场归约方法的又一流程图。
[0025]
图3示出了根据本发明的一个实施例的一种全波形反演中多进程协作的梯度场归约装置的结构框图。
[0026]
附图标记说明
[0027]
102、令牌初始化模块;104、控制权获得模块;106、节点分配模块;108、梯度场计算更新模块;110、主节点异常判断模块。
具体实施方式
[0028]
下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。
[0029]
本发明提供一种全波形反演中多进程协作的梯度场归约方法,包括:步骤1:初始化计算梯度场的令牌;步骤2:多个节点争抢令牌的控制权;步骤3:获得令牌控制权的节点作为主节点,其它节点作为从节点;步骤4:主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;步骤5:从节点未接收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,返回步骤2。
[0030]
具体的,初始化计算梯度场的令牌,多个节点(进程)平等争抢“令牌”的控制权,抢到控制权的节点获得控制权,变为主节点,其它节点为从节点,主节点向状态控制文件输入更新的计数,计算、更新梯度场并输出任务完成指令,从节点等待接收更新的梯度场和任务完成指令,当没收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,其它从节点重新争抢令牌,确定新的主节点。
[0031]
根据示例性的实施方式,全波形反演中多进程协作的梯度场归约方法在主节点异常时,由从节点继续进行梯度场规约,解决了单点故障异常导致的全局计算失败问题,提高了大规模集群节点长时间运行时的稳定性和鲁棒性。
[0032]
作为可选方案,主节点向状态控制文件输入更新的计数具体包括:初始化状态控制文件,启动心跳计数线程;根据心跳计数线程的计数,向状态控制文件输入更新的计数。
[0033]
具体的,主节点初始化状态控制文件,设置当前状态为init,并且启动心跳计数线程,持续输出计数(称为“心跳”),每秒向状态控制文件输出一次“心跳”,其它节点监控状态控制文件,主节点运行其它操作持续输出计数至状态控制文件,每秒一次向状态文件输出“心跳”计数。
[0034]
作为可选方案,计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收从节点的梯度文件;根据梯度文件,计算并更新梯度场;向从节点发送更新后的梯度场及任务完成指令。
[0035]
具体的,主节点向从节点发起梯度收集操作指令,调整状态为collect,接收从节点的梯度文件,等待完成全部梯度文件的收集整理,调整状态为collect_finish,根据这些梯度文件,计算更新梯度场,调整状态为update,向从节点发布计算结果,状态调整为broadcast,此时梯度场计算任务完成,状态更新为successful,发送任务完成指令。
[0036]
作为可选方案,从节点根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常具体包括:从节点获取每次状态控制文件更新计数的间隔时间;比较间隔时间与预设时间,当间隔时间大于或等于预设时间时,则主节点出现异常。
[0037]
具体的,从节点持续监控状态控制文件,未接收更新后的梯度场和任务完成指令时,当更新计数的时间间隔大于或等于预设时间时,即表示主节点出现异常,跳到步骤2,其它节点重新争抢“令牌”的控制权,抢到令牌的节点作为新的主节点,计算并更新梯度场,重复上述操作,直至梯度场规约完成。
[0038]
作为可选方案,从节点接收来自主节点的梯度收集操作指令后,将梯度文件发送至主节点,并接收来自主节点的更新后的梯度场及任务完成指令。
[0039]
具体的,从节点接收主节点的梯度收集操作指令,将梯度文件发送至主节点,同时读取状态控制文件更新的计数,等待接收更新后的梯度场和任务完成指令,当接收更新后的梯度场和任务完成指令时梯度场规约完成,当未接收更新后的梯度场和任务完成指令时,根据更新计数的时间间隔,判断主节点是否异常。
[0040]
本发明还提供一种电子设备,电子设备包括:存储器,存储有可执行指令;处理器,处理器运行存储器中的可执行指令,以实现上述全波形反演中多进程协作的梯度场归约方法。
[0041]
本发明还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述全波形反演中多进程协作的梯度场归约方法。
[0042]
本发明还提供一种全波形反演中多进程协作的梯度场归约装置,包括:令牌初始化模块,初始化计算梯度场的令牌;控制权获得模块,多个节点争抢令牌的控制权;节点分配模块,获得令牌控制权的节点作为主节点,其它节点作为从节点;梯度场计算更新模块,主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;主节点异常判断模块,从节点未接收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,其它节点再次争抢令牌的控制权。
[0043]
具体的,初始化计算梯度场的令牌,多个节点(进程)平等争抢“令牌”的控制权,抢
到控制权的节点获得控制权,变为主节点,其它节点为从节点,主节点向状态控制文件输入更新的计数,计算、更新梯度场并输出任务完成指令,从节点等待接收更新的梯度场和任务完成指令,当没收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,其它从节点重新争抢令牌,确定新的主节点。
[0044]
根据示例性的实施方式,全波形反演中多进程协作的梯度场归约装置在主节点异常时,由从节点继续进行梯度场规约,解决了单点故障异常导致的全局计算失败问题,提高了大规模集群节点长时间运行时的稳定性和鲁棒性。
[0045]
作为可选方案,主节点向状态控制文件输入更新的计数具体包括:初始化状态控制文件,启动心跳计数线程;根据心跳计数线程的计数,向状态控制文件输入更新的计数。
[0046]
具体的,主节点初始化状态控制文件,设置当前状态为init,并且启动心跳计数线程,持续输出计数(称为“心跳”),每秒向状态控制文件输出一次“心跳”,其它节点监控状态控制文件,主节点运行其它操作持续输出计数至状态控制文件,每秒一次向状态文件输出“心跳”计数。
[0047]
作为可选方案,计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收从节点的梯度文件;根据梯度文件,计算并更新梯度场;向从节点发送更新后的梯度场及任务完成指令。
[0048]
具体的,主节点向从节点发起梯度收集操作指令,调整状态为collect,接收从节点的梯度文件,等待完成全部梯度文件的收集整理,调整状态为collect_finish,根据这些梯度文件,计算更新梯度场,调整状态为update,向从节点发布计算结果,状态调整为broadcast,此时梯度场计算任务完成,状态更新为successful,发送任务完成指令。
[0049]
作为可选方案,从节点根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常具体包括:从节点获取每次状态控制文件更新计数的间隔时间;比较间隔时间与预设时间,当间隔时间大于或等于预设时间时,则主节点出现异常。
[0050]
具体的,从节点持续监控状态控制文件,未接收更新后的梯度场和任务完成指令时,当更新计数的时间间隔大于或等于预设时间时,即表示主节点出现异常,其它节点重新争抢“令牌”的控制权,抢到令牌的节点作为新的主节点,计算并更新梯度场,重复上述操作,直至梯度场规约完成。
[0051]
作为可选方案,从节点接收来自主节点的梯度收集操作指令后,将梯度文件发送至主节点,并接收来自主节点的更新后的梯度场及任务完成指令。
[0052]
具体的,从节点接收主节点的梯度收集操作指令,将梯度文件发送至主节点,同时读取状态控制文件更新的计数,等待接收更新后的梯度场和任务完成指令,当接收更新后的梯度场和任务完成指令时梯度场规约完成,当未接收更新后的梯度场和任务完成指令时,根据更新计数的时间间隔,判断主节点是否异常。
[0053]
实施例一
[0054]
图1示出了根据本发明的一个实施例的一种全波形反演中多进程协作的梯度场归约方法的流程图。图2示出了根据本发明的一个实施例的一种全波形反演中多进程协作的梯度场归约方法的又一流程图。
[0055]
结合图1和图2所示,该全波形反演中多进程协作的梯度场归约方法,包括:
[0056]
步骤1:初始化计算梯度场的令牌;
[0057]
步骤2:多个节点争抢令牌的控制权;
[0058]
步骤3:获得令牌控制权的节点作为主节点,其它节点作为从节点;
[0059]
步骤4:主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;
[0060]
其中,主节点向状态控制文件输入更新的计数具体包括:初始化状态控制文件,启动心跳计数线程;根据心跳计数线程的计数,向状态控制文件输入更新的计数。
[0061]
其中,计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收从节点的梯度文件;根据梯度文件,计算并更新梯度场;向从节点发送更新后的梯度场及任务完成指令。
[0062]
步骤5:从节点根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,返回步骤2。
[0063]
其中,从节点未接收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常具体包括:从节点获取每次状态控制文件更新计数的间隔时间;比较间隔时间与预设时间,当间隔时间大于或等于预设时间时,则主节点出现异常。
[0064]
其中,从节点接收来自主节点的梯度收集操作指令后,将梯度文件发送至主节点,并接收来自主节点的更新后的梯度场及任务完成指令。
[0065]
以3d全波形反演处理项目为例,一个项目需要1024个节点计算,全波形反演需要进行30次反演迭代,每次反演迭代平均需要16个小时,整个项目运行共计需要480小时,约20天。项目运行过程中由于硬件资源调整及硬件故障,出现了10次节点宕机,程序依然能够正常运行,并完成了全部迭代计算任务。说明本发明解决了单点故障异常导致的全局计算失败问题,提高了大规模集群节点长时间运行时的稳定性和鲁棒性。
[0066]
实施例二
[0067]
图3示出了根据本发明的一个实施例的一种全波形反演中多进程协作的梯度场归约装置的结构框图。
[0068]
如图3所示,该全波形反演中多进程协作的梯度场归约装置,包括:
[0069]
令牌初始化模块102,初始化计算梯度场的令牌;
[0070]
控制权获得模块104,多个节点争抢令牌的控制权;
[0071]
节点分配模块106,获得令牌控制权的节点作为主节点,其它节点作为从节点;
[0072]
其中,主节点向状态控制文件输入更新的计数具体包括:初始化状态控制文件,启动心跳计数线程;根据心跳计数线程的计数,向状态控制文件输入更新的计数。
[0073]
其中,计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收从节点的梯度文件;根据梯度文件,计算并更新梯度场;向从节点发送更新后的梯度场及任务完成指令。
[0074]
梯度场计算更新模块108,主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;
[0075]
主节点异常判断模块110,从节点未接收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,其它节点再次争抢令牌的控制权。
[0076]
其中,从节点根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常
具体包括:从节点获取每次状态控制文件更新计数的间隔时间;比较间隔时间与预设时间,当间隔时间大于或等于预设时间时,则主节点出现异常。
[0077]
其中,从节点接收来自主节点的梯度收集操作指令后,将梯度文件发送至主节点,并接收来自主节点的更新后的梯度场及任务完成指令。
[0078]
实施例三
[0079]
本公开提供一种电子设备包括,该电子设备包括:存储器,存储有可执行指令;处理器,处理器运行存储器中的可执行指令,以实现上述全波形反演中多进程协作的梯度场归约方法。
[0080]
根据本公开实施例的电子设备包括存储器和处理器。
[0081]
该存储器用于存储非暂时性计算机可读指令。具体地,存储器可以包括一个或多个计算机程序产品,该计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。
[0082]
该处理器可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中,该处理器用于运行该存储器中存储的该计算机可读指令。
[0083]
本领域技术人员应能理解,为了解决如何获取良好用户体验效果的技术问题,本实施例中也可以包括诸如通信总线、接口等公知的结构,这些公知的结构也应包含在本公开的保护范围之内。
[0084]
有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
[0085]
实施例四
[0086]
本公开提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述全波形反演中多进程协作的梯度场归约方法。
[0087]
根据本公开实施例的计算机可读存储介质,其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时,执行前述的本公开各实施例方法的全部或部分步骤。
[0088]
上述计算机可读存储介质包括但不限于:光存储介质(例如:cd-rom和dvd)、磁光存储介质(例如:mo)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置rom的媒体(例如:rom盒)。
[0089]
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

技术特征:
1.一种全波形反演中多进程协作的梯度场归约方法,其特征在于,包括:步骤1:初始化计算梯度场的令牌;步骤2:多个节点争抢所述令牌的控制权;步骤3:获得令牌控制权的节点作为主节点,其它节点作为从节点;步骤4:主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;步骤5:从节点未接收到任务完成指令时,根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常,当所述主节点出现异常时,返回步骤2。2.根据权利要求1所述的全波形反演中多进程协作的梯度场归约方法,其特征在于,所述主节点向状态控制文件输入更新的计数具体包括:初始化所述状态控制文件,启动心跳计数线程;根据所述心跳计数线程的计数,向状态控制文件输入更新的计数。3.根据权利要求2所述的全波形反演中多进程协作的梯度场归约方法,其特征在于,所述计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收所述从节点的梯度文件;根据所述梯度文件,计算并更新所述梯度场;向从节点发送更新后的梯度场及任务完成指令。4.根据权利要求1所述的全波形反演中多进程协作的梯度场归约方法,其特征在于,所述从节点根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常具体包括:所述从节点获取每次状态控制文件更新计数的间隔时间;比较所述间隔时间与预设时间,当所述间隔时间大于或等于预设时间时,则主节点出现异常。5.根据权利要求3所述的全波形反演中多进程协作的梯度场归约方法,其特征在于,所述从节点接收来自所述主节点的梯度收集操作指令后,将梯度文件发送至所述主节点,并接收来自所述主节点的更新后的梯度场及任务完成指令。6.一种电子设备,其特征在于,所述电子设备包括:存储器,存储有可执行指令;处理器,所述处理器运行所述存储器中的所述可执行指令,以实现权利要求1-5所述的全波形反演中多进程协作的梯度场归约方法。7.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现根据权利要求1-5所述的全波形反演中多进程协作的梯度场归约方法。8.一种全波形反演中多进程协作的梯度场归约装置,其特征在于,包括:令牌初始化模块,初始化计算梯度场的令牌;控制权获得模块,多个节点争抢所述令牌的控制权;节点分配模块,获得令牌控制权的节点作为主节点,其它节点作为从节点;梯度场计算更新模块,主节点向状态控制文件输入更新的计数,计算并更新梯度场,更
新梯度场后发送任务完成指令;主节点异常判断模块,从节点未接收到任务完成指令时,根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常,当所述主节点出现异常时,其它节点再次争抢所述令牌的控制权。9.根据权利要求8所述的全波形反演中多进程协作的梯度场归约装置,其特征在于,包括:所述主节点向状态控制文件输入更新的计数具体包括:初始化所述状态控制文件,启动心跳计数线程;根据所述心跳计数线程的计数,向状态控制文件输入更新的计数;所述计算更新梯度场具体包括:向从节点发起梯度收集操作指令;接收所述从节点的梯度文件;根据所述梯度文件,计算并更新所述梯度场;向从节点发送更新后的梯度场及任务完成指令。10.根据权利要求8所述的全波形反演中多进程协作的梯度场归约装置,其特征在于,包括:所述从节点根据所述状态控制文件更新计数的间隔时间,判断所述主节点是否出现异常具体包括:所述从节点获取每次状态控制文件更新计数的间隔时间;比较所述间隔时间与预设时间,当所述间隔时间大于或等于预设时间时,则主节点出现异常。

技术总结
本发明公开了全波形反演梯度场归约方法、装置、介质及设备,该方法包括:步骤1:初始化计算梯度场的令牌;步骤2:多个节点争抢令牌的控制权;步骤3:获得令牌控制权的节点作为主节点,其它节点作为从节点;步骤4:主节点向状态控制文件输入更新的计数,计算并更新梯度场,更新梯度场后发送任务完成指令;步骤5:从节点未接收到任务完成指令时,根据状态控制文件更新计数的间隔时间,判断主节点是否出现异常,当主节点出现异常时,返回步骤2。本发明的全波形反演中多进程协作的梯度场归约方法在主节点异常时,由从节点继续进行梯度场规约,解决了单点故障异常导致的全局计算失败问题,提高了大规模集群节点长时间运行时的稳定性和鲁棒性。棒性。棒性。


技术研发人员:魏哲枫 朱成宏 刘俊州
受保护的技术使用者:中国石油化工股份有限公司石油勘探开发研究院
技术研发日:2022.03.25
技术公布日:2023/10/8
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐