一种故障节点剔除方法及装置、电子设备、存储介质与流程
未命名
09-22
阅读:64
评论:0

1.本技术涉及云硬盘运维管理技术领域,特别涉及一种故障节点剔除方法及装置、电子设备、存储介质。
背景技术:
2.为了提高云硬盘的高可用性,当前通常采用三副本存储机制进行数据存储,即将三个存储节点组成包括一个主副本和多个从副本的副本组进行数据存储。为了保证副本组中的各个副本存储的数据一致,在接收到数据处理请求时,只有当各个副本均成功写入数据后,才会返回写入磁盘成功。因此相应的,当副本组中的一个副本出现长时间或永久故障时,需要及时将该副本从集群中剔除,并将其数据迁移到新的副本中。
3.当前为了能及时提出故障副本,主要是由副本组中的各个副本在与其他副本进行通信时,获取与其通信的副本的状态,并每秒向管理节点上报获取到的其他副本的状态信息。而为了保证准确性,所以当前若是副本组中的三个副本中的两个均上报剩余的那个副本出现故障,则管理节点将在指定时间的时间窗口内监测该副本,若连续收到该节点的故障情况,则对该副本进行剔除。
4.但是现有的方式,若是在写入数据时,某一个副本未与故障副本发送通信,则其并不会向管理节点上报故障副本存在故障,所以管理节点即使收到另一个副本上报的故障副本的异常信息,其也不会对故障副本进行剔除处理。从而导致当前请求以及后续请求均无法被成功处理。此时则需要通过人工介入进行处理,而人工处理不仅成本高,并且效率相对较低。因此现有的方式无法有效保证能及时剔除故障副本,避免影响响应的数据处理请求。
技术实现要素:
5.基于上述现有技术的不足,本技术提供了一种故障节点剔除方法及装置、电子设备、存储介质,以解决现有的剔除方法,无法保证及时剔除故障副本,避免影响响应数据处理请求。
6.为了实现上述目的,本技术提供了以下技术方案:
7.本技术第一方面提供了一种故障节点剔除方法,包括:
8.接收客户端或主副本上报的当前故障副本的异常信息;
9.向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,以触发所述当前故障副本对应的正常副本对所述当前故障副本进行探测;其中,所述当前故障副本对应的正常副本包括与所述当前故障副本所属的副本组中除所述当前故障副本外的多个副本;
10.接收所述当前故障副本对应的正常副本反馈的探测结果;
11.判断所述当前故障副本对应的正常副本反馈的探测结果是否均指示所述当前故障副本存在异常;
12.若判断出所述当前故障副本对应的正常副本反馈的探测结果均指示所述当前故
障副本存在异常,则向所述当前故障副本发送剔除指令,以剔除所述当前故障副本。
13.可选地,在上述的故障节点剔除方法中,所述当前故障副本为所述主副本,所述接收客户端或主副本上报的当前故障副本的异常信息,包括:
14.接收所述客户端上报的所述主副本的异常信息;其中,所述主副本的异常信息由所述主副本在响应所述客户端向其发送的数据处理请求过程中,无法成功写入数据时生成并反馈给所述客户端。
15.可选地,在上述的故障节点剔除方法中,所述当前故障副本为任意一个从副本,所述接收客户端或主副本上报的当前故障副本的异常信息,包括:
16.接收所述主副本上报的所述从副本的异常信息;其中,所述从副本的异常信息由所述从副本在无法成功写入所述主副本同步至所述从副本的数据时生成并反馈给所述主副本;所述主副本在响应客户端向其发送的数据处理请求,并成功写入数据后,将数据同步至所属副本组中的每个从副本。
17.可选地,在上述的故障节点剔除方法中,所述向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令之前,还包括:
18.基于所述当前故障副本的异常信息,从路由信息表中查找出所述当前故障副本对应的正常副本的路由信息;
19.其中,所述向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,包括:
20.分别基于所述当前故障副本对应的各个正常副本的路由信息,向所述当前故障副本对应的各个正常副本发送所述当前故障副本的探测指令。
21.可选地,在上述的故障节点剔除方法中,所述向所述当前故障副本发送剔除指令之后,还包括:
22.实时监测是否接收到所述当前故障副本反馈的成功剔除信息;
23.当监测到已接收到所述当前故障副本反馈的成功剔除信息时,向客户端发送最新副本信息,以触发所述客户端利用最新副本信息对所记录的副本信息进行更新。
24.本技术第二方面提供了一种故障节点剔除装置,包括:
25.信息接收单元,用于接收客户端或主副本上报的当前故障副本的异常信息;
26.探测单元,用于向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,以触发所述当前故障副本对应的正常副本对所述当前故障副本进行探测;其中,所述当前故障副本对应的正常副本包括与所述当前故障副本所属的副本组中除所述当前故障副本外的多个副本;
27.结果接收单元,用于接收所述当前故障副本对应的正常副本反馈的探测结果;
28.判断单元,用于判断所述当前故障副本对应的正常副本反馈的探测结果是否均指示所述当前故障副本存在异常;
29.剔除单元,用于在判断出所述当前故障副本对应的正常副本反馈的探测结果均指示所述当前故障副本存在异常,则向所述当前故障副本发送剔除指令,以剔除所述当前故障副本。
30.可选地,在上述的故障节点剔除装置中,所述当前故障副本为所述主副本,所述信息接收单元,包括:
31.第一信息接收单元,用于接收所述客户端上报的所述主副本的异常信息;其中,所述主副本的异常信息由所述主副本在响应所述客户端向其发送的数据处理请求过程中,无法成功写入数据时生成并反馈给所述客户端。
32.可选地,在上述的故障节点剔除装置中,所述当前故障副本为任意一个从副本,所述信息接收单元,包括:
33.第二信息接收单元,用于接收所述主副本上报的所述从副本的异常信息;其中,所述从副本的异常信息由所述从副本在无法成功写入所述主副本同步至所述从副本的数据时生成并反馈给所述主副本;所述主副本在响应客户端向其发送的数据处理请求,并成功写入数据后,将数据同步至所属副本组中的每个从副本。
34.可选地,在上述的故障节点剔除装置中,还包括:
35.查找单元,用于基于所述当前故障副本的异常信息,从路由信息表中查找出所述当前故障副本对应的正常副本的路由信息;
36.其中,所述探测单元,包括:
37.探测子单元,用于分别基于所述当前故障副本对应的各个正常副本的路由信息,向所述当前故障副本对应的各个正常副本发送所述当前故障副本的探测指令。
38.可选地,在上述的故障节点剔除装置中,还包括:
39.监测单元,用于实时监测是否接收到所述当前故障副本反馈的成功剔除信息;
40.更新单元,用于当监测到已接收到所述当前故障副本反馈的成功剔除信息时,向客户端发送最新副本信息,以触发所述客户端利用最新副本信息对所记录的副本信息进行更新。
41.本技术第三方面提供了一种电子设备,包括:
42.存储器和处理器;
43.其中,所述存储器用于存储程序;
44.所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如上述任意一项所述的故障节点剔除方法。
45.本技术第四方面提供了一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,用于实现如上述任意一项所述的故障节点剔除方法。
46.本技术提供了一种故障节点剔除方法,利用每次数据处理时,客户端会与主副本通信,而主副本会与各个从副本通信,所以当有副本出现故障时,通过客户端或主副本获取到异常信息并上报。相应的,接收客户端或主副本上报的当前故障副本的异常信息,然后向当前故障副本对应的正常副本发送当前故障副本的探测指令,以触发当前故障副本对应的正常副本对当前故障副本进行探测。其中,当前故障副本对应的正常副本包括与当前故障副本所属的副本组中除当前故障副本外的多个副本。然后,接收当前故障副本对应的正常副本反馈的探测结果,并判断当前故障副本对应的正常副本反馈的探测结果是否均指示当前故障副本存在异常。若判断出当前故障副本对应的正常副本反馈的探测结果均指示当前故障副本存在异常,则向当前故障副本发送剔除指令,以剔除当前故障副本。从而在出现副本可能已出现故障时及时发现,并在进一步确认出现故障时,将故障副本剔除,不再需要人工介入处理,有效保证能及时剔除故障副本,避免影响后续的数据处理请求。
附图说明
47.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
48.图1为本技术实施例提供的一种故障节点剔除方法的流程图;
49.图2为本技术实施例提供的一种主副本的剔除方法的示例的流程示意图;
50.图3为本技术实施例提供的一种从副本的剔除方法的示例的流程示意图;
51.图4为本技术实施例提供的一种故障节点剔除装置的架构示意图;
52.图5为本技术实施例提供的一种电子设备的架构示意图。
具体实施方式
53.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
54.在本技术中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
55.本技术实施例提供了一种故障节点剔除方法,以解决现有的剔除方法,无法保证及时剔除故障副本,避免影响响应数据处理请求。
56.可选地,本技术实施例提供的故障节点剔除方法具体可以应用于存储池中的管理节点,即存储池中的master节点。其中,存储池为云硬盘的最小物理运行集群单位。
57.如图1所示,本技术实施例提供的一种故障节点剔除方法,包括以下步骤:
58.s101、接收客户端或主副本上报的当前故障副本的异常信息。
59.需要说明的是,在多副本机制中,在需要对数据处理时,由客户端向副本组中的主副本发送数据处理请求,具体可以是输入或输出请求,然后先由主副本进行数据写入,在主副本成功写入数据后,再将数据同步至各个从副本,以让各个从副本写入数据。所以在一次数据处理过程中,客户端是会与主副本通信,而主副本会与各个从副本进行通信,因此客户端可以获取到主副本的健康状态,而主副本可以获取到从副本的监控状态。
60.因此,在本技术实施例中,在客户端发起数据处理请求后,由客户端获取主副本的健康状态,有主副本获取各个从副本的健康状态。所以具体的,在主副本出现故障时,由客户端上报主副本的异常信息。在任意一个从副本出现故障时,由主副本上报出现故障的从副本的异常信息。
61.可选地,异常信息中可以包括有当前故障副本的ip信息、发生异常的小表
(partition)的id信息以及对应的物理块(block)的id信息等。
62.s102、向当前故障副本对应的正常副本发送当前故障副本的探测指令,以触发当前故障副本对应的正常副本对当前故障副本进行探测。
63.其中,当前故障副本对应的正常副本包括与当前故障副本所属的副本组中除当前故障副本外的多个副本。
64.可选地,因为后续需要基于当前故障副本对应的正常副本的探测结果,确定当前故障副本是否真的存在故障,进而确定是否将其剔除。所以为了保证结果的准确性,通常可以将当前故障副本所属的副本组中除当前故障副本外的所有副本作为当前故障副本对应的正常副本。当然,若是当前故障副本所属的副本组中的副本数量较大,也可以仅是选择部分副本作为当前故障副本对应的正常副本。
65.需要说明的是,在本技术实施例中,一个副本在未能成功处理数据时,其生成异常信息,从而被暂定为故障副本。但是副本未能成功处理数据有可能是因为网络异常等其他原因导致的,所以并不一定是出现了故障,因此需要进一步进行确认。因此在本技术实施例中,还需要进一步向当前故障副本对应的正常副本发送当前故障副本的探测指令,以触发当前故障副本对应的正常副本向当前故障副本发出ping探测指令,从而对当前故障副本的状态进行探测。
66.可选地,在本技术另一实施例中,在向当前故障副本对应的正常副本发送当前故障副本的探测指令之前,还可以先进一步执行:
67.基于当前故障副本的异常信息,从路由信息表中查找出当前故障副本对应的正常副本的路由信息。
68.需要说明的是,由于一个存储池中通常会包括有多个副本组,所以管理节点会存储有各个副本组的副本的路由信息。因此,可以基于当前故障副本的异常信息,从路由表中查找出其所属的路由组,并从中提取其对应的多个正常副本的路由信息。具体可以根据发生异常的小表(partition)的id信息以及对应的物理块(block)的id信息,查找到当前故障副本对应的正常副本的路由信息。
69.相应的,在本技术实施例中,步骤s102的一种具体实施方式,包括:
70.分别基于当前故障副本对应的各个正常副本的路由信息,向当前故障副本对应的各个正常副本发送当前故障副本的探测指令。
71.s103、接收当前故障副本对应的正常副本反馈的探测结果。
72.具体的,当前故障副本对应的正常副本根据对当前故障副本的探测情况,向管理节点反馈探测结果。此时,则相应的接收当前故障副本对应的各个正常副本反馈的探测结果。
73.s104、判断当前故障副本对应的正常副本反馈的探测结果是否均指示当前故障副本存在异常。
74.其中,若判断出当前故障副本对应的正常副本反馈的探测结果均指示当前故障副本存在异常,则执行步骤s105。
75.s105、向当前故障副本发送剔除指令,以剔除当前故障副本。
76.可选地,当前的副本主要存在三种运行状态,分别为:正常状态(normal)、隔离状态(down)以及消亡状态(dead)。其中,隔离状态下的副本不再提供io服务,并且在超过指定
时间后,若副本不能恢复正常,则将其状态置为消亡状态。而消亡状态下的副本的数据会被迁移到其他正常的节点中。因此在本技术实施例中,可以是向当前故障副本发送剔除指令,将当前故障副本的状态置为消亡状态。
77.可选地,为了能及时恢复当前故障副本所属的副本组的正常工作,因此在本技术另一实施例中,在执行步骤s105之后,还可以进一步执行:
78.实时监测是否接收到当前故障副本反馈的成功剔除信息,并当监测到已接收到当前故障副本反馈的成功剔除信息时,向客户端发送最新副本信息,以触发客户端利用最新副本信息对所记录的副本信息进行更新。
79.具体的,当前故障副本在接收到剔除指令后,其数据会迁移到另一个正常的节点中,由该节点替换当前故障副本,所以可以采用获取该节点的相关信息作为最新副本信息,并利用最新副本信息替换客户端中原本记录的当前故障副本的信息,从而使得对客户端的副本信息的更新,使得客户端可以利用新的副本信息继续正常工作。
80.本技术实施例提供了一种故障节点剔除方法,利用每次数据处理时,客户端会与主副本通信,而主副本会与各个从副本通信,所以当有副本出现故障时,通过客户端或主副本获取到异常信息并上报。相应的,接收客户端或主副本上报的当前故障副本的异常信息,然后向当前故障副本对应的正常副本发送当前故障副本的探测指令,以触发当前故障副本对应的正常副本对当前故障副本进行探测。其中,当前故障副本对应的正常副本包括与当前故障副本所属的副本组中除当前故障副本外的多个副本。然后,接收当前故障副本对应的正常副本反馈的探测结果,并判断当前故障副本对应的正常副本反馈的探测结果是否均指示当前故障副本存在异常。若判断出当前故障副本对应的正常副本反馈的探测结果均指示当前故障副本存在异常,则向当前故障副本发送剔除指令,以剔除当前故障副本。从而在出现副本可能已出现故障时及时发现,并在进一步确认出现故障时,将故障副本剔除,不再需要人工介入处理,有效保证能及时剔除故障副本,避免影响后续的数据处理请求。
81.可选地,在本技术另一实施例中,在当前故障副本为主副本时,步骤s101的一种具体实施方式,包括:
82.接收客户端上报的主副本的异常信息。
83.其中,主副本的异常信息由主副本在响应客户端向其发送的数据处理请求过程中,无法成功写入数据时生成并反馈给客户端。相应的客户端,在收到其反馈的异常信息后,则将异常信息上报给管理节点。
84.所以在当前故障副本为主副本时,即主副本出现故障时,以三副本机制为例,此时主副本的剔除方法,如图2所示,具体包括以下步骤:
85.1、客户端发起io请求,并通过云硬盘的哈希算法查找到对应的主副本进行数据处理。
86.2、主副本在未成功处理数据时,将向客户端反馈异常信息。
87.3、客户端收到主副本的异常信息后,将异常信息上报给存储池中的master节点。
88.4、master节点收到主副本的异常信息后,根据异常信息查找到其所属的副本组的副本信息,并基于副本信息向所属副本组的两个从副本发送探测命令。
89.5、两个从副本同时向主副本发送ping探测指令。
90.6、两个从副本根据探测到的异常信息,向master节点上报主副本异常的信息。
91.7、master节点收到两个从副本上报的主副本异常的信息后,向主副本发出剔除指令。
92.8、主副本剔除成功后,向master节点反馈剔除成功的信息。
93.9、master节点向客户端更新最新的副本信息。
94.可选地,在本技术另一实施例中,在当前故障副本为从副本时,步骤s101的一种具体实施方式,包括:
95.接收主副本上报的从副本的异常信息。
96.其中,从副本的异常信息由从副本在无法成功写入主副本同步至从副本的数据时生成并反馈给主副本。主副本在响应客户端向其发送的数据处理请求,并成功写入数据后,将数据同步至所属副本组中的每个从副本。即祝福包在接收到数据处理请求后,向对数据进行写入,并在成功写入后,再将数据同步至从副本。当从副本无法成功写入数据时,说明出现异常,其将向主副本反馈异常信息。然后主副本会将异常信息上报给管理节点。
97.所以在当前故障副本为从副本时,即任意一个从副本出现故障时,以三副本机制为例,此时从副本的剔除方法,如图3所示,具体包括以下步骤:
98.1、客户端发起io请求,并通过云硬盘的哈希算法查找到对应的主副本进行数据处理。
99.2、主副本在成功处理数据后,将写完的数据同步给所示副本组中的两个从副本。
100.3、两个从副本中的从副本1发生异常,其写入数据失败并将异常信息反馈给主副本,从副本2数据写入成功,返回成功信息。
101.4、主副本将从副本1的异常信息上报给存储池中的master节点。
102.5、master节点收到从副本1的异常信息后,根据异常信息查找到其所属的副本组的副本信息,并基于副本信息向所属副本组的主副本和从副本2发送探测命令。
103.6、主副本和从副本2同时向从副本1发送ping探测指令。
104.7、主副本和从副本2根据探测到的异常信息,向master节点上报从副本1异常的信息。
105.8、master节点收到两个副本上报的从副本2异常的信息后,向从副本2发出剔除指令。
106.9、从副本2剔除成功后,向master节点反馈剔除成功的信息。
107.10、master节点向客户端更新最新的副本信息。
108.本技术另一实施例提供了一种故障节点剔除装置,如图4所示,包括:
109.信息接收单元401,用于接收客户端或主副本上报的当前故障副本的异常信息。
110.探测单元402,用于向当前故障副本对应的正常副本发送当前故障副本的探测指令,以触发当前故障副本对应的正常副本对当前故障副本进行探测。
111.其中,当前故障副本对应的正常副本包括与当前故障副本所属的副本组中除当前故障副本外的多个副本。
112.结果接收单元403,用于接收当前故障副本对应的正常副本反馈的探测结果。
113.判断单元404,用于判断当前故障副本对应的正常副本反馈的探测结果是否均指示当前故障副本存在异常。
114.剔除单元405,用于在判断出当前故障副本对应的正常副本反馈的探测结果均指
示当前故障副本存在异常,则向当前故障副本发送剔除指令,以剔除当前故障副本。
115.可选地,在本技术另一实施例提供的故障节点剔除装置中,当前故障副本为主副本,信息接收单元,包括:
116.第一信息接收单元,用于接收客户端上报的主副本的异常信息。
117.其中,主副本的异常信息由主副本在响应客户端向其发送的数据处理请求过程中,无法成功写入数据时生成并反馈给客户端。
118.可选地,在本技术另一实施例提供的故障节点剔除装置中,当前故障副本为任意一个从副本,信息接收单元,包括:
119.第二信息接收单元,用于接收主副本上报的从副本的异常信息。
120.其中,从副本的异常信息由从副本在无法成功写入主副本同步至从副本的数据时生成并反馈给主副本。主副本在响应客户端向其发送的数据处理请求,并成功写入数据后,将数据同步至所属副本组中的每个从副本。
121.可选地,在本技术另一实施例提供的故障节点剔除装置中,还包括:
122.查找单元,用于基于当前故障副本的异常信息,从路由信息表中查找出当前故障副本对应的正常副本的路由信息。
123.其中,在本技术实施例中探测单元,包括:
124.探测子单元,用于分别基于当前故障副本对应的各个正常副本的路由信息,向当前故障副本对应的各个正常副本发送当前故障副本的探测指令。
125.可选地,在本技术另一实施例提供的故障节点剔除装置中,还包括:
126.监测单元,用于实时监测是否接收到当前故障副本反馈的成功剔除信息。
127.更新单元,用于当监测到已接收到当前故障副本反馈的成功剔除信息时,向客户端发送最新副本信息,以触发客户端利用最新副本信息对所记录的副本信息进行更新。
128.需要说明的是,本技术上述实施例提供的各个单元的具体工作过程,可相应地参考上述方法实施例中的相应的步骤的实施过程,此处不再赘述。
129.本技术另一实施例提供了一种电子设备,如图5所示,包括:
130.存储器501和处理器502。
131.其中,存储器501用于存储程序。
132.处理器502用于执行存储器501存储的程序,该程序被执行时,具体用于实现如上述任意一个实施例提供的故障节点剔除方法。
133.本技术另一实施例提供了一种计算机存储介质,用于存储计算机程序,该计算机程序被执行时,用于实现如上述任意一个实施例提供的故障节点剔除方法。
134.需要说明的是,本技术实施例中提供的计算机存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体
(transitory media),如调制的数据信号和载波。
135.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
136.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
技术特征:
1.一种故障节点剔除方法,其特征在于,包括:接收客户端或主副本上报的当前故障副本的异常信息;向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,以触发所述当前故障副本对应的正常副本对所述当前故障副本进行探测;其中,所述当前故障副本对应的正常副本包括与所述当前故障副本所属的副本组中除所述当前故障副本外的多个副本;接收所述当前故障副本对应的正常副本反馈的探测结果;判断所述当前故障副本对应的正常副本反馈的探测结果是否均指示所述当前故障副本存在异常;若判断出所述当前故障副本对应的正常副本反馈的探测结果均指示所述当前故障副本存在异常,则向所述当前故障副本发送剔除指令,以剔除所述当前故障副本。2.根据权利要求1所述的方法,其特征在于,所述当前故障副本为所述主副本,所述接收客户端或主副本上报的当前故障副本的异常信息,包括:接收所述客户端上报的所述主副本的异常信息;其中,所述主副本的异常信息由所述主副本在响应所述客户端向其发送的数据处理请求过程中,无法成功写入数据时生成并反馈给所述客户端。3.根据权利要求1所述的方法,其特征在于,所述当前故障副本为任意一个从副本,所述接收客户端或主副本上报的当前故障副本的异常信息,包括:接收所述主副本上报的所述从副本的异常信息;其中,所述从副本的异常信息由所述从副本在无法成功写入所述主副本同步至所述从副本的数据时生成并反馈给所述主副本;所述主副本在响应客户端向其发送的数据处理请求,并成功写入数据后,将数据同步至所属副本组中的每个从副本。4.根据权利要求1所述的方法,其特征在于,所述向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令之前,还包括:基于所述当前故障副本的异常信息,从路由信息表中查找出所述当前故障副本对应的正常副本的路由信息;其中,所述向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,包括:分别基于所述当前故障副本对应的各个正常副本的路由信息,向所述当前故障副本对应的各个正常副本发送所述当前故障副本的探测指令。5.根据权利要求1所述的方法,其特征在于,所述向所述当前故障副本发送剔除指令之后,还包括:实时监测是否接收到所述当前故障副本反馈的成功剔除信息;当监测到已接收到所述当前故障副本反馈的成功剔除信息时,向客户端发送最新副本信息,以触发所述客户端利用最新副本信息对所记录的副本信息进行更新。6.一种故障节点剔除装置,其特征在于,包括:信息接收单元,用于接收客户端或主副本上报的当前故障副本的异常信息;探测单元,用于向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,以触发所述当前故障副本对应的正常副本对所述当前故障副本进行探测;其中,所述当
前故障副本对应的正常副本包括与所述当前故障副本所属的副本组中除所述当前故障副本外的多个副本;结果接收单元,用于接收所述当前故障副本对应的正常副本反馈的探测结果;判断单元,用于判断所述当前故障副本对应的正常副本反馈的探测结果是否均指示所述当前故障副本存在异常;剔除单元,用于在判断出所述当前故障副本对应的正常副本反馈的探测结果均指示所述当前故障副本存在异常,则向所述当前故障副本发送剔除指令,以剔除所述当前故障副本。7.根据权利要求6所述的装置,其特征在于,所述当前故障副本为所述主副本,所述信息接收单元,包括:第一信息接收单元,用于接收所述客户端上报的所述主副本的异常信息;其中,所述主副本的异常信息由所述主副本在响应所述客户端向其发送的数据处理请求过程中,无法成功写入数据时生成并反馈给所述客户端。8.根据权利要求6所述的装置,其特征在于,所述当前故障副本为任意一个从副本,所述信息接收单元,包括:第二信息接收单元,用于接收所述主副本上报的所述从副本的异常信息;其中,所述从副本的异常信息由所述从副本在无法成功写入所述主副本同步至所述从副本的数据时生成并反馈给所述主副本;所述主副本在响应客户端向其发送的数据处理请求,并成功写入数据后,将数据同步至所属副本组中的每个从副本。9.一种电子设备,其特征在于,包括:存储器和处理器;其中,所述存储器用于存储程序;所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求1至5任意一项所述的故障节点剔除方法。10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,用于实现如权利要求1至5任意一项所述的故障节点剔除方法。
技术总结
本申请公开了一种故障节点剔除方法及装置、电子设备、存储介质,所述方法包括:接收客户端或主副本上报的当前故障副本的异常信息;向所述当前故障副本对应的正常副本发送所述当前故障副本的探测指令,以触发所述当前故障副本对应的正常副本对所述当前故障副本进行探测;其中,所述当前故障副本对应的正常副本包括与所述当前故障副本所属的副本组中除所述当前故障副本外的多个副本;接收所述当前故障副本对应的正常副本反馈的探测结果;判断所述当前故障副本对应的正常副本反馈的探测结果是否均指示所述当前故障副本存在异常;若判断出反馈的探测结果均指示所述当前故障副本存在异常,则向所述当前故障副本发送剔除指令,以剔除所述当前故障副本。以剔除所述当前故障副本。以剔除所述当前故障副本。
技术研发人员:杨超
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:2023.08.02
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种卡钉装配用工装的制作方法 下一篇:厢壁单元、制作方法及房车车厢与流程