JBOG服务器故障容忍性测试方法、装置及电子设备与流程
未命名
10-08
阅读:142
评论:0
jbog服务器故障容忍性测试方法、装置及电子设备
技术领域
1.本发明涉及服务器技术领域,尤其涉及一种jbog服务器故障容忍性测试方法、装置及电子设备。
背景技术:
2.传统的故障容忍测试方法主要是通过手动测试来检测服务器的故障容忍性,例如通过模拟网络中断、硬盘损坏等故障场景来测试服务器的容错能力。然而传统的故障容忍测试方法的故障场景单一,传统的测试方法通常只针对单一的故障场景进行测试,无法全面地测试服务器的容错能力。如果进行全面的测试,则需要占用人力和时间,测试效率低,不能满足快速、高效的开发测试过程。
3.因此,如何实现针对多故障场景对服务器故障进行全面测试,提高测试效率,是当前亟需解决的技术问题。
技术实现要素:
4.本发明提供一种jbog服务器故障容忍性测试方法、装置及电子设备,用以解决现有技术中上述存在的缺陷,实现针对多故障场景对服务器故障进行全面测试,提高测试效率。
5.本发明提供一种jbog服务器故障容忍性测试方法,包括:
6.构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
7.基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;
8.基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;
9.基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
10.根据本发明提供的一种jbog服务器故障容忍性测试方法,在所述故障场景为cpu故障的情况下;
11.所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
12.在基本输入输出系统bios中禁用目标数量的cpu的计算核心的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
13.在禁用一个cpu的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
14.在所述jbog服务器正常运行时对cpu进行注错的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
15.在cpu的温度超过第一预设阈值时运行所述jbog服务器的情况下,运行所述cpu故
障对应的测试用例,得到所述cpu故障对应的故障测试指标。
16.根据本发明提供的一种jbog服务器故障容忍性测试方法,在所述故障场景为内存故障的情况下;
17.所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
18.在所述jbog服务器正常运行压力测试或性能测试的情况下,对内存进行注错,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;
19.在所述jbog的内存温度高于第二预设阈值的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;
20.在禁用第二目标数量内存的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标。
21.根据本发明提供的一种jbog服务器故障容忍性测试方法,在所述故障场景为存储故障的情况下;
22.所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括:
23.在所述jbog服务器正常运行压力测试或性能测试的情况下,对所述jbog服务器的硬盘进行强制掉电,运行存储故障的测试用例,得到所述存储故障对应的故障测试指标。
24.根据本发明提供的一种jbog服务器故障容忍性测试方法,在所述故障场景为网络故障的情况下;
25.所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
26.在所述jbog服务器上的设备正常运行的情况下,产生网络风暴,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。
27.在所述jbog服务器进行网络压力测试的情况下,断开网络,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。
28.根据本发明提供的一种jbog服务器故障容忍性测试方法,在所述故障场景为电源故障的情况下;
29.所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
30.在所述jbog服务器运行的过程中禁用目标电源模块,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;
31.在所述jbog服务器运行的过程中进行服务器掉电,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;
32.调整jbog的目标模块的供电电压和供电电流,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标。
33.根据本发明提供的一种jbog服务器故障容忍性测试方法,在所述故障场景为外部连接故障的情况下;
34.所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
35.在所述jbog服务器正常运行的情况下,断开外部连接线缆,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标;
36.在所述bios中禁用第三目标数量的线缆的链路,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标。
37.根据本发明提供的一种jbog服务器故障容忍性测试方法,所述构建jbog服务器的测试系统,并配置所述测试系统的测试环境,包括:
38.将普通服务器与jbog服务器通过线缆连接,基于所述普通服务器、jbog服务器以及外置pcie链路构建所述jbog服务器的测试系统。
39.根据本发明提供的一种jbog服务器故障容忍性测试方法,所述配置所述测试系统的测试环境,包括:
40.在所述jbog服务器上安装测试软件和测试工具,以及安装测试设备所需的驱动程序。
41.根据本发明提供的一种jbog服务器故障容忍性测试方法,所述故障测试指标包括服务器响应时间、错误日志、机器内关键部件的电压和电流、cpu使用率和内存使用率中的至少一种。
42.本发明还提供一种jbog服务器故障容忍性测试装置,包括:
43.配置模块,用于构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
44.场景确定模块,用于基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、gpu故障、电源故障以及链路故障中的至少一种;
45.运行模块,用于基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;
46.测试模块,用于基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
47.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述jbog服务器故障容忍性测试方法。
48.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述jbog服务器故障容忍性测试方法。
49.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述jbog服务器故障容忍性测试方法。
50.配置模块,用于构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
51.场景确定模块,用于基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、gpu故障、电源故障以及链路故障中的至少一种;
52.运行模块,用于基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;
53.测试模块,用于基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
54.本发明提供的jbog服务器故障容忍性测试方法、装置及电子设备,通过构建jbog服务器的测试系统,并配置测试系统的测试环境;基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;基于各故障场景模拟故障条件,在模拟的各故障条件下运行各测试用例,得到各故障场景对应的故障测试指标;基于故障测试指标进行jbog服务器的故障测试分析和评估。本发明能够通过jbog服务器进行多种故障场景的容忍性测试,可以对多种故障场景的故障测试指标进行分析和评估,实现针对多故障场景对服务器故障进行全面测试,提高测试效率。
附图说明
55.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
56.图1是本发明提供的jbog服务器故障容忍性测试方法的流程示意图之一;
57.图2是本发明提供的jbog服务器故障容忍性测试方法的服务器设置图;
58.图3是本发明提供的jbog服务器故障容忍性测试方法的流程示意图之二;
59.图4是本发明提供的jbog服务器故障容忍性测试装置的结构示意图;
60.图5是本发明提供的电子设备的结构示意图。
具体实施方式
61.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
62.首先需要说明的是,本发明提供的jbog服务器故障容忍性测试方法的执行主体可以是电子设备、电子设备中的部件、集成电路、或芯片。该电子设备可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,非移动电子设备可以为服务器、网络附属存储器(network attached storage,nas)或个人计算机(personal computer,pc)等,本发明不作具体限定。以下以计算机执行本发明提供的jbog服务器故障容忍性测试方法,对本发明的各步骤进行详细描述。
63.参照图1,本发明提供一种jbog服务器故障容忍性测试方法,包括以下步骤:
64.步骤110、构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
65.步骤120、基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;
66.步骤130、基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述
测试用例,得到各所述故障场景对应的故障测试指标;
67.步骤140、基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
68.以下对上述步骤进行详细描述。
69.首先,在上述步骤110中,构建jbog服务器的测试系统,也就是将一个jbog服务器通过外部pcie链路和一般服务器连接,可以为服务器提供高性能计算、低延时存储、带宽更高的网络等特性。
70.需要说明的是,jbog服务器是一种具有gpu设备、nvme设备、网卡等pcie设备组成的服务器,jbog服务器连接到一般的服务器时,jbog服务器会将自身的设备提供给一般的服务器使用。jbog服务器需要有更好的容错能力,以保证数据的安全和服务器的稳定运行。该服务器可以提供实时数据传输和处理,以及网络传输和管理所需的任何其他功能。它可用于处理大量数据或客户的同时,并且它具有许多内置的功能和模块,可用于处理各种不同类型的操作。
71.然后配置测试系统的测试环境,也就是在所述jbog服务器上安装测试软件和测试工具,以及安装测试设备所需的驱动程序。
72.需要说明的是,本实施例中的测试系统可以使用多种故障模式进行测试,包括硬件故障和软件故障。硬件故障可以模拟驱动器故障、pcie链路故障等,软件故障可以模拟操作系统故障、应用程序故障等。
73.然后通过上述步骤120,根据实际的测试环境和测试需求,设计多种故障场景和测试用例。例如,可以设计cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障等各种故障场景,并设置不同的负载和数据流量。
74.进一步地,通过上述步骤130,针对各种故障环境模拟出相应的故障条件,在此条件下运行对应的测试用例,以得到服务器的故障测试指标。比如,在cpu故障环境模拟的故障条件为cpu高温运行,在内存故障环境模拟的故障条件为内存高温运行,在电源故障环境在模拟的故障条件为服务器掉电等。以上故障条件仅为本实施例中的示例性描述。
75.可选地,所述故障测试指标包括服务器响应时间、错误日志、机器内关键部件的电压和电流、cpu使用率和内存使用率中的至少一种。
76.最后,通过上述步骤140,对步骤130中得到的各种故障环境下的故障测试指标进行综合故障测试分析和评估,评估结果包括服务器的容错能力、性能指标、故障率、可用性等,可以提供重要参考,用于改进和优化服务器的设计。通过上述测试过程能够获取服务器对上述故障的容忍度,可以模拟出多种故障场景进故障容忍度综合测试。
77.本发明提供的jbog服务器故障容忍性测试方法、装置及电子设备,通过构建jbog服务器的测试系统,并配置测试系统的测试环境;基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;基于各故障场景模拟故障条件,在模拟的各故障条件下运行各测试用例,得到各故障场景对应的故障测试指标;基于故障测试指标进行jbog服务器的故障测试分析和评估。本发明能够通过jbog服务器进行多种故障场景的容忍性测试,可以对多种故障场景的故障测试指标进行分析和评估,实现针对多故障场景对服务器故障进行全面测试,提高测试效率。
78.在一些实施例中,在所述故障场景为cpu故障的情况下;
79.所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
80.在基本输入输出系统bios中禁用目标数量的cpu的计算核心的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
81.在禁用一个cpu的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
82.在所述jbog服务器正常运行时对cpu进行注错的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
83.在cpu的温度超过第一预设阈值时运行所述jbog服务器的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标。
84.具体地,本实施例给出了故障环境为cpu故障,模拟cpu的故障条件,运行cpu故障的测试用例,得到在此场景下的故障测试指标。
85.其中,cpu故障可分为以下几种情况:
86.1、在基本输入输出系统bios中禁用部分cpu的计算核心(cpu core),对jbog服务器上的设备运行性能基准测试,验证cpu core减少的情况下对机器的影响。
87.2、直接禁用一个cpu。
88.3、当jbog服务器在正常运行时对cpu进行注错。
89.4、cpu的温度超过预设阈值,也就是cpu高温运行。
90.需要说明的是,服务器注错可能是指在服务器端编写程序时产生的错误,例如编写的代码不符合语法规则、逻辑错误、数据类型错误等等。这些错误可能会导致服务器异常、无法正常运行或者产生不正确的结果。服务器注错还可能指黑客攻击服务器的情况,黑客可能通过注入恶意代码、绕过安全措施等方式来攻击服务器系统,这种情况可能会导致服务器被入侵、信息泄露、数据丢失等严重后果。
91.本实施例通过模拟不同故障条件下的cpu故障场景,能够针对多种cpu故障场景下进行服务器故障测试,便于从多方面多角度地获取cpu故障的测试指标。
92.在一些实施例中,在所述故障场景为内存故障的情况下;
93.所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
94.在所述jbog服务器正常运行压力测试或性能测试的情况下,对内存进行注错,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;
95.在所述jbog的内存温度高于第二预设阈值的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;
96.在禁用第二目标数量内存的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标。
97.具体地,本实施例给出了故障环境为内存故障,模拟内存的故障条件,运行内存故障的测试用例,得到在此场景下的故障测试指标。
98.其中,内存故障可分为以下几种情况:
99.1、在jbog服务器上的设备正常运行压力测试或性能测试时,对内存进行注错;
100.2、内存温度高于预设阈值,即内存高温运行;
101.3、禁用部分内存。
102.本实施例通过模拟不同故障条件下的内存故障场景,能够针对多种内存故障场景下进行服务器故障测试,便于从多方面多角度地获取内存故障的测试指标。
103.在一些实施例中,在所述故障场景为存储故障的情况下;
104.所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括:
105.在所述jbog服务器正常运行压力测试或性能测试的情况下,对所述jbog服务器的硬盘进行强制掉电,运行存储故障的测试用例,得到所述存储故障对应的故障测试指标。
106.具体地,本实施例给出了故障环境为存储故障,模拟存储故障的故障条件,运行存储故障的测试用例,得到在此场景下的故障测试指标。
107.可以体现为,在jbog服务器上的设备正常运行压力或性能测试时,对jbog服务器上的硬盘进行掉电处理;或者模拟不同的硬盘读写压力。
108.本实施例通过模拟不同故障条件下的存储故障场景,能够针对存储故障场景下进行服务器故障测试,获取存储故障的测试指标以进行评估和分析。
109.在一些实施例中,在所述故障场景为网络故障的情况下;
110.所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
111.在所述jbog服务器上的设备正常运行的情况下,产生网络风暴,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。
112.在所述jbog服务器进行网络压力测试的情况下,断开网络,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。
113.具体地,本实施例给出了故障环境为网络故障,模拟网络的故障条件,运行网络故障的测试用例,得到在此场景下的故障测试指标。
114.其中,网络故障可分为以下几种情况:
115.1、jbog服务器上的设备正常运行时,产生网络风暴;
116.2、jbog服务器进行网络压力测试时,断开网络。
117.本实施例通过模拟不同故障条件下的网络故障场景,能够针对多种网络故障场景下进行服务器故障测试,便于从多方面多角度地获取网络故障的测试指标。
118.在一些实施例中,在所述故障场景为电源故障的情况下;
119.所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
120.在所述jbog服务器运行的过程中禁用目标电源模块,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;
121.在所述jbog服务器运行的过程中进行服务器掉电,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;
122.调整jbog的目标模块的供电电压和供电电流,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标。
123.具体地,本实施例给出了故障环境为电源故障,模拟电源的故障条件,运行电源故障的测试用例,得到在此场景下的故障测试指标。
124.其中,电源故障可分为以下几种情况:
125.1、机器在运行中禁用某个电源模块;
126.2、机器运行中给给整个机器掉电;
127.3、调整部分供电的电压、电流等。
128.本实施例通过模拟不同故障条件下的电源故障场景,能够针对多种电源故障场景下进行服务器故障测试,便于从多方面多角度地获取电源故障的测试指标。
129.在一些实施例中,在所述故障场景为外部连接故障的情况下;
130.所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:
131.在所述jbog服务器正常运行的情况下,断开外部连接线缆,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标;
132.在所述bios中禁用第三目标数量的线缆的链路,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标。
133.具体地,本实施例给出了故障环境为外部链路故障,模拟外部链路的故障条件,运行外部链路故障的测试用例,得到在此场景下的故障测试指标。
134.其中,外部链路故障可分为以下几种情况:
135.1、jbog服务器的设备正常运行时,断开外部连接线缆;
136.2、在bios中禁用部分线缆的链路。
137.本实施例通过模拟不同故障条件下的外部链路故障场景,能够针对多种外部链路故障场景下进行服务器故障测试,便于从多方面多角度地获取外部链路故障的测试指标。
138.在一些实施例中,所述构建jbog服务器的测试系统,并配置所述测试系统的测试环境,包括:
139.将普通服务器与jbog服务器通过线缆连接,基于所述普通服务器、jbog服务器以及外置pcie链路构建所述jbog服务器的测试系统。
140.具体地,本实施例为测试系统的构建过程。
141.参照图2,测试系统可以使用一台测试控制服务器作为控制机,控制机通过网络控制整个测试流程。一般服务器与jbog服务器通过线缆进行连接,接口上可以安装通过网络控制的通断器,用来模拟人为插拔线缆。jbod服务器内部在关键部件或电容上连接线缆,监控机器运行状态中的电压电流。
142.参照图3,本发明提供的jbog服务器故障容忍性测试方法的具体流程包括:
143.输入测试配置目测测试机器状态;
144.根据测试机器配置、形态设计测试用例,若机器安装有某型号的gpu,则安装gpu驱动,下载对应的测试程序;若机器安装其他设备,则安装其他设备对应的测试工具;根据机器安装的硬盘测试类型,安装硬盘对应的测试工具;
145.进行服务器故障容忍性测试;
146.测试1:运行性能测试时,断开线缆连接;
147.测试2、运行性能测试时,产生网络风暴;
148.……
149.判断所有的测试项是否完成;
150.若是,则汇总测试结果,生成测试报告;若否,则监控机器状态,将测试数据上传,将机器恢复,继续进行下一项测试。
151.下面对本发明提供的jbog服务器故障容忍性测试装置进行描述,下文描述的jbog服务器故障容忍性测试装置与上文描述的jbog服务器故障容忍性测试方法可相互对应参照。
152.参照图4,本发明提供一种种jbog服务器故障容忍性测试,包括以下模块:
153.配置模块410,用于构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
154.场景确定模块420,用于基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、gpu故障、电源故障以及链路故障中的至少一种;
155.运行模块430,用于基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;
156.测试模块440,用于基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
157.首先,在上述配置模块410中,构建jbog服务器的测试系统,也就是将一个jbog服务器通过外部pcie链路和一般服务器连接,可以为服务器提供高性能计算、低延时存储、带宽更高的网络等特性。
158.需要说明的是,jbog服务器是一种具有gpu设备、nvme设备、网卡等pcie设备组成的服务器,jbog服务器连接到一般的服务器时,jbog服务器会将自身的设备提供给一般的服务器使用。jbog服务器需要有更好的容错能力,以保证数据的安全和服务器的稳定运行。该服务器可以提供实时数据传输和处理,以及网络传输和管理所需的任何其他功能。它可用于处理大量数据或客户的同时,并且它具有许多内置的功能和模块,可用于处理各种不同类型的操作。
159.然后配置测试系统的测试环境,也就是在所述jbog服务器上安装测试软件和测试工具,以及安装测试设备所需的驱动程序。
160.需要说明的是,本实施例中的测试系统可以使用多种故障模式进行测试,包括硬件故障和软件故障。硬件故障可以模拟驱动器故障、pcie链路故障等,软件故障可以模拟操作系统故障、应用程序故障等。
161.然后通过上述场景确定模块420,根据实际的测试环境和测试需求,设计多种故障场景和测试用例。例如,可以设计cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障等各种故障场景,并设置不同的负载和数据流量。
162.进一步地,通过上述运行模块430,针对各种故障环境模拟出相应的故障条件,在此条件下运行对应的测试用例,以得到服务器的故障测试指标。比如,在cpu故障环境模拟的故障条件为cpu高温运行,在内存故障环境模拟的故障条件为内存高温运行,在电源故障环境在模拟的故障条件为服务器掉电等。以上故障条件仅为本实施例中的示例性描述。
163.可选地,所述故障测试指标包括服务器响应时间、错误日志、机器内关键部件的电压和电流、cpu使用率和内存使用率中的至少一种。
164.最后,通过上述测试模块440,对运行模块430中得到的各种故障环境下的故障测
试指标进行综合故障测试分析和评估,评估结果包括服务器的容错能力、性能指标、故障率、可用性等,可以提供重要参考,用于改进和优化服务器的设计。通过上述测试过程能够获取服务器对上述故障的容忍度,可以模拟出多种故障场景进故障容忍度综合测试。
165.本发明提供的jbog服务器故障容忍性测试方法、装置及电子设备,通过构建jbog服务器的测试系统,并配置测试系统的测试环境;基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;基于各故障场景模拟故障条件,在模拟的各故障条件下运行各测试用例,得到各故障场景对应的故障测试指标;基于故障测试指标进行jbog服务器的故障测试分析和评估。本发明能够通过jbog服务器进行多种故障场景的容忍性测试,可以对多种故障场景的故障测试指标进行分析和评估,实现针对多故障场景对服务器故障进行全面测试,提高测试效率。
166.在一些实施例中,在所述故障场景为cpu故障的情况下,运行模块具体用于:
167.在基本输入输出系统bios中禁用目标数量的cpu的计算核心的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
168.在禁用一个cpu的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
169.在所述jbog服务器正常运行时对cpu进行注错的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;
170.在cpu的温度超过第一预设阈值时运行所述jbog服务器的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标。
171.具体地,本实施例给出了故障环境为cpu故障,模拟cpu的故障条件,运行cpu故障的测试用例,得到在此场景下的故障测试指标。
172.其中,cpu故障可分为以下几种情况:
173.1、在基本输入输出系统bios中禁用部分cpu的计算核心(cpu core),对jbog服务器上的设备运行性能基准测试,验证cpu core减少的情况下对机器的影响。
174.2、直接禁用一个cpu。
175.3、当jbog服务器在正常运行时对cpu进行注错。
176.4、cpu的温度超过预设阈值,也就是cpu高温运行。
177.需要说明的是,服务器注错可能是指在服务器端编写程序时产生的错误,例如编写的代码不符合语法规则、逻辑错误、数据类型错误等等。这些错误可能会导致服务器异常、无法正常运行或者产生不正确的结果。服务器注错还可能指黑客攻击服务器的情况,黑客可能通过注入恶意代码、绕过安全措施等方式来攻击服务器系统,这种情况可能会导致服务器被入侵、信息泄露、数据丢失等严重后果。
178.本实施例通过模拟不同故障条件下的cpu故障场景,能够针对多种cpu故障场景下进行服务器故障测试,便于从多方面多角度地获取cpu故障的测试指标。
179.在一些实施例中,在所述故障场景为内存故障的情况下,运行模块具体用于:
180.在所述jbog服务器正常运行压力测试或性能测试的情况下,对内存进行注错,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;
181.在所述jbog的内存温度高于第二预设阈值的情况下,运行所述内存故障的测试用
例,得到所述内存故障对应的故障测试指标;
182.在禁用第二目标数量内存的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标。
183.具体地,本实施例给出了故障环境为内存故障,模拟内存的故障条件,运行内存故障的测试用例,得到在此场景下的故障测试指标。
184.其中,内存故障可分为以下几种情况:
185.1、在jbog服务器上的设备正常运行压力测试或性能测试时,对内存进行注错;
186.2、内存温度高于预设阈值,即内存高温运行;
187.3、禁用部分内存。
188.本实施例通过模拟不同故障条件下的内存故障场景,能够针对多种内存故障场景下进行服务器故障测试,便于从多方面多角度地获取内存故障的测试指标。
189.在一些实施例中,在所述故障场景为存储故障的情况下,运行模块具体用于:
190.在所述jbog服务器正常运行压力测试或性能测试的情况下,对所述jbog服务器的硬盘进行强制掉电,运行存储故障的测试用例,得到所述存储故障对应的故障测试指标。
191.具体地,本实施例给出了故障环境为存储故障,模拟存储故障的故障条件,运行存储故障的测试用例,得到在此场景下的故障测试指标。
192.可以体现为,在jbog服务器上的设备正常运行压力或性能测试时,对jbog服务器上的硬盘进行掉电处理;或者模拟不同的硬盘读写压力。
193.本实施例通过模拟不同故障条件下的存储故障场景,能够针对存储故障场景下进行服务器故障测试,获取存储故障的测试指标以进行评估和分析。
194.在一些实施例中,在所述故障场景为网络故障的情况下,运行模块具体用于:
195.在所述jbog服务器上的设备正常运行的情况下,产生网络风暴,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。
196.在所述jbog服务器进行网络压力测试的情况下,断开网络,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。
197.具体地,本实施例给出了故障环境为网络故障,模拟网络的故障条件,运行网络故障的测试用例,得到在此场景下的故障测试指标。
198.其中,网络故障可分为以下几种情况:
199.1、jbog服务器上的设备正常运行时,产生网络风暴;
200.2、jbog服务器进行网络压力测试时,断开网络。
201.本实施例通过模拟不同故障条件下的网络故障场景,能够针对多种网络故障场景下进行服务器故障测试,便于从多方面多角度地获取网络故障的测试指标。
202.在一些实施例中,在所述故障场景为电源故障的情况下,运行模块具体用于:
203.在所述jbog服务器运行的过程中禁用目标电源模块,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;
204.在所述jbog服务器运行的过程中进行服务器掉电,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;
205.调整jbog的目标模块的供电电压和供电电流,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标。
206.具体地,本实施例给出了故障环境为电源故障,模拟电源的故障条件,运行电源故障的测试用例,得到在此场景下的故障测试指标。
207.其中,电源故障可分为以下几种情况:
208.1、机器在运行中禁用某个电源模块;
209.2、机器运行中给给整个机器掉电;
210.3、调整部分供电的电压、电流等。
211.本实施例通过模拟不同故障条件下的电源故障场景,能够针对多种电源故障场景下进行服务器故障测试,便于从多方面多角度地获取电源故障的测试指标。
212.在一些实施例中,在所述故障场景为外部连接故障的情况下,运行模块具体用于:
213.在所述jbog服务器正常运行的情况下,断开外部连接线缆,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标;
214.在所述bios中禁用第三目标数量的线缆的链路,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标。
215.具体地,本实施例给出了故障环境为外部链路故障,模拟外部链路的故障条件,运行外部链路故障的测试用例,得到在此场景下的故障测试指标。
216.其中,外部链路故障可分为以下几种情况:
217.1、jbog服务器的设备正常运行时,断开外部连接线缆;
218.2、在bios中禁用部分线缆的链路。
219.本实施例通过模拟不同故障条件下的外部链路故障场景,能够针对多种外部链路故障场景下进行服务器故障测试,便于从多方面多角度地获取外部链路故障的测试指标。
220.在一些实施例中,所述构建jbog服务器的测试系统,并配置所述测试系统的测试环境,包括:
221.将普通服务器与jbog服务器通过线缆连接,基于所述普通服务器、jbog服务器以及外置pcie链路构建所述jbog服务器的测试系统。
222.具体地,本实施例为测试系统的构建过程。
223.测试系统可以使用一台测试控制服务器作为控制机,控制机通过网络控制整个测试流程。一般服务器与jbog服务器通过线缆进行连接,接口上可以安装通过网络控制的通断器,用来模拟人为插拔线缆。jbod服务器内部在关键部件或电容上连接线缆,监控机器运行状态中的电压电流。
224.图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(communications interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行jbog服务器故障容忍性测试方法,该方法包括:
225.构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
226.基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;
227.基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用
例,得到各所述故障场景对应的故障测试指标;
228.基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
229.此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
230.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的jbog服务器故障容忍性测试方法,该方法包括:
231.构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
232.基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;
233.基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;
234.基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
235.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的jbog服务器故障容忍性测试方法,该方法包括:
236.构建jbog服务器的测试系统,并配置所述测试系统的测试环境;
237.基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;
238.基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;
239.基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。
240.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
241.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指
令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
242.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种jbog服务器故障容忍性测试方法,其特征在于,包括:构建jbog服务器的测试系统,并配置所述测试系统的测试环境;基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。2.根据权利要求1所述的jbog服务器故障容忍性测试方法,其特征在于,在所述故障场景为cpu故障的情况下;所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:在基本输入输出系统bios中禁用目标数量的cpu的计算核心的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;在禁用一个cpu的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;在所述jbog服务器正常运行时对cpu进行注错的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标;在cpu的温度超过第一预设阈值时运行所述jbog服务器的情况下,运行所述cpu故障对应的测试用例,得到所述cpu故障对应的故障测试指标。3.根据权利要求1所述的jbog服务器故障容忍性测试方法,其特征在于,在所述故障场景为内存故障的情况下;所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:在所述jbog服务器正常运行压力测试或性能测试的情况下,对内存进行注错,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;在所述jbog的内存温度高于第二预设阈值的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标;在禁用第二目标数量内存的情况下,运行所述内存故障的测试用例,得到所述内存故障对应的故障测试指标。4.根据权利要求1所述的jbog服务器故障容忍性测试方法,其特征在于,在所述故障场景为存储故障的情况下;所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括:在所述jbog服务器正常运行压力测试或性能测试的情况下,对所述jbog服务器的硬盘进行强制掉电,运行存储故障的测试用例,得到所述存储故障对应的故障测试指标。5.根据权利要求1所述的jbog服务器故障容忍性测试方法,其特征在于,在所述故障场景为网络故障的情况下;所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测
试指标,包括以下任一种:在所述jbog服务器上的设备正常运行的情况下,产生网络风暴,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。在所述jbog服务器进行网络压力测试的情况下,断开网络,运行所述网络故障的测试用例,得到所述网络故障对应的故障测试指标。6.根据权利要求1所述的jbog服务器故障容忍性测试方法,其特征在于,在所述故障场景为电源故障的情况下;所述在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:在所述jbog服务器运行的过程中禁用目标电源模块,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;在所述jbog服务器运行的过程中进行服务器掉电,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标;调整jbog的目标模块的供电电压和供电电流,运行电源故障对应的测试用例,得到所述电源故障对应的故障测试指标。7.根据权利要求2所述的jbog服务器故障容忍性测试方法,其特征在于,在所述故障场景为外部连接故障的情况下;所述基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标,包括以下任一种:在所述jbog服务器正常运行的情况下,断开外部连接线缆,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标;在所述bios中禁用第三目标数量的线缆的链路,运行所述外部连接故障对应的测试用例,得到所述外部连接故障对应的故障测试指标。8.根据权利要求1所述的jbog服务器故障容忍性测试方法,其特征在于,所述构建jbog服务器的测试系统,并配置所述测试系统的测试环境,包括:将普通服务器与jbog服务器通过线缆连接,基于所述普通服务器、jbog服务器以及外置pcie链路构建所述jbog服务器的测试系统。9.根据权利要求8所述的jbog服务器故障容忍性测试方法,其特征在于,所述配置所述测试系统的测试环境,包括:在所述jbog服务器上安装测试软件和测试工具,以及安装测试设备所需的驱动程序。10.根据权利要求1-9任一项所述的jbog服务器故障容忍性测试方法,其特征在于,所述故障测试指标包括服务器响应时间、错误日志、机器内关键部件的电压和电流、cpu使用率和内存使用率中的至少一种。11.一种jbog服务器故障容忍性测试装置,其特征在于,包括:配置模块,用于构建jbog服务器的测试系统,并配置所述测试系统的测试环境;场景确定模块,用于基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括cpu故障、内存故障、存储故障、网络故障、gpu故障、电源故障以及链路故障中的至少一种;运行模块,用于基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所
述测试用例,得到各所述故障场景对应的故障测试指标;测试模块,用于基于所述故障测试指标进行所述jbog服务器的故障测试分析和评估。12.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至10任一项所述jbog服务器故障容忍性测试方法。13.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10任一项所述jbog服务器故障容忍性测试方法。
技术总结
本发明提供一种JBOG服务器故障容忍性测试方法、装置及电子设备,构建JBOG服务器的测试系统,并配置所述测试系统的测试环境;基于测试环境和测试需求,确定多种故障场景和各故障场景对应的测试用例,所述故障场景包括CPU故障、内存故障、存储故障、网络故障、电源故障以及链路故障中的至少一种;基于各所述故障场景模拟故障条件,在模拟的各故障条件下运行各所述测试用例,得到各所述故障场景对应的故障测试指标;基于所述故障测试指标进行所述JBOG服务器的故障测试分析和评估。本发明能够实现针对多故障场景对服务器故障进行全面测试,提高测试效率。高测试效率。高测试效率。
技术研发人员:刘茂峰 张文珂
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2023.04.21
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
