异构计算平台的节点系统控制方法、装置、设备及介质与流程

未命名 08-05 阅读:78 评论:0


1.本技术涉及异构计算技术领域,特别是涉及一种异构计算平台的节点系统控制方法、装置、设备及介质。


背景技术:

2.在异构计算平台中,运行操作系统及应用软件的异构计算节点片上系统可以根据应用场景进行灵活配置裁剪软件系统,实现最优化配置,相应地,该异构计算节点片上系统需要对其操作系统及软件包进行配置更新,即刷机。
3.目前,相关的刷机技术方案是采用独立于包含主机计算节点与异构计算节点片上系统构成的系统外的上位机对异构计算节点片上系统进行刷机。由于需要依赖上位机,故而,在不存在上位机的情况下,则无法实现对异构计算节点片上系统的刷机。
4.由此可见,在不存在上位机的情况下,实现对异构计算平台的异构计算节点片上系统的更新是本领域人员亟需解决的技术问题。


技术实现要素:

5.本技术的目的是提供一种异构计算平台的节点系统控制方法、装置、设备及介质,用于在不存在上位机的情况下,实现对异构计算平台的异构计算节点片上系统的更新。
6.为解决上述技术问题,本技术提供一种异构计算平台的节点系统控制方法,应用于主板管理控制器,所述方法包括:
7.获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;
8.在控制所述异构计算平台重启的过程中,控制所述目标异构计算节点上电以及控制主机计算节点上电;
9.利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序;其中,所述目标程序为所述刷机程序包中所述目标异构计算节点片上系统对应的程序。
10.优选地,在所述控制所述目标异构计算节点上电以及控制主机计算节点上电之前,还包括:
11.控制所述目标异构计算节点的约束引脚为低电平,以便所述目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。
12.优选地,在所述控制所述目标异构计算节点上电以及控制主机计算节点上电之前,还包括:
13.通过主板电源控制器控制所述目标异构计算节点的约束引脚为低电平,以便所述目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。
14.优选地,所述异构计算平台的节点系统还包括:信道选择路由器,在所述控制所述目标异构计算节点上电以及控制主机计算节点上电之后,所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序之前,还包括:
15.通过所述信道选择路由器建立所述主机计算节点与异构计算节点之间的信号通
道;
16.从所述信号通道中确定所述主机计算节点与所述目标异构计算节点之间的目标信号通道;
17.对应地,所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序包括:
18.将所述主机计算节点中的所述刷机程序包通过所述目标信号通道传输至所述目标异构计算节点;
19.利用所述刷机程序包将所述当前程序更新为所述目标程序。
20.优选地,在所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序之前,还包括:
21.判断所述主机计算节点上是否存在所述刷机程序包;
22.若是,则进入所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序的步骤;
23.若否,则通过网络将所述刷机程序包传输至所述主机计算节点,并进入所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序的步骤。
24.优选地,所述通过网络将所述刷机程序包传输至所述主机计算节点包括:
25.通过所述主板管理控制器的网络接口和/或所述主机计算节点的网络接口将所述刷机程序包传输至所述主机计算节点。
26.优选地,在所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序之后,还包括:
27.判断是否存在所述目标异构计算节点;
28.若是,则返回所述获取目标异构计算节点以及目标异构计算节点片上系统的当前程序的步骤;
29.若否,则控制所述异构计算平台启动。
30.为了解决上述技术问题,本技术还提供一种异构计算平台的节点系统的控制设备,包括主板管理控制器、主板电源控制器、主机计算节点、异构计算节点,还包括:信道选择路由器;
31.所述信道选择路由器用于建立所述主机计算节点与异构计算节点之间的信号通道;
32.所述信道选择路由器与所述主板管理控制器连接;
33.所述主板管理控制器用于获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制所述异构计算平台重启的过程中,控制或通过所述主板电源控制器控制所述目标异构计算节点上电,以及控制或通过所述主板电源控制器控制所述主机计算节点上电;从所述信号通道中确定所述主机计算节点与所述目标异构计算节点之间的目标信号通道;将所述主机计算节点中的所述刷机程序包通过所述目标信号通道传输至所述目标异构计算节点;利用所述刷机程序包将所述当前程序更新为所述目标程序。
34.优选地,还包括:远程计算机;
35.所述远程计算机通过网络接口与所述主板管理控制器连接,用于控制所述异构计算平台。
36.为了解决上述技术问题,本技术还提供一种异构计算平台的节点系统控制装置,应用于主板管理控制器,所述装置包括:
37.获取模块,用于获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;
38.控制模块,用于在控制所述异构计算平台重启的过程中,控制所述目标异构计算节点上电以及控制主机计算节点上电;
39.更新模块,用于利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序;其中,所述目标程序为所述刷机程序包中所述目标异构计算节点片上系统对应的程序。
40.为了解决上述技术问题,本技术还提供一种异构计算平台的节点系统控制装置,包括:
41.存储器,用于存储计算机程序;
42.处理器,用于执行所述计算机程序时实现上述的异构计算平台的节点系统控制方法的步骤。
43.为了解决上述技术问题,本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的异构计算平台的节点系统控制方法的步骤。
44.本技术所提供的异构计算平台的节点系统控制方法,应用于主板管理控制器,该方法包括:获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制异构计算平台重启的过程中,控制目标异构计算节点上电以及控制主机计算节点上电;利用主机计算节点中的刷机程序包将当前程序更新为目标程序;其中,目标程序为刷机程序包中目标异构计算节点片上系统对应的程序。可见,该方法中利用主板管理控制器实现了对异构计算平台的节点系统控制。由于主板管理控制器是异构计算平台的通用配置,故而,本技术实现了基于异构计算平台自身独立完成节点系统的控制,使得即使不存在独立于主机计算节点和异构计算节点的系统外的上位机也能实现对节点系统的控制,适用范围更广。
45.此外,本技术还提供一种异构计算平台的节点系统控制装置、计算机可读存储介质以及一种异构计算平台的节点系统控制设备,与上述提到的异构计算平台的节点系统控制方法具有相同或相对应的技术特征,效果同上。
附图说明
46.为了更清楚地说明本技术实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
47.图1为本技术实施例提供的一种典型的x86 cpu与异构计算节点片上系统组成的异构计算平台的系统架构图;
48.图2为本技术实施例提供的一种应用于主板管理控制器的异构计算平台的节点系统控制方法的流程图;
49.图3为本技术实施例提供的一种异构计算平台的节点系统的控制设备的架构图;
50.图4为本技术的一实施例提供的异构计算平台的节点系统控制装置的结构图;
51.图5为本技术另一实施例提供的异构计算平台的节点系统控制装置的结构图;
52.图6为本技术实施例提供的一种异构计算平台异构计算节点配置更新流程图。
具体实施方式
53.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。
54.本技术的核心是提供一种异构计算平台的节点系统控制方法、装置、设备及介质,用于在不存在上位机的情况下,实现对异构计算平台的异构计算节点片上系统的更新。
55.异构计算平台是一种新型的计算技术,它将多种不同的计算资源(如(中央处理器(central processing unit,cpu)、图形处理器(graphics processing unit,gpu)、现场可编程门阵列(field-programmable gate array,fpga)、专用集成电路(application specific integrated circuit,asic)等)整合在一起,充分利用这些不同的资源来实现高性能和高效的应用。通过异构计算平台,可以加快应用的执行速度并降低能耗。本技术的异构计算平台是一种片上系统(system on chip,soc),它包括cpu资源、arm cpu资源和神经网络芯片运行人工智能(artificial intelligence,ai)应用,实现快速部署和智能应用。本技术的异构计算平台支持单计算节点的部署,同时也支持将其符合高速串行计算机扩展总线标准(peripheral component cnterconnect express,pcie)总线资源配置为设备端节点(pcie device,pcie ep)模式。相较于使用以太网互联的计算节点,采用pcie总线将主机计算节点(host)和异构计算节点互联的系统具有更低的数据传输延迟,这样实现多节点计算平台可以获得更高的性能。图1为本技术实施例提供的一种典型的x86 cpu与异构计算节点片上系统组成的异构计算平台的系统架构图。如图1所示,主机计算节点1经pcie开关2并通过pcie总线与多个异构计算节点3连接。针对图1中的异构计算平台,其ai计算节点(异构计算节点)是一种片上系统,自身需要运行包括操作系统(operating system,os)在内的软件程序,不同于一般的pcie外设,异构计算节点的pcie ep模式需要在运行于异构计算节点的操作系统启动后,进行配置。而该异构计算平台的启动流程中,异构计算节点作为pcie的外设需要在主机计算节点发起对pcie设备扫描(pci scan)前,做好配置准备。另外该异构计算平台在正常运行状态下,异构计算节点作为pcie ep,其pcie相关配置的异常,会引起主机计算节点(cpu端)的异常中断,甚至主机重新启动。
56.在异构计算平台中,运行操作系统及应用软件的异构计算节点片上系统可以根据应用场景进行灵活配置裁剪软件系统,实现最优化配置,相应地,该异构计算节点片上系统需要对其操作系统及软件包进行配置更新,即刷机。
57.目前,相关的刷机技术方案是采用独立于包含主机计算节点与异构计算节点片上系统构成的系统外的上位机对异构计算节点片上系统进行刷机。由于需要依赖上位机,故而,在不存在上位机的情况下,则无法实现对异构计算节点片上系统的刷机。因此,本技术提供一种异构计算平台的节点系统控制方法,依赖异构计算平台即可独立完成系统配置的硬件架构及软件刷机流程。
58.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式
对本技术作进一步的详细说明。图2为本技术实施例提供的一种应用于主板管理控制器的异构计算平台的节点系统控制方法的流程图,如图2所示,该方法包括:
59.s10:获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;
60.s11:在控制异构计算平台重启的过程中,控制目标异构计算节点上电以及控制主机计算节点上电;
61.s12:利用主机计算节点中的刷机程序包将当前程序更新为目标程序;其中,目标程序为刷机程序包中目标异构计算节点片上系统对应的程序。
62.目标异构计算节点即为需要进行刷机的异构计算节点。对于目标异构计算节点、目标异构计算节点的数量等不作限定,根据实际情况确定。如异构计算平台中,主机计算节点与异构计算节点a,异构计算节点b、异构计算节点c通过pcie总线连接,实际中,当需要对异构计算节点a进行刷机,则异构计算节点a即为目标异构计算节点。
63.在确定出目标异构计算节点后,为了对目标计算节点进行刷机,需要使该异构计算平台具备更新的软件程序。通常情况下,预先将更新的软件程序存储在主机计算节点中。
64.在确定出目标异构计算节点以及配置更新程序后,主板管理控制器重启异构计算平台进入刷机配置状态。在重新启动过程中,控制目标异构节点上电和主机计算节点上电,根据主机中的软件程序便可以实现对目标异构计算节点的刷机。
65.本实施例所提供的异构计算平台的节点系统控制方法,应用于主板管理控制器,该方法包括:获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制异构计算平台重启的过程中,控制目标异构计算节点上电以及控制主机计算节点上电;利用主机计算节点中的刷机程序包将当前程序更新为目标程序;其中,目标程序为刷机程序包中目标异构计算节点片上系统对应的程序。可见,该方法中利用主板管理控制器实现了对异构计算平台的节点系统控制。由于主板管理控制器是异构计算平台的通用配置,故而,本实施例实现了基于异构计算平台自身独立完成节点系统的控制,使得即使不存在独立于主机计算节点和异构计算节点的系统外的上位机也能实现对节点系统的控制,适用范围更广。
66.由于异构计算平台在正常运行状态下,异构计算节点作为pcie ep,其pcie相关配置的异常,会引起主机计算节点的异常中断,甚至引起主机异常启动。在实施中,为了尽可能地避免主机计算节点异常重启,优选的实施方式是,在控制目标异构计算节点上电以及控制主机计算节点上电之前,还包括:
67.控制目标异构计算节点的约束引脚为低电平,以便目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。
68.在重新启动过程中,主板管理控制器控制异构计算节点的约束引脚,将约束引脚的电平调整为低电平。目标异构节点上电、主机计算节点上电后,目标异构计算节点即进入刷机状态。由于此时主机计算节点上电后,因为被刷机的目标异构计算节点目前并非pcie外设配置,故而主机正常启动,并在启动后根据存储的软件程序对目标异构节点进行程序更新。
69.本实施例提供的在控制目标异构计算节点上电以及控制主机计算节点上电之前,将目标异构计算节点的约束引脚的电平调整为低电平,使得主机计算节点上电后,由于被刷机的目标异构计算节点目前并非pcie外设配置,保证了主机正常启动。
70.上述实施例中通过主板管理控制器控制目标异构计算节点的约束引脚,尽可能使主机正常启动,在实施中,为了方便控制目标异构计算节点的约束引脚,优选的实施方式是,在控制目标异构计算节点上电以及控制主机计算节点上电之前,还包括:
71.通过主板电源控制器控制目标异构计算节点的约束引脚为低电平,以便目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。
72.主板电源控制器为异构计算平台通用的配置。主板电源控制器一般由复杂的逻辑元件(complex programmable logic device,cpld)或asic芯片实现。在通过主板电源控制器控制目标异构计算节点的约束引脚时,只需要通过主板电源控制器的一个引脚便可以实现。
73.本实施例提供的通过主板电源控制器控制目标异构计算节点的约束引脚的方式,易于实现。
74.实际中,目标异构计算节点可能为多个。针对需要加载操作系统的异构计算节点组成符合高速串行计算机扩展总线标准的总线拓扑的异构计算平台,其异构计算节点的软件系统更新需要独立的配置(刷机)环境(硬件主机及其软件)。具体地,使用独立于主机计算节点和异构计算节点组成的系统之外的上位机来对目标异构计算节点进行刷机时,一般情况下,主机计算节点在刷机过程中,只能连接一个目标异构计算节点,特别是在一套计算平台包含多个目标异构计算节点的系统中,需要人工选择目标设备的硬件配置通道和配置程序,故而,不适合批量产品的烧录更新;此外,包含异构计算节点的异构计算平台或批量部署于一些边缘端应用场景,现场对系统更新维护效率低,工程难度大,因此,不适合系统已部署条件下的远程烧录更新。为了能够实现自动更新,优选的实施方式是,异构计算平台的节点系统还包括:信道选择路由器,控制目标异构计算节点上电以及控制主机计算节点上电之后,利用主机计算节点中的刷机程序包将当前程序更新为目标程序之前,还包括:
75.通过信道选择路由器建立主机计算节点与异构计算节点之间的信号通道;
76.从信号通道中确定主机计算节点与目标异构计算节点之间的目标信号通道;
77.对应地,利用主机计算节点中的刷机程序包将当前程序更新为目标程序包括:
78.将主机计算节点中的刷机程序包通过目标信号通道传输至目标异构计算节点;
79.利用刷机程序包将当前程序更新为目标程序。
80.主机计算节点能够通过信道选择路由器访问各异构计算节点,该信道选择路由器是支持各个异构节点配置更新的。具体到jetson节点的配置更新,因为jetson节点的配置更新通路是通用串行总线(universal serial bus,usb),这个信号通路的集线器为usb hub。
81.本实施例提供的方法中,通过信道选择路由器实现了自动建立主机计算节点与目标异构计算节点之间的信号通道,使得主机计算节点中的软件程序能够通过信号通道传输至目标异构计算节点,从而实现对目标异构计算节点的刷机。
82.在通过主机计算节点中的软件程序对目标异构计算节点进行刷机的过程中,主机计算节点中需要有更新的软件程序,否则无法对目标异构计算节点进行刷机。因此,为了尽可能地保证对目标异构计算节点刷机成功,优选的实施方式是,在利用主机计算节点中的刷机程序包将当前程序更新为目标程序之前,还包括:
83.判断主机计算节点上是否存在刷机程序包;
84.若是,则进入利用主机计算节点中的刷机程序包将当前程序更新为目标程序的步骤;
85.若否,则通过网络将刷机程序包传输至主机计算节点,并进入利用主机计算节点中的刷机程序包将当前程序更新为目标程序的步骤。
86.具体地,通过网络将刷机程序包传输至主机计算节点包括:
87.通过主板管理控制器的网络接口和/或主机计算节点的网络接口将刷机程序包传输至主机计算节点。
88.本实施例提供的预先存储在主机计算节点下的软件程序包,或者通过网络(主板管理控制器网络接口,或主机计算节点的网络接口)传输软件程序包至主机计算节点,使得主机计算节点中存在更新的软件程序,尽可能地保证了目标异构计算节点能够被刷机成功。
89.在实施中,为了能够尽可能地保证所有的目标异构计算节点能够被刷机,优选的实施方式是,在利用主机计算节点中的刷机程序包将当前程序更新为目标程序之后,还包括:
90.判断是否存在目标异构计算节点;
91.若是,则返回获取目标异构计算节点以及目标异构计算节点片上系统的当前程序的步骤;
92.若否,则控制异构计算平台启动。
93.判断是否存在目标异构计算节点可以是根据用户确定是否需要刷机,也可以是检测引脚状态,若引脚的电平为低电平,则进入刷机状态。
94.本实施例提供的方法中,若存在目标异构计算节点,则对目标异构计算节点进行刷机,若不存在目标异构计算节点,则控制异构计算平台启动,能够尽可能地保证目标异构计算节点能够被刷机。
95.上文中描述了一种异构计算平台的节点系统的控制方法,本实施例还提供一种异构计算平台的节点系统的控制设备。图3为本技术实施例提供的一种异构计算平台的节点系统的控制设备的架构图,如图3所示,该设备包括主板管理控制器4、主板电源控制器5、主机计算节点1、异构计算节点3,还包括:信道选择路由器6;
96.信道选择路由器6用于建立主机计算节点1与异构计算节点3之间的信号通道;
97.信道选择路由器6与主板管理控制器4连接;
98.主板管理控制器4用于获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制异构计算平台重启的过程中,控制或通过主板电源控制器5控制目标异构计算节点上电,以及控制或通过主板电源控制器5控制主机计算节点1上电;从信号通道中确定主机计算节点1与目标异构计算节点之间的目标信号通道;将主机计算节点1中的刷机程序包通过目标信号通道传输至目标异构计算节点;利用刷机程序包将当前程序更新为目标程序。
99.实际中,异构计算平台的节点系统的控制设备还包括:远程计算机;
100.远程计算机通过网络接口与主板管理控制器连接,用于控制异构计算平台。
101.本实施例提供的异构计算平台的节点系统的控制设备具备独立配置异构计算节点的硬件条件,主要包括以下三方面的内容:
102.(1)一个主板管理控制器,在一般的通用服务器或工控机中称为board主板管理控制器(management controller,bmc),在嵌入式的计算机中也可以由微控制器(micro controller unit,mcu)完成该部分功能。该控制器包括一个对外通信的网络接口,远程计算机可以通过网络接口访问主板管理控制器,进一步控制该异构计算平台。
103.(2)该异构计算平台包括一个主板电源控制器,该控制器一般由cpld或asic芯片实现,主板管理控制器能够通过电源控制器控制异构计算平台上计算节点的电源。另外cpld或主板管理控制器能够控制异构计算节点的约束引脚,控制异构计算节点进入刷机状态或一般启动状态。
104.(3)主机计算节点能够通过信道选择路由器访问各异构计算节点,该信道选择路由器是支持各个异构节点配置更新的。
105.本实施例提供的异构计算平台的节点系统的控制设备,与上文中描述的异构计算平台的节点系统的控制方法具有相同或相对应的技术特征,上文中已对异构计算平台的节点系统的控制方法的实施例进行了详细地描述,此处对于异构计算平台的节点系统的控制设备的实施例不再赘述,并且具有与上述提到的异构计算平台的节点系统的控制方法相同的有益效果。
106.在上述实施例中,对于异构计算平台的节点系统控制方法进行了详细描述,本技术还提供对应的实施例。需要说明的是,本技术从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
107.图4为本技术的一实施例提供的异构计算平台的节点系统控制装置的结构图。本实施例基于功能模块的角度,包括:
108.获取模块10,用于获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;
109.控制模块11,用于在控制异构计算平台重启的过程中,控制目标异构计算节点上电以及控制主机计算节点上电;
110.更新模块12,用于利用主机计算节点中的刷机程序包将当前程序更新为目标程序;其中,目标程序为刷机程序包中目标异构计算节点片上系统对应的程序。
111.由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。并且具有与上述提到的异构计算平台的节点系统控制方法相同的有益效果。
112.此外,异构计算平台的节点系统控制装置还包括:
113.第一控制模块,用于控制目标异构计算节点的约束引脚为低电平,以便目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。
114.异构计算平台的节点系统控制装置还包括:
115.第二控制模块,用于通过主板电源控制器控制目标异构计算节点的约束引脚为低电平,以便目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。
116.异构计算平台的节点系统控制装置还包括:
117.建立模块,用于通过信道选择路由器建立主机计算节点与异构计算节点之间的信号通道;
118.确定模块,用于从信号通道中确定主机计算节点与目标异构计算节点之间的目标
信号通道;
119.更新模块具体用于将主机计算节点中的刷机程序包通过目标信号通道传输至目标异构计算节点;利用刷机程序包将当前程序更新为目标程序。
120.异构计算平台的节点系统控制装置还包括:
121.第一判断模块,用于判断主机计算节点上是否存在刷机程序包;
122.若是,则触发更新模块;
123.若否,则触发传输模块,用于通过网络将刷机程序包传输至主机计算节点,之后触发更新模块。
124.传输模块具体用于通过主板管理控制器的网络接口和/或主机计算节点的网络接口将刷机程序包传输至主机计算节点。
125.异构计算平台的节点系统控制装置还包括:
126.第二判断模块,用于判断是否存在目标异构计算节点;
127.若是,则触发获取模块;
128.若否,则控制第三控制模块,第三控制模块用于控制异构计算平台启动。
129.图5为本技术另一实施例提供的异构计算平台的节点系统控制装置的结构图。本实施例基于硬件角度,如图5所示,异构计算平台的节点系统控制装置包括:
130.存储器20,用于存储计算机程序;
131.处理器21,用于执行计算机程序时实现如上述实施例中所提到的异构计算平台的节点系统控制方法的步骤。
132.其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(digital signal processor,dsp)、fpga、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu;协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有gpu,gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(artificial intelligence,ai)处理器,该ai处理器用于处理有关机器学习的计算操作。
133.存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的异构计算平台的节点系统控制方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括windows、unix、linux等。数据203可以包括但不限于上述所提到的异构计算平台的节点系统控制方法所涉及到的数据等。
134.在一些实施例中,异构计算平台的节点系统控制装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
135.本领域技术人员可以理解,图5中示出的结构并不构成对异构计算平台的节点系统控制装置的限定,可以包括比图示更多或更少的组件。
136.本技术实施例提供的异构计算平台的节点系统控制装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:异构计算平台的节点系统控制方法,效果同上。
137.本技术还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
138.可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
139.本技术提供的计算机可读存储介质包括上述提到的异构计算平台的节点系统控制方法,效果同上。
140.为了使本技术领域的人员更好地理解本技术方案,下面结合附图6和具体实施方式对本技术作进一步的详细说明。图6为本技术实施例提供的一种异构计算平台异构计算节点配置更新流程图。如图6所示,该方法包括:
141.s13:输入更新的目标异构计算节点;
142.s14:判断是否进入异构计算节点刷机流程;若是,则进入步骤s15;若否,则进入步骤s18;
143.s15:控制异构计算平台重新启动;
144.s16:控制目标异构计算节点硬件约束,连通刷机信道通路,并控制目标异构计算节点上电;
145.s17:控制主机计算节点上电,主机计算节点对目标异构计算节点更新程序;
146.s18:控制异构节点启动、重置;
147.s19:控制主机计算节点上电、启动,以便主机计算节点扫描符合高速串行计算机扩展总线标准的设备;
148.s20:确定平台启动完成。
149.该异构计算平台中异构计算节点的配置更新主要包括以下步骤:
150.(1)需要使该异构计算平台具备更新的软件程序,它可以是预先存储在主机计算节点下的软件程序包,也可以是通过网络(主板管理控制器网络接口,或主机计算节点的网络接口)传输至主机计算节点的软件程序包。
151.(2)通过访问主板管理控制器确定需要进行配置更新的目标节点、配置更新程序。
152.(3)主板管理控制器重启异构计算平台进入刷机配置状态。在重新启动过程中,主板管理控制器或主板电源控制器控制目标异构计算节点的约束引脚后,目标异构计算节点上电启动,目标节点即进入刷机态,并连通刷新信号通路。此时主机计算节点上电启动,因为被刷机节点目前并非符合高速串行计算机扩展总线标准外设配置,主机计算节点正常启动,并在启动后将刷机程序包通过配置通路对目标异构节点进行程序更新。
153.(4)目标节点更新完成后,主板管理控制器发起异构计算平台正常启动流程。
154.可见,本技术提供的异构计算平台包括运行操作系统和应用软件的异构计算节点,平台自身的主机计算节点能够实现对异构计算节点系统的更新。同时也解决了在符合高速串行计算机扩展总线标准的外设配置更改过程中主机异常重启的问题。
155.以上对本技术所提供的异构计算平台的节点系统控制方法、装置、设备及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
156.还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

技术特征:
1.一种异构计算平台的节点系统控制方法,其特征在于,应用于主板管理控制器,所述方法包括:获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制所述异构计算平台重启的过程中,控制所述目标异构计算节点上电以及控制主机计算节点上电;利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序;其中,所述目标程序为所述刷机程序包中所述目标异构计算节点片上系统对应的程序。2.根据权利要求1所述的异构计算平台的节点系统的控制方法,其特征在于,在所述控制所述目标异构计算节点上电以及控制主机计算节点上电之前,还包括:控制所述目标异构计算节点的约束引脚为低电平,以便所述目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。3.根据权利要求1所述的异构计算平台的节点系统的控制方法,其特征在于,在所述控制所述目标异构计算节点上电以及控制主机计算节点上电之前,还包括:通过主板电源控制器控制所述目标异构计算节点的约束引脚为低电平,以便所述目标异构计算节点为非符合高速串行计算机扩展总线标准的外设配置。4.根据权利要求1至3任意一项所述的异构计算平台的节点系统的控制方法,其特征在于,所述异构计算平台的节点系统还包括:信道选择路由器,在所述控制所述目标异构计算节点上电以及控制主机计算节点上电之后,所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序之前,还包括:通过所述信道选择路由器建立所述主机计算节点与异构计算节点之间的信号通道;从所述信号通道中确定所述主机计算节点与所述目标异构计算节点之间的目标信号通道;对应地,所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序包括:将所述主机计算节点中的所述刷机程序包通过所述目标信号通道传输至所述目标异构计算节点;利用所述刷机程序包将所述当前程序更新为所述目标程序。5.根据权利要求1所述的异构计算平台的节点系统的控制方法,其特征在于,在所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序之前,还包括:判断所述主机计算节点上是否存在所述刷机程序包;若是,则进入所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序的步骤;若否,则通过网络将所述刷机程序包传输至所述主机计算节点,并进入所述利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序的步骤。6.根据权利要求5所述的异构计算平台的节点系统的控制方法,其特征在于,所述通过网络将所述刷机程序包传输至所述主机计算节点包括:通过所述主板管理控制器的网络接口和/或所述主机计算节点的网络接口将所述刷机程序包传输至所述主机计算节点。7.根据权利要求1所述的异构计算平台的节点系统的控制方法,其特征在于,在所述利
用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序之后,还包括:判断是否存在所述目标异构计算节点;若是,则返回所述获取目标异构计算节点以及目标异构计算节点片上系统的当前程序的步骤;若否,则控制所述异构计算平台启动。8.一种异构计算平台的节点系统的控制设备,包括主板管理控制器、主板电源控制器、主机计算节点、异构计算节点,其特征在于,还包括:信道选择路由器;所述信道选择路由器用于建立所述主机计算节点与异构计算节点之间的信号通道;所述信道选择路由器与所述主板管理控制器连接;所述主板管理控制器用于获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制所述异构计算平台重启的过程中,控制或通过所述主板电源控制器控制所述目标异构计算节点上电,以及控制或通过所述主板电源控制器控制所述主机计算节点上电;从所述信号通道中确定所述主机计算节点与所述目标异构计算节点之间的目标信号通道;将所述主机计算节点中的所述刷机程序包通过所述目标信号通道传输至所述目标异构计算节点;利用所述刷机程序包将所述当前程序更新为所述目标程序。9.根据权利要求8所述的异构计算平台的节点系统的控制设备,其特征在于,还包括:远程计算机;所述远程计算机通过网络接口与所述主板管理控制器连接,用于控制所述异构计算平台。10.一种异构计算平台的节点系统控制装置,其特征在于,应用于主板管理控制器,所述装置包括:获取模块,用于获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;控制模块,用于在控制所述异构计算平台重启的过程中,控制所述目标异构计算节点上电以及控制主机计算节点上电;更新模块,用于利用所述主机计算节点中的刷机程序包将所述当前程序更新为目标程序;其中,所述目标程序为所述刷机程序包中所述目标异构计算节点片上系统对应的程序。11.一种异构计算平台的节点系统控制装置,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的异构计算平台的节点系统控制方法的步骤。12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的异构计算平台的节点系统控制方法的步骤。

技术总结
本申请公开了一种异构计算平台的节点系统控制方法、装置、设备及介质,涉及异构计算技术领域。应用于主板管理控制器,该方法包括:获取目标异构计算节点以及目标异构计算节点片上系统的当前程序;在控制异构计算平台重启的过程中,控制目标异构计算节点上电以及控制主机计算节点上电;利用主机计算节点中的刷机程序包将当前程序更新为目标程序。可见,该方法中利用主板管理控制器实现了对异构计算平台的节点系统控制。由于主板管理控制器是异构计算平台的通用配置,故而,本申请实现了基于异构计算平台自身独立完成节点系统的控制,使得即使不存在独立于主机计算节点和异构计算节点的系统外的上位机也能实现对节点系统的控制,适用范围更广。适用范围更广。适用范围更广。


技术研发人员:张晶威 董培强 詹景麟
受保护的技术使用者:山东云海国创云计算装备产业创新中心有限公司
技术研发日:2023.04.27
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐