一种算力资源拓扑的生成方法、装置及可读存储介质与流程
未命名
08-29
阅读:90
评论:0

1.本发明涉及网络技术领域,尤其涉及一种算力资源拓扑的生成方法、装置及可读存储介质。
背景技术:
2.现有算力资源拓扑的生成方法一般通过边界网关协议(bgp,border gateway protocol)或互联网协议第6版(ipv6)中的扩展字段,携带网络节点自身的算力,发送给临近网络节点(即邻居节点),从而实现各个网络节点的算力感知以及算力资源拓扑的生成,然而,这些方法存在对于二层网络算力资源无法感知以及三层网络算力资源感知不全面的问题。
技术实现要素:
3.本发明所要解决的技术问题是针对现有技术的上述不足,提供一种算力资源拓扑的生成方法、装置及可读存储介质,用以解决现有的算力资源拓扑的生成方法存在对于二层网络算力资源无法感知以及三层网络算力资源感知不全面的问题。
4.第一方面,本发明提供一种算力资源拓扑的生成方法,应用于网络节点,所述方法包括:
5.向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;
6.接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;
7.将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
8.进一步地,所述向邻居节点发送第一lldp报文之前,所述方法还包括:
9.将算力资源划分为通用算力、图形算力和专用算力;
10.根据所述网络节点对应的通用算力、图形算力以及专用算力的最大算力和剩余算力得到所述算力资源信息。
11.进一步地,所述网络节点的算力资源信息为128位;其中,
12.第1到第42位用于表示所述网络节点对应的通用算力的最大算力和剩余算力;
13.第43到第84位用于表示所述网络节点对应的图形算力的最大算力和剩余算力;
14.第85到第126位用于表示所述网络节点对应的专用算力的最大算力和剩余算力;
15.第127到128位用于表示以下至少之一:所述网络节点是否为算力节点、所述网络节点是否能够对外提供算力服务、所述网络节点的算力资源是否存在故障。
16.进一步地,所述方法还包括:
17.将所述网络节点的mac地址信息以及算力资源信息存储至本地管理信息库mib中;
18.将所述邻居节点的mac地址信息以及算力资源信息存储至远端mib中。
19.进一步地,所述方法还包括:
20.当检测到所述邻居节点的算力资源信息和/或mac地址信息发生变化时,向所述管控系统发送所述邻居节点的新的算力资源信息和/或mac地址信息。
21.第二方面,本发明提供一种算力资源拓扑的生成方法,应用于管控系统,所述方法包括:
22.接收各网络节点发送的所述网络节点对应的mac地址信息和算力资源信息,以及所述网络节点的邻居节点的mac地址信息;
23.其中,所述mac地址信息和算力资源信息是所述网络节点向所述邻居节点发送第一lldp报文,并接收到所述邻居节点发送的第二lldp报文后发送的,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;
24.根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
25.进一步地,所述方法还包括:
26.接收所述网络节点发送的所述邻居节点的新的算力资源信息和/或mac地址信息;
27.根据所述新的算力资源信息和/或mac地址信息更新所述算力资源拓扑。
28.进一步地,所述方法还包括:
29.向上层管控系统发送本域对应的所述算力资源拓扑,以使所述上层管控系统根据接收到的算力资源拓扑以及跨域连接数据生成整网对应的算力资源拓扑。
30.第三方面,本发明提供一种算力资源拓扑的生成装置,应用于网络节点,所述装置包括:
31.第一报文发送模块,用于向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;
32.第二报文接收模块,用于接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;
33.算力信息发送模块,与所述第一报文发送模块以及第二报文接收模块连接,用于将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
34.第四方面,本发明提供一种算力资源拓扑的生成装置,应用于管控系统,所述装置包括:
35.算力信息接收模块,用于接收各网络节点发送的所述网络节点对应的mac地址信息和算力资源信息,以及所述网络节点的邻居节点的mac地址信息;
36.其中,所述mac地址信息和算力资源信息是所述网络节点向所述邻居节点发送第一lldp报文,并接收到所述邻居节点发送的第二lldp报文后发送的,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节
点的算力资源信息,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;
37.算力资源拓扑生成模块,与所述算力信息接收模块连接,用于根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
38.第五方面,本发明提供一种算力资源拓扑的生成装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述第一方面或第二方面所述的算力资源拓扑的生成方法。
39.第六方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面或第二方面所述的算力资源拓扑的生成方法。
40.本发明提供的算力资源拓扑的生成方法、装置及可读存储介质,首先向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;然后,接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;再将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。本发明通过在二层网络链路层发现协议(lldp)的扩展字段中携带算力资源信息,能够实现二层网络节点之间算力资源信息的交互,自动生成算力资源拓扑,从而能够提升算力资源感知效率,提高算力网络节点中算力资源的利用率,为算力业务调度与算力资源分配打下坚实基础,解决了现有的算力资源拓扑的生成方法存在对于二层网络算力资源无法感知以及三层网络算力资源感知不全面的问题。
附图说明
41.图1为本发明实施例1的一种算力资源拓扑的生成方法的流程图;
42.图2为本发明实施例的一种算力资源拓扑的生成方法的场景图;
43.图3为本发明实施例的一种算力资源拓扑的生成方法的又一场景图;
44.图4为本发明实施例2的一种算力资源拓扑的生成方法的流程图;
45.图5为本发明实施例3的一种算力资源拓扑的生成装置的结构示意图;
46.图6为本发明实施例4的一种算力资源拓扑的生成装置的结构示意图;
47.图7为本发明实施例5的一种算力资源拓扑的生成装置的结构示意图。
具体实施方式
48.为使本领域技术人员更好地理解本发明的技术方案,下面将结合附图对本发明实施方式作进一步地详细描述。
49.可以理解的是,此处描述的具体实施例和附图仅仅用于解释本发明,而非对本发明的限定。
50.可以理解的是,在不冲突的情况下,本发明中的各实施例及实施例中的各特征可相互组合。
51.可以理解的是,为便于描述,本发明的附图中仅示出了与本发明相关的部分,而与本发明无关的部分未在附图中示出。
52.可以理解的是,本发明的实施例中所涉及的每个单元、模块可仅对应一个实体结构,也可由多个实体结构组成,或者,多个单元、模块也可集成为一个实体结构。
53.可以理解的是,本发明的实施例中的术语“第一”、“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
54.可以理解的是,在不冲突的情况下,本发明的流程图和框图中所标注的功能、步骤可按照不同于附图中所标注的顺序发生。
55.可以理解的是,本发明的流程图和框图中,示出了按照本发明各实施例的系统、装置、设备、方法的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可代表一个单元、模块、程序段、代码,其包含用于实现规定的功能的可执行指令。而且,框图和流程图中的每个方框或方框的组合,可用实现规定的功能的基于硬件的系统实现,也可用硬件与计算机指令的组合来实现。
56.可以理解的是,本发明实施例中所涉及的单元、模块可通过软件的方式实现,也可通过硬件的方式来实现,例如单元、模块可位于处理器中。
57.申请概述
58.随着数字经济的发展,算力已经成为新时代数字经济发展的新生产力。将算力基础设施化,发展成算力网络,降低算力服务成本,算力广泛服务于数字社会各个方面,才能推动数字经济更加稳健、高质量发展。然而,如何自动感知网络中各节点的算力并生成算力资源拓扑,已成为当前亟待解决的问题。
59.现有算力资源拓扑的生成方法一般通过边界网关协议(bgp)或互联网协议第6版(ipv6)中的扩展字段,携带网络节点自身的算力,发送给临近网络节点(即邻居节点),从而实现各个网络节点的算力感知以及算力资源拓扑的生成。
60.具体地,网络节点通过在ipv6扩展字段中插入节点自身的算力资源,将ipv6数据包发送给同一as(autonomous system,自治系统)内部的其他节点设备。同理,网络节点还能从同一as内的其他节点设备获取ipv6数据包,并记录其算力资源。从而实现同一as内支持ipv6的三层网络节点的算力资源拓扑的自动发现。但该方法仅能自动获取同一as内部的支持ipv6协议的算力资源拓扑。对于不同as之间的算力资源交互,则通过bgp协议实现。在as边缘的三层网络设备,将自身as下所有感知到的算力资源通过bgp协议传递给相邻的as网络,从而实现算力资源跨as传递。但由于bgp或ipv6均属于三层(传输层)网络协议,仅能够通过三层网络传播,而现网中还有大量的二层网络节点同样具有算力资源,因此,现有方法无法感知二层(数据链路层)网络节点的算力资源,仅能够通过人工上报的方式实现算力资源拓扑的生成,而人工上报的方式无法实时感知当前网络的算力资源,存在很严重的滞后性,对算网业务分配以及算力资源的调度造成严重影响。此外,现网中有很多设备仅支持ipv4协议,不支持ipv6协议;且bgp协议是用于不同as之间的外部网关协议,对于同一自治系统(as)内部的网络节点并不适用。因此,现有方法仅能够得到支持ipv6或不同as之间的三层网络节点的算力资源拓扑,无法实现二层网络节点的算力资源拓扑的自动发现。
61.针对上述技术问题,本技术的构思是提供一种算力资源拓扑的生成方法、装置及可读存储介质,通过在二层网络链路层发现协议(lldp,link layer discovery protocol)
的扩展字段中携带算力资源信息,能够实现二层网络节点之间算力资源信息的交互,自动生成算力资源拓扑,从而能够提升算力资源感知效率,提高算力网络节点中算力资源的利用率,为算力业务调度与算力资源分配打下坚实基础,解决了业界对于二层网络算力资源无法感知和三层网络算力资源感知不全面的问题。
62.在介绍了本技术的基本原理之后,下面将参考附图来具体介绍本技术的各种非限制性实施例。
63.实施例1:
64.本实施例提供一种算力资源拓扑的生成方法,应用于网络节点,如图1所示,该方法包括:
65.步骤s101:向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac(media access control,介质访问控制层)地址信息,扩展字段携带所述网络节点的算力资源信息。
66.在本实施例中,网络节点可以是交换机、路由器、服务器、pc机等任何网络设备或其组合。网络节点事先开启lldp协议,并定义lldpdu扩展字段,网络节点通过向邻居节点发送第一lldp报文,使得邻居节点能够获知网络节点的mac地址和算力资源信息。
67.可选地,所述向邻居节点发送第一lldp报文之前,所述方法还包括:
68.将算力资源划分为通用算力、图形算力和专用算力;
69.根据所述网络节点对应的通用算力、图形算力以及专用算力的最大算力和剩余算力得到所述算力资源信息。
70.在本实施例中,算力资源可以分为:通用算力(cpu)、图形算力(gpu)、专用算力三类。一般浮点计算类业务主要需要靠cpu来运算,需要用到通用算力;图像处理类业务主要需要靠gpu来运算,需要用到图形算力;一些特殊的算力业务可能会用到专门的处理器(例如fpga),需要专用算力。在向邻居节点发送第一lldp报文之前,网络节点将三种算力的最大算力和剩余算力分别插入到lldp协议的数据单元(lldpdu)的扩展字段中,通过lldp协议发现与通告网络中节点设备的算力资源信息。
71.可选地,所述网络节点的算力资源信息为128位;其中,
72.第1到第42位用于表示所述网络节点对应的通用算力的最大算力和剩余算力;
73.第43到第84位用于表示所述网络节点对应的图形算力的最大算力和剩余算力;
74.第85到第126位用于表示所述网络节点对应的专用算力的最大算力和剩余算力;
75.第127到128位用于表示以下至少之一:所述网络节点是否为算力节点、所述网络节点是否能够对外提供算力服务、所述网络节点的算力资源是否存在故障。
76.在本实施例中,lldpdu的扩展字段共占用128个bit位的空间,用于存储128位的算力资源信息,具体定义可以如下:
77.第1到第42位用于通用算力(cpu),其中,第1位到第21位表示网络节点的最大通用算力,第22位到第42位表示网络节点的剩余通用算力。
78.第43到第84位用于图形算力(gpu),其中第43位到第63位表示网络节点的最大图形算力,第64位到第84位表示网络节点的剩余图形算力。
79.第85到第126位用于专用算力,其中第85位到第105位表示网络节点的最大专用算力,第106位到第126位表示网络节点的剩余专用算力。
80.第127和128位用于表示以下至少之一:所述网络节点是否为算力节点、所述网络节点是否能够对外提供算力服务、所述网络节点的算力资源是否存在故障。比如用00表示该网络节点不是算力节点,在算力网络中仅能够转发算力数据,无法处理算力数据;用01表示该网络节点是算力节点,但目前不提供对外的算力服务,即该节点的算力能力当前不希望提供给算力网络使用(可能预留给内部使用);用10表示该网络节点是算力节点且能够正常对外提供算力服务;用11表示该网络节点部分算力资源存在故障,需要尽快维修(例如gpu算力故障,但cpu算力正常,虽然gpu最大和剩余算力均为0,但可以通过维修恢复正常,需尽快维修。与不提供gpu算力的网络节点中gpu最大和剩余算力均为0产生区分)。
81.需要说明的是,当前网络中既包括具备算力资源的网络节点,又包括不具备算力资源的网络节点,通过第127和128位进行区分,从而便于算力资源拓扑的建立。
82.需要说明的是,一个网络节点可以由一台或多台网络设备组成,在计算算力资源时,该网络节点的算力资源等于该节点内所有网络设备的资源总和,网络节点的mac地址可以通过节点中的出口设备(或核心设备)的mac表示,一个节点仅存在唯一的一个mac。本发明在描述中不严格区分网络“节点”和网络“设备”。
83.步骤s102:接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息。
84.在本实施例中,邻居节点可以是交换机、路由器、服务器、pc机等任何网络设备或其组合。邻居节点事先开启lldp协议,并定义lldpdu扩展字段,网络节点通过接收邻居节点发送第二lldp报文,能够获知邻居节点的mac地址和算力资源信息。其中,邻居节点的算力资源信息与网络节点的算力资源信息的定义类似。
85.可选地,所述方法还包括:
86.将所述网络节点的mac地址信息以及算力资源信息存储至本地管理信息库mib中;
87.将所述邻居节点的mac地址信息以及算力资源信息存储至远端mib中。
88.在本实施例中,每个网络节点中具有两个管理信息库,一个是用于维护本地节点的mib信息,一个用于维护远端节点的mib信息,网络节点将自身的算力资源信息(lldpdu扩展字段中定义的128个bit位)与mac地址信息加入到本地mib中,将邻居节点的算力资源信息以及mac地址信息存储至远端mib中。
89.步骤s103:将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
90.在本实施例中,每个管控系统对应一个as域,管控系统通过接收本域内各网络节点发送的本地信息和邻居信息,能够生成本域对应的算力资源拓扑。需要说明的是,网络节点也可以将邻居节点的算力资源信息一并发送给管控系统,管控系统在接收到各网络节点发送各网络节点及其邻居节点的mac地址信息和算力资源信息后,进行算力资源拓扑分析,生成本域对应的算力资源拓扑。
91.在本实施例中,由于当前网络中还存在不具备算力资源的节点,而这些节点和具备算力资源的节点是相连的,管控系统通过接收本域内各网络节点发送的本地mac地址信息和算力资源信息以及邻居节点的mac地址信息能够发现所有的网络拓扑,通过排除掉其
中的非算力节点即可得到对应的算力资源拓扑。
92.在本实施例中,算力资源拓扑包括二层及以上网络连接关系与算力资源信息(不仅是二层网络,由于三层网络支持二层协议,因此,包括所有二层网络节点与所有三层网络节点的网络连接关系和算力资源信息),从而能够解决现有技术中三层网络算力资源感知不全面的问题。
93.在本实施例中,各域对应的管控系统可以向上层管控系统发送本域对应的算力资源拓扑,以使上层管控系统根据接收到的算力资源拓扑以及跨域连接数据生成整网对应的算力资源拓扑。
94.可选地,所述方法还包括:
95.当检测到所述邻居节点的算力资源信息和/或mac地址信息发生变化时,向所述管控系统发送所述邻居节点的新的算力资源信息和/或mac地址信息。
96.在本实施例中,当网络节点发现邻居节点的算力资源信息和/或mac地址信息变化后,通知管控系统(网管),管控系统根据所述新的算力资源信息和/或mac地址信息更新所述算力资源拓扑。
97.在一个具体的实施例中,如图2所示,以带有算力资源的高性能交换机为例,switch-a和switch-b通过lldp发现邻居节点及其算力资源的方法如下:
98.1、switch-a提取本地mib中的算力资源信息与mac地址,通过lldp报文中的lldpdu基础字段携带mac地址信息、扩展字段携带算力资源信息,向switch-b发送本地的算力资源信息与mac地址信息;
99.2、switch-b将接收到的lldp报文中关于switch-a的算力资源信息与mac地址信息提取出来,存储到本地设备的远端mib中,以备管控系统(网管)提取算力资源拓扑信息;
100.3、同样,switch-b也将自己的算力资源信息与mac地址信息发送给switch-a,switch-a也将接收到的lldp报文中关于switch-b的算力资源信息与mac地址信息提取出来,存储到本地设备的远端mib中,以备管控系统(网管)提取算力资源拓扑信息;
101.4、switch-a和switch-b通过南向接口将自己的算力资源信息与mac地址信息,以及对方的mac地址信息或对方的mac地址信息和算力资源信息发送给管控系统,管控系统提取本地信息和邻居信息并进行算力资源拓扑分析,最终发现本域的算力资源拓扑;
102.5、switch-a和switch-b发现邻居的算力资源信息与mac地址信息变化后,通知管控系统,管控系统通过南向接口从switch-a和switch-b提取本地信息和邻居信息并进行算力资源拓扑分析,以更新算力资源拓扑。
103.在另一个具体的实施例中,如图3所示,目标网络包括a域和b域两个as域,每个域内包含多个网络节点,通过lldp发现算力资源拓扑的方法如下:
104.1、同一as域内各网络节点均开启lldp协议,并定义lldpdu扩展字段,同一as域内各网络节点与邻居节点相互发送lldp报文。
105.2、网络节点间lldp交互稳定后,各域管控系统通过南向接口轮询或节点主动上报的方式,获取对应域内各网络节点对应的算力资源拓扑。
106.3、不同as域间lldp数据采集:上层管控系统基于各域管控系统北向接口获取各域(a域和b域)的算力资源拓扑。
107.4、整网算力资源拓扑生成:上层管控系统利用采集的单域算力资源拓扑和跨域连
接数据,拼接各个域的算力资源拓扑,完成整网算力资源拓扑的自动生成。
108.本发明实施例提供的算力资源拓扑的生成方法,首先向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;然后,接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;再将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。本发明通过在二层网络链路层发现协议(lldp)的扩展字段中携带算力资源信息,能够实现二层网络节点之间算力资源信息的交互,自动生成算力资源拓扑,从而能够提升算力资源感知效率,提高算力网络节点中算力资源的利用率,为算力业务调度与算力资源分配打下坚实基础,解决了现有的算力资源拓扑的生成方法存在对于二层网络算力资源无法感知以及三层网络算力资源感知不全面的问题。
109.实施例2:
110.如图4所示,本实施例提供一种算力资源拓扑的生成方法,应用于管控系统,所述方法包括:
111.步骤s201:接收各网络节点发送的所述网络节点对应的mac地址信息和算力资源信息,以及所述网络节点的邻居节点的mac地址信息;
112.其中,所述mac地址信息和算力资源信息是所述网络节点向所述邻居节点发送第一lldp报文,并接收到所述邻居节点发送的第二lldp报文后发送的,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息。
113.在本实施例中,算力资源可以分为:通用算力(cpu)、图形算力(gpu)、专用算力三类。一般浮点计算类业务主要需要靠cpu来运算,需要用到通用算力;图像处理类业务主要需要靠gpu来运算,需要用到图形算力;一些特殊的算力业务可能会用到专门的处理器(例如fpga),需要专用算力。
114.在本实施例中,算力资源信息为128位;其中,
115.第1到第42位用于表示通用算力的最大算力和剩余算力;
116.第43到第84位用于表示图形算力的最大算力和剩余算力;
117.第85到第126位用于表示专用算力的最大算力和剩余算力;
118.第127到128位用于表示以下至少之一:所述网络节点是否为算力节点、所述网络节点是否能够对外提供算力服务、所述网络节点的算力资源是否存在故障。
119.步骤s202:根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
120.在本实施例中,管控系统通过接收本域内各网络节点发送的本地信息和邻居信息,能够生成本域对应的算力资源拓扑。
121.可选地,所述方法还包括:
122.接收所述网络节点发送的所述邻居节点的新的算力资源信息和/或mac地址信息;
123.根据所述新的算力资源信息和/或mac地址信息更新所述算力资源拓扑。
124.在本实施例中,当网络节点发现邻居节点的算力资源信息和/或mac地址信息变化后,通知管控系统,管控系统根据所述新的算力资源信息和/或mac地址信息更新所述算力资源拓扑。
125.可选地,所述方法还包括:
126.向上层管控系统发送本域对应的所述算力资源拓扑,以使所述上层管控系统根据接收到的算力资源拓扑以及跨域连接数据生成整网对应的算力资源拓扑。
127.在本实施例中,各域对应的管控系统可以向上层管控系统发送本域对应的算力资源拓扑,上层管控系统利用采集的单域算力资源拓扑和跨域连接数据,拼接各个域的算力资源拓扑,完成整网算力资源拓扑的自动生成。
128.实施例3:
129.如图5所示,本实施例提供一种算力资源拓扑的生成装置,应用于网络节点,用于执行上述实施例1中的算力资源拓扑的生成方法,所述装置包括:
130.第一报文发送模块11,用于向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;
131.第二报文接收模块12,用于接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;
132.算力信息发送模块13,与所述第一报文发送模块11以及第二报文接收模块12连接,用于将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
133.可选地,所述装置还包括:
134.算力划分模块,用于将算力资源划分为通用算力、图形算力和专用算力;
135.算力信息生成模块,用于根据所述网络节点对应的通用算力、图形算力以及专用算力的最大算力和剩余算力得到所述算力资源信息。
136.可选地,所述网络节点的算力资源信息为128位;其中,
137.第1到第42位用于表示所述网络节点对应的通用算力的最大算力和剩余算力;
138.第43到第84位用于表示所述网络节点对应的图形算力的最大算力和剩余算力;
139.第85到第126位用于表示所述网络节点对应的专用算力的最大算力和剩余算力;
140.第127到128位用于表示以下至少之一:所述网络节点是否为算力节点、所述网络节点是否能够对外提供算力服务、所述网络节点的算力资源是否存在故障。
141.可选地,所述装置还包括:
142.第一存储模块,用于将所述网络节点的mac地址信息以及算力资源信息存储至本地管理信息库mib中;
143.第二存储模块,用于将所述邻居节点的mac地址信息以及算力资源信息存储至远端mib中。
144.可选地,所述装置还包括:
145.更新信息发送模块,用于当检测到所述邻居节点的算力资源信息和/或mac地址信息发生变化时,向所述管控系统发送所述邻居节点的新的算力资源信息和/或mac地址信息。
146.实施例4:
147.如图6所示,本实施例提供一种算力资源拓扑的生成装置,应用于管控系统,用于执行上述实施例2中的算力资源拓扑的生成方法,所述装置包括:
148.算力信息接收模块21,用于接收各网络节点发送的所述网络节点对应的mac地址信息和算力资源信息,以及所述网络节点的邻居节点的mac地址信息;
149.其中,所述mac地址信息和算力资源信息是所述网络节点向所述邻居节点发送第一lldp报文,并接收到所述邻居节点发送的第二lldp报文后发送的,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;
150.算力资源拓扑生成模块22,与所述算力信息接收模块21连接,用于根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。
151.可选地,所述装置还包括:
152.更新信息接收模块,用于接收所述网络节点发送的所述邻居节点的新的算力资源信息和/或mac地址信息;
153.算力资源拓扑更新模块,用于根据所述新的算力资源信息和/或mac地址信息更新所述算力资源拓扑。
154.可选地,所述装置还包括:
155.算力资源拓扑发送模块,用于向上层管控系统发送本域对应的所述算力资源拓扑,以使所述上层管控系统根据接收到的算力资源拓扑以及跨域连接数据生成整网对应的算力资源拓扑。
156.实施例5:
157.参考图7,本实施例提供一种算力资源拓扑的生成装置,包括存储器31和处理器32,存储器31中存储有计算机程序,处理器32被设置为运行所述计算机程序以执行实施例1中的算力资源拓扑的生成方法。
158.其中,存储器31与处理器32连接,存储器31可采用闪存或只读存储器或其他存储器,处理器32可采用中央处理器或单片机。
159.实施例6:
160.本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例1中的算力资源拓扑的生成方法。
161.该计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、计算机程序模块或其他数据)的任何方法或技术中实施的易失性或非易失性、可移除或不可移除的介质。计算机可读存储介质包括但不限于ram(random access memory,随机存取存储器),rom(read-only memory,只读存储器),eeprom(electrically erasable programmable read only memory,带电可擦可编程只读存储器)、闪存或其他存储器技术、cd-rom(compact disc read-only memory,光盘只读存储器),数字多功能盘(dvd)或其他
光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。
162.综上所述,本发明实施例提供的算力资源拓扑的生成方法、装置及可读存储介质,首先向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;然后,接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;再将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。本发明通过在二层网络链路层发现协议(lldp)的扩展字段中携带算力资源信息,能够实现二层网络节点之间算力资源信息的交互,自动生成算力资源拓扑,从而能够提升算力资源感知效率,提高算力网络节点中算力资源的利用率,为算力业务调度与算力资源分配打下坚实基础,解决了现有的算力资源拓扑的生成方法存在对于二层网络算力资源无法感知以及三层网络算力资源感知不全面的问题。
163.可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
技术特征:
1.一种算力资源拓扑的生成方法,其特征在于,应用于网络节点,所述方法包括:向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。2.根据权利要求1所述的方法,其特征在于,所述向邻居节点发送第一lldp报文之前,所述方法还包括:将算力资源划分为通用算力、图形算力和专用算力;根据所述网络节点对应的通用算力、图形算力以及专用算力的最大算力和剩余算力得到所述算力资源信息。3.根据权利要求2所述的方法,其特征在于,所述网络节点的算力资源信息为128位;其中,第1到第42位用于表示所述网络节点对应的通用算力的最大算力和剩余算力;第43到第84位用于表示所述网络节点对应的图形算力的最大算力和剩余算力;第85到第126位用于表示所述网络节点对应的专用算力的最大算力和剩余算力;第127到128位用于表示以下至少之一:所述网络节点是否为算力节点、所述网络节点是否能够对外提供算力服务、所述网络节点的算力资源是否存在故障。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述网络节点的mac地址信息以及算力资源信息存储至本地管理信息库mib中;将所述邻居节点的mac地址信息以及算力资源信息存储至远端mib中。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:当检测到所述邻居节点的算力资源信息和/或mac地址信息发生变化时,向所述管控系统发送所述邻居节点的新的算力资源信息和/或mac地址信息。6.一种算力资源拓扑的生成方法,其特征在于,应用于管控系统,所述方法包括:接收各网络节点发送的所述网络节点对应的mac地址信息和算力资源信息,以及所述网络节点的邻居节点的mac地址信息;其中,所述mac地址信息和算力资源信息是所述网络节点向所述邻居节点发送第一lldp报文,并接收到所述邻居节点发送的第二lldp报文后发送的,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:接收所述网络节点发送的所述邻居节点的新的算力资源信息和/或mac地址信息;根据所述新的算力资源信息和/或mac地址信息更新所述算力资源拓扑。8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
向上层管控系统发送本域对应的所述算力资源拓扑,以使所述上层管控系统根据接收到的算力资源拓扑以及跨域连接数据生成整网对应的算力资源拓扑。9.一种算力资源拓扑的生成装置,其特征在于,应用于网络节点,所述装置包括:第一报文发送模块,用于向邻居节点发送第一lldp报文,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息;第二报文接收模块,用于接收所述邻居节点发送的第二lldp报文,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;算力信息发送模块,与所述第一报文发送模块以及第二报文接收模块连接,用于将所述网络节点对应的mac地址信息和算力资源信息,以及所述邻居节点的mac地址信息发送给管控系统,以使所述管控系统根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。10.一种算力资源拓扑的生成装置,其特征在于,应用于管控系统,所述装置包括:算力信息接收模块,用于接收各网络节点发送的所述网络节点对应的mac地址信息和算力资源信息,以及所述网络节点的邻居节点的mac地址信息;其中,所述mac地址信息和算力资源信息是所述网络节点向所述邻居节点发送第一lldp报文,并接收到所述邻居节点发送的第二lldp报文后发送的,所述第一lldp报文中数据单元lldpdu的基础字段携带所述网络节点的mac地址信息,扩展字段携带所述网络节点的算力资源信息,所述第二lldp报文中lldpdu的基础字段携带所述邻居节点的mac地址信息,扩展字段携带所述邻居节点的算力资源信息;算力资源拓扑生成模块,与所述算力信息接收模块连接,用于根据接收到的mac地址信息以及算力资源信息生成本域对应的算力资源拓扑。11.一种算力资源拓扑的生成装置,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现如权利要求1-5中任一项所述的算力资源拓扑的生成方法,或实现如权利要求6-8中任一项所述的算力资源拓扑的生成方法。12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的算力资源拓扑的生成方法,或实现如权利要求6-8中任一项所述的算力资源拓扑的生成方法。
技术总结
本发明提供一种算力资源拓扑的生成方法、装置及可读存储介质,该方法包括:向邻居节点发送第一LLDP报文,所述第一LLDP报文中数据单元LLDPDU的基础字段携带所述网络节点的MAC地址信息,扩展字段携带所述网络节点的算力资源信息;接收所述邻居节点发送的第二LLDP报文;将所述网络节点对应的MAC地址信息和算力资源信息,以及所述邻居节点的MAC地址信息发送给管控系统,以使所述管控系统根据接收到的MAC地址信息以及算力资源信息生成本域对应的算力资源拓扑。该方法、装置及可读存储介质能够解决现有的算力资源拓扑的生成方法存在对于二层网络算力资源无法感知以及三层网络算力资源感知不全面的问题。资源感知不全面的问题。资源感知不全面的问题。
技术研发人员:魏汝翔 王晓东 尹祖新 刘琦 田洪宁 赵广 杨婧雅 李贝
受保护的技术使用者:中国联合网络通信集团有限公司
技术研发日:2023.06.05
技术公布日:2023/8/28
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/