一种分布式容器系统的任务调度方法、装置及系统与流程

未命名 08-06 阅读:63 评论:0


1.本发明涉及计算机技术领域,尤其涉及一种分布式容器系统的任务调度方法、装置及系统。


背景技术:

2.分布式容器在执行在线服务或分布式训练等任务时,需要将任务调度到集群中某一节点上,由该节点执行任务。
3.现有的分布式容器中,一般仅根据内存和中央处理器两项数据作为资源指标来为节点分配任务。
4.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:分布式容器对于网络要求的特殊性,任务执行过程中可能会出现某些节点由于带宽消耗过大而导致任务挤占,但另一些节点剩余带宽过多的情况;从而导致在线服务或分布式训练任务的执行过程中出现异常中断、执行时间长、服务请求卡顿等问题,进而导致分布式容器中任务的响应情况较差。


技术实现要素:

5.有鉴于此,本发明实施例提供一种分布式容器系统的任务调度方法、装置及系统,根据任务执行请求中所需的带宽信息、以及根据带宽流量监控服务的监测结果所确定出的剩余带宽信息,确定执行任务的目标节点代理,进而生成不同的调度任务,由此,将带宽信息作为任务调度过程的资源指标,实现了对节点代理的合理调度和使用,以避免任务执行过程中异常中断、执行时间长以及服务请求卡顿的问题。并且,节节点代理和带宽流量监控服务是相互独立的,带宽流量监控服务的错误不会影响节点代理的正常运行,从而有利于提高分布式容器系统的鲁棒性和稳定性。
6.为实现上述目的,根据本发明实施例的第一方面,提供了一种分布式容器系统的带宽调度方法。
7.本发明实施例的分布式容器系统的带宽调度方法包括:接收任务执行请求;所述任务执行请求包括执行任务所需的带宽信息;根据所述分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,所述剩余带宽信息是所述节点代理根据带宽流量监控服务的监测结果得到的;利用所述目标节点代理执行所述调度任务,以响应所述任务执行请求。
8.可选地,所述方法还包括:利用所述节点代理接收已注册成功的带宽流量监控服务上报的监测结果;根据所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,并将所述剩余带宽信息进行上报。
9.可选地,所述利用所述节点代理接收已注册成功的带宽流量监控服务上报的监测结果,包括:
10.利用所述节点代理获取所述带宽流量监控服务的注册服务,所述注册服务包括套接字;根据所述套接字对所述带宽流量服务进行注册,并向所述带宽流量监控服务返回状态码;所述状态码表征注册成功或注册失败;接收注册成功的所述带宽流量监控服务发送的监测结果。
11.可选地,利用所述节点代理根据预设时间周期获取所述带宽流量监控服务的注册服务上报的监测结果;根据每个所述时间周期所获取的所述监测结果中的实时带宽信息,对自身的当前剩余带宽信息进行更新,并将更新结果进行上报。
12.可选地,所述根据所述分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,包括:分别判断各个所述剩余带宽信息中的第一带宽流量是否大于所述执行任务所需的带宽信息中的第二带宽流量;针对所述第一带宽流量大于所述第二带宽流量的节点代理:根据所述节点代理的节点信息,根据所述节点信息按照预设评分策略对所述节点代理进行评分;根据评分结果,选择符合预设分值阈值的节点代理作为所述目标节点代理。
13.可选地,所述一个或多个节点代理的节点信息包括以下任意一个或多个:镜像分布、中央处理器、磁盘剩余量和中央处理器负载。
14.可选地,在所述确定用于执行任务的目标节点代理之后,该方法还包括:在预设时间内,将所述目标节点代理中用于执行所述调度任务所需的带宽信息设置为预留状态,使得处于所述预留状态的带宽信息无法被其他任务调用,以满足所述调度任务在预设时间内的带宽需求。
15.可选地,所述根据所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,包括:根据所述带宽分配函数指示的多个第一权重和求和函数,对所述实时带宽信息进行平均加权求和,得到当前待上报的剩余带宽信息。
16.可选地,所述实时带宽信息所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,包括:根据所述分配函数指示的多个第二权重和求和函数,对所述实时带宽信息进行加权求和;其中,距离当前时刻越近的实时带宽信息所对应的第二权重越大;其中,多个第二权重之和为1。
17.为实现上述目的,根据本发明实施例的第二方面,提供了一种分布式容器系统的任务调度装置。
18.本发明实施例的分布式容器系统的任务调度装置包括:
19.接收模块,用于接收任务执行请求;所述任务执行请求包括执行任务所需的带宽信息;
20.处理模块,用于根据所述分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,所述剩余带宽信息是所述节点代理根据带宽流量监控服务的监测结果得到的;
21.执行模块,用于利用所述目标节点代理执行所述调度任务,以响应所述任务执行请求。
22.可选地,所述装置还包括:注册模块,用于利用所述节点代理接收已注册成功的带
宽流量监控服务上报的监测结果;根据所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,并将所述剩余带宽信息进行上报。
23.可选地,所述注册模块还用于,利用所述节点代理获取所述带宽流量监控服务的注册服务,所述注册服务包括套接字;根据所述套接字对所述带宽流量服务进行注册,并向所述带宽流量监控服务返回状态码;所述状态码表征注册成功或注册失败;接收注册成功的所述带宽流量监控服务发送的监测结果。
24.可选地,所述注册模块还用于,利用所述节点代理根据预设时间周期获取所述带宽流量监控服务的注册服务上报的监测结果;根据每个所述时间周期所获取的所述监测结果中的实时带宽信息,对自身的当前剩余带宽信息进行更新,并将更新结果进行上报。
25.可选地,所述处理模块还用于,判断所述剩余带宽信息中的第一带宽流量是否大于所述执行任务所需的带宽信息中的第二带宽流量;针对所述第一带宽流量大于所述第二带宽流量的节点代理:根据所述节点代理的节点信息,根据所述节点信息按照预设评分策略对所述节点代理进行评分;根据评分结果,选择符合预设分值阈值的节点代理作为所述目标节点代理。
26.可选地,所述一个或多个节点代理的节点信息包括以下任意一个或多个:镜像分布、中央处理器、磁盘剩余量和中央处理器负载。
27.可选地,所述装置还包括:预留模块,用于在所述确定用于执行任务的目标节点代理之后,在预设时间内,将所述目标节点代理中用于执行所述调度任务所需的带宽信息设置为预留状态,使得处于所述预留状态的带宽信息无法被其他任务调用,以满足所述调度任务在预设时间内的带宽需求。
28.可选地,所述注册模块还用于,根据所述带宽分配函数指示的多个第一权重和求和函数,对所述实时带宽信息进行平均加权求和,得到当前待上报的剩余带宽信息。
29.可选地,所述注册模块还用于,根据所述分配函数指示的多个第二权重和求和函数,对所述实时带宽信息进行加权求和;其中,距离当前时刻越近的实时带宽信息所对应的第二权重越大;其中,多个第二权重之和为1。
30.为实现上述目的,根据本发明实施例的第三方面,提供了一种任务调度系统。
31.本发明实施例提供的一种任务调度系统包括:上述分布式容器系统的任务调度装置以及用于提供带宽流量监控服务的监控装置;其中,
32.所述监控装置,用于通过所述带宽流量监控服务获取一个或多个网卡的驱动程序分别对应的一个或多个数据包、以及所述一个或多个网卡分别对应的最大带宽信息;根据所述数据包确定对应的所述网卡的消耗带宽信息,将所述网卡的最大带宽信息与对应的消耗带宽信息之差作为所述网卡的实时带宽信息。
33.可选地,所述带宽流量监控服务,用于在一个所述网卡对应有多个数据包的情况下,针对单个网卡:确定所述网卡对应的多个数据包分别对应的平均传输速率;将每个所述数据包的平均传输速率进行加和,以确定所述网卡的消耗带宽信息。
34.为实现上述目的,根据本发明实施例的第四方面,提供了一种分布式容器系统的带宽调度设备。
35.本发明实施例的分布式容器系统的带宽调度设备包括:一个或多个处理器;存储系统,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使
得所述一个或多个处理器实现本发明实施例的分布式容器系统的任务调度方法。
36.为实现上述目的,根据本发明实施例的第五方面,提供了一种计算机可读介质。
37.本发明实施例的计算机可读介质上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的分布式容器系统的带宽调度方法。
38.上述发明中的一个实施例具有如下优点或有益效果:在本发明实施例中,根据任务执行请求中所需的带宽信息、以及根据带宽流量监控服务的监测结果所确定出的剩余带宽信息,确定执行任务的目标节点代理,进而生成不同的调度任务,由此,将带宽信息作为任务调度过程的资源指标,实现了对节点代理的合理调度和使用,以避免任务执行过程中异常中断、执行时间长以及服务请求卡顿的问题。并且,节节点代理和带宽流量监控服务是相互独立的,带宽流量监控服务的错误不会影响节点代理的正常运行,从而有利于提高分布式容器系统的鲁棒性和稳定性。。
39.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
40.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
41.图1是本发明实施例的一种分布式容器系统的带宽调度方法的主要流程的示意图;
42.图2是本发明实施例的接收任务执行请求之前的主要流程的示意图;
43.图3本发明实施例的利用节点代理接收已注册成功的带宽流量监控服务上报的实时带宽信息的主要流程的示意图;
44.图4本发明实施例的注册上报的整体流程的示意图;
45.图5是本发明实施例的从所述一个或多个节点代理中确定用于执行任务的目标节点代理的主要流程的示意图;
46.图6是本发明实施例的带宽调度过程整体示意图;
47.图7本发明实施例的一种任务调度系统的主要模块的示意图;
48.图8本发明实施例可以应用于其中的示例性系统架构图;
49.图9适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
50.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
51.根据本发明实施例的第一方面,提供一种应用于服务器的分布式容器系统的带宽调度方法。
52.图1是本发明实施例的一种分布式容器系统的带宽调度方法的主要流程的示意图。如图1所示,该方法主要包括:
53.步骤s101:接收任务执行请求;任务执行请求包括执行任务所需的带宽信息;
54.步骤s102:根据分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及执行任务所需的带宽信息,从一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,剩余带宽信息是节点代理根据带宽流量监控服务的监测结果得到的;
55.步骤s103:利用目标节点代理执行调度任务,以响应任务执行请求。
56.在本发明实施例中,在分布式容器系统的每个节点代理上都可以设置带宽流量监控服务,并且,节点代理的其他线程(如任务执行线程和上报线程等)与带宽流量监控服务相互独立,由此,即使带宽流量监控服务出现问题,也不影响节点代理的正常运行。另外,通过带宽流量监控服务对每个节点代理的带宽信息进行实时检测,并且,节点代理的其他线程(如任务执行线程和上报线程等)与带宽流量监控服务可以异步运行,由此提高节点代理的处理效率。
57.这相对于现有技术中通过源代码的修改来实现代理节点监控带宽指标的方式,本发明实施例对于代码编写的要求大大降低,并且出现报错后可以定位至带宽流量监控服务对应的节点代理,从而发现错误根源,便于及时对错误进行定位和更正。进一步滴,由于节点代理与带宽流量监控服务是相互独立的,带宽流量监控服务的错误不会影响节点代理的正常运行,因此解决了现有技术中带宽监控与代理节点以整体运行,一旦带宽监控出现错误会导致整个节点代理不可用的问题,从而有利于提高分布式容器系统的鲁棒性和稳定性。
58.在分布式容器系统中的节点可以分为主节点和其他节点,节点代理运行分布式容器的其他节点上。其中,主节点的作用为接收用户的各项请求,并根据请求管理和调度其他节点,对于节点代理上报的各项数据进行处理,并最终完成各个节点代理任务的调度,实现分布式容器的高效运行。其中,主节点可以是分布式容器系统中的任意一个节点,除主节点之外的其他节点上则运行有节点代理。
59.在实际应用过程中,用户请求与分布式容器系统之间的交互过程都是由主节点来完成的,而带宽流量监控服务与分布式容器之间的交互过程则是由节点代理完成的,分布式容器内部由主节点和节点代理之间的数据传输来完成。
60.在本发明中,为了区分于不同任务,执行任务所需的带宽信息可以包括带宽流量、任务名称、占用内存等。
61.在一种可选的实施例中,如图2示,在步骤s101之前,该方法还可以包括:
62.步骤s201:利用节点代理接收已注册成功的带宽流量监控服务所上报的监测结果;
63.步骤s202:根据监测结果中的实时带宽信息和带宽分配函数确定剩余带宽信息,并将剩余带宽信息进行上报。
64.在实际应用过程中,带宽流量监控服务可以实时监控其所在代理节点的带宽信息,但是不能达到实时上传的效果,为了节省带宽流量监控服务上报过程的占用空间,可以设定预设的上传周期,即利用所述节点代理根据预设时间周期获取所述带宽流量监控服务的注册服务上报的实时带宽信息,其中,每次上报的实时宽带信息中包含了当前上传周期中的所有数据。通过此种方式,减少了上传的频率但又不会缺失带宽数据,保证了后续代理
节点计算剩余带宽信息的准确性。
65.在带宽分配函数中可以设置不同的权重来求得结果,在一种可选的实施例中,根据实时带宽信息和带宽分配函数确定剩余带宽信息,包括:根据带宽分配函数指示的多个第一权重和求和函数,对实时带宽信息进行平均加权求和,得到当前待上报的剩余带宽信息。
66.示例性的,预设的上传周期为5分钟,即带宽流量监控服务每5分钟进行一次注册服务,将近5分钟的数据上报给代理节点。其中,近5分钟数据的权重比例相同,均为20%,如表1所示。
67.表1第一权重求和表
68.时间54321权重20%20%20%20%20%
69.在近5分钟带宽数据相对平均的情况下,权重比例相同可以得到更为准确的剩余带宽信息,但如果带宽数据波动较大,权重相同会导致计算结果偏差较大,此时则可以选择另一种可选的实施例,根据实时带宽信息和预设带宽分配函数得到当前注册服务对应的剩余带宽信息,包括:根据分配函数指示的多个第二权重和求和函数,对实时带宽信息进行加权求和;其中,距离当前时刻越近的实时带宽信息所对应的第二权重越大;其中,多个第二权重之和为1。
70.例如,预设的上传周期为5分钟,即带宽流量监控服务每5分钟进行一次注册服务,将近5分钟的数据上报给代理节点。其中,近5分钟数据的权重比例不同,如表2所示。
71.表2第二权重求和表
72.时间54321权重5%10%15%25%45%
73.通常在任务执行过程中,带宽的需求量是呈现趋势变化的,在任务量大的时候,带宽信息也不是突然间的上升,而是趋势性的上升,在任务即将完成时,带宽信息又回呈现趋势性的下降。因此距离当前时刻越近的实时带宽信息越能表征剩余带宽信息。
74.在进一步可选的实施例中,如图3所示,步骤s201的具体实施方式可以包括:
75.步骤s301:利用节点代理获取带宽流量监控服务的注册服务,注册服务包括套接字;
76.步骤s302:根据套接字对带宽流量服务进行注册,并向带宽流量监控服务返回状态码;状态码表征注册成功或注册失败;
77.步骤s303:接收注册成功的带宽流量监控服务发送的监测结果。
78.在本发明中,套接字是对网络中不同主机上的应用进程之间进行双向通信的端点的抽象。一个套接字就是网络上进程通信的一端,提供了应用层进程利用网络协议交换数据的机制。在步骤s301中,注册服务便是向代理节点发送套接字。
79.状态码可以表征注册成功或注册失败,在状态码表征注册成功的情况下,在步骤s302之后继续执行步骤s303。若状态码表征注册失败,在一种可选的实施例中,可以设置重复注册次数,例如3次,即在注册失败后立刻重复执行注册步骤,此种情况针对由于网络错误等突发原因导致的暂时失败的情况。如果重复执行3次后仍然失败,则说明不是由于突发事件所导致的注册失败,此时可以选择另一种可选的实施例,将当前预设时间周期内的实
时带宽信息进行短暂存储,在下一个时间周期进行注册服务上报的时候一起上报。此种情况针对由于请求过多导致的注册量过大,在限流的情况下无法正常注册的情况,即暂时停止注册,待错过注册高峰后再次进行注册。
80.在一种可选的实施例中,可以采用kubernetes作为容器编排和调度的工具,其每个节点为node,kubelet是在每个节点上运行的节点代理,主要功能为上报节点状态。具体地,带宽流量监控服务与节点代理之间的注册过程如图4所示,其中,该过程可以包括以下步骤:
81.步骤s401:带宽流量监控服务向节点代理发送注册服务,节点代理kubelet判断注册是否通过;
82.步骤s402:在注册服务通过的情况下,带宽流量监控服务向节点代理kubelet发送当前节点所监测到实时带宽信息;
83.步骤s403:节点代理kubelet调用带宽分配函数来确定当前节点的剩余带宽信息。
84.在每次注册服务确定当前节点的剩余带宽信息后,节点代理kubelet还可以执行步骤s404和步骤s405,
85.步骤s404:节点代理kubelet通过调用软件服务,将当前节点的剩余带宽信息发送给容器编排引擎主节点;
86.步骤s405:通过本次注册过程确定的当前节点的剩余带宽信息来更新当前节点的数据状态。
87.对于确定用于执行任务的目标节点代理的步骤,在一种可选的实施例中,如图5所示,具体可以包括:
88.步骤s501:分别判断各个剩余带宽信息中的第一带宽流量m1是否大于执行任务所需的带宽信息中的第二带宽流量m2;
89.步骤s502:针对第一带宽流量m1大于第二带宽流量m2的节点代理:根据节点代理的节点信息,根据节点信息按照预设评分策略对节点代理进行评分;
90.步骤s503:根据评分结果,选择符合预设分值阈值的节点代理作为目标节点代理。
91.其中,针对不满足第一带宽流量大于第二带宽流量的节点代理,则在步骤s501后,跳转执行步骤s504:本次任务执行请求不予调用。
92.在一种可选的实施例中,可以将第一带宽流量大于第二带宽流量的节点代理的状态设置为可执行任务的状态,将第一带宽流量大于第二带宽流量的节点代理设置为不可执行任务的状态,并根据可执行任务的状态的一个或多个节点代理生成可执行任务表,以便于后续的评分计算过程。
93.进一步地,在一种可选的实施例中,一个或多个节点代理的节点信息包括以下任意一个或多个:镜像分布、中央处理器、磁盘剩余量和中央处理器负载。
94.示例性的,节点信息选择镜像分布、中央处理器、磁盘剩余量和中央处理器负载,预设评分策略为根据剩余带宽信息、镜像分布、中央处理器、磁盘剩余量和中央处理器负载的权重进行打分,如表3所示。
95.表3预设评分策略权重表
[0096][0097]
综合分数=剩余带宽信息得分
×
2+镜像分布得分
×
2+中央处理器得分
×
3+中央处理器负载得分
×
4+磁盘剩余量得分
×
3。其中,剩余带宽信息、镜像分布、中央处理器、磁盘剩余量和中央处理器负载的分数可以根据不同的计算规则进行自定义设置。
[0098]
示例性的,对于剩余带宽信息的得分,在一种可选的实施例中,节点代理可以通过调用软件服务进行计算,具体如下:当容器编排引擎调度软件服务时,软件服务会设置一个需求值,根据需求值、剩余带宽信息和最大优先级进行计算,分数=最大优先级-最大优先级*(需求值/剩余带宽信息)。
[0099]
在对所述节点代理进行评分后,一种可选的实施例中,可以对应将评分填入可执行任务表得到可执行任务分值表,从可执行任务分值表中选择符合预设分值阈值的节点代理作为目标节点代理。
[0100]
如果同时出现多个满足预设分值阈值的节点代理,可以按照由高至低的顺序进行排列,取得分最高的节点代理作为目标节点代理。如果出现多个分值最高且均满足预设分值阈值的节点代理,可以任意选择其一执行任务,或者根据节点代理的历史执行任务次数进行排序,选择历史执行任务次数最低的节点代理来执行当前任务,将节点代理的任务平均化分配,尽可能避免多次任务调用同一节点代理,而其他节点代理闲置的问题,减缓同一节点代理频繁被调用而导致的使用老化。
[0101]
在一种可选的实施例中,确定用于执行任务的目标节点代理之后,该方法还包括:在预设时间内,将目标节点代理中用于执行调度任务所需的带宽信息设置为预留状态,使得处于预留状态的带宽信息无法被其他任务调用,以满足调度任务在预设时间内的带宽需求。
[0102]
其中,预留的带宽信息可以为执行调度任务每一时刻所需的带宽信息的平均值,例如,任务a共需3分钟完成,第一分钟需要的带宽信息为3mbps,第二分钟需要的带宽信息为10mbps,第三分钟需要的带宽信息为5mbps,那么在任务开始后,每一分钟预留的带宽信息为6mbps,即只有第二分钟需要的带宽信息超过了预留值,此时可以从没有预留的带宽信息中进行调用。
[0103]
预留的带宽信息也可以为执行调度任务每一时刻所需的带宽信息值中的最大值,例如,任务b共需3分钟完成,第一分钟需要的带宽信息为3mbps,第二分钟需要的带宽信息为10mbps,第三分钟需要的带宽信息为5mbps,那么在任务开始后,每一分钟预留的带宽信息均为10mbps,此种方式可以保证整个任务的完整执行,但是相对于预留的带宽信息值较大,在某一任务中带宽信息波动较大时,预留的带宽并不能够完整利用,而是有大量带宽处于空闲状态,容易影响其他任务的执行过程。
[0104]
在另一种可选的实施例中,当任务执行完成后,也可以选择在预设时间段内为该任务预留带宽信息,当短时间内有相同任务需要再次执行时,无需进行重复计算,直接将相同的执行任务分配到上次执行的节点代理上,以节省空间资源。
[0105]
在一种可选的实施例中,当用户发起任务请求后,带宽调度过程的整体示意图如图6所示。在节点1、节点2和节点3上都设置有节点代理和带宽流量监控服务,在用户发起任务请求后,节点1、节点2和节点3上的节点代理分别通过带宽流量监控服务获得自身节点上的剩余带宽信息,并将剩余带宽信息上报给容器编排引擎的主节点,主节点根据带宽分配函数分别确定每个节点代理的综合评分,即节点1的得分1、节点2的得分2和节点3的得分3,并根据得分1、得分2和得分3的分数高低最终确定目标节点代理,由目标节点代理来执行用户发起的任务请求。
[0106]
其中,带宽流量监控服务在一种可选的实施例中可以通过拦截网卡驱动程序的方式获取所有的数据包并计算数据大小,算出平均速率,通过获取多块网卡驱动程序来获取已消耗带宽。再根据网卡属性获取当前网卡的最大带宽信息,利用最大带宽信息减去已消耗带宽信息来获取当前节点的实时带宽信息。其中,实时带宽信息可以理解为实时的剩余带宽信息。
[0107]
本发明实施例的分布式容器系统的带宽调度的方法,在不影响代理节点正常运行的情况下,带宽流量监控服务通过异步的方式获取节点代理处的剩余带宽信息,并根据任务执行请求中所需的带宽信息,确定执行任务的目标节点代理,进而生成不同的调度任务,实现对节点代理的合理调度和使用,以避免任务执行过程中异常中断、执行时间长以及服务请求卡顿的问题。
[0108]
根据本发明实施例第二方面,提供一种应用于服务器的分布式容器系统的带宽调度装置。
[0109]
图7是根据本发明实施例第二方面的分布式容器系统的带宽调度装置700的主要模块的示意图。如图7所示,包括:
[0110]
接收模块701,用于接收任务执行请求;任务执行请求包括执行任务所需的带宽信息;
[0111]
处理模块702,用于根据分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及执行任务所需的带宽信息,从一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,剩余带宽信息是节点代理根据带宽流量监控服务的监测结果得到的;
[0112]
执行模块703,用于利用目标节点代理执行调度任务,以响应任务执行请求。
[0113]
在本发明一个实施例中,所述装置还包括:注册模块704,用于利用所述节点代理接收已注册成功的带宽流量监控服务上报的监测结果;根据所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,并将所述剩余带宽信息进行上报。
[0114]
其中,接收模块701和处理模块702均设置于主节点上,执行模块703和注册模块704设置于节点代理对应的节点上。
[0115]
在本发明一个实施例中,所述注册模块704还用于,利用所述节点代理获取所述带宽流量监控服务的注册服务,所述注册服务包括套接字;根据所述套接字对所述带宽流量服务进行注册,并向所述带宽流量监控服务返回状态码;所述状态码表征注册成功或注册失败;接收注册成功的所述带宽流量监控服务发送的监测结果。
[0116]
在本发明一个实施例中,所述注册模块704还用于,利用所述节点代理根据预设时间周期获取所述带宽流量监控服务的注册服务上报的监测结果;根据每个所述时间周期所
获取的所述监测结果中的实时带宽信息,对自身的当前剩余带宽信息进行更新,并将更新结果进行上报。
[0117]
在本发明一个实施例中,所述处理模块702还用于,判断所述剩余带宽信息中的第一带宽流量是否大于所述执行任务所需的带宽信息中的第二带宽流量;针对所述第一带宽流量大于所述第二带宽流量的节点代理:根据所述节点代理的节点信息,根据所述节点信息按照预设评分策略对所述节点代理进行评分;根据评分结果,选择符合预设分值阈值的节点代理作为所述目标节点代理。
[0118]
在本发明一个实施例中,所述一个或多个节点代理的节点信息包括以下任意一个或多个:镜像分布、中央处理器、磁盘剩余量和中央处理器负载。
[0119]
在本发明一个实施例中,所述装置还包括:预留模块,用于在所述确定用于执行任务的目标节点代理之后,在预设时间内,将所述目标节点代理中用于执行所述调度任务所需的带宽信息设置为预留状态,使得处于所述预留状态的带宽信息无法被其他任务调用,以满足所述调度任务在预设时间内的带宽需求。
[0120]
在本发明一个实施例中,所述注册模块704还用于,根据所述带宽分配函数指示的多个第一权重和求和函数,对所述实时带宽信息进行平均加权求和,得到当前待上报的剩余带宽信息。
[0121]
在本发明一个实施例中,所述注册模块704还用于,根据所述分配函数指示的多个第二权重和求和函数,对所述实时带宽信息进行加权求和;其中,距离当前时刻越近的实时带宽信息所对应的第二权重越大;其中,多个第二权重之和为1。
[0122]
根据本发明实施例第三方面,还提供了一种包括上述任一实施例提供的任务调度装置的任务调度系统,该任务调度系统还包括用于提供带宽流量监控服务的监控装置,其中,所述监控装置用于通过所述带宽流量监控服务获取一个或多个网卡的驱动程序分别对应的一个或多个数据包、以及所述一个或多个网卡分别对应的最大带宽信息;根据所述数据包确定对应的所述网卡的消耗带宽信息,将所述网卡的最大带宽信息与对应的消耗带宽信息之差作为所述网卡的实时带宽信息。
[0123]
上述监控装置可以设置于任务调度装置中,也可以与任务调度装置相互独立设置。可以理解的是,即使监控装置设置于任务调度装置上,二者的功能也是相互独立的,也就是说,带宽流量监控服务的错误不会影响节点代理的正常运行。
[0124]
在本发明一个实施例中,所述带宽流量监控服务,用于在一个所述网卡对应有多个数据包的情况下,针对单个网卡:确定所述网卡对应的多个数据包分别对应的平均传输速率;将每个所述数据包的平均传输速率进行加和,以确定所述网卡的消耗带宽信息。
[0125]
图8示出了可以应用本发明实施例的分布式容器带宽调度方法或分布式容器系统的带宽调度系统的示例性系统架构800。
[0126]
如图8所示,系统架构800可以包括终端设备801、802、803,网络804和多个服务器805、806、807。网络804用以在终端设备801、802、803和服务器805之间、以及各个服务器805、806、807之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0127]
用户可以使用终端设备801、802、803通过网络804与服务器805交互,以发送任务执行请求或接收请求的响应信息等。终端设备801、802、803上可以安装有各种通讯客户端
应用,例如在线服务应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0128]
终端设备801、802、803可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0129]
服务器805、806、807可以是提供各种服务的服务器,例如对用户利用终端设备801、802、803所发送的在线服务请求提供支持的后台管理服务器、或者对任务进行调度的服务器。后台管理服务器可以对接收到的任务执行请求等数据进行分析等处理,并将处理结果(例如分配的带宽信息)反馈给终端设备。
[0130]
需要说明的是,本发明实施例第一方面所提供的分布式容器带宽调度方法一般由服务器805、806、807执行,相应地,本发明实施例第二方面所提供的分布式容器系统的带宽调度系统一般设置于服务器805、806、807中。
[0131]
应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0132]
下面参考图9,其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0133]
如图9所示,计算机系统900包括中央处理单元(cpu)901,其可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行各种适当的动作和处理。在ram 903中,还存储有系统900操作所需的各种程序和数据。cpu 701、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
[0134]
以下部件连接至i/o接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分905;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
[0135]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(cpu)901执行时,执行本发明的系统中限定的上述功能。
[0136]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、
或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0137]
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0138]
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括接收模块、处理模块、执行模块和注册模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,接收模块还可以被描述为“用于接收任务执行请求的模块”。
[0139]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:接收任务执行请求;所述任务执行请求包括执行任务所需的带宽信息;根据所述分布式容器中一个或多个节点代理分别对应的一个或多个剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,节点代理运行于所述分布式容器的节点上,且所述剩余带宽信息是根据所述节点代理通过带宽流量监控服务监测得到的;利用所述目标节点代理执行所述调度任务,以响应所述任务执行请求。
[0140]
本发明实施例的分布式容器系统及其带宽调度的方法,在不影响代理节点正常运行的情况下,带宽流量监控服务通过异步的方式获取节点代理处的剩余带宽信息,并根据任务执行请求中所需的带宽信息,确定执行任务的目标节点代理,进而生成不同的调度任务,实现对节点代理的合理调度和使用,以避免任务执行过程中异常中断、执行时间长以及服务请求卡顿的问题。
[0141]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围
之内。

技术特征:
1.一种分布式容器系统的任务调度方法,其特征在于,所述方法包括:接收任务执行请求;所述任务执行请求包括执行任务所需的带宽信息;根据所述分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,所述剩余带宽信息是所述节点代理根据带宽流量监控服务的监测结果得到的;利用所述目标节点代理执行所述调度任务,以响应所述任务执行请求。2.根据权利要求1所述的方法,其特征在于,还包括:利用所述节点代理接收已注册成功的带宽流量监控服务所上报的监测结果;根据所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,并将所述剩余带宽信息进行上报。3.根据权利要求2所述的方法,其特征在于,所述利用所述节点代理接收已注册成功的带宽流量监控服务所上报的监测结果实时带宽信息,包括:利用所述节点代理获取所述带宽流量监控服务的注册服务,所述注册服务包括套接字;根据所述套接字对所述带宽流量服务进行注册,并向所述带宽流量监控服务返回状态码;所述状态码表征注册成功或注册失败;接收注册成功的所述带宽流量监控服务发送的监测结果实时带宽信息。4.根据权利要求2所述的方法,其特征在于,利用所述节点代理根据预设时间周期获取所述带宽流量监控服务的注册服务上报的监测结果;根据每个所述时间周期所获取的所述监测结果中的实时带宽信息,对自身的当前剩余带宽信息进行更新,并将更新结果进行上报。5.根据权利要求1所述的方法,其特征在于,所述根据所述分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,包括:分别判断各个所述剩余带宽信息中的第一带宽流量是否大于所述执行任务所需的带宽信息中的第二带宽流量;针对所述第一带宽流量大于所述第二带宽流量的节点代理:根据所述节点代理的节点信息,根据所述节点信息按照预设评分策略对所述节点代理进行评分;根据评分结果,选择符合预设分值阈值的节点代理作为所述目标节点代理。6.根据权利要求5所述的方法,其特征在于,所述一个或多个节点代理的节点信息包括以下任意一个或多个:镜像分布、中央处理器、磁盘剩余量和中央处理器负载。7.根据权利要求5所述的方法,其特征在于,在所述确定用于执行任务的目标节点代理之后,该方法还包括:在预设时间内,将所述目标节点代理中用于执行所述调度任务所需的带宽信息设置为预留状态,使得处于所述预留状态的带宽信息无法被其他任务调用,以满足所述调度任务在预设时间内的带宽需求。8.根据权利要求2所述的方法,其特征在于,
所述根据所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,包括:根据所述带宽分配函数指示的多个第一权重和求和函数,对所述实时带宽信息进行平均加权求和,得到当前待上报的剩余带宽信息。9.根据权利要求2所述的方法,其特征在于,所述实时带宽信息所述监测结果中的实时带宽信息和带宽分配函数确定所述剩余带宽信息,包括:根据所述分配函数指示的多个第二权重和求和函数,对所述实时带宽信息进行加权求和;其中,距离当前时刻越近的实时带宽信息所对应的第二权重越大;其中,多个第二权重之和为1。10.一种分布式容器系统的任务调度装置,其特征在于,包括:接收模块,用于接收任务执行请求;所述任务执行请求包括执行任务所需的带宽信息;处理模块,用于根据所述分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及所述执行任务所需的带宽信息,从所述一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,所述剩余带宽信息是所述节点代理根据带宽流量监控服务的监测结果得到的;执行模块,用于利用所述目标节点代理执行所述调度任务,以响应所述任务执行请求。11.一种任务调度系统,其特征在于,包括权利要求10所述的分布式容器系统的任务调度装置以及用于提供带宽流量监控服务的监控装置;其中,所述监控装置,用于通过所述带宽流量监控服务获取一个或多个网卡的驱动程序分别对应的一个或多个数据包、以及所述一个或多个网卡分别对应的最大带宽信息;根据所述数据包确定对应的所述网卡的消耗带宽信息,将所述网卡的最大带宽信息与对应的消耗带宽信息之差作为所述网卡的实时带宽信息。12.根据权利要求11所述的系统,其特征在于,所述带宽流量监控服务,用于在一个所述网卡对应有多个数据包的情况下,针对单个网卡:确定所述网卡对应的多个数据包分别对应的平均传输速率;将每个所述数据包的平均传输速率进行加和,以确定所述网卡的消耗带宽信息。13.一种分布式容器系统的带宽调度设备,其特征在于,包括:一个或多个处理器;存储系统,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。

技术总结
本发明公开了一种分布式容器系统的任务调度方法、装置及系统,涉及计算机技术领域。该方法的一具体实施方式包括:接收任务执行请求;任务执行请求包括执行任务所需的带宽信息;根据分布式容器中一个或多个节点代理分别对应的剩余带宽信息、以及执行任务所需的带宽信息,从一个或多个节点代理中确定用于执行任务的目标节点代理,并对应生成调度任务;其中,剩余带宽信息是节点代理根据带宽流量监控服务的监测结果得到的;利用目标节点代理执行调度任务,以响应任务执行请求。在不影响代理节点正常运行的情况下,通过异步的方式获取节点代理处的剩余带宽信息,实现对节点代理的合理调度和使用。调度和使用。调度和使用。


技术研发人员:高新 包勇军 朱小坤 牛文杰 李开荣 王龙辉
受保护的技术使用者:北京京东世纪贸易有限公司
技术研发日:2022.01.26
技术公布日:2023/8/5
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐