基于预测行为控制的多航天器编队系统控制一体化方法

未命名 07-04 阅读:368 评论:0


1.本发明涉及航天工程技术领域,特别是一种基于预测行为控制的多航天器编队系统控制一体化方法。


背景技术:

2.由于多航天器编队与单航天器系统相比,具有通信成本低、鲁棒性强和效率高等优点,在军事和民事领域受到广泛关注。多航天器编队作为一种多智能体系统通常需要,并需要完成多个任务包括沿着预设轨迹移动,避开静态和动态的障碍物,保持刚性编队等等,然而航天器之间的相对距离受限、动力学的强非线性以及编队一致性的要求等都给航天器的控制带来了不小的技术挑战。
3.在过去的几十年中已经广泛研究了许多编队控制架构,包括领航-跟随者编队、虚拟领航-跟随者编队和基于行为控制的方法。以上方法各有优缺点,具体而言,领航-跟随者对编队给出明确的反馈,但抗干扰能力较差;而虚拟结构方法缺乏鲁棒性并且是开环的;行为控制方法在任务设计过程中实现简单,但数学分析复杂。编队控制的另一个关键问题是避障,避障技术主要包括人工势场(apf)方法、基于行为的控制方法和基于优化的方法。人工势场法势设计一个吸引势函数和一个排斥势函数来避开障碍,但众所周知很容易陷入局部最小值。基于行为的控制方法,尤其是基于零空间的行为控制(nsbc)是另一种通过零空间投影解决任务冲突来实现避障的方法。另外,基于优化的方法则是将避障看作非线性和非凸约束,将避障和避碰作为模型预测控制问题的约束,在求解优化问题中解决。然而,随着航天器和障碍物数量的增加,底层优化算法具有更高的计算复杂度,难以实时求解。
4.为了克服各航天器控制技术的局限性,有学者提出双层控制架构来分解复杂的控制目标:上层的轨迹规划和下层的参考跟踪。例如,在上层采用基于人工势场的方法来规划无障碍路径,而在底层采用分布式连续渐进式跟踪控制来跟踪路径。但是,这并不能解决人工势场法容易陷入局部最小点的问题。有学者将nsbc方法用于解决避碰问题,并结合滑动控制器来实现编队的鲁棒性控制。然而,这项工作存在多约束变化、缺乏最优性和控制律抖动的问题。最近,也有学者将nsbc用于生成航天器编队和避障的速度参考,但在上层生成的参考轨迹不涉及未来的预测信息,可能会降低性能甚至违反避障约束。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种基于预测行为控制的多航天器编队系统控制一体化方法,将底层的控制器的预测信息反馈给上层规划层,使得规划层根据未来预测信息实现未来的轨迹的优化,可以使系统克服了零空间行为控制切换任务优先级的时机选取的问题,从而显着提高了航天器的安全性同时达到预期的控制目标。
6.为实现上述目的,本发明采用如下技术方案:基于预测行为控制的多航天器编队系统控制一体化方法,包括以下步骤:
7.步骤s1:明确多航天器编队所要执行的全局任务:编队保持、移动;局部任务:避
障,再通过零空间的行为控制投影的方式建立复合任务;
8.步骤s2:设计一个基于分散式模型预测控制的轨迹跟踪器跟踪参考轨迹;
9.步骤s3:将预测轨迹反馈给规划层用于未来任务优先级的预测,将传统零空间的单步规划扩展到多步预测。
10.在一较佳的实施例中,所述步骤s1包括:
11.步骤s11:基本任务设计;基本任务设计包括避障任务设计、刚性编队任务设计以及重心移动任务设计;
12.步骤s12:复合任务的设计。
13.在一较佳的实施例中,避障任务设计具体为:在避障任务中,航天器必须避开由传感器检测到在预设轨迹上的障碍物,通过定义一个虚拟球体为躲避障碍物范围:
[0014][0015]
其中,pi=[p
i,x p
i,y p
i,z
]
t
是第i架航天器的位置,p
i,o
是障碍物的位置,σ
i,od
=di是航天器与障碍物之间的安全距离;那么产生避障任务速度相应的任务函数被定义为:
[0016]
σ
i,o
=(max{||p
i-p
i,o
||,di}-||v
i-v
i,o
||),
ꢀꢀꢀ
(2)
[0017]
其中,v_{i,o}表示第i个航天器与障碍物的相对速度;
[0018]ji,o
=(p
i-p
i,o
)/||p
i-p
i,o
||是避障任务中的雅可比矩阵,即指向障碍物方向的单位向量,则避障任务的期望速度为:
[0019][0019][0020]
其中,λ
i,o
是增益的正定矩阵,另外当表示避障任务是活动的,表示避障任务是不活动的。
[0021]
在一较佳的实施例中,刚性编队任务设计具体为:
[0022]
刚性编队任务要求航天器移动到一个预定义的位置,同时保持一个与编队重心的刚性相对位置;将刚性编队任务函数定义为:
[0023]
σr=[(p
1-pg)
t
,...,(p
n-pg)
t
]
t
,
ꢀꢀꢀ
(4)
[0024]
其中,是航天器编队的重心;任务函数的误差定义为其中σ
r,d
是航天器相对于航天器重心的期望位置;刚性编队任务的雅可比矩阵写为:
[0025]
其中,
[0026][0027]
在固定的期望编队的情况下即那么编队任务函数的输出为
[0028]
在一较佳的实施例中,重心移动任务设计具体为:
[0029]
通过重心移动任务的设计使得航天器编队跟随重心移动;重心移动任务函数的定义为:
[0030][0031]
重心移动任务函数对时间导数为:
[0032][0033]
其中,重心移动任务的雅可比矩阵为用i3表示3维的单位矩阵;重心移动任务的速度表示为
[0034]
式中,σ
g,d
为重心运动任务函数的期望值,即所有航天器中心的期望轨迹。
[0035]
在一较佳的实施例中,步骤s12具体为:
[0036]
复合任务是由多个基本任务经过零空间投影的融合,定义是第m个任务输出,其中dm为第m个任务空间的维数,h为任务数;定义一个优先级排序函数:s(
·
):它将任务函数空间映射到一个优先级空间;定义以下任务层次结构规则:
[0037]
最低优先级任务dm的维度需要大于从而使系统的维度n大于所有任务的组合总维度;
[0038]
定义一个任务优先级函数
[0039]
w=s(t)
[0040]
(7)
[0041]
其中t=[1,...,h]是所有任务的升序索引,w是优先级排序由最高到最低的任务索引向量;例如,w=s([1,2,3])=[2,3,1]意味着在三个任务中,第二个任务具有最高的优先级,第三个任务具有第二个优先级,第一个任务具有最低的优先级;
[0042]
最后,将所有任务的速度融合,将低优先级任务投影到高优先级任务的零空间上,以消除任务冲突:
[0043][0044]
其中,w(j)为w的第j个元素,v
d,w(j)
(j=1,2,...,h)为优先级为j的任务速度。
[0045]
在一较佳的实施例中,步骤s2具体为:
[0046]
在底层设计模型预测控制跟踪控制器;将第i个航天器与领航者航天器之间的相对运动的状态空间定义为:x:=[v
i,x v
i,y v
i,z
]
t
,将航天器在径向、轨道内和交叉轨道方向的推力作为控制输入,表示为:u:=[u
i,x u
i,y u
i,z
]
t
,航天器相对运动的非线性模型写为:
[0047]
其中:
[0048][0049]
公式中,mi为第i次跟随者航天器的质量,为领航者航天器纬度角的速率,θ表示领航者航天器纬度角;ec是轨道的轨道偏心率,是领航者航天器从地球中心的标量半径,ac是领航者航天器的半长轴;μ是引力常数,表示从地球中心到第i个跟随者航天器的距离,f
id
=[f
id,x
,f
id,y
,f
id,z
]
t
分别是第i个航天器的干扰力;
[0050]
设计一个分散的mpc,其中每个航天器只在线优化自己的控制问题;设控制器的预测时域为n个离散采样时刻,系统的输入和状态从时刻k到k+n可以根据模型分别表示为:
[0051]
u(n-1|k)=[u(k),...,u(k+n-1)]和x(n|k+1)=[x(k+1),...,x(k+n)];系统成本函数的设计为:
[0052][0053]
其中,加权范数‖
·
‖w可以定义成三个权重矩阵w1,w2,w3为正定矩阵,是系统状态误差;
[0054]
建立系统的非线性规划nlp问题为:
[0055][0056]
其中,f(xm(k),u(k))表示离散的动力学方程,表示航天器在第k次采样时刻的系统状态;集合u和x分别表示系统控制和状态的饱和约束;通过求解nlp,得到具有n个元素的最优控制序列u
*
(n-1|k)=[u
*
(k),...,u
*
(k+n-1)];取第一个控制量元素u
*
(k)并将其反馈给航天器进行控制,完成mpc的一个典型的采样控制操作;
[0057]
采用最优控制序列u
*
(n-1|k)生成预测的位置轨迹:p(n+1|k+1)=[p(k+1),p(k+2),...,p(k+n),p(k+n)];之后在第k+1采样时刻将通过预测轨迹来获得预测的任务优先级序列;以第上一节中设计的三个任务避障任务、刚性编队、重心移动任务为例,任务优先级由以下规则确定,对于j=1,...,n+1:
[0058][0059]
公式(11)表明,当航天器位置与障碍物之间的距离小于安全距离时,避障任务的优先级最高,其次是刚性编队,重心运动的优先级最低;当系统位置与障碍物之间的距离大于安全距离时,刚性编队优先级最高,重心运动任务第二,避障优先级最低;通过对未来的n步预测轨迹,得到第k+1个采样瞬间的预测任务优先级序列为w=[w1,w2,...,wn],以反馈上层零空间行为控制规划时变参考轨迹。
[0060]
在一较佳的实施例中,步骤s3具体为:
[0061]
不同于传统模型预测控制,预测行为控制将最优控制序列u
*
(n-1|k)用于生成预测位置轨迹p(n+1|k+1)=[p(k+1),p(k+2),...,p(k+n),p(k+n)],
[0062]
通过预测轨迹来获得第k+1个时刻的预测任务优先级序列;
[0063]
将xk定义为模型预测控制器在第k个采样时刻获得的预测状态轨迹;预测行为控
制规划层的一个重要步骤是设计一个任务监管器,优先级由任务监管器根据任务需求和受控系统的状态来确定;例如,如果受控系统的位置和障碍物太近,避障任务被分配最高的任务;预测零空间行为控制与底层模型预测控制器交互,获得未来n个采样时刻的系统预测状态信息xk的,然后确定n个采样时刻的任务优先级;
[0064]
定义n步的任务优先级序列为:w=[w1,w2,...,wn],其中,第k个采样时刻的任务优先级向量wk是从公式(5)计算出来,h个任务的n步复合速度为:其中对于第k个采样瞬间的期望速度从(6)计算获得,综合规划和控制预测行为控制方法将控制器预测的n步状态轨迹反馈给规划层。
[0065]
本发明还提供了基于预测行为控制的多航天器编队系统控制一体化方法,包括处理器、内存以及存储于内存上的计算机程序,当处理器运行所述程序指令时,能够实现如所述的基于预测行为控制的多航天器编队系统控制一体化方法。
[0066]
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述指令由处理器加载并执行时,能够实现如所述的基于预测行为控制的多航天器编队系统控制一体化方法。
[0067]
与现有技术相比,本发明具有以下有益效果:
[0068]
(1)本发明提出的预测零空间行为控制将传统的一步零空间行为控制规划器扩展为具有轨迹预测能力的多步规划器。模型预测控制器及其计算的预测轨迹反馈帮助零空间行为控制规划器生成预测的任务优先级序列,并最终在下一个采样时刻生成时变速度参考。这样的参考可以更好地指导模型预测控制器获得更好的控制性能。预测行为控制克服了现有行为控制任务优先级切换时机不当的问题,从而显著提高了航天器的安全性。
[0069]
(2)本发明借助零空间行为控制多任务冲突解决机制,将避障、刚度编队和航天器移动作为规划层的任务,在规划层进行任务的融合消解使得在跟踪层模型预测控制器无需考虑约束,与传统在模型预测控制器中将各任务为求解最优问题的非线性约束相比,大大降低了在线计算成本,使得在线实时运算成为可能。
附图说明
[0070]
图1是本发明背景技术的预测零空间行为规划控制一体化架构图;
[0071]
图2是本发明背景技术的两层mpc+nsbc与pnsbc方法流程对比图;
[0072]
图3是本发明优选实施例的各航天器相对轨迹图;
[0073]
图4是本发明优选实施例的障碍物和各航天器之间的相对距离图;
[0074]
图5是本发明优选实施例的第5架航天器采用pnsbc和nsbc方法对比图;
[0075]
图6是本发明优选实施例的第5架航天器采用pnsbc与mpc计算时间对比图。
具体实施方式
[0076]
下面结合附图及实施例对本发明做进一步说明。
[0077]
应该指出,以下详细说明都是例示性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
[0078]
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式;如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0079]
如图1所示;本实施例提供一种基于预测行为控制的多航天器编队系统规划控制一体化方法,包括以下步骤:
[0080]
步骤一:明确多航天器编队所要执行的全局任务:编队保持、移动等,局部任务:避障等,再通过零空间的行为控制投影的方式建立复合任务。
[0081]
步骤s11:基本任务设计:
[0082]
a.避障任务设计:
[0083]
在避障任务中,航天器必须避开由传感器检测到在预设轨迹上的障碍物,通过定义一个虚拟球体为躲避障碍物范围:
[0084][0084][0085]
其中,pi=[p
i,x p
i,y p
i,z
]
t
是第i架航天器的位置,p
i,o
是障碍物的位置,σ
i,od
=di是航天器与障碍物之间的安全距离。那么产生避障任务速度相应的任务函数可以被定义为:
[0086]
σ
i,o
=(max{||p
i-p
i,o
||,di}-||v
i-v
i,o
||),
ꢀꢀꢀ
(2)
[0087]
其中,v_{i,o}表示第i个航天器与障碍物的相对速度。
[0088]ji,o
=(p
i-p
i,o
)/||p
i-p
i,o
||是避障任务中的雅可比矩阵,即指向障碍物方向的单位向量,则避障任务的期望速度为:
[0089][0090]
其中,λ
i,o
是增益的正定矩阵,另外当表示避障任务是活动的,表示避障任务是不活动的。
[0091]
b.刚性编队任务设计:
[0092]
刚性编队任务要求航天器移动到一个预定义的位置,同时保持一个与编队重心的刚性相对位置。将刚性编队任务函数定义为:
[0093]
σr=[(p
1-pg)
t
,...,(p
n-pg)
t
]
t
,
ꢀꢀꢀ
(4)
[0094]
其中,是航天器编队的重心。任务函数的误差可以定义为其中σ
r,d
是航天器相对于航天器重心的期望位置。刚性编队任务的雅可比矩阵可以写为:
[0095]
其中,
[0096][0097]
在固定的期望编队的情况下(即),那么编队任务函数的输出为
[0098]
c.重心移动任务设计:
[0099]
通过重心移动任务的设计使得航天器编队跟随重心移动。重心移动任务函数的定义为:
[0100][0101]
重心移动任务函数对时间导数为:
[0102][0103]
其中,重心移动任务的雅可比矩阵为用i3表示3维的单位矩阵。重心移动任务的速度表示为
[0104]
式中,σ
g,d
为重心运动任务函数的期望值,即所有航天器中心的期望轨迹。
[0105]
步骤s12:复合任务的设计:
[0106]
复合任务是由多个基本任务经过零空间投影的融合,定义是第m个任务输出,其中dm为第m个任务空间的维数,h为任务数。定义一个优先级排序函数:s(
·
):它将任务函数空间映射到一个优先级空间。定义以下任务层次结构规则:
[0107]
最低优先级任务dm的维度需要大于从而使系统的维度n大于所有任务的组合总维度;
[0108]
定义一个任务优先级函数
[0109]
w=s(t)
[0110]
(7)
[0111]
,其中t=[1,...,h]是所有任务的升序索引,w是优先级排序由最高到最低的任务索引向量。例如,w=s([1,2,3])=[2,3,1]意味着在三个任务中,第二个任务具有最高的优先级,第三个任务具有第二个优先级,第一个任务具有最低的优先级。
[0112]
最后,将所有任务的速度融合,将低优先级任务投影到高优先级任务的零空间上,以消除任务冲突:
[0113][0114]
其中,w(j)为w的第j个元素,v
d,w(j)
(j=1,2,...,h)为优先级为j的任务速度。
[0115]
步骤二:设计一个基于分散式模型预测控制的轨迹跟踪器跟踪参考轨迹。
[0116]
在底层设计了模型预测控制跟踪控制器。将第i个航天器与领航者航天器之间的相对运动的状态空间定义为:x:=[v
i,x v
i,y v
i,z
]
t
,将航天器在径向、轨道内和交叉轨道方向的推力作为控制输入,表示为:u:=[u
i,x u
i,y u
i,z
]
t
,航天器相对运动的非线性模型写为:其中:
[0117][0118]
公式中,mi为第i次跟随者航天器的质量,为领航者航天器纬度角的速率,θ表示领航者航天器纬度角。ec是轨道的轨道偏心率,是领航者航天器从地球中心的标量半径,ac是领航者航天器的半长轴。μ是引力常数,表示从地球中心到第i个跟随者航天器的距离,f
id
=[f
id,x
,f
id,y
,f
id,z
]
t
分别是第i个航天器的干扰力。
[0119]
为了减少在线计算的负担,设计了一个分散的mpc,其中每个航天器只在线优化自己的控制问题。设控制器的预测时域为n个离散采样时刻,系统的输入和状态从时刻k到k+n可以根据模型分别表示为:u(n-1|k)=[u(k),...,u(k+n-1)]和x(n|k+1)=[x(k+1),...,x(k+n)]。系统成本函数的设计为:
[0120][0121]
其中,加权范数‖
·
‖w可以定义成三个权重矩阵w1,w2,w3为正定矩阵,是系统状态误差。
[0122]
建立系统的非线性规划(nlp)问题为:
[0123][0124]
其中,f(xm(k),u(k))表示离散的动力学方程,表示航天器在第k次采样时刻的系统状态。集合u和x分别表示系统控制和状态的饱和约束。通过求解nlp,得到了具有n个元素的最优控制序列u
*
(n-1|k)=[u
*
(k),...,u
*
(k+n-1)]。取第一个控制量元素u
*
(k)并将其反馈给航天器进行控制,完成mpc的一个典型的采样控制操作。
[0125]
与传统的mpc不同,采用最优控制序列u
*
(n-1|k)来生成预测的位置轨迹:p(n+1|k+1)=[p(k+1),p(k+2),...,p(k+n),p(k+n)]。之后在第k+1采样时刻将通过预测轨迹来获得预测的任务优先级序列。以第上一节中设计的三个任务避障任务、刚性编队、重心移动任务为例,任务优先级由以下规则确定,对于j=1,...,n+1:
[0126][0127]
公式(11)表明,当航天器位置与障碍物之间的距离小于安全距离时,避障任务的优先级最高,其次是刚性编队,重心运动的优先级最低。当系统位置与障碍物之间的距离大于安全距离时,刚性编队优先级最高,重心运动任务第二,避障优先级最低。通过对未来的n步预测轨迹,可以得到第k+1个采样瞬间的预测任务优先级序列为w=[w1,w2,...,wn],以反馈上层零空间行为控制规划时变参考轨迹。
[0128]
步骤三:将预测轨迹反馈给规划层用于未来任务优先级的预测,将传统零空间的
单步规划扩展到多步预测。
[0129]
不同于传统模型预测控制,预测行为控制将最优控制序列u
*
(n-1|k)用于生成预测位置轨迹p(n+1|k+1)=[p(k+1),p(k+2),...,p(k+n),p(k+n)],
[0130]
通过预测轨迹来获得第k+1个时刻的预测任务优先级序列。
[0131]
将xk定义为模型预测控制器在第k个采样时刻获得的预测状态轨迹。预测行为控制规划层的一个重要步骤是设计一个任务监管器,优先级由任务监管器根据任务需求和受控系统的状态来确定。例如,如果受控系统的位置和障碍物太近,避障任务被分配最高的任务。传统的零空间行为控制是一步一步式的规划器,因为它只能使用当前的系统状态信息来确定当前时刻的任务的优先级。相反,所提出的预测零空间行为控制与底层模型预测控制器交互,获得未来n个采样时刻的系统预测状态信息xk的,然后确定n个采样时刻的任务优先级。
[0132]
定义n步的任务优先级序列为:w=[w1,w2,...,wn],其中,第k个采样时刻的任务优先级向量wk是从公式(5)计算出来,h个任务的n步复合速度为:其中对于第k个采样瞬间的期望速度可以从(6)计算获得,综合规划和控制预测行为控制方法将控制器预测的n步状态轨迹反馈给规划层,如图2所示。
[0133]
步骤四:仿真对比与分析
[0134]
给出的仿真案例中,将预测行为控制方法和行为控制进行了比较,在零空间行为控制规划器中,设计了三个任务优先级从高到低分别为:避碰任务、刚性形成任务和重心运动任务。在避撞任务中,避障距离设置为d=15m,避障速度增益为λ
k,o
=1。刚性编队增益矩阵设置为λr=0.8i,每个航天器的最大控制推力设置为u≤5。每个跟随者航天器的初始位置相对于虚拟领航者航天器的初始位置是p
init,k
=[x
init,k
,y
init,k
,z
init,k
]
t
和p
init
=[p
init,1
,...,p
init,5
]。假设在航天器的周围有两个障碍,即p
o,1
=[60,50,17]和p
o,2
=[118,77,45]。个跟随者航天器相对于虚拟领航者航天器的初始位置和速度以及编队重构后的目标位置σ
g,d
如表1所示。所提基于预测行为控制的多航天器编队系统规划控制一体化方法的航天器编队轨迹如图3所示,航天器编队中各航天器与障碍物的距离如图4所示,所提的预测行为控制方法与传统行为控制方法分别用于第5个航天器的对比如图5所示,图5(a)是两种方法的轨迹对比,图5(b)是两种方法所输出的控制量对比,可以看出传统行为控制方式的控制量有较为剧烈的抖振,并且多处控制量达到执行器的饱和状态,图5(c)是两种方法第5个航天器与障碍物的距离图,可以看出传统行为控制方式超出了安全距离,形成安全隐患,而预测行为控制由于有对未来预测的信息未超过安全距离。图5(d)是两种方法切换任务优先级的时刻对比图。所提的双层编队的方式与将避障作为模型预测控制约束方式的计算量对比如图6所示。仿真案例中五架航天器用pnsbc与nsbc两种方式在总里程(tm)、燃油消耗(fc)、违反安全距离(svt)三个维度的对比,如表2所示。
[0135][0136]
表1
[0137][0138]
表2
[0139]
表1是本发明实施例子的五个航天器初始位置、速度和目标的相对位置;
[0140]
表2是本发明实施例子的五架航天器编队采用pnsnc和nsbc+mpc性能对比表。
[0141]
以上所述的仅为本发明的较佳实施例而已,本发明不仅仅局限于上述实施例,凡在本发明的精神和原则之内所做的局部改动、等同替换、改进等均应包含在本发明的保护范围之内。

技术特征:
1.基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,包括以下步骤:步骤s1:明确多航天器编队所要执行的全局任务:编队保持、移动;局部任务:避障,再通过零空间的行为控制投影的方式建立复合任务;步骤s2:设计一个基于分散式模型预测控制的轨迹跟踪器跟踪参考轨迹;步骤s3:将预测轨迹反馈给规划层用于未来任务优先级的预测,将传统零空间的单步规划扩展到多步预测。2.根据权利要求1所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,所述步骤s1包括:步骤s11:基本任务设计;基本任务设计包括避障任务设计、刚性编队任务设计以及重心移动任务设计;步骤s12:复合任务的设计。3.根据权利要求2所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,避障任务设计具体为:在避障任务中,航天器必须避开由传感器检测到在预设轨迹上的障碍物,通过定义一个虚拟球体为躲避障碍物范围:其中,p
i
=[p
i,x
p
i,y
p
i,z
]
t
是第i架航天器的位置,p
i,o
是障碍物的位置,σ
i,od
=d
i
是航天器与障碍物之间的安全距离;那么产生避障任务速度相应的任务函数被定义为:σ
i,o
=(max{||p
i-p
i,o
||,d
i
}-||v
i-v
i,o
||),
ꢀꢀꢀ
(2)其中,v_{i,o}表示第i个航天器与障碍物的相对速度;j
i,o
=(p
i-p
i,o
)/||p
i-p
i,o
||是避障任务中的雅可比矩阵,即指向障碍物方向的单位向量,则避障任务的期望速度为:其中,λ
i,o
是增益的正定矩阵,另外当表示避障任务是活动的,表示避障任务是不活动的。4.根据权利要求2所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,刚性编队任务设计具体为:刚性编队任务要求航天器移动到一个预定义的位置,同时保持一个与编队重心的刚性相对位置;将刚性编队任务函数定义为:σ
r
=[(p
1-p
g
)
t
,...,(p
n-p
g
)
t
]
t
,
ꢀꢀꢀ
(4)其中,是航天器编队的重心;任务函数的误差定义为其中σ
r,d
是航天器相对于航天器重心的期望位置;刚性编队任务的雅可比矩阵
写为:其中,在固定的期望编队的情况下即那么编队任务函数的输出为5.根据权利要求2所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,重心移动任务设计具体为:通过重心移动任务的设计使得航天器编队跟随重心移动;重心移动任务函数的定义为:重心移动任务函数对时间导数为:其中,重心移动任务的雅可比矩阵为用i3表示3维的单位矩阵;重心移动任务的速度表示为式中,σ
g,d
为重心运动任务函数的期望值,即所有航天器中心的期望轨迹。6.根据权利要求2所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,步骤s12具体为:复合任务是由多个基本任务经过零空间投影的融合,定义是第m个任务输出,其中d
m
为第m个任务空间的维数,h为任务数;定义一个优先级排序函数:它将任务函数空间映射到一个优先级空间;定义以下任务层次结
构规则:最低优先级任务d
m
的维度需要大于从而使系统的维度n大于所有任务的组合总维度;定义一个任务优先级函数w=s(t)(7)其中t=[1,...,h]是所有任务的升序索引,w是优先级排序由最高到最低的任务索引向量;例如,w=s([1,2,3])=[2,3,1]意味着在三个任务中,第二个任务具有最高的优先级,第三个任务具有第二个优先级,第一个任务具有最低的优先级;最后,将所有任务的速度融合,将低优先级任务投影到高优先级任务的零空间上,以消除任务冲突:其中,w(j)为w的第j个元素,v
d,w(j)
(j=1,2,...,h)为优先级为j的任务速度。7.根据权利要求1所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,步骤s2具体为:在底层设计模型预测控制跟踪控制器;将第i个航天器与领航者航天器之间的相对运动的状态空间定义为:x:=[v
i,x
v
i,y
v
i,z
]
t
,将航天器在径向、轨道内和交叉轨道方向的推力作为控制输入,表示为:u:=[u
i,x
u
i,y
u
i,z
]
t
,航天器相对运动的非线性模型写为:其中:其中:公式中,m
i
为第i次跟随者航天器的质量,为领航者航天器纬度角的速率,θ表示领航者航天器纬度角;e
c
是轨道的轨道偏心率,是领航者航天器从地球中心的标量半径,a
c
是领航者航天
器的半长轴;μ是引力常数,表示从地球中心到第i个跟随者航天器的距离,f
id
=[f
id,x
,f
id,y
,f
id,z
]
t
分别是第i个航天器的干扰力;设计一个分散的mpc,其中每个航天器只在线优化自己的控制问题;设控制器的预测时域为n个离散采样时刻,系统的输入和状态从时刻k到k+n可以根据模型分别表示为:u(n-1|k)=[u(k),...,u(k+n-1)]和x(n|k+1)=[x(k+1),...,x(k+n)];系统成本函数的设计为:其中,加权范数‖
·

w
可以定义成三个权重矩阵w1,w2,w3为正定矩阵,是系统状态误差;建立系统的非线性规划nlp问题为:建立系统的非线性规划nlp问题为:x(k+j+1)=f(x(k+j),u(k+j)),j=1,...,n-1,u(k+j)∈u,j=0,...,n-1,x(k+j)∈x,j=1,...,n,
ꢀꢀꢀ
(10)其中,f(x
m
(k),u(k))表示离散的动力学方程,表示航天器在第k次采样时刻的系统状态;集合u和x分别表示系统控制和状态的饱和约束;通过求解nlp,得到具有n个元素的最优控制序列u
*
(n-1|k)=[u
*
(k),...,u
*
(k+n-1)];取第一个控制量元素u
*
(k)并将其反馈给航天器进行控制,完成mpc的一个典型的采样控制操作;采用最优控制序列u
*
(n-1|k)生成预测的位置轨迹:p(n+1|k+1)=[p(k+1),p(k+2),...,p(k+n),p(k+n)];之后在第k+1采样时刻将通过预测轨迹来获得预测的任务优先级序列;以第上一节中设计的三个任务避障任务、刚性编队、重心移动任务为例,任务优先级由以下规则确定,对于j=1,...,n+1:由以下规则确定,对于j=1,...,n+1:公式(11)表明,当航天器位置与障碍物之间的距离小于安全距离时,避障任务的优先级最高,其次是刚性编队,重心运动的优先级最低;当系统位置与障碍物之间的距离大于安全距离时,刚性编队优先级最高,重心运动任务第二,避障优先级最低;通过对未来的n步预测轨迹,得到第k+1个采样瞬间的预测任务优先级序列为w=[w1,w2,...,w
n
],以反馈上层零空间行为控制规划时变参考轨迹。
8.根据权利要求1所述的基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,步骤s3具体为:不同于传统模型预测控制,预测行为控制将最优控制序列u
*
(n-1|k)用于生成预测位置轨迹p(n+1|k+1)=[p(k+1),p(k+2),...,p(k+n),p(k+n)],通过预测轨迹来获得第k+1个时刻的预测任务优先级序列;将x
k
定义为模型预测控制器在第k个采样时刻获得的预测状态轨迹;预测行为控制规划层的一个重要步骤是设计一个任务监管器,优先级由任务监管器根据任务需求和受控系统的状态来确定;例如,如果受控系统的位置和障碍物太近,避障任务被分配最高的任务;预测零空间行为控制与底层模型预测控制器交互,获得未来n个采样时刻的系统预测状态信息x
k
的,然后确定n个采样时刻的任务优先级;定义n步的任务优先级序列为:w=[w1,w2,...,w
n
],其中,第k个采样时刻的任务优先级向量w
k
是从公式(5)计算出来,h个任务的n步复合速度为:其中对于第k个采样瞬间的期望速度从(6)计算获得,综合规划和控制预测行为控制方法将控制器预测的n步状态轨迹反馈给规划层。9.基于预测行为控制的多航天器编队系统控制一体化方法,其特征在于,包括处理器、内存以及存储于内存上的计算机程序,当处理器运行所述程序指令时,能够实现如权利要求1至8中任意一项所述的基于预测行为控制的多航天器编队系统控制一体化方法。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序指令,所述指令由处理器加载并执行时,能够实现如权利要求1至8中任意一项所述的基于预测行为控制的多航天器编队系统控制一体化方法。

技术总结
基于预测行为控制的多航天器编队系统控制一体化方法,包括以下步骤:步骤S1:明确多航天器编队所要执行的全局任务:编队保持、移动;局部任务:避障,再通过零空间的行为控制投影的方式建立复合任务;步骤S2:设计一个基于分散式模型预测控制的轨迹跟踪器跟踪参考轨迹;步骤S3:将预测轨迹反馈给规划层用于未来任务优先级的预测,将传统零空间的单步规划扩展到多步预测。应用本技术方案可得到一个无任务约束轨迹跟踪控制问题,大大降低了在线计算成本。此外,在任务优先级的确定过程中考虑了对航天器未来状态的预测信息,使得其相较于传统的逻辑切换方法具有更加理想的切换效果。的逻辑切换方法具有更加理想的切换效果。的逻辑切换方法具有更加理想的切换效果。


技术研发人员:黄捷 张建程 陈宇韬 程俊哲
受保护的技术使用者:福州大学
技术研发日:2022.12.30
技术公布日:2023/6/27
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐