一种基于零和微分对策的航天器护卫控制方法
未命名
09-15
阅读:245
评论:0

1.本发明属于航天技术领域,具体涉及一种基于零和微分对策的航天器护卫控制方法。
背景技术:
2.航天器轨道追逃是一种研究广泛的工程问题,经典轨道追逃问题中的参与者的目的是尽可能远离对方或者尽可能靠近对方。然而,一些在轨航天器由于其价值高燃料需要用于在轨工作,因此在受到追击星威胁时不能自主躲避,需要释放伴随卫星作为防御星进行协同对抗。防御星与追击星之间对于主星的位置争夺就称为航天器护卫问题,追击星的目的是靠近主星,同时又要保证自身不被防御星拦截破坏;防御星的目的是尽可能避免追击星靠近主星。
3.目前对航天器护卫问题的建模与求解大部分使用非零和微分对策方法,但由于其属于博弈类型中的非零和博弈,追击星和防御星的代价函数并不相同,因此对其最优控制策略的求解往往非常复杂。
技术实现要素:
4.为了克服上述现有技术的缺点,本发明的目的在于提供一种基于零和微分对策的航天器护卫控制方法,建立基于零和微分对策的航天器护卫问题模型,将追击星和防御星的博弈目的通过一对数值相反的代价函数描述,通过上述方法将航天器护卫问题转化为零和微分对策求解问题,使得求解过程大大简化,并在仿真中取得了良好的效果。
5.为了达到上述目的,本发明采用以下技术方案予以实现:
6.本发明提供了一种基于零和微分对策的航天器护卫控制方法,包括以下步骤:
7.s1:获取追击星和防御星的航天器护卫参数;
8.s2:建立基于零和微分对策的航天器护卫模型,并将追击星和防御星的航天器护卫参数输入至航天器护卫模型内,获得追击星和防御星的最优控制律;
9.s3:根据追击星和防御星的最优控制律以及在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程将航天器护卫模型转化为两点边值问题模型;
10.s4:利用遗传算法求解两点边值问题模型,获得博弈时间内的状态轨线,完成航天器护卫控制。
11.在具体实施过程中,所述s2中,所述建立基于零和微分对策的航天器护卫模型的过程如下:
12.s11:以主星的位置为原点建立lvlh坐标系,基于lvlh坐标系结合追击星和防御星的目的建立代价函数;
13.s12:基于代价函数以及cw方程,确定在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程,建立基于零和微分对策建立的航天器护卫模型。
14.在具体实施过程中,所述s11中,所述代价函数为:
[0015][0016]
其中,对称半正定矩阵
[0017]
q1∈r4×4、q2∈r4×4、q3∈r4×4、q4∈r4×4、rd∈r2×2、ra∈r2×2满足:
[0018]
q1=k1i4×4,q2=k2i4×4,q3=k3i4×4,q4=k4i4×4,rd=kdi2×2,ra=kai2×2;
[0019]
上式中:
[0020]
k1,k2,k3,k4,ka,kd为权重系数;
[0021]
k1=6
×
10-5
,k2=4
×
10-5
,k3=6
×
10-5
,k4=4
×
10-5
,ka=1
×
10-5
,kd=2
×
10-5
;
[0022]
其中,a为追击星的下标;d为防御星的下标;xa为追击星的状态矢量,xa=[xa,ya,v
ax
,v
ay
]
t
;xd为防御星的状态矢量,xd=[xd,yd,v
dx
,v
dy
]
t
;x为lvlh系下轨道径向的位置分量;y为lvlh系下飞行方向的位置分量;v
x
为lvlh系下轨道径向的速度分量;vy为lvlh系下轨道飞行方向的速度分量;ua为追击星施加的连续控制量,ua=[u
ax
,u
ay
]
t
;ud为防御星施加的连续控制量,ud=[u
dx
,u
dy
]
t
;j为追击星和防御星双方的代价函数;tf为博弈终止时间;t0为博弈开始时间。
[0023]
在具体实施过程中,所述在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程为:
[0024][0025]
其中,矩阵a表示航天器相对运动动力学约束矩阵;b为追击星和防御星的控制矩阵,其中,b=[02×2,i2×2]
t
;
[0026]
所述矩阵a通过cw方程构建,所述矩阵a如下:
[0027][0028]
其中,表示主星的地球公转轨道角速度,μ为地球引力场系数,μ=3.986
×
10
14
,a0为主星的轨道半长轴。
[0029]
在具体实施过程中,获得追击星和防御星的最优控制律的过程如下:
[0030]
基于拉格朗日乘子法引入协态变量λ和v,将有微分方程等式约束的双边优化问题转化为无约束双边优化问题,对代价函数进行处理得到辅助代价函数;
[0031]
将辅助代价函数进行处理并结合设定条件求解,获得追击星和防御星的最优控制律。
[0032]
在具体实施过程中,所述辅助代价函数为
[0033][0034]
所述设定条件为
[0035][0036]
所述追击星和防御星的最优控制律如下:
[0037][0038][0039]
在具体实施过程中,所述两点边值问题模型为:
[0040][0041]
在具体实施过程中,利用遗传算法求解两点边值问题模型的步骤如下:
[0042]
s21:设置种群为协态变量的初始值λ0和v0;
[0043]
s22:对初始值λ0和v0进行积分处理,获得协态变量终端值
[0044]
s23:结合种群的适应度函数,获得使适应度函数最小的协态变量初值
[0045]
所述种群的适应度函数为所述种群的适应度函数为
[0046]
在具体实施过程中,获得博弈时间内的状态轨线的过程如下:
[0047]
以作为变量的初始值对两点边值问题模型中的微分方程进行求解,获得博弈时间内追击星和防御星的运动轨迹、博弈时间内追击星和防御星的速度变化、博弈时间内追击星与防御星之间的距离变化以及追击星和主星之间的距离变化,获得博弈
时间内的状态轨线。
[0048]
与现有技术相比,本发明具有以下有益效果:
[0049]
本发明提供一种基于零和微分对策的航天器护卫控制方法,所述求解方法将复杂的非零和博弈问题转化为了零和博弈问题,并进一步转化为了两点边值问题,显著提升了问题的求解效率。所述航天器护卫问题模型是基于线性的cw方程的一种微分对策博弈模型,具有模型简单,线性化误差很小的优点。上述模型和方法可为采用主从星协同的航天器提供有效的威胁解决方案。
附图说明
[0050]
图1为本发明所适用的航天器护卫问题博弈场景图;
[0051]
图2为本发明的航天器护卫问题具体实施流程图;
[0052]
图3为本发明的仿真轨迹图;
[0053]
图4为本发明的仿真速度变化图;
[0054]
图5为本发明的追击星与防御星的距离以及追击星和主星的距离变化图。
具体实施方式
[0055]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0056]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0057]
下面结合附图对本发明做进一步详细描述:
[0058]
本发明公开了一种基于零和微分对策的航天器护卫控制方法,具体内容包括:首先建立了一种基于微分对策的航天器护卫模型,包含优化指标、优化变量、动力学约束等;其中优化指标采用包含了星间距离和燃料消耗的加权二次型函数描述,优化变量为追防双方的连续控制力加速度,动力学约束采用相对运动模型下cw方程描述,然后建立了上述优化问题的求解方法(护卫控制方法)。
[0059]
如图2所示,包括以下步骤:
[0060]
步骤一:获取追击星以及防御星的航天器护卫参数;
[0061]
步骤二:建立基于零和微分对策的航天器护卫模型,并将初始参数输入至航天器护卫模型内;
[0062]
步骤三:将航天器护卫模型转化为16维两点边值问题模型;
[0063]
步骤四:使用遗传算法对16维两点边值问题模型进行求解,获得博弈时间内的状态轨线,完成航天器护卫控制。
[0064]
本发明提供了一种基于零和微分对策的航天器护卫控制方法,具体步骤如下:
[0065]
s1:获取追击星和防御星的航天器护卫参数;包括追击星的初始位置、防御星的初始位置、追击星的速度以及防御星的速度;
[0066]
s2:建立基于零和微分对策的航天器护卫模型即以主星的位置为原点建立lvlh坐标系,基于lvlh坐标系结合追击星和防御星的目的建立代价函数;基于代价函数以及cw方程,确定在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程,完成模型建立;将追击星和防御星的航天器护卫参数输入至航天器护卫模型内,获得追击星和防御星的最优控制律;航天器护卫模型是基于线性的cw方程的一种微分对策博弈模型,具有模型简单,线性化误差很小的优点。
[0067]
上述代价函数为:
[0068][0069]
该代价函数分为终端项和积分项两部分,终端项的含义是终端时刻追击星和主星之间的相对状态与防御星和主星之间的相对状态。积分项的含义是整个博弈过程中追击星和主星之间的相对状态与防御星和主星之间的相对状态,以及双方燃料消耗。
[0070]
上述在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程为:
[0071][0072]
其中,对称半正定矩阵
[0073]
q1∈r4×4、q2∈r4×4、q3∈r4×4、q4∈r4×4、rd∈r2×2、ra∈r2×2满足:
[0074]
q1=k1i4×4,q2=k2i4×4,q3=k3i4×4,q4=k4i4×4,rd=kdi2×2,ra=kai2×2ꢀꢀꢀ
(3)
[0075]
上式中:
[0076][0076]
k1,k2,k3,k4,ka,kd为权重系数;
[0077]
k1=6
×
10-5
,k2=4
×
10-5
,k3=6
×
10-5
,k4=4
×
10-5
,ka=1
×
10-5
,kd=2
×
10-5
;
[0078]
式(1)至(4)中其他符号的含义为:
[0079]
a——追击星的下标;
[0080]
d——防御星的下标;
[0081]
xa——追击星的状态矢量,具体为xa=[xa,ya,v
ax
,v
ay
]
t
;
[0082]
xd——防御星的状态矢量,具体为xd=[xd,yd,v
dx
,v
dy
]
t
;
[0083]
x——相对坐标系(lvlh系)下轨道径向的位置分量;
[0084]
y——相对坐标系(lvlh系)下飞行方向的位置分量;
[0085]vx
——相对坐标系(lvlh系)下轨道径向的速度分量;
[0086]
vy——相对坐标系(lvlh系)下轨道飞行方向的速度分量;
[0087]
ua——追击星施加的连续控制量,具体形式为ua=[u
ax
,u
ay
]
t
;
[0088]
ud——防御星施加的连续控制量,具体形式为ud=[u
dx
,u
dy
]
t
;
[0089]
b——追击星和防御星的控制矩阵,具体形式为b=[02×2,i2×2]
t
;
[0090]
j——追击星和防御星双方的代价函数;
[0091]
tf——博弈终止时间;
[0092]
t0——博弈开始时间;
[0093]
其中,矩阵a表示航天器相对运动动力学约束矩阵;b为追击星和防御星的控制矩阵,其中,b=[02×2,i2×2]
t
;
[0094]
所述矩阵a通过cw方程构建,所述矩阵a如下:
[0095][0096]
其中,表示主星的地球公转轨道角速度,μ为地球引力场系数,μ=3.986
×
10
14
,a0为主星的轨道半长轴。
[0097]
获得追击星和防御星的最优控制律的过程如下:
[0098]
s11:基于拉格朗日乘子法引入协态变量λ和v,将有微分方程等式约束的双边优化问题转化为无约束双边优化问题,对代价函数进行处理得到辅助代价函数;
[0099][0100]
其中,λ和v为协态变量。
[0101]
s12:为了方便对辅助代价函数进行求变分,首先将辅助代价函数进行分部积分处理:
[0102][0103]
其中:
[0104][0105][0106]
s13:对辅助代价函数求变分:
[0107][0108]
s14:由于变分法求解该问题解的必要条件为辅助代价函数的变分为0,即,因此可以得到下列必要条件:
[0109][0110][0111][0112][0113][0114][0115]
其中,双方的最优控制律根据后两式得到,即:
[0116][0117][0118]
s3:根据追击星和防御星的最优控制律以及在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程将航天器护卫模型转化为16维两点边值问题模型;即将双方的最优控制律代入双方的动力学约束微分方程,并与必要条件即式(10)-(17)进行组合得到以下两点边值问题,将复杂的非零和博弈问题转化为了零和博弈问题,并进一步转化为了两点边值问题,显著提升了问题的求解效率。
[0119]
即具体包括如下步骤:步骤一:使用变分原理得到微分对策博弈问题的鞍点解必要条件;步骤二:将鞍点解必要条件与博弈初始条件共同整理为16维两点边值问题;
[0120]
上述两点边值问题模型如下:
[0121][0122]
s4:利用遗传算法设置种群为协态变量的初始值,适应度函数为协态变量的积分末值与理论末值的差的模,对16维两点边值问题模型进行求解,得到博弈时间内追防双方的各种状态量的变化曲线,得到该航天器护卫问题的解,完成航天器护卫控制。
[0123]
具体步骤如下:
[0124]
s41:设置种群为协态变量的初始值λ0和v0;
[0125]
s42:对初始值λ0和v0进行积分处理,根据两点边值问题中的微分方程进行积分,得到积分后的协态变量终端值
[0126]
s43:设置种群的适应度函数为s43:设置种群的适应度函数为其中,表示协态变量的初值经过两点边值问题中的微分方程积分后得到协态变量的对应末值。其物理含义为协态变量初值经过两点边值问题中的微分方程积分后得到协态变量的对应末值,与协态变量末值应该满足的条件之间的误差量,这个误差量越小的种群个体的适应度越高。
[0127]
s44:获得使适应度函数g最小的协态变量初值
[0128]
s45:以作为变量的初始值对两点边值问题中的微分方程进行计算,得到博弈时间内追击星和防御星的运动轨迹、博弈时间内追击星和防御星的速度变化、博弈时间内追击星与防御星之间的距离变化以及追击星和主星之间的距离变化,得到博弈时间内追防双方的各种状态量的变化曲线,得到该航天器护卫问题的解,完成航天器护卫控制。
[0129]
实施例
[0130]
参见图1,假设在某初始时刻t0=0,在一个轨道半径为7000km的圆轨道附近,存在3颗卫星,分别为主星m、追击星a和防御星d,其中主星不能机动,追击星和防御星可以在平面内机动,以主星为原点建立lvlh坐标系,其初始状态如表1追击星a与防御星d的初始位置和速度(m,m/s)所示。
[0131]
表1
[0132]
jxj(t0)yj(t0)v
xj
(t0)v
yj
(t0)a1000010000-5-5
d2000200055
[0133]
使用遗传算法对上述两点边值问题进行求解,具体步骤为:
[0134]
输入航天器护卫问题的相关参数,包括:参考卫星轨道半长轴a0=7000km;追击星初始状态xa(t0)=[10000m,10000m,-5m/s,-5m/s];防御星初始状态xd(t0)=[2000m,2000m,5m/s,5m/s];各权重矩阵系数k1=6
×
10-5
,k2=4
×
10-5
,k3=6
×
10-5
,k4=4
×
10-5
,ka=1
×
10-5
,kd=2
×
10-5
,博弈终止时间tf=2000s;
[0135]
设置种群为协态变量λ和v的初始值λ0和v0,适应度函数为其中代表的含义是协态变量的初值经过两点边值问题中的微分方程积分后得到的对应末值。
[0136]
得到使得适应度函数最小的协态变量的初始值和
[0137]
以作为变量的初始值对两点边值问题中的微分方程进行积分,得到如图1、图3、图4和图5所示的博弈时间内追击星和防御星的运动轨迹、博弈时间内追击星和防御星的速度变化、博弈时间内追击星与防御星之间的距离变化以及追击星和主星之间的距离变化,获得状态轨线,完成航天器护卫问题求解。
[0138]
所述航天器护卫控制方法,可有效解决连续推力作用下的航天器护卫问题,是对现有技术中连续推力护卫问题模型及方法的一种有效拓展。该模型采用了零和代价函数描述的微分对策方法,因而使得难以求解的加权型性能指标护卫问题求解简化,提高了航天器护卫博弈问题的求解效率。
[0139]
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
技术特征:
1.一种基于零和微分对策的航天器护卫控制方法,其特征在于,包括以下步骤:s1:获取追击星和防御星的航天器护卫参数;s2:建立基于零和微分对策的航天器护卫模型,并将追击星和防御星的航天器护卫参数输入至航天器护卫模型内,获得追击星和防御星的最优控制律;s3:根据追击星和防御星的最优控制律以及在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程将航天器护卫模型转化为两点边值问题模型;s4:利用遗传算法求解两点边值问题模型,获得博弈时间内的状态轨线,完成航天器护卫控制。2.根据权利要求1所述的基于零和微分对策的航天器护卫控制方法,其特征在于,所述s2中,所述建立基于零和微分对策的航天器护卫模型的过程如下:s11:以主星的位置为原点建立lvlh坐标系,基于lvlh坐标系结合追击星和防御星的目的建立代价函数;s12:基于代价函数以及cw方程,确定在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程,建立基于零和微分对策建立的航天器护卫模型。3.根据权利要求2所述的基于零和微分对策的航天器护卫控制方法,其特征在于,所述s11中,所述代价函数为:其中,对称半正定矩阵q1∈r4×4、q2∈r4×4、q3∈r4×4、q4∈r4×4、r
d
∈r2×2、r
a
∈r2×2满足:q1=k1i4×4,q2=k2i4×4,q3=k3i4×4,q4=k4i4×4,r
d
=k
d
i2×2,r
a
=k
a
i2×2;上式中:k1,k2,k3,k4,k
a
,k
d
为权重系数;k1=6
×
10-5
,k2=4
×
10-5
,k3=6
×
10-5
,k4=4
×
10-5
,k
a
=1
×
10-5
,k
d
=2
×
10-5
;其中,a为追击星的下标;d为防御星的下标;x
a
为追击星的状态矢量,x
a
=[x
a
,y
a
,v
ax
,v
ay
]
t
;x
d
为防御星的状态矢量,x
d
=[x
d
,y
d
,v
dx
,v
dy
]
t
;x为lvlh系下轨道径向的位置分量;y为lvlh系下飞行方向的位置分量;v
x
为lvlh系下轨道径向的速度分量;v
y
为lvlh系下轨道飞行方向的速度分量;u
a
为追击星施加的连续控制量,u
a
=[u
ax
,u
ay
]
t
;u
d
为防御星施加的连续控制量,u
d
=[u
dx
,u
dy
]
t
;j为追击星和防御星双方的代价函数;t
f
为博弈终止时间;t0为博弈开始时间。4.根据权利要求3所述的基于零和微分对策的航天器护卫控制方法,其特征在于,所述在空间轨道上追击星和防御星所需要满足的动力学约束的微分方程为:
其中,矩阵a表示航天器相对运动动力学约束矩阵;b为追击星和防御星的控制矩阵,其中,b=[02×2,i2×2]
t
;所述矩阵a通过cw方程构建,所述矩阵a如下:其中,表示主星的地球公转轨道角速度,μ为地球引力场系数,μ=3.986
×
10
14
,a0为主星的轨道半长轴。5.根据权利要求4所述的基于零和微分对策的航天器护卫控制方法,其特征在于,获得追击星和防御星的最优控制律的过程如下:基于拉格朗日乘子法引入协态变量λ和ν,将有微分方程等式约束的双边优化问题转化为无约束双边优化问题,对代价函数进行处理得到辅助代价函数;将辅助代价函数进行处理并结合设定条件求解,获得追击星和防御星的最优控制律。6.根据权利要求5所述的基于零和微分对策的航天器护卫控制方法,其特征在于,所述辅助代价函数为所述设定条件为所述设定条件为所述追击星和防御星的最优控制律如下:所述追击星和防御星的最优控制律如下:7.根据权利要求6所述的基于零和微分对策的航天器护卫控制方法,其特征在于,所述两点边值问题模型为:
8.根据权利要求7所述的基于零和微分对策的航天器护卫控制方法,其特征在于,利用遗传算法求解两点边值问题模型的步骤如下:s21:设置种群为协态变量的初始值λ0和ν0;s22:对初始值λ0和ν0进行积分处理,获得协态变量终端值s23:结合种群的适应度函数,获得使适应度函数最小的协态变量初值所述种群的适应度函数为所述种群的适应度函数为9.根据权利要求8所述的基于零和微分对策的航天器护卫控制方法,其特征在于,获得博弈时间内的状态轨线的过程如下:以x
a0
,x
d0
,作为变量的初始值对两点边值问题模型中的微分方程进行求解,获得博弈时间内追击星和防御星的运动轨迹、博弈时间内追击星和防御星的速度变化、博弈时间内追击星与防御星之间的距离变化以及追击星和主星之间的距离变化,获得博弈时间内的状态轨线。
技术总结
本发明提供了一种基于零和微分对策的航天器护卫控制方法,属于航天技术领域。所述控制方法包括以下步骤:获取追击星以及防御星的航天器护卫问题参数;建立基于零和微分对策的航天器护卫模型,并将初始参数输入至航天器护卫模型内;将航天器护卫模型转化为两点边值问题模型;使用遗传算法对两点边值问题进行求解模型,获得博弈时间内的状态轨线,完成航天器护卫控制。该航天器护卫控制方法,可有效解决连续推力作用下的航天器护卫问题,是对现有技术中连续推力护卫问题模型及方法的一种有效拓展。该模型采用了零和代价函数描述的微分对策方法,因而使得难以求解的加权型性能指标护卫问题求解简化,提高了航天器护卫博弈问题的求解效率。求解效率。求解效率。
技术研发人员:党朝辉 李一峰 唐生勇 肖余之 卫国宁 吴斌
受保护的技术使用者:西北工业大学
技术研发日:2023.06.15
技术公布日:2023/9/13
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:大鼠一氧化碳中毒实验装置 下一篇:一种基于分级结构的模块化固态储氢罐体的制作方法