一种遥感星座对空中动目标的智能协同跟踪方法

未命名 07-04 阅读:120 评论:0


1.本发明涉及人工智能技术领域,是一种遥感星座对空中动目标的智能协同跟踪方法。


背景技术:

2.高超声速滑翔飞行器(hgvs)的天基跟踪问题近年来受到相当大的关注。与地基预警系统相比,天基预警系统的优势在于空间覆盖率更广,跟踪连贯性更好,并且不受地理位置限制。低轨星群对高超声速飞行器的协同定位问题是天基预警体系的研究重点。高超声速飞行器的航迹具有高机动性和不确定性。对星群的协同定位能力提出了新的挑战。近年来,人工智能技术的突破为多星协同自主智能决策技术提供了新的途径。深度强化学习是解决序贯决策问题的有效方法,其通过智能体与环境的相互作用来不断更新自身的决策网络,可以有效的解决星群预警系统中样本数据获取难的问题。目前常用的深度强化学习算法主要包括:深度q网络(dqn)、深度确定性策略梯度(ddpg)、近端策略优化(ppo)、和软行动家-评论家(sac)等。大规模星群决策过程具有协同性和连续性,并且卫星、传感器及目标的状态信息实时变化,因此任务决策算法的解空间维度很高。


技术实现要素:

3.本发明针对遥感星座对hgvs多星协同跟踪问题,设计了多目标凝视跟踪模型和双星几何定位模型,实现对hgvs的跟踪和定位。基于此,本发明提供一种遥感星座对空中动目标的智能协同跟踪方法。
4.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
5.本发明提供了一种遥感星座对空中动目标的智能协同跟踪方法,本发明提供了以下技术方案:
6.一种遥感星座对空中动目标的智能协同跟踪方法,所述方法包括以下步骤:
7.步骤1:建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;
8.步骤2:建立针对临近空间飞行器的双星几何定位模型;
9.步骤3:以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位。
10.优选地,所述步骤1具体为:
11.步骤1.1:进行星间通信约束,相邻的两颗卫星采用激光通信技术,考虑最低链路
高度hc,最大星间通信距离通过下式表示为:
[0012][0013][0014]
其中,hs为卫星轨道高度,re为地球半径长度,为最大地心角;
[0015]
步骤1.2:建立红外传感器约束,红外传感器的覆盖空域由视场角α
field
,最大探测距离卫星轨道高度hs和目标飞行高度h
tar
共同决定,与载荷能力和目标红外辐射强度有关,通过下式表示最大探测距离:
[0016][0017]
其中,d0为传感器孔径,d
*
为传感器探测度(m
·
hz
1/2
·
w-1
),τa为环境透射率,τo为光学系统的透射率,δ为传感器信号过程因子,ad为探测单元面积(m2),δf为噪声等效带宽(hz),snr
min
为传感器探测到目标所需的最小信噪比,i为传感器捕捉到的目标红外强度;
[0018]
红外辐射强度通过下式表示:
[0019][0020]
其中,a为目标的红外辐射面积(m2),λ1、λ2为红外波段下限和上限,ε为目标表面光谱发射率,c1为第一辐射常数(w
·
m2),c2为第二辐射常数(m
·
k);
[0021]
步骤1.3:确定驻点温度,驻点温度通过下式描述:
[0022][0023]
其中,t0为目标所在位置的环境温度,ν为大气绝热指数,β为热传递恢复系数,m为目标马赫数。
[0024]
优选地,所述步骤2具体为:
[0025]
步骤2.1:设置协同观测的两个卫星位置为[x
a y
a za]和[x
c y
c zc],通过卫星位置和测角信息计算卫星视线内可探测的最远点[x
b y
b zb]和[x
d y
d zd],先计算异面直线的公垂线,按比例划分公垂线,估算目标位置,定位通过下式表示:
[0026]
[0027][0028]
其中,f和t为中间变量,[x
tarytarztar
]为估算的目标位置;
[0029]
步骤2.2:星群红外传感器的像平面测量误差和欧拉角测量误差等效为二维平面内的测角误差,将卫星视线投影到以公垂线为法线的平面内,测角表示为:
[0030][0031]
目标在平面内的投影坐标为[x,y],(x1,y1)和(x2,y2)分别为两个卫星在平面内的投影坐标:
[0032][0033]
从测角误差转换到目标定位误差的观测矩阵h
θ
为:
[0034][0035]
其中,l为两个卫星间的距离;
[0036]
几何定位精度计算如下:
[0037][0038]
式中,σ
θ
为测角误差。
[0039]
优选地,所述步骤3具体为:
[0040]
步骤3.1:设置环境状态空间,环境状态空间s定义为s={t
num
,obs
angle
,pos
tar
,vel
tar
,l
tar
,l
score
},t
num
为目标数量,为天线坐标系下的观测角,n为卫星编号;pos
tar
为目标位置,vel
tar
为目标速度;为卫星跟踪目标
的列表,为卫星satn的传感器指向目标的编号,为卫星回报列表,为卫星satn的传感器指向目标id
tar
时获得的回报,l
tar
和l
score
的维度与卫星数量相同,卫星satn未观测到目标时
[0041]
步骤3.2:建立行为空间,卫星的行为空间a={tar1,tar2,...,tark}描述为传感器在t时刻指向的目标;a为k维向量,tark的初始值为-1;由于行为空间中除目标方向外,还包含一个回扫至初始位置的行为,因此当卫星可见目标数量小于k-1时,a包含所有可见目标的方向;
[0042]
步骤3.3:建立回报函数,回报函数用来评价卫星行为的价值;r
t
通过a
t
,s
t
计算获得,具体计算如下:
[0043][0044]
其中,cm和ca分别为观测角度权重和传感器转动权重,为传感器最大探测距离,为卫星与目标的距离,为传感器从当前方向转到目标方向的转动角度,ω
max
为传感器最大转动角速度,可见性参数i
vis
通过下式表示:
[0045][0046]
步骤3.4:进行网络更新,决策网络梯度更新方程通过下式表示:
[0047][0048][0049]
其中,策略π
θ
(a
t
|s
t
)表示在时间步t时,智能体获得环境状态s
t
后选择行为a
t
的概率;为时间步t时,采样的平均值,为时间步t时的广义优势函数,γ为折扣因子,λ为广义优势估计的折扣系数,r
t
为当前回报,v为评论家网络的评价值;
[0050]
建立策略梯度的目标函数,通过下式表示目标函数:
[0051][0052]
其中,为重要性权重;策略梯度的更新方程为:
[0053][0054]
其中,α为参数更新步长;
[0055]
mappo算法训练和参数更新采用经验共享机制,利用全局信息训练每个卫星的独立决策策略。
[0056]
优选地,当可见目标数量大于k-1时,a包含可见目标中按回报值降序排列的前k-1个目标的方向,卫星综合考虑传感器当前指向和环境状态,决策下一时刻传感器指向。
[0057]
优选地,重要性权重被超参数ε和截断操作clip限制在(1-ε,1+ε)范围内。
[0058]
一种遥感星座对空中动目标的智能协同跟踪系统,所述系统包括:
[0059]
凝视跟踪模块,所述凝视跟踪模块建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;
[0060]
双星几何定位模块,所述双星几何定位模块建立针对临近空间飞行器的双星几何定位模型;
[0061]
跟踪定位模块,所述跟踪定位模块以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位。
[0062]
优选地,对hgvs的跟踪过程中,多颗卫星协同观测以确保对目标的连续覆盖,同一时刻两颗以上的卫星同时跟踪同一个目标才能满足定位需求;由于星群预警系统中的卫星均为低轨卫星,因此卫星和hgvs均处于高速运动状态,卫星和目标的时空关系具有高动态性,目标在飞行过程中需要多颗卫星接力跟踪来实现对目标的连续多重覆盖,对于星群预警系统,hgvs是非合作目标,位置,速度信息均由卫星观测和消息共享获得。
[0063]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现一种遥感星座对空中动目标的智能协同跟踪方法。
[0064]
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种遥感星座对空中动目标的智能协同跟踪方法。
[0065]
本发明具有以下有益效果:
[0066]
本发明与现有技术相比:
[0067]
本发明针对遥感星座对高超声速飞行器(hgvs)的跟踪和定位是天基预警中的关键问题。遥感星座对hgvs的协同定位过程是一个多对多的动态任务分配过程。预警卫星的任务分配存在时序关联性和动态性,因此决策算法将面临解空间较大和容易陷入局部最优的问题。同时,hgvs的高机动性对遥感星座的任务决策算法的实时性提出了新的挑战。
[0068]
传统的遥感卫星任务决策算法通常采用中心节点卫星决策,多星协同执行的任务决策方法。此类方法对中心节点的计算压力较大。在复杂的跟踪场景中,较难应对具有不确定性的hgvs的跟踪问题。
[0069]
本发明设计一种遥感星座对临近空间多目标的凝视跟踪模型,通过星座构型方法,星间通信约束以及红外传感器约束三个方面描述遥感星座对临近空间飞行器的跟踪过程。
[0070]
本发明设计了一种针对临近空间飞行的双星几何定位模型。通过两颗卫星目标的测角信息计算目标的位置,并且考虑了测角误差对目标定位的影响,设计了几何定位精度因子,用来衡量双星定位的效果。
[0071]
本发明设计了一种基于强化学习的遥感星座任务决策方法。建立环境状态空间、行为空间并设计了回报函数等,实现了遥感星座的独立实时智能决策。
附图说明
[0072]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的
附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0073]
图1为红外传感器探测范围示意图;
[0074]
图2为遥感星座凝视跟踪模型示意图;
[0075]
图3为遥感星座智能决策整体流程;
[0076]
图4为双星定位示意图;
[0077]
图5为参数更新流程。
具体实施方式
[0078]
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0079]
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0080]
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0081]
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0082]
以下结合具体实施例,对本发明进行了详细说明。
[0083]
具体实施例一:
[0084]
根据图1至图5所示,本发明为解决上述技术问题采取的具体优化技术方案是:本发明涉及一种遥感星座对空中动目标的智能协同跟踪方法。
[0085]
一种遥感星座对空中动目标的智能协同跟踪方法,所述方法包括以下步骤:
[0086]
步骤1:建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;
[0087]
所述步骤1具体为:
[0088]
步骤1.1:进行星间通信约束,相邻的两颗卫星采用激光通信技术,考虑最低链路高度hc,最大星间通信距离通过下式表示为:
[0089][0090]
[0091]
其中,hs为卫星轨道高度,re为地球半径长度,为最大地心角;
[0092]
步骤1.2:建立红外传感器约束,红外传感器的覆盖空域由视场角α
field
,最大探测距离卫星轨道高度hs和目标飞行高度h
tar
共同决定,与载荷能力和目标红外辐射强度有关,通过下式表示最大探测距离:
[0093][0094]
其中,d0为传感器孔径,d
*
为传感器探测度(m
·
hz
1/2
·
w-1
),τa为环境透射率,τo为光学系统的透射率,δ为传感器信号过程因子,ad为探测单元面积(m2),δf为噪声等效带宽(hz),snr
min
为传感器探测到目标所需的最小信噪比,i为传感器捕捉到的目标红外强度;
[0095]
红外辐射强度通过下式表示:
[0096][0097]
其中,a为目标的红外辐射面积(m2),λ1、λ2为红外波段下限和上限,ε为目标表面光谱发射率,c1为第一辐射常数(w
·
m2),c2为第二辐射常数(m
·
k);
[0098]
步骤1.3:确定驻点温度,驻点温度通过下式描述:
[0099][0100]
其中,t0为目标所在位置的环境温度,ν为大气绝热指数,β为热传递恢复系数,m为目标马赫数。
[0101]
步骤2:建立针对临近空间飞行器的双星几何定位模型;
[0102]
所述步骤2具体为:
[0103]
步骤2.1:设置协同观测的两个卫星位置为[x
a y
a za]和[x
c y
c zc],通过卫星位置和测角信息计算卫星视线内可探测的最远点[x
b y
b zb]和[x
d y
d zd],先计算异面直线的公垂线,按比例划分公垂线,估算目标位置,定位通过下式表示:
[0104]
[0105][0106]
其中,f和t为中间变量,[x
tar y
tar z
tar
]为估算的目标位置;
[0107]
步骤2.2:星群红外传感器的像平面测量误差和欧拉角测量误差等效为二维平面内的测角误差,将卫星视线投影到以公垂线为法线的平面内,测角表示为:
[0108][0109]
目标在平面内的投影坐标为[x,y],(x1,y1)和(x2,y2)分别为两个卫星在平面内的投影坐标:
[0110][0111]
从测角误差转换到目标定位误差的观测矩阵h
θ
为:
[0112][0113]
其中,l为两个卫星间的距离;
[0114]
几何定位精度计算如下:
[0115][0116]
式中,σ
θ
为测角误差。
[0117]
步骤3:以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位。
[0118]
所述步骤3具体为:
[0119]
步骤3.1:设置环境状态空间,环境状态空间s定义为s={t
num
,obs
angle
,pos
tar
,vel
tar
,l
tar
,l
score
},t
num
为目标数量,为天线坐标系下的观测角,n为卫星
编号;pos
tar
为目标位置,vel
tar
为目标速度;为卫星跟踪目标的列表,为卫星satn的传感器指向目标的编号,为卫星回报列表,为卫星satn的传感器指向目标id
tar
时获得的回报,l
tar
和l
score
的维度与卫星数量相同,卫星satn未观测到目标时
[0120]
步骤3.2:建立行为空间,卫星的行为空间a={tar1,tar2,...,tark}描述为传感器在t时刻指向的目标;a为k维向量,tark的初始值为-1;由于行为空间中除目标方向外,还包含一个回扫至初始位置的行为,因此当卫星可见目标数量小于k-1时,a包含所有可见目标的方向;
[0121]
步骤3.3:建立回报函数,回报函数用来评价卫星行为的价值;r
t
通过a
t
,s
t
计算获得,具体计算如下:
[0122][0123]
其中,cm和ca分别为观测角度权重和传感器转动权重,为传感器最大探测距离,为卫星与目标的距离,为传感器从当前方向转到目标方向的转动角度,ω
max
为传感器最大转动角速度,可见性参数i
vis
通过下式表示:
[0124][0125]
步骤3.4:进行网络更新,决策网络梯度更新方程通过下式表示:
[0126][0127][0128]
其中,策略π
θ
(a
t
|s
t
)表示在时间步t时,智能体获得环境状态s
t
后选择行为a
t
的概率;为时间步t时,采样的平均值,为时间步t时的广义优势函数,γ为折扣因子,λ为广义优势估计的折扣系数,r
t
为当前回报,v为评论家网络的评价值;
[0129]
建立策略梯度的目标函数,通过下式表示目标函数:
[0130][0131]
其中,为重要性权重;策略梯度的更新方程为:
[0132][0133]
其中,α为参数更新步长;
[0134]
mappo算法训练和参数更新采用经验共享机制,利用全局信息训练每个卫星的独立决策策略。
[0135]
当可见目标数量大于k-1时,a包含可见目标中按回报值降序排列的前k-1个目标的方向,卫星综合考虑传感器当前指向和环境状态,决策下一时刻传感器指向。
[0136]
重要性权重被超参数ε和截断操作clip限制在(1-ε,1+ε)范围内。
[0137]
本发明提供一种遥感星座对空中动目标的智能协同跟踪系统,所述系统包括:
[0138]
凝视跟踪模块,所述凝视跟踪模块建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;
[0139]
双星几何定位模块,所述双星几何定位模块建立针对临近空间飞行器的双星几何定位模型;
[0140]
跟踪定位模块,所述跟踪定位模块以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位。
[0141]
对hgvs的跟踪过程中,多颗卫星协同观测以确保对目标的连续覆盖,同一时刻两颗以上的卫星同时跟踪同一个目标才能满足定位需求;由于星群预警系统中的卫星均为低轨卫星,因此卫星和hgvs均处于高速运动状态,卫星和目标的时空关系具有高动态性,目标在飞行过程中需要多颗卫星接力跟踪来实现对目标的连续多重覆盖,对于星群预警系统,hgvs是非合作目标,位置,速度信息均由卫星观测和消息共享获得。
[0142]
本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现一种遥感星座对空中动目标的智能协同跟踪方法。
[0143]
本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种遥感星座对空中动目标的智能协同跟踪方法。
[0144]
具体实施例二:
[0145]
本技术实施例二与实施例一的区别仅在于:
[0146]
一种基于强化学习的遥感星座任务决策方法步骤如下:
[0147]
建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;
[0148]
建立针对临近空间飞行器的双星几何定位模型;
[0149]
设计一种基于强化学习的遥感星座任务决策方法,以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位;
[0150]
具体实施措施
[0151]
下面对本发明具体实施方式进行进一步的详细描述。
[0152]
本发明遥感星座对高超声速飞行器的跟踪方法分为以下几个步骤进行:
[0153]
步骤1)中建立遥感星座对临近空间多目标的凝视跟踪模型:
[0154]
星座构型:本发明中涉及到的遥感星座以高超声速飞行器为观测目标,并且需要实现全球全时段覆盖特性,因此适合选用walker-δ星座构型。该星座构型由多颗相同轨道倾角和相同轨道高度的卫星组成。并且星座的每个轨道面内卫星的相位均匀分布,轨道面之间升交点均匀分布。walker-δ星座构型可以表示为n/p/f,其中n为卫星数量,p为轨道面数量,f为相邻轨道面的相位差。临近空间是是指距离地面20~100公里的空域。星载红外传感器采用临边观测方式,因此其对临近空间飞行器的可见时间窗较短。两个以上的红外传
感器同时覆盖一个目标时可以确定其位置。因此,星群预警系统的星座需要满足对全球不同地区的临近空间目标均可以实现2重以上的覆盖重数。
[0155]
星间通信约束:
[0156]
相邻的两颗卫星采用激光通信技术,为了降低链路损耗,需要避免穿越大气,因此需要考虑最低链路高度hc。最大星间通信距离可以表示为:
[0157][0158]
式中,hs为卫星轨道高度,re为地球半径长度,为最大地心角。
[0159][0160]
红外传感器约束:
[0161]
受地球和大气红外辐射的影响,传感器需要满足几何可见性约束,临边观测约束,最大探测距离约束等。红外传感器的覆盖空域由视场角α
field
,最大探测距离卫星轨道高度hs和目标飞行高度h
tar
共同决定。几何可见性约束是指卫星与目标的连线上不能被地球或其他障碍物遮挡。临边观测约束是指卫星的观测视野内保持深空背景,视野中不能有地球或太阳等红外辐射物体。与载荷能力和目标红外辐射强度有关,描述如下:
[0162][0163]
式中,d0为传感器孔径,d
*
为传感器探测度(m
·
hz
12
·
w-1
,τa为环境透射率,τo为光学系统的透射率,δ为传感器信号过程因子,ad为探测单元面积(m2),δf为噪声等效带宽(hz),snr
min
为传感器探测到目标所需的最小信噪比,i为传感器捕捉到的目标红外强度。本文研究的hgvs以无动力滑翔的方式进入临近空间,蒙皮与空气摩擦产生红外辐射。红外辐射强度可以表示为:
[0164][0165]
式中,a为目标的红外辐射面积(m2),λ1、λ2为红外波段下限和上限,ε为目标表面光谱发射率,c1为第一辐射常数(w
·
m2),c2为第二辐射常数(m
·
k)。
[0166]
驻点温度t描述如下:
[0167][0168]
式中,t0为目标所在位置的环境温度,ν为大气绝热指数,β为热传递恢复系数,m为目标马赫数。
[0169]
星群预警系统对hgvs的跟踪过程中,多颗卫星协同观测以确保对目标的连续覆盖。同一时刻两颗以上的卫星同时跟踪同一个目标才能满足定位需求。由于星群预警系统中的卫星均为低轨卫星,因此卫星和hgvs均处于高速运动状态。卫星和目标的时空关系具有高动态性。目标在飞行过程中需要多颗卫星接力跟踪来实现对目标的连续多重覆盖。对
于星群预警系统,hgvs是非合作目标。其位置,速度等信息均由卫星观测和消息共享获得。
[0170]
步骤2)考虑步骤1)中建立的遥感星座对临近空间多目标的凝视跟踪模型设计一种双星几何定位方法:
[0171]
星群预警系统中的卫星为了获取目标的位置和运动信息,需要至少两颗卫星同时跟踪同一个目标。因此,多卫星多角度跟踪观测目标是星群预警系统任务决策的核心任务,同时也是卫星间协同决策的核心目的。
[0172]
卫星定位方法如下:假设协同观测的两个卫星位置为[x
a y
a za]和[x
c y
c zc]。通过卫星位置和测角信息计算卫星视线内可探测的最远点[x
b y
b zb]和[x
d y
d zd]。由于测角误差导致的两个卫星的观测方向通常是异面直线。先计算异面直线的公垂线,然后按比例划分公垂线,估算目标位置。定位算法如下:
[0173][0174][0175]
式中,f和t为中间变量,[x
tar y
tar z
tar
]为估算的目标位置。
[0176]
星群红外传感器的像平面测量误差和欧拉角测量误差可以等效为二维平面内的测角误差。将卫星视线投影到以公垂线为法线的平面内,二维平面的测角定位方法如图4所示。
[0177]
测角表示为:
[0178][0179]
目标在平面内的投影坐标为[x,y]。(x1,y1)和(x2,y2)分别为两个卫星在平面内的投影坐标。从图4中几何关系可见:
[0180][0181]
从测角误差转换到目标定位误差的观测矩阵h
θ
为:
[0182][0183]
式中,l为两个卫星间的距离。
[0184]
几何定位精度计算如下:
[0185][0186]
式中,σ
θ
为测角误差。
[0187]
步骤3)以步骤1)中的星座构型为基础,考虑约束限制,以步骤2)中的双星几何定位精度为优化目标,设计一种基于强化学习的遥感星座任务决策方法:
[0188]
环境状态空间:环境状态空间s定义为s={t
num
,obs
angle
,pos
tar
,vel
tar
,l
tar
,l
score
},t
num
为目标数量,为天线坐标系下的观测角,n为卫星编号。pos
tar
为目标位置,vel
tar
为目标速度。为卫星跟踪目标的列表,为卫星satn的传感器指向目标的编号。为卫星回报列表,为卫星satn的传感器指向目标id
tar
时获得的回报。l
tar
和l
score
的维度与卫星数量相同,卫星satn未观测到目标时
[0189]
行为空间:卫星的行为空间a={tar1,tar2,...,tark}可以描述为传感器在t时刻指向的目标。a为k维向量,tark的初始值为-1。由于行为空间中除目标方向外,还包含一个回扫至初始位置的行为,因此当卫星可见目标数量小于k-1时,a包含所有可见目标的方向。当可见目标数量大于k-1时,a包含可见目标中按回报值降序排列的前k-1个目标的方向。卫星综合考虑传感器当前指向和环境状态,决策下一时刻传感器指向。
[0190]
回报函数:回报函数用来评价卫星行为的价值。r
t
通过a
t
,s
t
计算获得,具体计算如下:
[0191][0192]
式中,cm和ca分别为观测角度权重和传感器转动权重。为传感器最大探测距离,为卫星与目标的距离。为传感器从当前方向转到目标方向的转动角度,ω
max
为传感器最大转动角速度。可见性参数i
vis
表示为:
[0193][0194]
网络更新:
[0195]
决策网络梯度更新方程为:
[0196][0197]
式中,策略π
θ
(a
t
|s
t
)表示在时间步t时,智能体获得环境状态s
t
后选择行为a
t
的概率。为时间步t时,采样的平均值。为时间步t时的广义优势函数。
[0198][0199]
式中,γ为折扣因子,λ为广义优势估计的折扣系数。r
t
为当前回报,v为评论家网络的评价值。
[0200]
策略梯度的目标函数为:
[0201][0202]
式中,为重要性权重(importanceweight)。重要性权重的作用是通过新旧两个策略梯度的比值来调整回报值。更有可能采取的行为的权重被提高,不太可能采取的行为的权重被降低。重要性权重被超参数ε和截断操作clip限制在(1-ε,1+ε)范围内。
[0203]
策略梯度的更新方程为:
[0204][0205]
式中,α为参数更新步长。
[0206]
mappo算法训练和参数更新采用经验共享机制。利用全局信息训练每个卫星的独立决策策略。参数更新流程如图5所示。
[0207]
算法中包括n个本地策略网络和一个全局策略网络。在每一段时间步长t中,算法计算n个actor网络的行为策略并与环境交互后获得行为的回报值每个本地策略网络计算te步。然后计算优势(advantages)a
t
,t=1,2,3,...n
·
te。n个本地网络共享经验然后利用adam优化器更新全局网络,最后将新的全局网络复制给每个本地网络。
[0208]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要
性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或n个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0209]
以上所述仅是一种遥感星座对空中动目标的智能协同跟踪方法的优选实施方式,一种遥感星座对空中动目标的智能协同跟踪方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

技术特征:
1.一种遥感星座对空中动目标的智能协同跟踪方法,其特征是:所述方法包括以下步骤:步骤1:建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;步骤2:建立针对临近空间飞行器的双星几何定位模型;步骤3:以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位。2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:步骤1.1:进行星间通信约束,相邻的两颗卫星采用激光通信技术,考虑最低链路高度h
c
,最大星间通信距离通过下式表示为:,最大星间通信距离通过下式表示为:其中,h
s
为卫星轨道高度,r
e
为地球半径长度,为最大地心角;步骤1.2:建立红外传感器约束,红外传感器的覆盖空域由视场角α
field
,最大探测距离卫星轨道高度h
s
和目标飞行高度h
tar
共同决定,与载荷能力和目标红外辐射强度有关,通过下式表示最大探测距离:其中,d0为传感器孔径,d
*
为传感器探测度(m
·
hz
1/2
·
w-1
),τ
a
为环境透射率,τ
o
为光学系统的透射率,δ为传感器信号过程因子,a
d
为探测单元面积(m2),δf为噪声等效带宽(hz),snr
min
为传感器探测到目标所需的最小信噪比,i为传感器捕捉到的目标红外强度;红外辐射强度通过下式表示:其中,a为目标的红外辐射面积(m2),λ1、λ2为红外波段下限和上限,ε为目标表面光谱发射率,c1为第一辐射常数(w
·
m2),c2为第二辐射常数(m
·
k);步骤1.3:确定驻点温度,驻点温度通过下式描述:其中,t0为目标所在位置的环境温度,ν为大气绝热指数,β为热传递恢复系数,m为目标马赫数。3.根据权利要求2所述的方法,其特征是:所述步骤2具体为:步骤2.1:设置协同观测的两个卫星位置为[x
a y
a z
a
]和[x
c y
c z
c
],通过卫星位置和测角信息计算卫星视线内可探测的最远点[x
b y
b z
b
]和[x
d y
d z
d
],先计算异面直线的公垂
线,按比例划分公垂线,估算目标位置,定位通过下式表示:线,按比例划分公垂线,估算目标位置,定位通过下式表示:其中,f和t为中间变量,[x
tar y
tar z
tar
]为估算的目标位置;步骤2.2:星群红外传感器的像平面测量误差和欧拉角测量误差等效为二维平面内的测角误差,将卫星视线投影到以公垂线为法线的平面内,测角表示为:目标在平面内的投影坐标为[x,y],(x1,y1)和(x2,y2)分别为两个卫星在平面内的投影坐标:从测角误差转换到目标定位误差的观测矩阵h
θ
为:其中,l为两个卫星间的距离;几何定位精度计算如下:
式中,σ
θ
为测角误差。4.根据权利要求3所述的方法,其特征是:所述步骤3具体为:步骤3.1:设置环境状态空间,环境状态空间s定义为s={t
num
,obs
angle
,pos
tar
,vel
tar
,l
tar
,l
score
},t
num
为目标数量,为天线坐标系下的观测角,n为卫星编号;pos
tar
为目标位置,vel
tar
为目标速度;为卫星跟踪目标的列表,为卫星sat
n
的传感器指向目标的编号,为卫星回报列表,为卫星sat
n
的传感器指向目标id
tar
时获得的回报,l
tar
和l
score
的维度与卫星数量相同,卫星sat
n
未观测到目标时步骤3.2:建立行为空间,卫星的行为空间a={tar1,tar2,...,tar
k
}描述为传感器在t时刻指向的目标;a为k维向量,tar
k
的初始值为-1;由于行为空间中除目标方向外,还包含一个回扫至初始位置的行为,因此当卫星可见目标数量小于k-1时,a包含所有可见目标的方向;步骤3.3:建立回报函数,回报函数用来评价卫星行为的价值;r
t
通过a
t
,s
t
计算获得,具体计算如下:其中,c
m
和c
a
分别为观测角度权重和传感器转动权重,为传感器最大探测距离,为卫星与目标的距离,为传感器从当前方向转到目标方向的转动角度,ω
max
为传感器最大转动角速度,可见性参数i
vis
通过下式表示:步骤3.4:进行网络更新,决策网络梯度更新方程通过下式表示:步骤3.4:进行网络更新,决策网络梯度更新方程通过下式表示:其中,策略π
θ
(a
t
|s
t
)表示在时间步t时,智能体获得环境状态s
t
后选择行为a
t
的概率;为时间步t时,采样的平均值,为时间步t时的广义优势函数,γ为折扣因子,λ为广义优势估计的折扣系数,r
t
为当前回报,v为评论家网络的评价值;建立策略梯度的目标函数,通过下式表示目标函数:
其中,为重要性权重;策略梯度的更新方程为:其中,α为参数更新步长;mappo算法训练和参数更新采用经验共享机制,利用全局信息训练每个卫星的独立决策策略。5.根据权利要求4所述的方法,其特征是:当可见目标数量大于k-1时,a包含可见目标中按回报值降序排列的前k-1个目标的方向,卫星综合考虑传感器当前指向和环境状态,决策下一时刻传感器指向。6.根据权利要求5所述的方法,其特征是:重要性权重被超参数ε和截断操作clip限制在(1-ε,1+ε)范围内。7.一种遥感星座对空中动目标的智能协同跟踪系统,其特征是:所述系统包括:凝视跟踪模块,所述凝视跟踪模块建立遥感星座对临近空间多目标的凝视跟踪模型,包括星座构型以及约束模型;双星几何定位模块,所述双星几何定位模块建立针对临近空间飞行器的双星几何定位模型;跟踪定位模块,所述跟踪定位模块以多目标凝视跟踪模型中的星座构型为基础,考虑约束限制,以双星几何定位精度为优化目标,实现遥感星座对临近空间飞行器的跟踪和定位。8.根据权利要求7所述的系统,其特征是:对hgvs的跟踪过程中,多颗卫星协同观测以确保对目标的连续覆盖,同一时刻两颗以上的卫星同时跟踪同一个目标才能满足定位需求;由于星群预警系统中的卫星均为低轨卫星,因此卫星和hgvs均处于高速运动状态,卫星和目标的时空关系具有高动态性,目标在飞行过程中需要多颗卫星接力跟踪来实现对目标的连续多重覆盖,对于星群预警系统,hgvs是非合作目标,位置,速度信息均由卫星观测和消息共享获得。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-6的方法。10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征是:所述处理器执行所述计算机程序时实现权利要求1-6的方法。

技术总结
本发明是一种遥感星座对空中动目标的智能协同跟踪方法。本发明涉及人工智能技术领域,本发明针对遥感星座对HGVs多星协同跟踪问题,设计了多目标凝视跟踪模型和双星几何定位模型,实现对HGVs的跟踪和定位。本发明针对遥感星座对高超声速飞行器的跟踪和定位是天基预警中的关键问题。遥感星座对HGVs的协同定位过程是一个多对多的动态任务分配过程。预警卫星的任务分配存在时序关联性和动态性,因此决策算法将面临解空间较大和容易陷入局部最优的问题。同时,HGVs的高机动性对遥感星座的任务决策算法的实时性提出了新的挑战。务决策算法的实时性提出了新的挑战。务决策算法的实时性提出了新的挑战。


技术研发人员:魏承 程禹 刘天喜 曹喜滨
受保护的技术使用者:哈尔滨工业大学
技术研发日:2023.02.14
技术公布日:2023/6/28
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐