一种无人机辅助的通感一体化系统资源调度方法

未命名 10-08 阅读：144 评论：0

1.本发明属于无线通信技术领域，涉及一种无人机辅助的通感一体化系统资源调度方法。

背景技术：

2.无人机具有机动性强，低成本及易部署等特性，可作为移动基站部署于无线通信系统中，提升用户通信性能。相对于传统静态部署的蜂窝基站而言，移动无人机基站充分利用无人机高机动性特点，通过优化设计无人机的飞行轨迹，有望进一步提升无人机对地通信性能。此外，通过搭载通信及感知设备，无人机可作为融合通信与感知技术的高性能空中平台。然而，在无人机辅助的通感一体化系统中，如何合理优化设计无人机的飞行轨迹，以及通信、感知资源的调度策略，满足用户通信、感知需求，并实现两者之间的性能折中成为极具挑战性的问题。现有研究考虑无人机资源分配与功率控制问题，通过感知数据和用户需求，设计相应的算法和策略，以优化系统传输性能，提升用户的服务质量和公平性。然而，目前工作较少考虑地面用户业务的随机动态，以及用户传输性能与目标感知性能的联合优化。

技术实现要素：

3.有鉴于此，本发明的目的在于提供一种无人机辅助的通感一体化系统资源调度方法，针对包含一架无人机、m个地面用户和n个目标的无人机通感一体化系统，建模系统奖励为优化目标，联合考虑无人机通信和感知性能，优化设计通信调度及目标感知策略，实现系统传输性能优化及用户qos提升。
4.为达到上述目的，本发明提供如下技术方案：
5.一种无人机辅助的通感一体化系统资源调度方法，包括以下步骤：
6.s1：建模无人机辅助的通感一体化系统，由一架无人机、多个地面用户和多个目标组成；
7.s2：建模无人机通信信道模型感知信道模型；
8.s3：建模无人机传输速率及无人机能耗；
9.s4：建模目标感知变量及用户通信调度变量，建模用户队列长度；
10.s5：建模累积目标检测概率；
11.s6：建模系统成本函数；
12.s7：建模无人机通信感知限制条件；
13.s8：建模系统状态、动作和收益函数；
14.s9：建模并训练ddqn网络；
15.s10：基于ddqn网络确定无人机飞行轨迹、通信调度及目标感知策略。
16.进一步，所述建模无人机辅助的通感一体化系统，具体包括：令m表示系统中用户数目，n表示系统中目标数目；将系统时间划分为t个等长的时隙，每个时隙的长度用τ表示；
17.所述无人机用于执行通信任务，向地面用户传输数据，还用于执行目标感知任务，在一个时隙内发送感知信号，并接收回波信号；
18.所述无人机采用时分多址机制，在一个时隙内只能选择与一个用户进行通信或执行一个目标感知任务；
19.所述无人机通过回程网络获取用户数据，并存储在本地队列中，令表示无人机为第m个用户分配的最大队列长度；
20.所述无人机飞行高度固定为h，飞行速度为ν，令表示第t个时隙无人机的位置，1≤t≤t，令表示第m个用户的位置，1≤m≤m，令表示第n个目标的位置，1≤n≤n。
21.进一步，步骤s2中所述建模无人机通信信道模型，具体包括：
22.第t个时隙无人机与第m个用户之间的通信链路为：
[0023][0024]
其中表示第t个时隙无人机与第m个用户的距离，建模为：
[0025][0026]
通信链路中存在存在视距传输los和非视距传输nlos，αe表示路径损失系数，e∈{los,nlos}；
[0027]
第t个时隙无人机与第m个用户之间的平均空对地路径损失为：
[0028][0029]
其中和分别表示第t个时隙无人机与第m个用户之间los传输和nlos传输的概率，为：
[0030][0031]
其中χ和ω是与传播环境相关的常数，表示第t个时隙无人机与第m个用户之间的夹角，建模为：
[0032][0033]
表示los链路的路径损耗，建模为：
[0034][0035]
其中λ
l
表示los链路的路径损耗因子，d0表示自由空间参考距离，fc表示载波频率，c表示光速，表示los链路的阴影衰落损耗；表示nlos链路的路径损耗，建模为：
[0036][0037]
其中λn表示nlos链路的路径损耗因子，表示nlos链路的阴影衰落损耗；
[0038]
步骤s2中所述建模感知信道模型具体包括：
[0039]
第t个时隙无人机与第n个目标之间的感知链路增益为：
[0040][0041]
其中表示第t个时隙无人机与第n个目标之间的距离，建模为：
[0042][0043]cn
建模为：
[0044][0045]
其中g
t
和gr分别表示发送天线增益和接收天线增益，λ表示机载雷达发送信号波长，μn表示第n个目标的雷达截面积。
[0046]
进一步，步骤s3中所述建模无人机传输速率及无人机能耗，具体包括：
[0047]
无人机传输速率：第t个时隙无人机到第m个用户的链路传输速率为：
[0048][0049]
其中b表示系统带宽，表示第t个时隙无人机传输数据至第m个用户时对应的发送功率，σ2为通信链路噪声功率；
[0050]
无人机飞行能耗：无人机飞行能耗为：
[0051][0052]
其中表示第t个时隙无人机飞行能耗，建模为：
[0053][0054]
表示无人机飞行变量，若第t个时隙无人机处于飞行状态，否则，p0和p0′
分别表示无人机悬停状态下叶型功率和诱导功率的常数，u
tip
表示转子叶片的叶尖速度，v0为悬停状态下转子的平均诱导速度，ξd和ξr分别为机身阻力比和转子可靠性，ρa和sr分别为空气密度和转子盘面积；
[0055]
无人机悬停能耗：令eh表示无人机悬停能耗，建模为：
[0056][0057]
其中表示第t个时隙无人机悬停能耗，建模为：
[0058][0059]
为无人机悬停变量，若第t个时隙无人机悬停，反之，
[0060]
进一步，步骤s4中所述建模目标感知变量及用户通信调度变量，具体包括：
[0061]
建模目标感知变量：令表示第t个时隙第n个目标的感知变量，表示无人机在第t个时隙检测第n个目标，反之，1≤n≤n，1≤t≤t；
[0062]
建模用户通信调度变量：令β
m,t
表示第t个时隙第m个用户的数据调度变量，β
m,t
＝1表示第t个时隙无人机向第m个用户发送数据，反之，β
m,t
＝0，1≤m≤m，1≤t≤t；
[0063]
所述建模用户队列长度，具体包括：第t个时隙无人机处第m个用户的队列长度为：
[0064][0065]
其中a
m,t
表示第t个时隙无人机接收的第m个用户的数据量。
[0066]
进一步，步骤s5中所述建模累积目标检测概率，具体包括：前t个时隙第n个目标的累计检测概率为：
[0067][0068]
其中表示第t个时隙第n个目标的检测概率，建模为：
[0069][0070]
其中i0(
·
)是第一类零阶贝塞尔函数，v
t
为雷达接收机的检测阈值；令pf表示雷达虚警概率，建模为：
[0071][0072]
表示第t个时隙雷达检测第n个目标的接收功率，建模为：
[0073][0074]
其中表示第t个时隙雷达的发送功率，l
rt
为检测信道损失系数。
[0075]
进一步，步骤s6中，建模系统成本函数，具体包括：
[0076]
第t个时隙的系统成本函数，考虑用户队列长度及目标感知性能为：
[0077]ft
＝θ1q
t-θ2ψ
t
[0078]
其中θ1和θ2为权重因子，q
t
表示第t个时隙用户的平均队列长度，建模为：
[0079][0080]
ψ
t
表示第t个时隙目标的累积检测概率，建模为：
[0081][0082]
进一步，步骤s7中，建模无人机通信感知限制条件，具体包括：
[0083]
(1)建模无人机飞行限制条件，包括：
[0084]
①
[0085]
②
[0086]
(2)建模无人机能量限制条件，包括：
[0087]
①ef
+eh≤e
max
，其中e
max
表示无人机的可用能量；
[0088]
(3)建模无人机通信限制条件，包括：
[0089][0090]
②
其中r
min
表示用户最小通信速率需求；
[0091]
(4)建模无人机感知限制条件，包括：
[0092]
①
[0093]
②
其中表示无人机最大感知距离；
[0094]
③
其中s
min
表示雷达接收机的最小灵敏度。
[0095]
进一步，步骤s8中所述建模系统状态、动作和收益函数，具体包括：
[0096]
系统在第t个时隙的状态为：
[0097][0098]
其中，表示第t个时隙用户队列集合，e
t
表示第t个时隙无人机的剩余能量，建模为：
[0099][0100]
令a
t
表示系统的动作空间，建模为：
[0101][0102]
其中a
t
表示第t个时隙无人机选择的飞行动作，建模为：
[0103][0104]
其中d表示无人机移动距离，建模为：
[0105]
d＝vτ
[0106]
令r
t
表示无人机在状态s
t
下采取行动a
t
获得的奖励，建模为：
[0107][0108]
进一步，步骤s9中，建模并训练ddqn网络，具体包括：
[0109]
初始化q网络参数θ及目标q网络参数初始化经验回放缓冲区z和贪心策略参数ε；初始化系统状态s
t
；将动作施加于系统环境，得到第t个时隙的奖励值r
t
和第t+1个时隙的状态s
t+1
，并将其存入经验回放缓冲区z中；从z中抽取一批样本，确定目标网络中最大q值所对应的动作，将该动作输入到q网络中，得到更新后的q值；
[0110]
目标网络的输出为：
[0111][0112]
其中γ为折扣因子，0≤γ≤1；q
θ
(s
t+1
,a
t+1
)表示从z抽取的小批量数据样本中观察状态为s
t+1
时的q值；
[0113]
损失函数l(θ)为均方误差，即：
[0114]
l(θ)＝e[(q
θ
(s
t
,a
t
)-y(s
t
,a
t
,s
t+1
))2]
[0115]
基于损失函数最小化确定参数θ，具体为：
[0116][0117]
其中α为学习率，α∈[0,1]，经过一定次数的迭代，利用更新后的θ替换重复上述过程，直至q网络参数θ及目标q网络参数均收敛。
[0118]
本发明的有益效果在于：本发明能够有效保障地面用户业务的随机动态到达的情况下，联合考虑无人机通信和感知性能，基于通信调度及目标感知策略，实现系统传输性能优化及用户qos提升。
[0119]
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0120]
为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：
[0121]
图1为本发明涉及的无人机辅助的通感一体化系统场景示意图；
[0122]
图2为本发明无人机辅助的通感一体化系统资源分配方法的流程示意图。
具体实施方式
[0123]
以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。
[0124]
其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本发明的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。
[0125]
本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或
暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本发明的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。
[0126]
请参阅图1～图2，图1为本发明采用的无人机辅助的通感一体化系统场景示意图，如图1所示，该通信系统包含一架无人机、m个地面用户和n个目标，通过联合设计通信调度及目标感知策略可实现系统奖励函数最大化。
[0127]
图2为本发明无人机辅助的通感一体化系统资源分配方法的流程示意图，如图2所示，该方法具体包括以下步骤：
[0128]
步骤1：无人机辅助的通感一体化系统建模；
[0129]
无人机辅助的通感一体化系统建模，具体为：系统由一架无人机、多个地面用户和多个目标组成，令m表示系统中用户数目，n表示系统中目标数目；将系统时间划分为t个等长的时隙，每个时隙的长度用τ表示；无人机需执行通信任务，向地面用户传输数据；还需执行目标感知任务，在一个时隙内发送感知信号，并接收回波信号；假设无人机采用时分多址机制，在一个时隙内只能选择与一个用户进行通信或执行一个目标感知任务；假设无人机可通过回程网络获取用户数据，并存储在本地队列中，令表示无人机为第m个用户分配的最大队列长度；假设无人机飞行高度固定为h，飞行速度为ν，令表示第t个时隙无人机的位置，1≤t≤t，令表示第m个用户的位置，1≤m≤m，令表示第n个目标的位置，1≤n≤n。
[0130]
步骤2：无人机通信及感知信道模型建模；
[0131]
无人机通信及感知信道模型建模，具体为：
[0132]
(1)通信信道模型：令表示第t个时隙无人机与第m个用户之间的通信链路，建模为：其中表示第t个时隙无人机与第m个用户的距离，建模为：
[0133]
通信链路中存在存在视距传输los和非视距传输nlos，αe表示路径损失系数，e∈{los,nlos}，令l
m,t
表示第t个时隙无人机与第m个用户之间的平均空对地路径损失，建模为：其中和分别表示第t个时隙无人机与第m个用户之间los传输和nlos传输的概率，建模为：其中χ和ω是与传播环境相关的常数，表示第t个时隙无人机与第m个用户之间的夹角，建模为：表示los链路的路径损耗，建模为：其中λ
l
表示los链路的路径损耗因子，d0表示自由空间参考距离，fc表示载波频率，c表示光速，表示los链路的阴影衰落损耗；表示nlos链路的路径损耗，建模为：
[0134]
其中λn表示nlos链路的路径损耗因子，表示nlos链路的阴影衰落损耗；
[0135]
(2)感知信道模型：令表示第t个时隙无人机与第n个目标之间的感知链路增益，建模为：其中表示第t个时隙无人机与第n个目标之间的距离，建模为：cn建模为：其中g
t
和gr分别表示发送天线增益和接收天线增益，λ表示机载雷达发送信号波长，μn表示第n个目标的雷达截面积。
[0136]
步骤3：无人机传输速率及能耗建模；
[0137]
无人机传输速率及能耗建模，具体为：
[0138]
(1)无人机传输速率：令r
m,t
表示第t个时隙无人机到第m个用户的链路传输速率，建模为：其中b表示系统带宽，表示第t个时隙无人机传输数据至第m个用户时对应的发送功率，σ2为通信链路噪声功率；
[0139]
(2)无人机飞行能耗：令ef表示无人机飞行能耗，建模为：其中表示第t个时隙无人机飞行能耗，建模为：
[0140]
表示无人机飞行变量，若第t个时隙无人机处于飞行状态，否则，p0和p0′
分别表示无人机悬停状态下叶型功率和诱导功率的常数，u
tip
表示转子叶片的叶尖速度，v0为悬停状态下转子的平均诱导速度，ξd和ξr分别为机身阻力比和转子可靠性，ρa和sr分别为空气密度和转子盘面积；
[0141]
(3)无人机悬停能耗：令eh表示无人机悬停能耗，建模为：其中表示第t个时隙无人机悬停能耗，建模为：为无人机悬停变量，若第t个时隙无人机悬停，反之，
[0142]
步骤4：目标感知变量及用户通信调度变量建模；
[0143]
目标感知变量及用户通信调度变量建模，具体为：
[0144]
(1)建模目标感知变量：令表示第t个时隙第n个目标的感知变量，表示无人机在第t个时隙检测第n个目标，反之，1≤n≤n，1≤t≤t；
[0145]
(2)建模用户通信调度变量：令β
m,t
表示第t个时隙第m个用户的数据调度变量，β
m,t
＝1表示第t个时隙无人机向第m个用户发送数据，反之，β
m,t
＝0，1≤m≤m，1≤t≤t。
[0146]
步骤5：用户队列长度建模；
[0147]
用户队列长度建模，具体为：令q
m,t
表示第t个时隙无人机处第m个用户的队列长
度，建模为：其中a
m,t
表示第t个时隙无人机接收的第m个用户的数据量。
[0148]
步骤6：累积目标检测概率建模；
[0149]
累积目标检测概率建模，具体为：令表示前t个时隙第n个目标的累计检测概率，建模为：其中表示第t个时隙第n个目标的检测概率，建模为：其中i0(
·
)是第一类零阶贝塞尔函数，v
t
为雷达接收机的检测阈值；令pf表示雷达虚警概率，建模为：表示第t个时隙雷达检测第n个目标的接收功率，建模为：其中表示第t个时隙雷达的发送功率，l
rt
为检测信道损失系数。
[0150]
步骤7：系统成本函数建模；
[0151]
系统成本函数建模，具体为：令f
t
表示第t个时隙的系统成本函数，考虑用户队列长度及目标感知性能，建模f
t
为：f
t
＝θ1q
t-θ2ψ
t
，其中θ1和θ2为权重因子，q
t
表示第t个时隙用户的平均队列长度，建模为：ψ
t
表示第t个时隙目标的累积检测概率，建模为：
[0152]
步骤8：无人机通信感知限制条件建模，具体包括：
[0153]
(1)建模无人机飞行限制条件，包括：
[0154]
①
[0155]
②
[0156]
(2)建模无人机能量限制条件，包括：
[0157]
①ef
+eh≤e
max
；其中e
max
表示无人机的可用能量；
[0158]
(3)建模无人机通信限制条件，包括：
[0159]
①
[0160]
②
其中r
min
表示用户最小通信速率需求；
[0161]
(4)建模无人机感知限制条件，包括：
[0162]
①
[0163]
②
其中表示无人机最大感知距离；
[0164]
③
其中s
min
表示雷达接收机的最小灵敏度。
[0165]
步骤9：系统状态、动作和收益函数建模；
[0166]
系统状态、动作和收益函数建模，具体为：建模系统在第t个时隙的状态其中，表示第t个时隙用户队列集合，e
t
表示第t个时隙无人机的剩余能量，建模为：令a
t
表示系统的动作空间，建模为：其中a
t
表示第t个时隙无人机选择的飞行动作，建模为：其中d表示无人机移动距离，建模为：d＝vτ；令r
t
表示无人机在状态s
t
下采取行动a
t
获得的奖励，建模为：
[0167]
步骤10：构建并训练ddqn网络；
[0168]
构建并训练ddqn网络，具体为：初始化q网络参数θ及目标q网络参数初始化经验回放缓冲区z和贪心策略参数ε；初始化系统状态s
t
；将动作施加于系统环境，得到第t个时隙的奖励值r
t
和第t+1个时隙的状态s
t+1
，并将其存入经验回放缓冲区z中；从z中抽取一批样本，确定目标网络中最大q值所对应的动作，将该动作输入到q网络中，得到更新后的q值；令y(s
t
,a
t
,s
t+1
)表示目标网络的输出，建模为：其中γ为折扣因子，0≤γ≤1；q
θ
(s
t+1
,a
t+1
)表示从z抽取的小批量数据样本中观察状态为s
t+1
时的q值；建模损失函数l(θ)为均方误差，即：l(θ)＝e[(q
θ
(s
t
,a
t
)-y(s
t
,a
t
,s
t+1
))2]，基于损失函数最小化确定参数θ，具体为：其中α为学习率，α∈[0,1]，经过一定次数的迭代，利用更新后的θ替换重复上述过程，直至q网络参数θ及目标q网络参数均收敛。
[0169]
步骤11：基于ddqn网络确定无人机飞行轨迹、通信调度及目标感知策略。
[0170]
最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

技术特征：
1.一种无人机辅助的通感一体化系统资源调度方法，其特征在于：包括以下步骤：s1：建模无人机辅助的通感一体化系统，由一架无人机、多个地面用户和多个目标组成；s2：建模无人机通信信道模型感知信道模型；s3：建模无人机传输速率及无人机能耗；s4：建模目标感知变量及用户通信调度变量，建模用户队列长度；s5：建模累积目标检测概率；s6：建模系统成本函数；s7：建模无人机通信感知限制条件；s8：建模系统状态、动作和收益函数；s9：建模并训练ddqn网络；s10：基于ddqn网络确定无人机飞行轨迹、通信调度及目标感知策略。2.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：所述建模无人机辅助的通感一体化系统，具体包括：令m表示系统中用户数目，n表示系统中目标数目；将系统时间划分为t个等长的时隙，每个时隙的长度用τ表示；所述无人机用于执行通信任务，向地面用户传输数据，还用于执行目标感知任务，在一个时隙内发送感知信号，并接收回波信号；所述无人机采用时分多址机制，在一个时隙内只能选择与一个用户进行通信或执行一个目标感知任务；所述无人机通过回程网络获取用户数据，并存储在本地队列中，令表示无人机为第m个用户分配的最大队列长度；所述无人机飞行高度固定为h，飞行速度为ν，令表示第t个时隙无人机的位置，1≤t≤t，令表示第m个用户的位置，1≤m≤m，令表示第n个目标的位置，1≤n≤n。3.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s2中所述建模无人机通信信道模型，具体包括：第t个时隙无人机与第m个用户之间的通信链路为：其中表示第t个时隙无人机与第m个用户的距离，建模为：通信链路中存在存在视距传输los和非视距传输nlos，α
e
表示路径损失系数，e∈{los,nlos}；第t个时隙无人机与第m个用户之间的平均空对地路径损失为：其中和分别表示第t个时隙无人机与第m个用户之间los传输和nlos传输的概
率，为：其中χ和ω是与传播环境相关的常数，表示第t个时隙无人机与第m个用户之间的夹角，建模为：角，建模为：表示los链路的路径损耗，建模为：其中λ
l
表示los链路的路径损耗因子，d0表示自由空间参考距离，f
c
表示载波频率，c表示光速，表示los链路的阴影衰落损耗；表示nlos链路的路径损耗，建模为：其中λ
n
表示nlos链路的路径损耗因子，表示nlos链路的阴影衰落损耗；步骤s2中所述建模感知信道模型具体包括：第t个时隙无人机与第n个目标之间的感知链路增益为：其中表示第t个时隙无人机与第n个目标之间的距离，建模为：c
n
建模为：其中g
t
和g
r
分别表示发送天线增益和接收天线增益，λ表示机载雷达发送信号波长，μ
n
表示第n个目标的雷达截面积。4.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s3中所述建模无人机传输速率及无人机能耗，具体包括：无人机传输速率：第t个时隙无人机到第m个用户的链路传输速率为：其中b表示系统带宽，表示第t个时隙无人机传输数据至第m个用户时对应的发送功率，σ2为通信链路噪声功率；无人机飞行能耗：无人机飞行能耗为：
其中表示第t个时隙无人机飞行能耗，建模为：表示第t个时隙无人机飞行能耗，建模为：表示无人机飞行变量，若第t个时隙无人机处于飞行状态，否则，p0和p
′0分别表示无人机悬停状态下叶型功率和诱导功率的常数，u
tip
表示转子叶片的叶尖速度，v0为悬停状态下转子的平均诱导速度，ξ
d
和ξ
r
分别为机身阻力比和转子可靠性，ρ
a
和s
r
分别为空气密度和转子盘面积；无人机悬停能耗：令e
h
表示无人机悬停能耗，建模为：其中表示第t个时隙无人机悬停能耗，建模为：表示第t个时隙无人机悬停能耗，建模为：为无人机悬停变量，若第t个时隙无人机悬停，反之，5.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s4中所述建模目标感知变量及用户通信调度变量，具体包括：建模目标感知变量：令表示第t个时隙第n个目标的感知变量，表示无人机在第t个时隙检测第n个目标，反之，1≤n≤n，1≤t≤t；建模用户通信调度变量：令β
m,t
表示第t个时隙第m个用户的数据调度变量，β
m,t
＝1表示第t个时隙无人机向第m个用户发送数据，反之，β
m,t
＝0，1≤m≤m，1≤t≤t；所述建模用户队列长度，具体包括：第t个时隙无人机处第m个用户的队列长度为：其中a
m,t
表示第t个时隙无人机接收的第m个用户的数据量。6.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s5中所述建模累积目标检测概率，具体包括：前t个时隙第n个目标的累计检测概率为：其中表示第t个时隙第n个目标的检测概率，建模为：其中i0(
·
)是第一类零阶贝塞尔函数，v
t
为雷达接收机的检测阈值；令p
f
表示雷达虚警概率，建模为：概率，建模为：表示第t个时隙雷达检测第n个目标的接收功率，建模为：
其中表示第t个时隙雷达的发送功率，l
rt
为检测信道损失系数。7.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s6中，建模系统成本函数，具体包括：第t个时隙的系统成本函数，考虑用户队列长度及目标感知性能为：f
t
＝θ1q
t-θ2ψ
t
其中θ1和θ2为权重因子，q
t
表示第t个时隙用户的平均队列长度，建模为：ψ
t
表示第t个时隙目标的累积检测概率，建模为：。8.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s7中，建模无人机通信感知限制条件，具体包括：(1)建模无人机飞行限制条件，包括：
①②
(2)建模无人机能量限制条件，包括：
①
e
f
+e
h
≤e
max
，其中e
max
表示无人机的可用能量；(3)建模无人机通信限制条件，包括：
①②
其中r
min
表示用户最小通信速率需求；(4)建模无人机感知限制条件，包括：
①②
其中表示无人机最大感知距离；
③
其中s
min
表示雷达接收机的最小灵敏度。9.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s8中所述建模系统状态、动作和收益函数，具体包括：系统在第t个时隙的状态为：其中，表示第t个时隙用户队列集合，e
t
表示第t个时隙无人机的剩余能量，建模为：
令a
t
表示系统的动作空间，建模为：其中a
t
表示第t个时隙无人机选择的飞行动作，建模为：其中d表示无人机移动距离，建模为：d＝vτ令r
t
表示无人机在状态s
t
下采取行动a
t
获得的奖励，建模为：10.根据权利要求1所述的无人机辅助的通感一体化系统资源调度方法，其特征在于：步骤s9中，建模并训练ddqn网络，具体包括：初始化q网络参数θ及目标q网络参数初始化经验回放缓冲区z和贪心策略参数ε；初始化系统状态s
t
；将动作施加于系统环境，得到第t个时隙的奖励值r
t
和第t+1个时隙的状态s
t+1
，并将其存入经验回放缓冲区z中；从z中抽取一批样本，确定目标网络中最大q值所对应的动作，将该动作输入到q网络中，得到更新后的q值；目标网络的输出为：其中γ为折扣因子，0≤γ≤1；q
θ
(s
t+1
,a
t+1
)表示从z抽取的小批量数据样本中观察状态为s
t+1
时的q值；损失函数l(θ)为均方误差，即：l(θ)＝e[(q
θ
(s
t
,a
t
)-y(s
t
,a
t
,s
t+1
))2]基于损失函数最小化确定参数θ，具体为：其中α为学习率，α∈[0,1]，经过一定次数的迭代，利用更新后的θ替换重复上述过程，直至q网络参数θ及目标q网络参数均收敛。

技术总结
本发明涉及一种无人机辅助的通感一体化系统资源调度方法，属于无线通信技术领域，包括以下步骤：S1：建模无人机辅助的通感一体化系统，由一架无人机、多个地面用户和多个目标组成；S2：建模无人机通信信道模型感知信道模型；S3：建模无人机传输速率及无人机能耗；S4：建模目标感知变量及用户通信调度变量，建模用户队列长度；S5：建模累积目标检测概率；S6：建模系统成本函数；S7：建模无人机通信感知限制条件；S8：建模系统状态、动作和收益函数；S9：建模并训练DDQN网络；S10：基于DDQN网络确定无人机飞行轨迹、通信调度及目标感知策略。本发明提升了系统传输性能优化及用户QoS。提升了系统传输性能优化及用户QoS。提升了系统传输性能优化及用户QoS。

技术研发人员：柴蓉王丙燕邱江陈前斌
受保护的技术使用者：重庆邮电大学
技术研发日：2023.07.27
技术公布日：2023/10/6

版权声明

本文仅代表作者观点，不代表航家之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

上一篇：一种真空绝热板复合外模板及现浇混凝土保温系统的制作方法 下一篇：一种短信即时通讯系统的制作方法

一种无人机辅助的通感一体化系统资源调度方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种无人机辅助的通感一体化系统资源调度方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表