基于人机交互二阶非线性多智能体系统的编队控制方法
未命名
08-07
阅读:63
评论:0

1.本发明属于人机交互技术领域,尤其涉及基于人机交互二阶非线性多智能体系统的编队控制方法。
背景技术:
2.多智能体系统由若干独立的智能体组成,是一种典型的复杂网络;众所周知,单个智能体很难完成一些复杂或大型的任务,但是多个智能体可以通过协作来更有效地解决这些问题;近年来,多智能体系统已广泛应用于无人机、地面移动机器人、无人水面舰艇等多个领域;因此,许多研究者都在关注多智能体系统的协同控制问题,包括聚集、会合、一致、编队控制等,并取得了许多重要的结果。
3.编队控制作为协同控制的重要研究方向之一,因其在监视、军事训练、救援等领域的应用受到了广泛的关注;到目前为止,大量关于多智能体系统编队控制的结果已经被报道了;例如,现有技术中存在一类线性复值多智能体系统,设计了一种事件触发控制协议来实现期望的编队;也有现有技术采用pi控制方法解决了一类二阶非线性多智能体系统的仿射编队控制问题。
4.根据目前关于多智能体系统编队控制的研究成果来看,研究者都没有讨论人的干预;然而,在未知和复杂的操作环境中,多智能体系统容易做出错误的决策甚至失去控制;因此,人的干预对多智能体系统的协同控制至关重要;到目前为止,一些研究者已经初步研究了基于人机交互多智能体系统的协同控制问题,并取得了一些有意义的研究结果,但对于加入人的干预的多智能体系统编队控制问题迄今尚未被考虑。
技术实现要素:
5.本发明实施例的目的在于提供基于人机交互二阶非线性多智能体系统的编队控制方法,旨在解决对于加入人的干预的多智能体系统编队控制问题迄今尚未被考虑的问题。
6.本发明实施例是这样实现的,一种基于人机交互二阶非线性多智能体系统的编队控制方法,所述方法包括:
7.构建多智能体系统和虚拟领导者模型;
8.在部分智能体上增加人的干预;
9.引入新的多智能体系统模型,得到误差系统;
10.构造相应的lyapunov函数,得到系统实现编队的条件;
11.基于人机交互的多智能体系统实现期望的编队。
12.一种基于人机交互二阶非线性多智能体系统的编队控制方法,步骤如下:
13.步骤1:构建二阶非线性多智能体系统数学模型,二阶非线性多智能体系统中包括多个智能体,编号为d=1,2,...,n,每个智能体可以获得相邻智能体的位置信息,且信息的交互是对称的,所述多智能体系统中单个智能体模型为:
[0014][0015]
其中和分别表示智能体的位置向量、速度向量和控制输入向量,t是时间变量,表示智能体的非线性内部动力学并且满足以下不等式:
[0016]
|φ(t,a1,a2)-φ(t,a3,a4)|≤ρ1|a
1-a3|+ρ2|a
2-a4|
[0017]
对于任意的其中ρ1和ρ2为正常数。
[0018]
为了得到期望的结果,选取虚拟领导者如下:
[0019][0020]
其中和分别表示虚拟领导者的位置向量和速度向量。
[0021]
对于任意给定的初始状态,如果以下等式关系成立,则称基于人机交互多智能体系统实现了期望的编队:
[0022][0023]
lim
t
→
+∞
||wd(t)-w
*
(t)||=0,
[0024]
其中d=1,2,...,n,是智能体d和虚拟领导者之间期望的相对位置。
[0025]
步骤2:对于所研究的n个智能体,考虑到智能体在未知和复杂的环境中容易做出错误的决策甚至失去控制,在部分智能体上增加人的干预。因此智能体在系统中被分为两类:人控智能体和自治智能体。可以得到以下模型:
[0026][0027]
其中x表示人控智能体集合,而其他智能体不受人为干预。
[0028]
为了方便起见,对vd(t)进行分类:
[0029][0030]
更进一步的,构建新的多智能体系统中单个智能体模型为:
[0031][0032]
其中cd表示人控制常数,cd=1(d∈x)表示智能体受人控制,表示智能体不受人干预。
[0033]
本发明考虑的人的模型由下面的线性微分方程来表示:
[0034]
[0035]
其中d∈x,和分别表示人的状态、人的输入和人的输出;和为已知的常矩阵。为了便于推导,在情况下,设定控制智能体的人(虚拟人)的序号为d。
[0036]
步骤3:结合人控制输入和自治智能体控制输入,控制协议设计如下:
[0037][0038][0039][0040]
其中为常数,为智能体之间的通信权重矩阵,如果智能体d和智能体q之间有通信,那么否则否则此外,
[0041]
步骤4:定义和则误差系统可以表示为:
[0042][0043]
其中,
[0044][0045][0046]
步骤5:基于人机交互的多智能体系统实现期望的编队如果存在正定矩阵使得以下条件成立:
[0047]
[0048]
其中其中其中其中
[0049]
针对误差系统(1),构造如下的lyapunov函数:
[0050][0051]
其中,
[0052]
对上式求导可得
[0053]
结合不等式技术和(2),可以得到v(t)趋于0,进一步得到趋于0;因此,基于人机交互多智能体系统在控制协议下实现了期望的编队。
[0054]
与现有技术相比,本发明的有益效果是:本发明提出了一种新的基于人机交互二阶非线性多智能体系统的编队控制方法;考虑到多智能体系统在未知和复杂的环境中容易做出错误的决定甚至失去控制,本发明首次在多智能体系统的编队控制中加入人的干预,降低系统的错误率并提高了系统的稳定性;对于每个智能体而言,仅仅只需要用到与其相邻的智能体的位置和速度信息就可以实现编队控制。从实现角度考虑,本发明所需的计算资源更少并且所需控制量更容易获取;与传统的编队控制协议相比,该协议结合了人控智能体和自治智能体的控制输入,有效解决了由于自治智能体的失误而导致整个系统不稳定的问题;基于人机交互多智能体系统的编队控制方法适用于任何由本发明所考虑的单个智能体的数学模型来建模的实际系统,应用范围广泛。
附图说明
[0055]
图1为基于人机交互多智能体系统编队控制的流程图;
[0056]
图2为多智能体系统的通信拓扑图;
[0057]
图3和图4为本发明的仿真结果分析图。
具体实施方式
[0058]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0059]
可以理解,本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本技术的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
[0060]
如图1所示,步骤1:构建二阶非线性多智能体系统中单个智能体模型为:
[0061][0062]
其中和分别表示智能体的位置向量、速度向量和控制输入向量,t是时间变量,表示智能体的非线性内部动力学并且满足以下不等式:
[0063]
|φ(t,a1,a2)-φ(t,a3,a4)|≤ρ1|a
1-a3|+ρ2|a
2-a4|
[0064]
对于任意的其中ρ1和ρ2为正常数。
[0065]
为了得到期望的结果,选取虚拟领导者如下:
[0066][0067]
其中和分别表示虚拟领导者的位置向量和速度向量。
[0068]
对于任意给定的初始状态,如果以下等式关系成立,则称基于人机交互多智能体系统实现了期望的编队:
[0069][0070]
lim
t
→
+∞
||wd(t)-w
*
(t)||=0,
[0071]
其中d=1,2,...,n,是智能体d和虚拟领导者之间期望的相对位置。
[0072]
步骤2:对于所研究的n个智能体,考虑到智能体在未知和复杂的环境中容易做出错误的决策甚至失去控制,在部分智能体上增加人的干预。因此智能体在系统中被分为两类:人控智能体和自治智能体。可以得到以下模型:
[0073][0074]
其中x表示人控智能体集合,而其他智能体不受人为干预。
[0075]
为了方便起见,对vd(t)进行分类:
[0076][0077]
更进一步的,构建新的多智能体系统中单个智能体模型为:
[0078][0079]
其中cd表示人控制常数,cd=1(d∈x)表示智能体受人控制,表示智能体不受人类干预。
[0080]
本发明考虑的人的模型由下面的线性微分方程来表示:
[0081]
[0082]
其中d∈x,和分别表示人的状态、人的输入和人的输出;和为已知的常矩阵;为了便于推导,在情况下,设定控制智能体的人(虚拟人)的序号为d。
[0083]
步骤3:结合人的控制输入和自治智能体控制输入,控制协议如下:
[0084][0085][0086][0087]
其中为常数,为智能体之间的通信权重矩阵,如果智能体d和智能体q之间有通信,那么否则否则此外,
[0088]
步骤4:定义和则误差系统可以表示为:
[0089][0090]
其中,
[0091][0092][0093]
步骤5:基于人机交互的多智能体系统实现期望的编队如果存在正定矩阵使得以下条件成立:
[0094]
[0095]
其中其中其中其中
[0096]
针对误差系统(1),构造如下的lyapunov函数:
[0097][0098]
其中
[0099]
对上式求导可得
[0100][0101]
结合不等式技术和(2),可以得到v(t)趋于0,进一步得到趋于0;因此,基于人机交互多智能体系统在控制协议下实现了期望的编队。
[0102]
步骤6:选取实例进行仿真验证;
[0103]
选取显然,很容易验证φ(t,
·
,
·
)满足以下不等式:
[0104]
|φ(t,a1,a2)-φ(t,a3,a4)|≤2|a
1-a3|+0.4|a
2-a4|
[0105]
对于任意的假设智能体1、4、5受人控制,则x={1,4,5}。
[0106]
选择:
[0107]
b=diag(3.5,8.6,7.6,3.1,3.6),d1=
‑‑
0.1,d2=2.25,d3=1,d4=2.5,利用matlab yalmip toolbox工具,可以找到z=0.1275使得(2)成立。因此,多智能体系统可以取得期望的编队。
[0108]
令智能体的初始状态为:
[0109]
p1=[0.6,0.4]
t
,p2=[0.83,0.3]
t
,p3=[0.6,0.5]
t
,p4=[0.5,0.5]
t
,p5=[0.35,0.3]
t
。
[0110]
选取人的初始状态为:
[0111][0112]
各智能体与虚拟领导者之间的相对距离定义为:
[0113][0114]
图3和图4分别描述了智能体的的位置和速度随时间变化的过程。由图3可以看出,智能体的位置随着时间的变化逐渐趋于设计的队形。由图4可以看出,智能体的速度随时间的变化最终趋于相同。
[0115]
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0116]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0117]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0118]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并
不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
[0119]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,所述方法包括:构建多智能体系统和虚拟领导者模型;在部分智能体上增加人的干预;引入新的多智能体系统模型,得到误差系统;构造相应的lyapunov函数,得到系统实现编队的条件;基于人机交互的多智能体系统实现期望的编队。2.根据权利要求1所述的基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,所述构建多智能体系统和虚拟领导者模型的步骤,包括构建二阶多智能体系统数学模型和多智能体系统中的虚拟领导者模型,其中二阶多智能体系统数学模型为其中和分别表示智能体的位置向量、速度向量和控制输入向量,t是时间变量,表示智能体的非线性内部动力学。3.根据权利要求2所述的基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,所述多智能体系统中的虚拟领导者模型为:其中和分别表示虚拟领导者的位置向量和速度向量。4.根据权利要求1所述的基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,构建多智能体系统和虚拟领导者模型的步骤还包括构建新的二阶多智能体系统数学模型:其中c
d
表示人控制常数,c
d
=1(d∈x)表示智能体受人控制,表示智能体不受人类干预。5.根据权利要求1所述的基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,所述人的干预通过线性微分方程表示:其中d∈x,和分别表示人的状态、人的输入和人的输出;和为已知的常矩阵。6.根据权利要求5所述的基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,对于人的干预,结合人的控制输入和自治智能体控制输入,控制协议如下:
其中为常数,为智能体之间的通信权重矩阵,若智能体d与智能体q之间有通信,那么否则否则此外,7.根据权利要求1所述的基于人机交互二阶非线性多智能体系统的编队控制方法,其特征在于,确定系统误差时,定义和那么系统误差为:其中,其中,
技术总结
本发明公开了一种基于人机交互二阶非线性多智能体系统的编队控制方法,属于智能控制领域,其包括:构造多智能体系统与虚拟领导者数学模型,便于后续的推导;增加人的干预,智能体在系统中被分为两类:人控智能体和自治智能体;通过上述分类引入新的多智能体系统模型,得到误差系统;构造适当的泛函函数,利用李雅普诺夫稳定性理论得到系统稳定的准则;利用状态反馈控制器使基于人机交互的多智能体系统误差趋于0,使得该系统实现期望的编队。本发明考虑到多智能体系统在未知和复杂的环境中容易做出错误的决定甚至失去控制的情况,在多智能体系统的编队控制中加入人的干预,降低了系统的错误率,使多智能体系统可以达到期望的队形。形。形。
技术研发人员:王金亮 凌坤 任顺燕
受保护的技术使用者:天津工业大学
技术研发日:2023.06.12
技术公布日:2023/8/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/