1、第 卷第期复 杂 系 统 与 复 杂 性 科 学 年 月 文章编号:();:非线性耦合多智能体系统组编队跟踪控制杜向阳,李伟勋,陈增强,张利民(天津职业技术师范大学理学院,天津 ;南开大学人工智能学院,天津 ;中原工学院电子信息学院,郑州 )摘要:为研究非线性和双积分器耦合领导跟随多智能体系统的组编队控制问题,在处理多智能体系统的分组时,没有基于传统的保守假设(从一个组中的每个节点到其他组中的所有节点的相邻权值之和为零或其他常数),设计了一种新的控制协议。根据李雅普诺夫稳定性理论和代数图论,分别给出了双积分和非线性器二阶多智能体系统的组编队控制问题的充分条件,使得多智能体系统能够达到期望的几何
2、结构并随着时间维持下去。最后,用两个数值仿真的例子验证了所得结论的有效性。关键词:多智能体系统;组编队控制;非线性系统;双积分器系统;无向拓扑中图分类号:文献标识码:收稿日期:;修回日期:基金项目:国家自然科学基金();河南省重点研发与推广专项项目()第一作者:杜向阳(),男,河南信阳人,硕士研究生,主要研究方向为多智能体协调控制方面的研究。通信作者:李伟勋(),男,江西南昌人,博士,副教授,主要研究方向为多智能体系统协调控制。,(,;,;,):,:;引言近年来,多智能体系统的分布式协调控制得到了广泛的关注和研究。编队控制作为多智能体协调控制里重要且基础的一部分,在各种系统里面实用性比较强,所
3、以有必要对它进行深入研究。目前对编队控制的研究大致分为个方面,基于行为的方法、领导者跟随者的方法和虚拟结构的方法。第 卷第期杜向阳,等:非线性耦合多智能体系统组编队跟踪控制在面对复杂的任务和环境时,对多智能体系统进行分组去完成一个共同的目标或者多目标更有优势。文献 通过引入双树形变换,解决了具有时滞的切换拓扑下的多智能体系统组的一致性问题。文献 设计了混杂协议,得到了多智能体系统组一致性的充分条件。文献 首次将文献 中的保守假设推广到智能体在不同组的信息权重之和为一常数的前提下,得到了多智能体系统组一致性的充分条件。文献 则针对线性多智能体系统得到了实现组一致性的充要条件。多智能体系统的编队控
4、制和一致性控制有着异曲同工之妙,例如在基于领导跟随一致性控制分析里面,是让跟随者随着时间逐步收敛到领导者的状态,而编队控制相较于一致性控制多了编队向量,即让跟随者随着时间收敛到领导者与编队向量的和的形式。当编队控制里面的编队向量趋于零时,编队控制就转化为一致性控制问题,而当组一致性问题里面添加编队向量时,就形成了组编队控制问题,此时每一个子组的智能体就会构成一个期望编队结构。事实上,无论在自然界还是人类社会,群体中的多个个体通过形成一定的结构来完成目标任务的现象是非常普遍的,如多任务移动机器人的分散形成以及多利益冲突的社会社区的分裂形成。所以对于多编队控制问题的研究具有很大的实际和应用意义。截
5、止到目前为止对多编队控制问题的研究结果并不多见,主要是对组一致性,集群一致性,多跟踪问题的研究。不依赖大多数相关研究工作中提出的一些保守假设,文献 得到了一些可以保证多智能体系统达成群体共识的很有前途的标准。文献 研究了具有几种不同子群的一种新的聚类共识,基于马尔可夫链和非负矩阵分析,分别得到了具有固定拓扑和切换拓扑的两种新的聚类一致准则。文献 基于智能体是向同一目标移动还是向单独的目标移动,提出了两种潜在的函数来进行群集算法,研究了一种多智能体系统的多目标跟踪群集算法。文献 研究了非线性领导跟随多智能体系统的多编队控制问题,给出了基于相邻信息的多编队控制协议。综上所述,另考虑到非线性系统 对
6、实际大部分现象和规律具有较优越的吻合度,本文主要解决了在没有保守假设下,组内组间都存在耦合的非线性领导跟随多智能体系统的多编队控制问题。基于系统的拉普拉斯矩阵,跟随者和领导者的连接矩阵,提出了新的控制协议去实现带有多领导者的二阶非线性系统和双积分器系统的组编队跟踪控制。预备知识与问题阐述图论知识本文中,假 定 多 智 能 体 系 统 包 含个 智 能 体,其 中个 为 跟 随 者,个 为 领 导 者。用,表示个跟随者的无向拓扑图,其中,分别是顶点集,边集和一个非负邻接矩阵。对于无向图,()当且仅当 ,此时智能体和智能体之间存在信息交流。假定智能体不存在自循环,即,对。为无向图的拉普拉斯矩阵,为
7、第个智能体与其领导者的连接权重,()。如果中任意两个顶点之间至少存在一条路径,称 无向 图是连 通 的,否 则 为 不 连 通的。把图分 成个 子 图,第个 子 图 表 示 为,可以得到,任意两个子图点集的交有,(),为空集。基于此把邻接矩阵写成分块形式 熿燀燄燅为了下面讨论的方便,定义如下的映射(),;,;,烅烄烆(),顶点集中的智能体数量为。为了进一步的方便性,把的指标集写为复 杂 系 统 与 复 杂 性 科 学 年 月,并记()(),。模型阐述和相关引理考虑一个含有个非线性耦合的多智能系统,其跟随者的二阶动力学系统描述为()()()()(),(),烅烄烆()其中,(),()分别代表智能体
8、的位置和速度,(),(),()分别为第个智能体的控制输入和内部动力学,是一个非线性连续可微向量函数。其个领导者的二阶动力学描述为()()()(),(),烅烄烆()其中,()、()和(),()分别代表第个领导者的位置、速度和内部动力学。假设非线性连续可微向量函数满足一个全局的利普希茨条件,如果存在一个正的常数使得,(),(),假设一个含有个智能体的系统,假定其领导跟随连接矩阵 ,(),即存在,使得第个跟随者与第()个领导者有信息交换,。注把个跟随者分成个子组,记第个子组的领导者为,为跟随者。根据前面构建的()映射关系,第个跟随者的领导者为()。因此,如果()(),则说明智能体和智能体属于同一个子
9、组。定义针对带有领导者的多智能体系统()、(),如果对任一子组,和任意的初始状态都存在一个控制协议,使得同一组的所有智能体形成一个被设计的队形,即 !()()()(),!()()()(),其中,是智能体相对于领导者()的编队向量,则称多智能体系统达到了组编队一致性。注由定义可以看到,当编队向量时,多智能体系统的编队控制问题就转化成了一致性或组一致性问题,也即组一致性问题是组编队控制问题的特殊情况。所以组编队控制问题的研究具有更一般的普遍性。引理 对于一个连通的无向图,如果至少存在一个跟随者与领导者有信息连接,即,则矩阵。引理 矩阵不等式(补引理)()()()()熿燀燄燅其中,()(),()()
10、,等价于如下的条件之一:()(),()()()();()(),()()()()。引理 假设两个厄米特矩阵,分别为,和的特征根,则有,引理 对于任意合适维度的向量,以及合适维度的对称正定矩阵,都有 主要研究结果通过设计一种新的控制协议,结合李雅普诺夫稳定性理论和代数图论证明了系统的稳定性。非线性耦合领导跟随多智能体组编队控制为解决多编队控制问题,设计控制器为()()()(),()()()()(),()()第 卷第期杜向阳,等:非线性耦合多智能体系统组编队跟踪控制()()()(),()()()()()()()()其中,为耦合强度,()为智能体和领导者()的连接权重,为控制增益。注相较于文献 基于分
11、组的假设,即对于一个子组,从其他子组接收到的信息总数为零而设计的如下的控制协议(),()()()()()()()()()()()()(),本文中的控制器强化了不同组之间智能体的通讯能力,使得多智能体系统面对复杂的实际环境可以有更好的灵活性和抗干扰性。定理在假设条件()()下,通信网络为无向拓扑的非线性耦合领导跟随多智能体系统在控制协议()下,可以实现多编队跟踪控制,如果系统参数满足如下两个条件 ()()和 ()()证明:令珔()()()(),珋()()()()。得到其误差系统为珔()珋()珋()()()(),珔()珔()()()()(),珋()珋()(),()珔()珋()()(),()()()
12、,()()将误差系统写成向量形式珔()珋()珋()()()珔()()()珋()()其中,珔()珔,珔(),珋()珋,珋(),(),(),(),()。(),()(),()()(),(),。令珔()珔(),珋()(),构造李雅普诺夫函数()珔()()珔()其中,()()烄烆烌烎。首先说明这个李雅普诺夫候选函数是有效的。根据引理,等价于()(),令()()()()。再 由 引 理 有()()()()(),根据()和()以及,可得,故()且()当且仅当珔()。将 泛函重新写为()珔()()()()珔()珔()珋()珋()珋()()计算()沿轨迹()的时间导数,得到()珔()()()珋()珋()珋()珔
13、()()珔()()珋()珋()()珔()()珋()珔()()珔()珋()()珋()珔()(),)复 杂 系 统 与 复 杂 性 科 学 年 月()(),)珋()(),)()(),)根据假设和引理有珋()(),()()(),()()珋()(),()()(),()珋()()()()珋()珋()()和珔()(),()()(),()()珔()珋()珔()珔()珋()珋()()其中,取正定矩阵为单位矩阵,整理得()珋()()()()珋()珔()()()珔()。根据引理,可以很显然地得到,其中,都是大于的常数,故存在适当大小的参数使得,(),只要它们满足()和()即可。由上面的讨论可知(),且()当 且仅
14、当珔()。根据李雅普诺夫稳定性理论,多智能体系统()和()在控制器()的作用下实现了多编队跟踪控制。注对定理的分析,可以看到控制增益的取值取决于耦合强度,利普希茨常数以及矩阵和的特征根的共同作用,也就是多智能体系统之间的交互拓扑和耦合强度对控制增益有影响。双积分器耦合领导跟随多智能体组编队控制考虑智能体的内部动力学,则多智能体系统可以简化为如式()的形式()()()(),烅烄烆()领导者的动态为()()(),烅烄烆()这表明领导者的参考速度为恒定常数。基于控制协议()有()()()()()(),()()()()()()(),()()()()()()(),()()()()()()()()(),。
15、烅烄烆写成矩阵形式为珔()珋()珋()()珔()()珋()()对于对称矩阵的定义和上面讨论的一样,从定理的结论和证明可以很容易得到推论。推论在无向通信拓扑和假设条件()下,控制协议()可以让多智能体系统()和()实现多编队跟踪控制,如果系统参数满足如下的条件 ()()数值仿真例考虑一个具有个跟随者和个领导者的二阶非线性多智能体系统。其拓扑结构如图所示,个跟随者被分为两个子组,分别为,领导者为,。假设网络的每条连接权重均为。故其权重矩阵和拉普拉斯矩阵为第 卷第期杜向阳,等:非线性耦合多智能体系统组编队跟踪控制图通信拓扑图 图带有非线性动态的位置轨迹 熿燀燄燅,熿燀燄燅 (),假设跟随者的非线性动
16、态如式():(),()(),(),(),(),烅烄烆()领导者的非线性动态如式():(),()(),(),(),(),烅烄烆()令耦合强度,利普希茨常数 ,增益,显然可以看到假设和假设满足,并且定理成立。设,(),(),()为组的跟随者的期望队形向量。组的跟随者的期望编队向量为(,),(,),(,),()。图带有非线性动态的位置和速度变化 图带有非线性动态的位置和速度误差 复 杂 系 统 与 复 杂 性 科 学 年 月图双积分器系统的位置轨迹 在控制协议()下,非线性系统的队形仿真结果如图所示。图刻画了跟随者的位置和速度分别沿着轴和轴随时间变化的状态。图刻画了每个跟随者在轴方向和轴方向的位置误差和速度误差。由图的仿真结果可知非线性耦合引领跟随多智能体的多编队控制在无向拓扑结构下实现了。例取耦合强度,增益,非线性动态为零。在相同的结构拓扑下,双积分器的多编队仿真效果如图所示。图为跟随者沿轴和轴的位置与速度的状态变化,图为跟随者在轴和轴方向上的位置误差和速度误差。由图图可以很容易看出双积分器耦合引领跟随多智能体的多编队控制问题解决了。图双积分器系统的位置和速度变化 图双积分器系统的位置和速