1、 年第 卷 月第 期机 械 科 学 与 技 术 :收稿日期:基金项目:国家自然科学基金项目()作者简介:万敏(),教授,博士,研究方向为智能控制技术和自动化装置,万敏,杨山山具有状态约束的机械臂切换自适应控制机械科学与技术,():具有状态约束的机械臂切换自适应控制万敏,杨山山(西南石油大学 机电工程学院,成都)摘要:为了解决具有状态约束的机械臂的控制问题,本文针对一类具有全状态约束和状态不完全可测的切换严格反馈非线性系统进行研究,通过引入状态观测器、自适应神经网络和动态表面控制技术,设计了一种基于径向基函数()神经网络的自适应输出反馈控制方法。利用 方法和平均驻留时间理论()保证了闭环系统所有
2、信号是半全局一致最终有界的(),通过数值例子仿真验证了所提方法的有效性。最后将该方法应用于带电机驱动的机械臂并进行仿真实验,仿真结果表明,机械臂轨迹跟踪误差很小,有着良好的控制精度,同时也表明所提出的控制算法能够应用于实际工程模型。关键词:动态面控制;全状态约束;非线性切换系统;神经网络状态观测器;机械臂轨迹控制中图分类号:文献标志码:文章编号:(),(,):,()(),:;机械臂是一个比较复杂的多输入多输出的非线性系统,并且由于其具有强耦合和时变的特性,因而对机械臂的轨迹跟踪控制一直是一个难点。目前对于机械臂的控制方法一般有前馈补偿法、自适应控制、变结构控制、鲁棒控制、控制和神经网络与模糊控
3、制等方法。目前对由于外界干扰或是自身因素引起的机械臂的参数跳变问题多是使用鲁棒控制和自适应控制,但是鲁棒控制有比较大的控制力矩。自适应控制通过在线辨识、学习,在线调整控制规律能够达到不错的控制效果,但是其每一次控制参数的变机 械 科 学 与 技 术第 卷:化都会重复进行一次自适应调节过程,对于实时性要求比较高的系统并不是很适合。实际上,针对含有参数跳变和有着未知扰动的机械臂系统是可以看做一个切换系统,不同的控制参数对应着不同的子系统,切换系统也弥补了自适应控制的实时性问题。近年来,对于非线性切换系统的跟踪控制问题也有着大量的研究。文献针对一类柔性机械臂在负载跳变时对其轨迹跟踪控制进行研究,其利
4、用多 函数及 理论设计的切换滑模控制器完成了对柔性机械臂的轨迹控制。文献针对一类具有随机切换的非线性系统,提出了一种自适应模糊控制方案。文献针对一类非严格反馈不确定切换非线性系统,提出了一种模糊自适应输出反馈控制方法,并将该方法应用于带有电机驱动的机械臂轨迹跟踪控制的研究。状态约束是指系统由于安全性和性能因素等原因要求其某些状态在暂态和稳态时都能运行在某个特定的边界内,即满足一定的约束条件。在实际工业生产中,如果忽视这些约束限制带来的系统状态“越界”的情况,可能就会引发严重的事故,造成不必要的财产损失,因此对于状态约束控制的研究是非常有必要的。目前对于状 态 约 束 的 研 究 多 是 引 入
5、 合 适 的 函数防止系统状态违反相应的约束。文献研究了一类全状态约束和输入饱和的全向三轮驱动移动机器人的轨迹跟踪控制问题,并达到了良好的控制效果,但是其对系统状态不完全可测的情况缺乏考虑。文献 针对具有输入饱和的全状态约束非线性系统,研究了状态和外界干扰均不可测情况下的输出反馈跟踪控制,但是其关于反步法中存在的复杂性“爆炸”问题并未解决。文献针对一类具有全状态约束和状态不完全可测的严格反馈非线性系统,提出了一种基于 神经网络状态观测器的动态面输出反馈技术,达到了良好的控制精度,但是该文献仅是针对单一系统进行控制器设计和稳定性分析,未考虑包含多个子系统的情况。本文的特点在于:首先,大多数控制器
6、的设计都是需要所有的状态向量是可测的,而本文仅是需要系统的输出信号可测即可完成控制器的设计,实用范围更广;其次,由于在反步设计方法中虚拟控制律需要在每一级的反推设计中进行重复求导,因而所设计的控制器的计算复杂度会随着系统阶数的增加而增加,设计的控制器也只能应用于一些低阶实际系统。因此本文利用动态表面控制技术,即在反步设计方法中引入一阶滤波器,将复杂的微分运算变为简单的代数运算,从而避免了控制器设计中反复对虚拟控制律求导的情况,极大的简化了控制器的设计过程;最后,本文设计的控制算法能够应用于实际工程模型,有一定的实用性。被控系统模型及准备 系统模型描述及基本假设考虑如下一类严格反馈非线性切换系统
7、,其形式为:,()(),()(),()(),()()(),()(),()()|()式中:为系统的状态向量,且只有 是可测的;()为控制信号;():,),为系统的切换信号,并且它是一个右分段连续函数,当()时,即第 个子系统处于运行状态,是第 个子系统的控制器输入;为系统的输出;,()(,下文中若无其他说明,均为此取值范围)为一个未知非线性光滑函数;,()()是未知扰动。假设 未知扰动,()()以未知常数,()为界,且有,()(),()。假设 存在常数 和(,),有(),()()和()(),。假设 存在函数:和:使得 有()和(),存在正常数,使得期望轨迹()和它的时间导数满足()()()和()
8、(),。引理 对于给定的连续函数():定义一个紧集,存在最优权值,对于给出的任意小的正数,使得逼近误差 满足 ()(,)()式中 ()(),()为神经网络的基函数向量。第 期 万敏,等:具有状态约束的机械臂切换自适应控制:引理 对任意正常数,当 时,存在不等式 ()引理 定义切换系统()有一个平均驻留时间 的切换信号(),且存在着两个常数 和,有(,),其中(,)为区间,)中的切换次数。控制目标:)设计一个自适应输出反馈控制器,使得输出()能够跟踪期望轨迹(),且跟踪误差 尽可能小;)保证闭环系统中所有信号有界;)系统中的所有状态都不违反约束。神经网络状态观测器设计对于第 个子系统,非线性切换
9、系统()可以写成如下形式:,(),()式中:;,|;|;,。通过选择合适的 可以保证 是一个严格的 矩阵,并且存在着下列不等式 ()式中:与 分别是任意给定的正定对角矩阵和正定对称矩阵,和。由于非线性切换系统()中的系统状态,是不可直接测量的,因此需设计一个状态观测器去估计不可测量的系统状态。令,为 的估计值。因此有,(),(),()其中,(),(),结合引理,()可以表示为,(),(),()式中:,()和,分别是神经网络的基函数向量和权值向量;,是近似误差。令,是,的最优权值向量,由此可得,(),()()式中:,和 分别是,和 的紧集。因此,最小逼近误差可以表示为,(),(),()()式中,
10、(),且,是未知常数。神经网络权值向量参数误差可定义为:,将式()和式()代入式()可得:,(),(),|()因此对于第 个子系统,神经网络状态观测器可以设计成如下形式:,()|()令观测误差为,则观测器误差为 ,(),(),()式中 ,令,则 。自适应控制律设计对于自适应控制律的推导过程包括 步,通过在每一个步骤中选择恰当的 函数,来构造虚拟控制律。控制器设计步骤如下:定义 为跟踪误差,为虚拟误差,为虚拟控制律,同时引入一阶滤波器,有:,(),()|()式中:为期望跟踪轨迹;,为滤波器的时间常数;,为,的低通滤波器,的输出。由式()可得,阶滤波器的误差为,。机 械 科 学 与 技 术第 卷:
11、步骤 对 进行求导,可得 ,(),(),()()其中:,(),(),();,;。定义如下的 函数,()其中,是设计参数,令。由式()、式()和引理 可得,的时间导数:,()(,(),(),(,(),),(),()根据 不等式,有:()()(),(),()()()由式()式()可得(,),()将式()代入式()得,(,),(),()(,(),(,(),)()设计虚拟控制律,和自适应律,为:,(,),()(),(),()根据 不等式,有,()将式()和式()代入式(),有(),(),()步骤 ():对 进行求导,可得 ,(),(),()式中,。定义 函数为,()式中,为设计参数,。,的时间导数为,
12、(,(),),(,(),)()因此,虚拟控制律,和自适应律,为:,|,(),(),(),()由式()和式(),有第 期 万敏,等:具有状态约束的机械臂切换自适应控制:()(,),()步骤 在最后一步中,系统的控制输出为,有,(),(),()其中,。定义如下的 函数,()式中,为设计参数,。,的时间导数为,(,(),),(,(),)()因此综合控制律,和自适应律,为:,|,(),(),(),()由式()和式(),有,(),(,),()稳定性分析定义闭环系统的李亚普洛夫函数为 ,因此可以得到 的导数,有,(),(,),()根据文献,有,()()式中,()是连续函数。因此,有,(),(),()当 时
13、,连续函数,()有界,且存在一个最大值,。根据 不等式,有:,(),(),()根据引理,可得,()所以由式(),有()(,),()(,)|,|,()其中 ,()通过选择合适的,和,有(),()式中,。定义正参数机 械 科 学 与 技 术第 卷:()(),(,),(,)()定义 和 ,因此,式()可写为 ()定理 在假设 的条件下,考虑由非线性切换系统(式(),状态观测器(式()和实际控制器(式()组成的闭环系统,若切换信号(),且所有初始状态都在规定的范围内,则所提出的自适应神经网络输出反馈控制器能保证闭环系统 且约束不会被违反。同时,观测器和跟踪误差可以收敛到任意小。证明()()()是系统方
14、程式()的解且分段可微。根据式(),在每一个,)区间里,有()()()()()()同式()的证明方式,有()()()其中,且,。因此,可以得到()()()()()()()()对于任意 ,将不等式()从 迭代到(,),有()(,)(,)(,)(,)(,)(,)(,)()(,)(,)(,)()由于,对于任意 ,|,有。因此,可得(,)()()()由于,(,)(,)(,(,),则(,)()()()因为,有 ()()将式()和式()代入式(),可得()(,)()()()根据文献 可得,存在着两个 类函数()和(),满足()()(),。因此,可得()()()()()()()()()由式()可得()()(
15、),()因为,通过选择合适的,和,的值,有()()()()因此,可得 ()()式()表明,状态观测器的误差可以通过选择适当地设计参数减小,。通过式()和 的条件,我们可以推断得出:若切换信号()满足,且初始条件都在规定的范围内,则,和,都是有界的。因此,()()()是成立的。通过()()()和,可以得到()()(),因此易知 是有界的。,是关于,和第 期 万敏,等:具有状态约束的机械臂切换自适应控制:的函数,因此可得,和,也是有界的。,是关于,和 的函数,因此可得,和,也是有界的。通过()()()和 ,可以得到()()()。,是关于,和,的函数,因此可得,和,也是有界的。同理易推,()()()
16、是成立的,因此,易知所有状态都满足()()()不等式,即系统中所有状态都没有违反约束。与已有成果的对比分析将提出的控制算法和已有的成果进行对比分析。)文献针对一类具有全状态约束和状态不完全可测的严格反馈非线性系统(其结构如式()所示),提出了一种自适应输出反馈控制算法。但该控制算法仅考虑的单一系统,未考虑被控对象存在着切换系统的情况。事实上,在实际生活中切换系统是广泛存在的,如汽车变速系统,智能机器人系统和电压转换系统等,因此,针对上述系统,很显然文献所提的控制算法是不适用的。而本文提出的控制算法就解决了这一类切换问题,且通过利用 方法和平均驻留时间理论保证了闭环系统的稳定性。(,)(,)|()式中:,是系统状态向量;和 分别为系统的输入和输出;是有界未知扰动;令,假定在该系统中只有 是已知可测的,(),是一个未知的非线性光滑函数。)文献针对一类严格反馈不确定非线性切换系统进行研究(其结构如式()所示),提出了一种基于共同 函数的自适应动态表面控制方法。但是,该方法由于未考虑系统状态变量是否可测的问题,有着一定的局限性。因为在实际工业中通过直接测量从而得到所有状态变量的现象是很少见的,