1、第 卷第 期 年 月兵工学报 :参数自优化的有人与无人车辆编队鲁棒模型预测控制宋佳睿,陶刚,李德润,臧政,吴绍斌,龚建伟(北京理工大学 机械与车辆学院,北京;中汽研汽车检验中心(天津)有限公司,天津)摘要:为解决有人与无人车辆编队中,有人领航车紧急加减速和紧急转向控制输入对无人车跟踪控制的扰动问题,设计了一种参数自优化的有人与无人车辆编队鲁棒模型预测控制算法。通过采集分析历史数据确定控制器扰动的噪声极值,并经过适度放缩得到其鲁棒边界。设计抑制该扰动的局部反馈鲁棒控制器,并通过贝叶斯优化的方法实现鲁棒边界等控制器参数自优化。基于混合整数线性优化的方法预测有人领航车未来轨迹,并设计鲁棒模型预测控制
2、器实现无人车对有人领航车的跟踪控制。仿真和实车试验结果表明:所设计的鲁棒模型预测控制器在跟踪精度方面相比于传统模型预测控制器有明显的提升;同时该控制器有效地抵抗了来自有人领航车紧急加减速和紧急转向控制输入、无人跟随车系统模型不确定性和外部环境的扰动,振荡情况明显改善,提高了系统的鲁棒性。关键词:有人与无人车辆编队;领航跟踪控制;鲁棒模型预测控制;贝叶斯优化 中图分类号:.文献标志码:文章编号:()收稿日期:基金项目:国家自然科学基金区域创新发展联合基金项目(),(,;(),):,第 期参数自优化的有人与无人车辆编队鲁棒模型预测控制:;引言近年来,为实现无人装备集群化、规模化和可指挥化,无人装备
3、集群行驶在军事领域中得到了越来越多的应用。当前,有人与无人车辆编队领航跟踪控制作为无人装备集群行驶的一项关键技术,其发展也被越来越多的学者关注。车辆编队控制可以分为领航 跟随法、行为控制法、滑模控制法、鲁棒控制方法、模糊控制法和模型预测控制()等。方法在车辆编队控制方面具有可预测性和可约束性等众多优点,广泛应用于集群车辆列队系统中。鲁若宁等针对单向通信拓扑的车辆编队自适应巡航控制问题,提出一种满足队列稳定的模型预测控制策略。等提出基于多目标优化问题的切换控制策略以协调多车自适应巡航系统中的安全性、舒适性、协同性和燃油经济性等控制目标。等提出一种应用于同质量重型卡车成队列行驶的燃油经济性模型预测
4、控制策略,该策略将领航车的燃油最优控制方法与跟随车的协同控制方法相结合,提升了系统的燃油经济性。李永福等在编队控制基础上提出一种双向领导跟随通信拓扑结构以考虑车车通信时延对控制器的影响。上述研究提供了丰富的无人车辆编队行驶控制策略,但是由于军用无人车队通常行驶在非结构化道路,且其控制器模型存在结构和参数的不确定性,所以军用无人车编队行驶控制存在受地面外部扰动和模型失配的问题。因此,由外部扰动和模型失配的引起的鲁棒控制问题是编队控制急需解决的关键问题。针对此类鲁棒问题,孙中奇对具有输入边界限制和有界不确定影响的轮式机器人展开研究,提出基于不变集的鲁棒模型预测控制()方法,该方法将实际状态轨迹收紧
5、在鲁棒不变集内并保证系统渐近稳定性。等在模型预测控制方案的基础上,引入 阶积分滑膜校正项,保持和增强了车队在巡航时的一致性。等设计了集中式扰动观测器获得稳定状态参考,并利用 控制器保证队列稳定和实现轨迹跟踪,同时减小参数不确定性的影响。等提出分布式 与终端不变集结合的方案用于多地面无人车辆控制,有效地应对突发状况与通信数据包丢失问题。上述方法均在解决车辆系统的参数不确定、结构不确定或外部扰动不确定方面取得了成功。但是不同于无人车编队行驶,对于有人车领航与无人车跟踪控制问题,有人领航车通常为处理突发场景需要进行紧急加减速和转向,进而产生随机不连续的扰动输入且难以预测。同时随机扰动的鲁棒边界不易确
6、定,边界过小或过大会引起控制系统鲁棒性不足和保守性过大的问题。因此,综合考虑有人领航车随机扰动输入并优化其鲁棒边界是有人车领航与无人车跟踪控制需要解决的重要问题。根据上述分析,本文提出一种参数自优化的有人与无人车辆编队 算法。该算法在 控制器中考虑了有人领航车的输入扰动,并设计了基于线性矩阵不等式的局部反馈鲁棒控制器抑制该扰动。基于贝叶斯优化方法对鲁棒边界进行优化,保证控制器鲁棒性和低保守性。最后通过 仿真实验和实车试验验证该算法在有人领航与无人跟随控制中的可靠性。本文的总体框架如图 所示。领航跟踪及有人和无人车辆模型.领航跟踪几何模型领航跟踪需要控制器精确跟踪期望路径并与领航车辆维持期望间距
7、。领航跟踪控制系统使用 方法建立表述车间相对位置的领航跟踪几何模型。有人领航车和无人跟随车如图 所示。图 中,坐标系 为大地坐标系,(,)为领航车辆 的全局位置坐标,为车辆 的航向角,(,)为跟随车辆 的全局位置坐标,为车辆 的航向角,定义车辆 和车辆 的质心间距为,定义车辆、的质心连线与车辆 航向的角度偏差为。车辆节点、的相对位置关系可表述为()()()()()在参考路径已确定的情况下,只需根据需求给定期望间距,在控制器中设计如下控制目标:()即可实现车辆领航跟踪控制中的间距保持。通过设兵 工 学 报第 卷图 总体框架图 图 领航跟踪几何模型 图 轮式车辆运动学模型 计不同的 可以调整编队协
8、同形式。为保证领航跟踪控制可实现,假设 大于等于车辆 与车辆 参考路径的横向间隔。.轮式车辆运动学模型阿克曼前轮转向车辆的运动示意图如图 所示。图 中:(,)、(,)分别为全局坐标系下车辆前、后轴中心坐标;为车辆前轮转角;为车辆前后轴轴距;为车辆后轴中心前进速度;为车辆航向角;黑色曲线为参考轨迹。由此可得笛卡尔坐标系下的车辆运动学微分方程如下:|()进一步,该微分方程可重写为控制系统的一般形式:(,)()式中:为控制系统状态量,;为控制系统控制量,。.履带车辆运动学模型由于传统运动学模型容易忽略履带车辆滑移、滑转等运动特性,而动力学模型的参数随环境变化较大且不易获得,本文选取在 坐标系下基于瞬
9、时转向中心的履带速差转向车辆运动学模型。将状态向量,替代,对车辆位姿进行描述,模型如图 所示,并作出如下假设:)假设履带车辆只在水平面上运动;)假设履带车辆的几何中心与质心重合;)车体坐标系原点 位于几何中心。图 中:为沿曲线移动的切向距离;为沿曲线的法向距离;为航向角跟踪误差;、为履带车辆的纵向速度和横向速度;为履带车辆的横摆角速度;为车辆的航向角;为履带车辆的瞬时转向中心;(,)为车体坐标系下车辆瞬时转向中心坐标;、分别为左右两侧履带的瞬时转向中心;(,)、(,)分别为两侧履带的瞬时转向中心坐标;、分别为左右两侧履带的卷绕速度;、为左右两侧履带牵连速度;为左右两侧履带中 第 期参数自优化的
10、有人与无人车辆编队鲁棒模型预测控制图 履带车辆运动学模型 心距。进而可得 坐标系下履带车辆运动学模型微分方程的矩阵形式如下:|()式中:为履带车辆几何中心 在参考曲线上对应点 的曲率值。由于基于瞬时转向中心的运动学模型更加有利于控制系统的建模,在实车控制时通常运用该模型进行建模,其运动学微分方程如下:|()式中:;。进一步,该微分方程可重写为控制系统的一般形式:(,)()式中:为系统状态量,此处 ,;为系统控制量,此处 ,。领航车轨迹预测与跟踪控制器设计领航轨迹预测与跟踪控制器首先对有人领航车轨迹进行预测,并使用 控制器跟踪预测轨迹,实现编队控制。.基于混合整数线性优化的有人领航车轨迹预测有人
11、车的未来状态可由轨迹树状图表示。以当前车辆位置作为根节点,并通过对车辆行为进行采样拓展可得到未来时刻的状态和预测轨迹,如图 所示。图 车辆轨迹树示意图 图 中 为车辆轨迹树的节点,后文统一将节点以 表示:,()式中:为当前节点的时间戳;为节点的代价。每次向轨迹树中添加新的节点时,则向扩展列表 中添加新节点对应所有可能扩展节点及其轨迹,并进行下一步探索和扩展。扩展列表中,使用边表示两节点之间的状态转移。边 由带有转移代价的转角输入和固定速度组成,表述为,()式中:为力 的代价。状态转移方程来自轮式车运动学模型的 阶 离散。轨迹树一步扩展算法流程如图 所示。根据有人车驾驶员在实际驾驶过程的行为设计
12、节点 的代价 计算公式为(,)()()式中:中两项分别表征该节点与参考路径上最近点的距离和速度偏差;为参考距离;为参考速度;、分别为各项的权重系数,分别表征了预测轨迹与有人车驾驶过程的实际轨迹和实际运动的相关程度,对应权重越大则轨迹预测器越基于对应实测值进行预测,二者需根据驾驶员行为确定。为使有人车的转向控制量尽可能小,设计边 的代价 计算公式为()式中:为权重系数。将轨迹优化计算模块中优化问题表述为图 中边的流问题,表示边的数量,表示图中节点的数量,流问题的决策变量表述为,()兵 工 学 报第 卷轨迹树一步扩展算法流程:当前车辆状态:扩展列表:轨迹树:扩展数量:轨迹树:扩展列表 :()()(
13、)(,)(,)()()(,)(),图 轨迹树一步扩展算法伪代码 式中:表示源节点,表示目标节点;表示节点连接经过该边,表示节点连接不经过该边。为决策变量的求解构建如下目标函数:,(,)()有人车轨迹要保证轨迹树根结点位于车辆初始位置,并保证流入和流出某节点的边的数量一致,构建如下优化问题求解决策变量,(,),为根节点,为汇点,其他|节点()上述决策变量求解得到有人车的预测轨迹。.模型预测控制器设计为实现编队任务下的无人车辆跟踪控制,本节将设计模型预测控制器。在无人履带车辆被控系统微分方程 (,),为状态量,为控制量,下文相同符号均为相同含义。参考信息 和参考期望间距 已知的情况下,求解控制率,
14、使得 (,)满足如下条件:,存在,使得,()同时建立一般形式的控制系统为 (,)、,为状态量可行集,为控制量可行集。在参考点(,)处进行 阶泰勒展开,可得(,)()()()参考点上的任意值均满足系统微分方程,有(,)()控制器需要离散化模型,此处使用前向欧拉法,在第 个控制周期得?()式中:|,为采样时间;|。对于基于瞬时转向中心的运动学模型,泰勒展开作差,可得?,|,|,|()参考点处 ,同时对系统进行离散化,得?()第 期参数自优化的有人与无人车辆编队鲁棒模型预测控制式中:,为适当维度单位矩阵;。控制器需精确跟踪期望路径,即令无人车辆的实际横向偏差、航向偏差最小,控制器选取路径跟踪的代价函
15、数项设计为(,)()控制器需以尽量小的无人车控制量完成任务,选取控制量的代价函数项为()式中:|,表示控制量权重系数。由于两个控制量均为履带卷绕速度,两权重系数相同。将两个控制量的权重系数设为相同值。控制器还需考虑车辆行驶的平顺性及稳定性,即前后采样时间内的控制量变化不能太大,由此设计目标函数为()()()式中:|,为相邻两个时刻控制增量的权重系数。最后控制器需考虑无人车辆的间距保持功能,即无人履带车和其他车辆节点的实际间距与预设的期望间距差异最小,由此设计代价函数为()式中:为距离偏差权重参数;为实际间距与期望间距的跟踪误差。从而可得总的代价函数为 ()同时由于控制量及增量需要符合执行机构的
16、客观要求,因此对控制量及控制增量不等式约束如下:,?,(),?,()则在当前控制周期 最终发送给车辆底层执行器的控制量如下:?,()即将控制序列的第一个控制量?,与参考控制量,的和作为控制器的输出作用于被控系统完成当前周期 的控制,并在下个控制周期重复上述过程。参数自适应优化的鲁棒控制器.鲁棒局部反馈控制器鲁棒局部反馈控制器用于消除有人领航车紧急加减速和紧急转向控制输入、无人跟随车系统模型不确定性和外部环境的扰动。基于.节建立的无人履带车运动学模型建模结果,设具有建模误差的实际系统为?()式中:为实际系统未建模部分的系统扰动误差。控制器对应名义系统为?()将实际系统与名义系统做差,可得表征扰动不确定系统的误差转移方程为,()式中:,?;,?。为保证上述系统的渐进稳定性,设计鲁棒控制器线性状态反馈控制率为,并假设扰动误差 ,则扰动不确定系统可表述为,(),()式中:为具有单位协方差的零均值白噪声;为有界噪声标准差矩阵。为使系统极点均位于(,)内,(,)表示左半复平面的中心在 ()、半径为()的圆盘,则可以通过求解如下线性矩阵不等式问题。()|()当存在对称正定矩阵 和矩阵 使得该问题有解