1、第 卷 第 期兵 器 装 备 工 程 学 报 年 月 收稿日期:;修回日期:基金项目:国家自然科学基金项目()作者简介:王梦阳(),男,硕士,:。通信作者:贾录良(),男,博士,讲师,:。:基于博弈理论的认知星地网络抗干扰信道选择方法王梦阳,贾录良,颜培杰,陈亚明(航天工程大学 航空信息学院,北京;中国人民解放军 部队,北京;中国人民解放军 部队,青海 格尔木)摘要:针对认知星地网络频谱稀缺、易受干扰的特点,研究了认知星地网络中的抗干扰信道选择问题。首先考虑到地面认知用户受到多方面干扰,根据用户和干扰之间的主从关系将其构造为 博弈。同时针对用户间互扰呈现局部影响的特性,又将用户间关系构造为图博
2、弈,并从理论上证明上述博弈均衡的存在性。然后为了获得抗干扰信道选择问题的均衡解,提出一种基于局部信息交互的分层学习算法,在该算法中,认知用户不仅考虑自身吞吐量,还考虑邻居用户的吞吐量,通过局部最优实现全局最优。经过仿真分析,从实验层面验证了所提算法的收敛性和有效性。关键词:认知星地网络;抗干扰;博弈;图博弈;局部信息交互本文引用格式:王梦阳,贾录良,颜培杰,等 基于博弈理论的认知星地网络抗干扰信道选择方法 兵器装备工程学报,():,():中图分类号:文献标识码:文章编号:(),(,;,;,):,:;引言随着信息技术的快速发展,频谱稀缺和利用率低下的冲突日益凸显,基于认知星地系统之间的动态频谱共
3、享,可以有效提升频谱利用效率,增强星地网络的信息服务能力。文献研究了基于波束成形技术的星地网络的频谱共享问题,其中卫星上行链路用户为主用户,地面下行链路用户为认知用户。文献利用中继链路,实现卫星网络与地面认知用户的频谱共享。目前关于认知星地网络频谱共享的研究很多,但不少研究内容考虑因素相对不全。文献研究了基于多波束认知卫星网络的功率控制和信道选择问题,认知用户之间不仅相互干扰,而且受到多波束卫星通信系统的同信道干扰影响。文献提出了一种新颖的认知卫星网络设计,地面认知用户根据频谱保护距离的不同,采用不同的频谱接入策略,构造了一个多信道访问博弈和一个功率优化博弈。然而,这些研究忽略了外部恶意干扰的
4、影响。文献研究了动态频谱接入网络中的抗干扰会合问题。文献研究了在类似模拟式攻击条件下主用户的信道选择策略。而在这些研究工作中,没有充分考虑用户间互扰问题。文献研究了功率控制抗干扰问题,并将其建模为一个非零和博弈。文献将高斯衰落信道条件下抗干扰决策问题建模为一个博弈问题,用户和干扰在功率受限条件下追求自身效用最大化。而这些研究工作中都隐含一个假设,即所有用户同时行动,没有考虑用户和干扰之间的分层行为特征。文献研究了复杂干扰条件下信道选择抗干扰决策问题,并将其建模为一个 博弈,该博弈能够同时考虑用户和干扰间的竞争以及用户内部间的竞争,分析了该博弈的性质和 均衡的存在性,提出了一种基于随机学习理论的
5、分层学习算法。除此之外,为了从不同角度刻画用户之间的关系,使系统整体效果最优,文献采用图形博弈的方法,研究了小蜂窝网络的负载感知频谱接入问题。文献研究认知无线电网络中分布式信道选择的全局优化问题,提出了 种特殊的局部交互博弈:局部利他博弈和局部拥塞博弈,通过局部信息交互,实现全局最优,但研究内容也忽略了恶意干扰的影响。本文主要工作和创新点如下:)研究了认知星地网络中的抗干扰信道选择问题。在地面网络中,认知用户不仅受到用户间的互扰、多波束卫星通信系统的同信道干扰,还受到外部恶意干扰的影响。考虑到认知用户和恶意干扰之间有明显的分层行为,将该抗干扰信道选择问题构造为一个 博弈,该博弈同时考虑 个层面
6、的竞争:外部恶意干扰与用户之间的竞争和用户内部间的竞争,并证明了它的上层子博弈是一个精确势博弈,至少具有一个 解。)针对认知用户间互干扰呈现局部影响的特性,提出局部理性的假设,因此把下层子博弈构造为图博弈 局部影响博弈。每个认知用户在充分考虑各方面干扰的前提下,在做决策时需同时考虑自身的效用和邻居用户的效用,通过局部信息交互来实现系统最优,同时证明了该博弈是一个精确势博弈,至少具有一个 解。)针对认知用户抗干扰信道选择策略,提出了基于局部信息交互的分层学习算法。仿真结果表明,所提分层学习算法收敛性能突出,且与最优响应算法和随机选择算法进行对比,该算法的系统平均吞吐量接近最优 解。系统模型与问题
7、建模 系统模型本文考虑一个多波束卫星通信系统,每个波束服务于一个特定区域。卫星及其固定卫星接收站是主用户,而地面用户是认知用户,每个认知用户都对应于一个由发射机和接收机组成的通信链路。认知用户通过频谱感知或查询本地数据库的方式,来获取主卫星用户的可用空闲频谱信息。本文考虑不存在中心控制器的情况,系统中用户数为 个,授权信道数为 个,认知用户使用机会频谱接入方式,自主地竞争可用空闲信道,即当授权信道空闲时,认知用户接入信道进行数据传输;反之,认知用户不能接入授权信道,必须保持静默。图 系统模型图 由于认知用户在空间上任意分布,用户间的互扰呈现局王梦阳,等:基于博弈理论的认知星地网络抗干扰信道选择
8、方法部影响的特性。为了定量描述认知用户之间的局部互扰特性,引入干扰图的概念。认知用户和干扰图上的顶点一一对应,而 个用户之间的距离决定了干扰图的边。具体地,当用户之间的距离小于门限时,顶点之间由一条边相连接。当选择一样的信道时,干扰图上相邻的用户之间会互相干扰。如图 所示,图 中包含 个认知用户,用户间的互干扰呈现局部影响的特性。比如,若 个认知用户选择同一信道,则用户 只会对用户 产生干扰,却不会对用户,和 产生干扰。图 网络拓扑图 问题建模本文假设认知用户能够感知和获得全部信道信息,即所用信道的状态已知。但由于设备条件受限,用户在同一时间只能接入一个信道进行传输。针对认知用户上述特点,本文
9、考虑基于时隙 的传输模型。具体来讲,当认知用户进行通信时,它以概率 接入信道,以 概率保持静默。记认知用户 的可用信道集为,即:,()假定用户 选择接入信道,则它能获得的吞吐量为:(,)()(,)()式()中:为用户 的邻居用户集合;为外部恶意干扰;为多波束卫星通信系统的同信道干扰。(,)是指示函数,可表示为:(,),()()()()那么,系统的网络吞吐量可表示为:()(,)()基于上述分析,本文考虑的优化目标是当系统的吞吐量最大时,所选的最优信道选择组合,即:()该信道选择问题是组合优化问题,针对这类问题,可以使用穷举方法进行求解,但穷举法计算复杂度很高,而其他一些启发式算法,比如贪心算法等
10、,无法得到系统最优解。因此,需要研究能获得最优解以及复杂度较低的求解方法。抗干扰信道选择博弈 博弈模型本文研究认知星地网络场景中,地面认知用户信道选择抗干扰决策问题,认知用户考虑外部恶意干扰,多波束卫星通信系统的同信道干扰和用户间互扰等多方面影响。从干扰效果来说,多波束卫星通信系统的同信道干扰可以归结为“非智能”的外部恶意干扰或者“特殊”的背景噪声。因此,可将该问题构造为一个 博弈。博弈也叫分层博弈,是用来建模与分析领导者()和跟随者()的分层决策交互过程,能够较好地建模先后、主从的交互关系,从数学上它可表示为,。其中,表示认知用户集,表示外部恶意干扰,表示认知用户策略集,表示恶意干扰的策略集
11、,表示认知用户 的效用函数,表示恶意干扰的效用函数。该博弈能够同时考虑 个层面的竞争:外部恶意干扰与认知用户之间的竞争和认知用户内部间的竞争。假设用户为,干扰为,认知用户和干扰各自独立地进行信道选择,并且追求自身效用的最大化。为了分析求解该博弈的 均衡,采用经典的 博弈分析方法逆向递推法,即先分析下层子博弈,再分析上层子博弈。定义:(,)是一个纯策略 均衡,当且仅当无任何用户者能通过单方面改变策略而增加效用函数,即:(,)(,),()定义:假如存在某势能函数 ,使得对于任意用户,任意策略 和,下面的等式成立:(,)(,)(,)(,)()则可称该博弈为精确势能博弈,即是任何一个用户单方面偏离所引
12、起的效用函数的变化趋势与势函数的变化趋势是一致的。下层子博弈针对认知用户间互扰呈现局部影响的特性,提出局部理性的假设,将该问题构造为图博弈 局部影响博弈,研究如何分布式求解系统最优解。首先,定义下面动作图。定义:动作图 (,)由以下几要素构成:)是节点集合,在本节中每个节点代表一个地面认知用户对。)对每一个节点,记它选择的动作为,其中 是可用行动集,即是策略集。)是边的集合。如果节点 是 的邻居,那么它们之间由一条连接的边(,)。根据上面所述,定义图博弈模型如下。兵 器 装 备 工 程 学 报:定义:图博弈由 (,)确定,其中:)是一个选择图,其中的每一个节点对应一个博弈参与者。)是博弈参与者
13、的效用函数。综上,可定义下层子博弈为:,()式()中:为认知用户数;为认知用户的可用信道集;为认知用户与邻居连接的边的集合;为认知用户的效用函数。本节考虑的博弈模型,突破传统的博弈模型,一般博弈参与者按照利己主义的原则进行决策,只考虑个体最大化回报,而这种决策方式往往难以实现全局最优。本节参考自然界中的局部互利行为,生物个体在做决策时会考虑其邻近的个体。于是,本文提出一种基于局部互利的频谱接入方式,该博弈的效用函数定义为:(,)(,)(,)()式()中:(,)为认知用户 所获得的吞吐量;(,)为认知用户 的邻居用户所获得的吞吐量。当认知用户 进行决策时,它不仅考虑自己,还同时考虑它的邻居用户。
14、以图 为例进行说明,用户 考虑用户、用户 和用户 的吞吐量之和,用户 考虑用户、用户、用户 和用户 的吞吐量之和,用户 考虑用户、用户 和用户 的吞吐量之和,用户 考虑用户、用户、用户、用户和用户 的吞吐量之和,而用户 考虑用户 和用户 的吞吐量之和。基于上述效用函数,该博弈的优化目标为:(,)()均衡分析定理:局部影响博弈 是一个精确势能博弈,至少有一个纯策略的纳什均衡。证明:构造下列势能函数:(,)(,)()式()中,(,)是认知用户 获得的吞吐量。该势能函数与公式()定义的网络吞吐量形式相似。若任意认知用户 单方面把它的信道选择由 改为,则该认知用户 的效用函数的变化量为:(,)(,)(
15、,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)()整合上式,令:(,)(,)(,)(,)(,)(,)()(,)(,)(,)(,)(,)(,)()上式整合后为:(,)(,)()式()中:表示认知用户 单方面改变信道选择后,认知用户 的效用变化量;表示认知用户 单方面改变信道选择后,认知用户 的邻居用户的效用变化量。而认知用户 单方面改变信道选择,导致势能函数的变化量为:(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(),(,)(,)(),(,)(,)(),(,)(,)()整合上式,令:(,)(,)(,)(,)(,)(,)()(),(,
16、)(,)(),(,)(,)(),(,)(,)()上式整合后为:(,)(,)()式()中:表示认知用户 单方面改变信道选择后,邻居用户获得吞吐量;表示集合 从集合 中删除。由于王梦阳,等:基于博弈理论的认知星地网络抗干扰信道选择方法认知用户 只考虑其相邻用户的效用,那么有:()又因为()所以,可知下面的等式成立,即:(,)(,)(,)(,)()综上分析可知,任意认知用户 单方面改变信道选择,导致该用户的效用函数变化量和导致的势能函数变化量相同。所以,根据定义 可知:该博弈 是一个精确势能博弈,至少存在一个纯策略纳什均衡。精确势能博弈有很多特殊的性质,部分如下:)任何精确势能博弈至少有一个纯策略 均衡;)能函数的全局最优解或者局部的最优解是一个 均衡。基于上述 条性质,定理 证毕。上层子博弈本文将抗干扰信道选择问题构造为 博弈,干扰作为领导者,首先动作,先一步选择策略。由于认知用户考虑局部理性,在考虑自身效用的时候,同时还考虑邻居用户的效用。因此,干扰也需要同时考虑对认知用户和其邻居用户的干扰效果。则上层子博弈可以定义为:,()式()中:为恶意干扰;为恶意干扰的信道集(策略集);为恶意干扰