1、投稿网址:http:/ 沙 理 工 大 学 学 报(自 然 科 学 版)Journal of Changsha University of Science&Technology(Natural Science)Vol.20 No.3Jun.2023DOI:10.19951/ki.16729331.20220514002文章编号:16729331(2023)03014613引用格式:黄益绍,王喜博,陈润泽.基于信号博弈的道路交通隐性违法行为研究 J.长沙理工大学学报(自然科学版),2023,20(3):146-158.Citation:HUANG Yishao,WANG Xibo,CHEN Ru
2、nze.Study on implicit illegal behavior of road traffic based on signaling game J.J ChangshaUniv Sci Tech(Nat Sci),2023,20(3):146-158.基于信号博弈的道路交通隐性违法行为研究黄益绍1,王喜博1,2,陈润泽1(1.长沙理工大学 交通运输工程学院,湖南 长沙410114;2.郑州综合交通运输研究院有限公司,河南 郑州450003)摘要:【目的】方便道路交通安全管理部门更有效地开展交通违法治理,遏制道路交通中的隐性违法行为,实现道路交通的有序、安全、畅通。【方法】将酒后驾
3、驶、无证驾驶等无法通过视频监控设施完成线上执法的交通违法行为定义为道路交通隐性违法行为。利用信号博弈理论,对驾驶员与交通执法者的决策互动过程进行建模,模型中引入了检测器机制,使交通执法者依据检测器输出结果和驾驶员信号来进行决策;推导交通执法者与驾驶员博弈双方的混同均衡策略和准分离均衡策略,揭示在不同先验概率下驾驶员和交通执法者均衡策略的变化情况。【结果】仿真结果表明:交通执法者两种信任度的倾向程度和质量对供驾驶员选择的纯策略先验概率区间、驾驶员自身实际类型的概率以及交通执法者的均衡效用均有重要影响。【结论】本研究基于信号博弈模型,从交通执法者的决策机理角度,对道路交通隐性违法行为的治理提出具有
4、针对性的建议。关键词:城市交通;道路交通隐性违法;完美贝叶斯纳什均衡;信号博弈;数值仿真中图分类号:U491.4文献标志码:A0引言随着机动车保有量和驾驶员数量的快速增长,道路交通违法行为呈现出多样性的特点,交通执法者(以下简称执法者)面临着新的挑战1。公安部发布的 2020 年 5 月份的交通违法数据显示,交通非现场执法与现场执法所查处的违法行为的数量之比约为 4 1。在现阶段,城市交通执法管理总体呈非现场执法查处率高、现场执法查处率低的特征2。本研究将在机动车道路交通违法行为中无法通过视频监控技术来完成线上执法,而需要交通管理人员通过现场执法来查处的行为定义为道路交通隐性违法行为。在机动车
5、保有量、驾驶人员数量、交通违法行为数量持续增长的情况下,很多学者采用不同方法探究遏制交通违法行为增长趋势的措施。在交通违法行为影响因素方面,范浩轩等3采用卡方检验分析了违法行为的潜在因素;张光南等4结合 GIS 技 术 及 系 统 聚 类 法 分 析 了 风 险 因 素;AURORA 等5和 OPPENHEIM 等6均基于机器学习揭示了部分因素与违法行为的相关性。在违法行为与交通事故相关性方面,有研究基于关联分析算法、对应分析法等深入挖掘了交通事故和交通违法行为之间的内在关联7-9。这些研究均依赖于电子执法数据,而对于数据量小且数据难以获取的交通隐性违法行为则束手无策。从执法技术的角度来看,不
6、少学者针对交通隐性违法行为设计了车载检测装置10-12,但通过此类设施直接完成执法仍很难。从交通参与者的角度来看,执收稿日期:20220514;修回日期:20220620;接受日期:20220627基金项目:湖南省自然科学基金项目(2022JJ30619);长沙理工大学大学生创新创业训练项目(201867)通信作者:黄益绍(1976)(ORCID:0000000256869317),男,副教授,主要从事交通运输规划与管理方面的研究。E-mail:投稿网址:http:/ 1:N=D,E为博弈双方组成的集合,D代表驾驶员,为信号发送方,E代表执法者,为信号接收方18。驾驶员在自然状态下的类型空间为
7、=0,1,0代表不存在交通违法行为的驾驶员,1代表存在交通违法行为的驾驶员。驾驶员自身类型 为私人信息,执法者不了解驾驶员类型,只知道其概率分布为p,且 p()=1。假设 2:驾驶员基于自身类型,从信号空间集合 M=0,1中选择信号 m 发送给执法者,其中,0代表没有异常驾驶行为,1代表有异常驾驶行为。驾驶员若选择混合策略,会以一定的概率选择 m。用D表示驾驶员的策略空间,DD表示驾驶员的策略,则D(m|)表示当驾驶员类型为时,其发送信号m给执法者的概率。策略空间的表达式为:D=D|,m MD(m|)=1;,m,D(m|)0(1)假设 3:车内检测器只具备检测、通信与定位的功能,执法者具备执法
8、和查处的能力。当检测器判定驾驶员有违法驾驶行为,即认为 为 1 时,会发送 w=1 的信号给执法者;当检测器判定驾驶员不存在违法驾驶行为,即认为为0时,会发送w=0的信号给执法者,且 wW=0,1。执法者执法时会配置一个信号接收器,车内检测器只有在侦测到附近存在信号接收器时,才会开启检测功能;否则,保持关闭状态。检测器在检测完交通违法状况后,会将检测结果、驾驶员信息和具体位置等数据发送给附近的执法者。检测器的检测存在一定的错误率,不能完全准确地识别出驾驶员的类型,但可提供信息给执法者参考。假设其检测结果的正确率为,即检测器判定的驾驶员类型与其真实的类型相符的概率为,即p()w=。假设 4:执法
9、者在接收到驾驶员发送的信号 m和检测器的检测结果 w 后,会综合考虑后再采取行动。在理想条件下,检测器检测结果就是驾驶员的实际类型,且执法者严格按照 m 和 w 来判定对驾驶员所发信号的信任程度。若检测器发出的信号 w 和驾驶员发出的信号 m 相同,说明驾驶员发出的信号m与驾驶员的实际类型相符,此时执法者对此信号 m的信任度 e=1;若检测器发出的信号 w 和驾驶员发出的信号 m 不同,说明驾驶员发出的信号m与驾驶员的实际类型不符,此时执法者对此信号 m 的信任度 e=0。这个过程反映了执法者的决策机理。随后,执法者将根据信任度e和信号 m决定是否执法。执法者产生正确的信任度e的概率为 (e|
10、w,m),其中 eE=0,1。但在该执法机制中,由于检测器的局限性,起主导作用的仍是执法者自身,一方面执法者需结合道路交通实际运营状况,另一方面其也需结合自身的主观意愿,并非一定按照理想条件形成信任度(也有可能形成错误的信任度 e)。假设 (0|1,0)=(0|0,1)=,即所形成的信任度为 0是正确的概率为,那么(1|1,0)=(1|0,1)=1-,即所形成的信任度为 1是错误的概率为 1-;假设 (0|1,1)=(0|0,0)=,即所形成的信任度为 0 是错误的概率为,那么(1|1,1)=(1|0,0)=1-,即所形成的信任度为 1是正确的概率为1-。通常对于执法者来说,所形成的信任度为
11、0是正确的概率要大于所形成的信任度为0是错误的概率,即。147投稿网址:http:/ 沙 理 工 大 学 学 报(自 然 科 学 版)2023年6月假设 5:执法者会根据信号 m 和对该信号的信任度 e选择一个行动 aA=0,1,1代表进行执法,0代表不进行执法。用 EE表示执法者的混合策略,即在给定信号 m 的条件下,以一定的概率选择行动 a,则执法者选择混合策略的概率为E(a|m,e),其策略空间如式(2)所示。在信号 m的基础上,执法者形成了一个对驾驶员类型的信念。对于任意的,m,设 E:0,1,E(|m,e)给出了执法者在收到信号 m 和产生信任度 e时判断驾驶员类型为的概率,执法者通
12、过E来选择具体的行动。E=E|m,e,a AE(a|m,e)=1;e,m,a,E(a|m,e)0(2)假设 6:uD:MAE 表示驾驶员的效用函数,uD(,m,a)为类驾驶员发送信号m给执法者,执法者采取行动 a时驾驶员的效用。类似地,uE:MA表示执法者的效用函数,uE(,m,a)为 类驾驶员发送信号m给执法者,执法者采取行动a时执法者的效用。假设驾驶员发送不同信号的成本是一样的,那么uD(,0,a)=uD(,1,a)。执法者正确选择 a=时的效用高于选择 a时的效用,即uE(1,m,0)uE(1,m,1),uE(0,m,1),可得:(1-)E0/(1-)E1+(1-)E0 E0/(E0+E
13、1),E0/(E1+E0)(1-)E0/(1-)E0+(1-)E1。当 1-时,平衡状态的边界条件存在以下关 系:E0/(E1+E0)(1-)E0/(1-)E1+(1-)E0 (1-)E0/(1-)E0+(1-)E1 1-时,平衡状态的边界条件存在以下关 系:(1-)E0/(1-)E1+(1-)E0 E0/(E1+E0)E0/(E0+E1)(1-)E0/(1-)E0+(1-)E1。当1-时,执法者形成信任度 0的概率大于形成信任度 1的概率,称这类执法者为激进型执法者,这类执法者倾向于不相信驾驶员发出的信号。为了行文的简洁,下文仅以保守型执法者(p(0);在区间内,p(1)接近于1,驾驶员的类
14、型=1占主导地位。图2均衡状态下p(1)的区间分布Fig.2Interval distribution of p(1)in equilibrium state对于每个条件下的混同均衡,执法者的最优策略E*(1|m,e)在平衡路径上的分布见表2。表2执法者的混同均衡策略Table 2Confusion equalization strategies of trafficenforcement officers区间E(1|0,0)01111E(1|0,1)00011E(1|1,0)00001E(1|1,1)00111在区间内,对于所有的 m 和 e,执法者选择的最优策略均为 E*(1|m,e)=0
15、;在区间内,对于全部的 m 和 e,执法者选择的最优策略均为E*(1|m,e)=1;在 中 间 区 间 内,执 法 者 选 择E*(1|m,1)=m且 E*(1|m,0)=1-m,也就是说,若 e=1,则执法者相信驾驶员所传递的信号 m;若 e=0,则执法者不相信驾驶员所传递的信号m。在求出执法者的混同均衡策略后,要检验是否每种可能的策略对驾驶员来说都是最优的,这取决于在驾驶员偏离平衡路径后发送相反的信号时执法者的策略选择,且执法者的行动选择取决于其对偏离信号的信念E。因此,重要的是要判断是否存在使每一种混同均衡策略对驾驶员来说均为最优的信念E。当驾驶员发送信号 m 后,若E*()1|m,0=
16、1-E*()1|m,1,即执法者的反应a取决于信任度e。执法者在 e=1的情况下对发出信号 m 的驾驶员采取行动 a=m,在 e=0的情况下对发出信号 m的驾驶员采取行动a=1-m。在平衡路径上,类型为m的驾驶员的效用为:uD(m,m,1-m)(0|m,m)+uD(m,m,m)(1|m,m)=uD(m,m,1-m)+uD(m,m,m)(1-)(10)类型为1-m的驾驶员的效用为:uD(1-m,m,1-m)(0|1-m,m)+uD(1-m,m,m)(1|1-m,m)=uD(1-m,m,1-m)+uD(1-m,m,m)(1-)(11)现在,考虑执法者对非平衡路径信息的可能响应,若执法者在 e=0和 e=1偏离平衡路径时采取相同的行动,则不可能存在一种贝叶斯纳什均衡。在这种情况下,其中一种类型的驾驶员可以通过偏离信号 1-m 来进行欺骗。若执法者在 e=1的情况下对发出信号 1-m的驾驶员采取行动 a=m,在 e=0的情况下对发出信号 1-m 的驾驶员采取行动 a=1-150投稿网址:http:/ e=1的情况下对发出信号 1-m的驾驶员采取行动 a=1-m,在 e=0的情况下对发出信号 1