1、第 卷 第 期运筹与 管理,年 月 收稿日期:基金项目:国家自然科学基金资助项目();辽宁省教育厅科学研究经费项目(,);辽宁工程技术大学学科创新团队项目()作者简介:崔铁军(),男,辽宁沈阳人,副教授,安全工程博士,力学博士后,安全科学博士后,研究方向:系统安全及系统故障演化;李莎莎(),通讯作者,女,辽宁盘锦人,博士,副教授,研究方向:安全系统工程及安全管理。事件故障状态量子博弈过程的参与者收益研究崔铁军,李莎莎(辽宁工程技术大学 安全科学与工程学院,辽宁 葫芦岛;辽宁工程技术大学 工商管理学院,辽宁 葫芦岛)摘要:为了解事件故障状态量子博弈过程中参与者收益随各影响因素的变化情况,提出在空
2、间故障树(,)框架内,以事件故障状态为对象,对参与者收益进行研究。事件故障状态使用量子态表示,管理者和操作者的不同行为对事件故障状态的作用使用博弈表示。考虑因素包括安全产出价值、安全收益分配系数、安全措施成本。研究了事件故障状态与量子博弈的关系;纠缠与非纠缠态下的参与者收益;参与者收益受到各因素影响的特征等。研究得到了管理者和操作者考虑纠缠和非纠缠态的收益函数。结合 理论方法,提出了针对收益的因素重要度、因素联合重要度、收益风险区和安全区、因素区域重要度。理论上 可用于量子博弈参与者收益的分析。也论述了使用因素空间理论解决该问题的可能性。关键词:安全系统工程;空间故障树;事件故障状态;量子博弈
3、;参与者收益中图分类号:文章标识码:文章编号:():,(,;,):,(),:;引言量子博弈过程的特点是将系统状态及参与者的策略等表示为量子态形式。这样可将博弈过程中各种参与者行为的博弈过程充分展示,即参与者采用不同策略对收益的影响。利用量子态表示了多种参与者的多种行为对于收益变化的作用和影响。实际上,对于事件而言,将事件是否安全完成作为目标,参与者也可分为两派,拥有并管理事件的管理者及具体操作完成事件的操作者。双方也有各自的安全行为和不安全行为。当然双方采取不同行为给自身带来的事件完成后的收益也不同。他们的安全和不安全行为策略组合有四种状态。按照一般的博弈论,双方都采用安全行为必将获得最大收益
4、;都采取不安全行为受益最小;但双方之一采用不安全行为,另一方采用安全行为则收益更小。进一步的,当双方有信息通讯时可调整各自策略,无信息通讯时只能各自完成策略。因此对于事件故障状态的分析,即是双方的博弈过程,也是有无信息通信的量子纠缠过程。那么由众多事件组成的系统故障演化过程的系统故障状态与这些事件的故障状态有密切关系。因此在研究系统故障状态之前必须了解事件故障状态,并进行描述和分析。相关事件和系统的故障状态研究目前已出现一些。较新的包括量子态与故障状态的研究,例如 能量矩和改进量子粒子群神经网络的故障诊断,的 故障诊断,量子计算和免疫优化结合的电网故障定位,多尺度量子熵的信号故障特征提取,机械
5、故障稀疏特征相似性度量优化;博弈方法与故障状态的研究,例如主从博弈理论的电网多能互补协调故障研究,博弈论综合法的城市供电系统安全,合作博弈的电网支路脆弱性研究,考虑共因故障的系统组成单元故障分析,完全信息序贯博弈模型的变压器保护策略;智能分析方法与故障状态的研究,例如灰色关联理论下的移动机器人故障诊断,故障本征证据和特征指标的变压器故障状态研究,轴承故障的排列熵特征提取与模糊识别,改进残差神经网络的滚动轴承故障诊断,扩张状态观测器的运输机多故障容错研究,供应链中损失和浪费的量子博弈方法,基于量子博弈安全性的密码分析与改进,量子博弈在信息通讯加密方面的研究,使用量子博弈的设备错误修正技术。这些研
6、究方法在各自领域中对故障状态的研究都较为有效,但缺乏系统层面的研究方法和策略。就上述问题而言,参与者的目标是获得收益,针对事件故障状态而言即是安全收益。参与者存在安全和不安全行为策略,同时事件故障状态至少存在四种形式,且行为策略的实施也要考虑安全投入成本、安全效益分配等因素。因此上述这些方法都难以在这种条件下对参与者收益进行分析。针对上述情况,作者提出使用量子态表示事件故障状态,使用博弈论研究参与者行为策略对事件故障状态的影响,在 理论框架内研究参与者安全收益。同时借助 的方法提出了一些分析影响收益因素重要性的方法。研究认为多因素影响下的量子博弈参与者收益分析可应用 中方法,也完全可能使用因素
7、空间理论进行研究。事件故障状态与量子博弈系统 故 障 演 化 过 程(,),是作者提出的描述系统故障发展过程中各事件、逻辑关系及影响因素的相互作用关系。空间故障网络理论(,)用于描述和研究。中最重要的是事件、逻辑和因素,对应的 是节点及有向线段。的发生源于边缘事件的发生,经过过程事件的传递最终达到故障的结果,即最终事件。因此研究 中的事件,特别是边缘事件的故障发生特点是关键。进一步地,将边缘事件的故障特点简称为事件故障状态,进而研究单一事件故障状态。对事件故障总有对立合作的两方存在,一是管理者,二是操作者。一般拥有系统,目的是保证系统运行,从而得到收益,同时监督 安全完成事件。一般被 雇佣,目
8、的是完成事件从而获得收益,希望减少自身行为的投入成本。和 可采取安全行为 和不安全行为。的 是根据规章制度履行职责,对 进行监督;的是不充分履行或不履行对 的监督检查。的是无论是否 检查,仍然按照规章制度安全完成事件;的 是只为完成事件,考虑降低安全行为甚至不采取安全行为完成事件。很显然 和 采取 的成本必将高于采取 的成本,但很难确定采取 就比 获得更多的安全收益,因此双方都存在侥幸心理。这构成了以事件故障状态为对象,参与者收益目标,和 采取不同行为获得不同收益的博弈过程。给出基本参数,:操作者;:管理者;安全行为,用量子态 表示;不安全行为,用量子态 表示;、和 都是 实施不同行为,实施对
9、策,获得的收益;、和 都是 实施不同行为,实施对策,获得的收益;:安全产出价值,在安全的生产过程中的产出价值量,类比于总产值;:安全收益分配系数,取值范围,表明从安全产出价值 中获得的安全收益;:安全措施成本,表明实施安全行为所需的成本。需要说明的事,由于目标是事件的安全性,即事件安全收益,因此如下确定的参与者收益是期望安全收益,在不引起歧义时统称为参与者收益。现有博弈研究主要围绕参与者及其行为展开,进而得到参与者收益,但缺少在安全和系统故障方面的类似研究。文中事件故障状态的研究第 期 崔铁军,等:事件故障状态量子博弈过程的参与者收益研究不但需要考虑参与者 和,及行为 和,还需考虑安全产出价值
10、、安全收益分配系数、安全措施成本。参考类似的博弈研究 可得到事件故障状态的量子博弈收益矩阵,如表 所示。表 事件故障状态的量子博弈收益矩阵收益操作者 安全行为,操作者 不安全行为,管理者 安全行为,(),管理者 不安全行为,表 可知双方都有两种行为可以实施。双方都采取 后双方收益为()。可见无论是双方总收益或是 和 都有可能大于,这是最理想情况。当双方都采取 时,即双方都采取不安全行为很可能导致事件无法完成,甚至出现损失(这里不考虑)。当一方采取,但另一方采取 时,当事件能完成时,采取 的一方获得更大收益,一方收益不变;当事件未完成时,采取 的一方损失更小,一方损失不变。这说明无论结果如何采用
11、 的一方更有优势。关于损失可折合成安全措施成本以 和 的形式呈现。纠缠与非纠缠态的参与者收益表 中四种参与者博弈状态可分别使用量子态 、表示。结合文献,对类似问题的研究,给出如下参与者收益推导过程。设纠缠算子:,无纠缠,有纠缠,纠缠达到最大。这里纠缠的含义表示 和 之间存在信息联系,这使得一方采取措施后,另一方将迅速调整来应对,因此双方采行为策略是纠缠的。对应的,当两者间没有信息联系,双方将凭借自身情况采取策略,这是双方行为不随对方行为的变化而改变,是非纠缠的。设 ,为单位矩阵,那么纠缠算子如式()所示,同理非纠缠算子如式()所示。参与者策略使用量子态表示的酉算子有两种形式,()()()()(
12、)或(,)()()()(),。由于 和 对量子态的表示特点,这里使用第二种形式表示 和 的策略。策略,(,)策略 (,)其中:,。首先考虑纠缠情况,纠缠算子 ,。设初始状态为事件故障状态的安全状态 。先通过纠缠算子 再通过解纠缠算子,对初始状态 进行变换得到经过一次博弈的事件故障状态 ,如式()所示。参与者 和 执行 和 的行为概率分别为:,。的行为收益如式()所示。的行为收益 如式()所示。考虑非纠缠态情况,纠缠算子 ,。设初始状态为事件故障状态的安全状态 。先通过纠缠算子 再通过解纠缠算子,对初始状态进行变换得到经过一次博弈的事件故障状态 。的行为收益 如式()所示。的行为收益 如式()所
13、示。参与者收益特征分析由式()()所示,当考虑纠缠态时,的收益函数为 (,),收益(,);考虑非纠缠态时,的收益函数 为 (,),收 益(,)。当然他们也与、相关,但这些因素是在确定参与者收益之前设定的,不参与收益变化和特征分析。进一步,借助 的多因素分析方法可对参与者收益与因素关系的特征进行分析。由于四个收益函数结构类似,这里以 的收益函数(,)为例进行说明,给出计算方法。但由于多维函数难以使用直观图像表示,这里不给出函数变化图像。将,定义运 筹 与 管 理 年第 卷为影响 的因素,那么,与 组成 维空间。这些因素同时变化的叠加形成空间分布曲面,如下所有定义均基于该曲面进行分析。因素重要度:
14、(,),。确定某一因素变化导致收益变化的程度,即该因素对收益的影响,也可理解为收益在该因素维度的变化趋势。因素联合重要度(,),。确定多个因素同时变化导致收益变化的程度,即收益在这些因素维度的变化趋势。收益风险区:,(,),。其中 是设定的收益阈值,小于该值对参与者存在收益风险;表示相应因素的取值范围。确定 (,)时可能的所有多维空间区域。同理收益安全区为:,(,)。但应注意,但 ,即 是全集,代表整个多维空间。因素区域重要度:(,),即 在指定区域 内的积分值。确定在各因素指定变化范围内的全部收益。其意义在于,因素的变化总是稳定在一个区间内,单一时刻各因素的组合并不一定能反应区域内真实收益情
15、况,因此从区域角度研究收益情况更符合实际。事件故障状态及其分析方法是多样的,上述研究主要是结合 和量子博弈进行的。量子态表示事件故障状态的多样性,博弈表示 和 以收益为目标的行为策略。最终得到了在,因素影响下的参与者收益函数,并使用 理论的一些方法对其进行了研究。主要分析影响因素与目标之间的关系,对多因素影响下的参与者收益分析特别适用。更多方法请参见作者相关论著,可广泛扩展基于量子博弈的参与者收益研究方法。实例分析根据前述的各变量定义,设定安全收益分配系数 ,安全产出价值 ,针对量子状态,(,),(,),管 理 者 实 施 安 全 措 施 的 成 本,操作者实施安全措施的成本 ;和 的确定与安
16、全产出价值 有关,可理解为安全生产后的产出,和 则是相应的管理者和操作者实施安全措施的成本;分别取(非纠缠),(中间值)和(最大值)。由式()和式(),带入上述参数可得式()。当 时,即 非 纠 缠 状 态 时,;当 时,;当 时,即 最 大 纠 缠 时,。从结果中可知,非纠缠时参与者双方都不考虑对方实施的行为情况,以自己中心实施行为,这时各自的收益应是最大的。而当参与者双方完全考虑对方采取的行为,而非根据实际情况确定行为时,实施行为的成本将增加和效益降低,这时两者的收益是负值。而在上述两种情况之间时,同时考虑对方行为和己方实际情况时将出现系统整体的收益最大值,即 的最大值。上述过程在趋势上是合理的,过程中的具体值还与、和 的值相关。对因素重要度而言,例如考察 对 和 的重要度,即为 的变化造成 和 变化的程度,因此根据因素重要度定义,可将式()改写为式()。并通过式()得到参与者收益与纠缠程度的关系。同理对于因素联合重要度而言,在多个因素的变化情况下确定参与者收益的变化情况。这时与联合重要度相关的因素作为变量,其余因素带入数值即可得到这些因素的联合重要度。对于给定的,将各因素变化过程