1、企业竞争博弈与最优反映,窦文章 博士/教授北京大学Tel:13801227836 E-mail:,1,Session 11:企业竞争博弈与最优反映,Session 11:企业竞争博弈与最优反映,2,Session 11:企业竞争博弈与最优反映,3,在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsan
2、yi),他们都对博弈论在经济学中的应用作出了贡献。,Session 11:企业竞争博弈与最优反映,4,70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两个方面的原因:1传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。2完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计
3、各参与者的策略空间和收益函数。,Session 11:企业竞争博弈与最优反映,5,1、博弈和博弈论博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。,Session 11:企业竞争博弈与最优反映,6,在博弈论中,博弈的基本要素被概括为以下概念:1)参与者Players(玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,
4、最少要有两个参与者。2)策略Strategies(战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。5)均衡 Equilibrium(均势):指达到稳定的策略组合或结局。6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。,Se
5、ssion 11:企业竞争博弈与最优反映,7,可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略)博弈的目标和得失情况体现为利润的多少(收益)利润的大小取决于双方的策略组合(收益函数)博弈有四种策略组合,其结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解,它是由博弈规则(即参与者采取
6、什么策略会取得什么结局,市场的需求弹性、交叉价格弹性等)决定的。,案例:,Session 11:企业竞争博弈与最优反映,8,博弈一般用数学模型表达,分为标准和扩展模型两种。1.博弈的标准模型 包括三个要素:参与者、每个参与者可以选择的策略以及收益函数。在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。如上例的可乐价格博弈可以表示如下:,在收益矩阵中,包含了标准博弈模型的基本信息,表格中各组数字表示不同策略组合条件下的结局。在每个结局中,第一个数字代表参与者1 的收益,第二个数字代表参与者2的收益。,Session 11:企业竞争博弈与最优反映,9,10,10,100,-30,-20,30,
7、140,35,博弈树一般用来分析动态博弈。在博弈过程中,从某一个决策点开始,参与者在已有行动的基础上开始选择,到博弈结束,称为“子博弈”。子博弈是相对的,从事态发展的历史来看,所有的博弈都是子博弈。,2.博弈的扩展模型,Session 11:企业竞争博弈与最优反映,10,2、零和博弈零和博弈是博弈论的一个概念,属非合作博弈,参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。某一步行街有三个摊位点(起点、中点和终点)和两个冷饮商贩(A,B)。AB紧邻平均销售总额各获得50%。如果一个起点或终点,另一个在中点,则中点摊位获得75%。问:A、B
8、博弈的结局是什么?,Session 11:企业竞争博弈与最优反映,11,起点,A,中点,终点,起点,中点,终点,50,50,25,75,50,50,50,50,50,50,50,50,25,75,75,25,75,25,占优策略:指无论对手选择何种策略。都优于其他策略选择的策略纳什均衡:纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。,B,Session 11:企业竞争博弈与最优反映,12,3、博弈论的信息结构完全信息非完全信息对称信息非对称信息,Session 11:企业竞争博弈与最优反映,13,4、囚徒的困境与纳
9、什均衡1囚徒的困境:假设有两个嫌疑犯作案后被抓获,并在不同的房间审讯。警察告诉他们,如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年;如果其中一人坦白而另一人抵赖,坦白者释放,抵赖者判刑10年;这样,每个犯人就有两种策略,即坦白和抵赖。这个博弈的收益矩阵如下,在这个博弈中,(坦白,坦白)是博弈的解,即均衡结局。因为不管对方怎样行动,两个囚徒都会选择坦白。囚徒的困境说明,个人理性(最优)与集体理性(最优)可能不一致。如寡头之间的广告投入、产量控制等。,Session 11:企业竞争博弈与最优反映,14,5、重复博弈,重复博弈是指参与者之间的博弈不是一次性的,而是可以重复的。这样,参与者就可
10、以通过分析对手的行动采取相应的策略。摆脱囚徒的困境的条件以寡头之间的价格竞争为例,在下图的价格博弈中,如果是静态博弈,厂商很容易陷入囚徒的困境(低价,低价)。但如果博弈可以无限重复下去,则厂商的最佳策略是“以牙还牙”。这样,考虑到对手会以牙还牙,从长远和整体来看,降低价格不会有什么好处,博弈可能达到合作的结果。,Session 11:企业竞争博弈与最优反映,15,在现实中,较常见的是序列博弈,即一方先行动,另一方后行动。先行者优势在序列博弈中,先行者处于有利地位,可得到竞争优势。在下图中,两家厂商进行产品开发的博弈,如果是静态博弈,两家厂商必须同时宣布决策。根据最大最小原则,可能大家都无新产品
11、。但如果其中某一厂商具有研发优势,可以率先推出新产品,则另一厂商只好放弃进入该市场的打算。,6、序贯博弈,Session 11:企业竞争博弈与最优反映,16,6、序贯博弈,对进入的威慑,在许多行业中都存在现有厂商(在位者)与潜在进入者(进入者)之间关于进入与反进入之间的博弈。这也是一种序列博弈,在位者可以采取一定的策略性行动形成对进入的威慑。下图列出了一个进入博弈的收益矩阵。显然,默许是在位者的支配性策略(上策),商战是一个空头威胁,潜在的进入者将会选择进入。,Session 11:企业竞争博弈与最优反映,17,为了使商战的威胁具有可信性和效果,在位者可以用策略性行动作出承诺,一旦进入发生,它
12、将以低价回击。比如,它可以建造并维持一定的剩余生产能力,这将使它的垄断利润减少30,博弈的收益矩阵变为:,这样,高价不再是一个上策,均衡可能是(高价,不进入)。在重复博弈的情况下,厂商可能不仅考虑短期收益,而且更重视长期利益。因此,为了维持长期的垄断利润,厂商可能以牺牲短期利益为代价把进入者驱逐出去。这种在博弈中采取一定非理性行为的方法,形成进入威慑的另一种途径,即建立不惜一切代价粗暴对待进入者的名声,而不需要有具体的承诺。(实际上是把牺牲短期利益作为承诺),Session 11:企业竞争博弈与最优反映,18,古诺模型,1、模型基本假设:产品是同质的只有两家企业,且有着相同的成本结构每家企业对
13、市场需求曲线上每一点有着完全信息 只有一个时期决策变量是产量每家企业再选择产量时,假定对方产出不变,2、反映函数曲线,企业1的最优反映函数曲线:企业1对企业2的产量进行预测,然后根据预测来决定自己的最优产量。行业市场需求曲线:企业1的边际成本:,假定企业预测企业的生产量为,则在每一市场价格下企业所面临的需求量就是市场需求量减去单位的产量,业绩行业需求曲线DD需求曲线向左移动 个单位。,企业1的剩余需求曲线表示了企业1在需求不能在企业2处得到满足的那些消费者拥有垄断的地位。那么,确定企业1的最优产量决策类似于在垄断条件下寻找最优,利润最大化的最优决策条件是:MR=MC。在图4-1中,企业1的最优
14、的产量就由MC=c曲线和剩余MR曲线的交点决定。这样在给定企业1对企业2产量的一个推测,我们得到了企业1的最优产量。,我们将企业1利润最大化的产量 和企业2产量 之间的关系表示为一个方程:反应函数,企业1最优反应函数曲线的特征:1)线性2)反应函数曲线与横轴交于点,表示完全竞争产量;与横轴交于点,表示垄断产量3)反映函数曲线向下倾斜,由于 越大 越小,且,其斜率绝对值小于1,数学推导:企业1的利润函数:由企业利润最大化一阶条件得企业1的反应函数:同理,可得企业2的反应函数:,3、古诺均衡,定义:古诺均衡是指这样一对产量的组合,在这个产量水平上没有企业认为可通过增加或减少产量而提高自己的利润,产出的组合除了古诺均衡外,不可能再达到均衡。古诺均衡是纳什均衡在企业设定产量决策情况下的一个特例,常被称为古诺纳什均衡。,古诺均衡产量使两个企业都达到利润最大化,故古诺均衡点既在企业1的反应函数曲线上又在企业2的反应函数曲线上,两条企业反应函数曲线的交点就是古诺均衡点。企业1和企业2的反应函数曲线都为线性且对称,所以这两条反应函数曲线有且仅有一个交点,古诺均衡是唯一的;两个企业的最优的产量相等;产量严格为正。,古诺均衡的“动态”稳定,数学推导:联立方程得出古诺均衡解得产量市场总产量为均衡价格为:均衡利润为,:,