1、11北京大学经济学院博弈论重难点补充学习资料(内部资料,仅供学习研究之用)/人,八入”八八、勇平题-)第1章完全信息静态博弈在本章中,我们讨论如下简单形式的博奔:开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果(一定的收益或支出)。在此类静态(即各方同时行动)的博奔中,我们的分析又仅限于完全信息博奔的情况,即每一参与者的收益函数(根据所有参与者选择行动的不同组合决定某一参与者收益的函数)在所有参与者之间是共同知识(commgn kaowledge)。我们在本书的第2章和第4章讨论动态(即序贯行动)博奔,在本书的第3章和第4章分析不完全信息博奔(博奔中的一些参与者不
2、知道其他参与者的收益函数,如拍卖中每一人都不清楚其他人到底愿意为拍卖品出多高的价格)。在第1.1节首先介绍博奔论入门的两个最基本何题:如何描述一个博奔问题以及如何求得博弈问题的解。我们定义博弈的标准式表述和严格劣战略的概念,并说明有些博弈问题只要运用理性参与者绝不会使用严格劣战略这一原则,就可得到解决,但此原则在其他博奔问题中也可能出现非常不精确的预测(像任何结果都有可能发生之类)。接着,我们引出纳什均衡的概念并给出定义一这一概念的用途很广,对很多类型的博奔都能作出较为严格的预测。在第12节我们运用前面介绍的工具,分析其四个应用模型:古诺(Cournot,1838)的不完全竞争模型,贝特兰德(
3、Bertrand,1883)的不完全竞争模型,法伯(Farber,1980)的最后要价仲裁和公共财产问题(休漠(Hume),1739年提出了此类问题,以后又不断被经济学家提出讨论)。在每一应用例子中,我们先把问题的非标准描述转化为博奔的标准式,其后再解出该博弈的纳什均衡。(上面每一例子都存在惟一的纳什均衡,但我们讨论的范围却不限于此。)在第1.3节重回理论分析。首先我们定义混合战略(Mixed strategy),它可理解为一个参与者并不能确定其他参与者将会如何行动,然后引出并2棘弈论基础讨论纳什定理,该定理保证了在非常广泛的博弈类型中都存在着纳什均衡(也许会是混合战略均衡)。由于我们在第1.
4、1节介绍了最基本的理论,在第1.2节安排了应用举例,最后在第13节又给出了更进一步的理论内容,显然,在第1.3节中更深入的理论探讨,对第1.2节例子的理解并不是必须的前提,混合战略的概念和均衡的存在性在以后各章中都时有提及。本章及其后各章后面均附有习题、建议以及进一步的阅读资料及参考文献目录。1.1基础理论:博弈的标准式和纳什均衡1.1.A博弈的标准式表述在博弈的标准式表述中,每一参与者同时选择一个战略,所有参与者选择战略的组合决定了每个参与者的收益。我们借一个经典的例子说明博奔的标准式一囚徒困境。两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招认犯罪,警方并无充足证据将其按罪判刑。警方把他们
5、关入不同牢室,并对他们说明不同行动带来的后果。如果两人都不坦白,将均被判为轻度犯罪,入狱一个月;如果双方都坦白招认,都将被判入狱6个月;最后,如果一人招认而另一人拒不坦白,招认的一方将马上获释,而另一人将判入狱9个月一所犯罪行6个月,干扰司法加判3个月。囚徒面临的问题可用下图所示的双变量矩阵表来描述。(正如同一个矩阵一样,双变量矩阵可由任意多的行和列组成,“双变量”指的是在两个参与者的博奔中,每二单元格有两个数字一分别表示两个参与者的收益)四徒2沉状招认沉款-1,-1-9.0囚徒1招认0.-9-6.-6因徒的困境44:在此博弈中,每一囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉歌在一组
6、特定的战略组合被选定后,两人的收益由上图双变量矩阵中相应单元的数据所表示。习惯上,横行代表的参与者(此例中为囚徒1)的收益在两个数字中放前面,列代表的参与者(此例为囚徒2)的收益置于其后。第1登完全俏息萨态博弈3这样,如果囚徒1选择沉默,囚徒2选择招认,囚徒1的收益就是-9(代表服刑9个月),囚徒2的收益为0(代表马上开释)。现在我们回到一般情况。博奔的标准式表述包括:(1)博弈的参与著,(2)每一参与者可供选择的战略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的收益。我们后面将经常讨论到”个参与者的博弈,其中参与者从1到n排序,设其中任一参与者的序号为i,令S;代表参与者:可
7、以选择的战略集合(称为:的战略空间),其中任意一个特定的战略用5;表示(有时我们写成5:S:表示战略是战略集S:中的要素)。令(51,5n)表示每个参与者选定一个战略形成的战略组合,4:表示第;个参与者的收益函数,u;(s51,5n)即为参与者选择战略(5,5n)时第i个参与者的收益。将上述内容综合起来,我们得到:、定义在一个n人博弈的标准式表述中,参与者的战略空间为S1,,S,收益函数为u1,un,我们用G=1S1,Sn:41,4n表示此博弈。1尽管我们曾提到在博弈的标准式中,参与者是同时选择战略的,但这并不意味着各方的行动也必须是同时的:只要是每一参与者在选择行动时不知道其他参与者的选择就
8、足够了,像上例中牢里分开关押的囚徒可以在任何时间作出他们的选择。更进一步,尽管在本章中博奔的标准式只用来表示参与者行动时不清楚他人选择的静态博弈,但在第2章中我们就会看到标准式也可用来表示序贯行动的博奔,只不过另一种变通的方式一博弈的扩展式表述更为常用,它在分析动态问题时也更为方便。1.1.B重复剔除严格劣战略上节已讲过一个博奔的表述方法,下面开始介绍如何着手分析一个博奔论问题。我们从囚徒的困境这个例子开始,因为它较为简单,只需用到理性的参与者不会选择严格劣战略这一原则。在囚徒的困境中,如果一个嫌疑犯选择了招认,那么另一人也会选择招认,被判刑6个月,而不会选择沉默从而坐9个月的牢;相似地,如果
9、一个嫌疑犯选择沉默,另一人还是会选择招认,这样会马上获释,而不会选择沉默在牢里渡过一个月。这样,对第:个囚徒讲,沉默相比招认来说是劣战略一对囚徒方可以选择的每一战略,囚徒:选择沉默的收益都低于选择招认的收益。(对任何双变量矩阵,上例中的收益的具体数字0,-1,-6,专博弈论蓝础-9换成任意的T、R、P、S,只要满足TRPS,上述结论依然成立。)更为一般地:定义在标准式的博弈G=S1,Smi41,n中,令和s芳代表参与者:的两个可行战略(即行和:是S:中的元素)。如果对其他参与者每一个可能的战略组合,:选择的收益都小于其选择的收益,则称战略:相对于战略是严格劣战略:1,-i,+1,5n)0),但如2相应的逆命题也很有趣:如果某一参与者(对其他参与片弦择的战略)无法作出这样的推断,从而使战略成为他的最优反应,我们能否得到结论,一定存在另一战略是乡的严格占优战略?答案是骨定的。前提是对“推断”和“另一战略”的正确理解,两者都涉及到将在第1.3.A节中介绍的混合战略。本书的绝大多数例子都取自经济学的实际应用,而很少使用纯数字的抽象例子,这不仅因为应用本身往往烧有趣味,还因为应用经常是解释理论的较好方式。不过在说明一些基本的理论原理时,我们有时也求助于没有现实经济含义的抽象例子。