性相同,垄断厂商利润最大化要求各个市场的边际收益均等于边际成本。这样,根据MC=P(1-1/ed),如果,e(弹性)相同,MR相同,那么价格也必然相等,从而歧视定价失败。
第八章 博 弈 论
内 容 提 要
(一)博弈论概述
1. 博弈论及其基本概念
博弈论研究人与人之间相互“斗智”的形式和结果。当经济主体之间的利益存在冲突时,每一方所获得的利益不仅取决于自己采取的行动,也取决于其他各方采取的行动或对自己行动的反应。简单地说,博弈论主要研究决策主体在给定信息结构下如何决策以达到效用最大化和不同决策主体之间决策的均衡。
博弈论的基本概念包括: 一是参与者或局中人。
二是策略和策略空间。策略是在给定条件博弈中,局中人完整的一套相机行动方案。局中人可选择的策略的全体构成了策略空间(或策略集)。
三是支付函数与支付矩阵。博弈论中,可用数值表示各局中人从博弈中所获得的收益或效用水平,该数值称为支付。支付依赖于各个局中人所作出的策略,这种收益与策略的依赖关系构成了支付函数。参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。
除此之外,博弈论中的基本概念还包括:行动、信息、结果和均衡。它们关系是:行动是局中人的决策变量;信息是局中人在进行博弈时有关其他局中人的特征和行动的知识;结果是博弈分析者感兴趣的要素的集合;均衡是所有局中人的最优策略或行动的集合。
2. 博弈类型
博弈论总体上可分为合作博弈和非合作博弈。两者的区别在于局中人在博弈过程中能否
达成一个有约束力的协议。如果不能,则为非合作博弈。非合作博弈是现代博弈论的研究重点。合作博弈强调的是集体主义,是团体的公平和效率;而非合作博弈则强调个人理性、个人最优决策,其结果有时有效率,有时没有。
根据局中人行动的先后顺序,博弈论可分为静态博弈和动态博弈。前者指在博弈中,局中人同时选择行动或虽然不是同时但后行动者不知道先行动者所采取的行动;后者是指局中人的行动具有先后顺序,且后行动者可观察到先行动者所选择的行动。
根据局中人对有关其他局中人的特征、策略空间及支付函数的了解,博弈论可分为完全信息博弈和不完全信息博弈。前者是指在博弈中,每一个局中人能对所有其他局中人的特征、策略空间和支付函数有准确的了解;而后者是指在博弈中,有局中人不能对其他局中人的特征、策略空间和支付函数有准确的了解。在动态博弈中,轮到行动的博弈方若完全了解此前对方的行动,则称之为具有完美信息的动态博弈,如下棋;否则,就是不完美信息的动态博弈,其结果只能是概率期望。
把以上两个角度交叉结合,可得到四种博弈类型:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈(表9-1)。 3. 最小最大值(或最大最小值)策略
在两人博弈中,不管对方采取何种策略,局中人先从收益矩阵中找出自己的每一种策略下至少可以获得的收益(即所能获得的最小收益),然后从这些最小收益策略中选择收益最大的策略,这种策略叫做最小最大值策略,与之相反的策略叫做最大最小值策略。
表9-1 博弈的分类及对应的均衡
静态 完全信息静态均衡 完全信息 纳什均衡 不完全信息静态均衡 不完全信息 贝叶斯纳什均衡 精炼贝叶斯纳什均衡 子博弈精炼纳什均衡 不完全信息动态均衡 动态 完全信息动态均衡
(二)完全信息静态博弈
1. 占优策略均衡
在博弈中,占优策略是指一个局中人的最优策略不依赖于其他局中人的策略选择。如果
所有的局中人都有占优策略存在,则博弈将在所有局中人的占优策略基础上达到均衡,这种均衡被称为占优策略均衡。
表9-2 囚徒困境
坦 白 坦 白 囚徒A 抵 赖 20,0 1,1 10,10 囚徒B 抵 赖 0,20
囚徒困境是博弈论中的经典例子,如图9-2。从图中可以看出,坦白是犯罪嫌疑人A的占优策略,同样也是犯罪嫌疑人B的占优策略。因而,“A坦白,B坦白”就是占优策略均衡。
但在大多数博弈中,占优均衡并不存在。尽管如此,在有些博弈中仍可运用占优的逻辑找出均衡。其方法是:先找出某一局中人的严格劣策略,将它剔除,并重新构造一个不包括已剔除策略的新博弈;然后重复这一过程,直至剩下唯一的局中人策略组合为止。这个唯一的策略组合,就是该博弈的均衡解,它被称为重新剔除的占优策略均衡。 2. 纳什均衡
纳什均衡是完全静态博弈解的一般概念,它是指所有局中人的最优策略所组成的一个策略组合,也就是说,给定其他人的策略,每个局中人都不能因单方面改变自己的策略而获利,从而也就没有任何人有积极性去打破该均衡。容易验证,囚徒困境中的(坦白,坦白)是纳什均衡。
占优策略均衡一定是纳什均衡,但纳什均衡不一定是占优策略均衡。纳什均衡是有条件的占优策略均衡,其条件是其局中人不改变策略。如果其他局中人改变策略,则该局中人也要改变策略。因而,占优策略均衡比纳什均衡更为稳定。 3. 纯策略和混合策略纳什均衡
如果博弈方采取“要么做,要么不做”的策略形式,则该策略为纯策略。而博弈方根据一组选定的概率,在两种或两种以上可能的行为中随机选择的策略,被称为混合策略。
表9-3 纯策略和混合策略
左 游戏者B 右 左 游戏者B 右 上 游戏者A 下 -1,1 1,-1 1,-1 游戏者A -1,1 上 下 2,1 0,0 0,0 1,2
在表9-3中,左边的博弈不存在纯策略纳什均衡。而在右边的博弈中,不仅存在纯策略的纳什均衡,而且也存在混合策略的纳什均衡。
(三)完全信息动态博弈
1. 子博弈精炼纳什均衡
子博弈精炼纳什均衡是完全信息动态博弈解的一般概念,它是指在每一个子博弈(包括原博弈)上都构成一个纳什均衡的策略组合。它要求局中人的决策在任何时点上都是最优的。 2. 重复博弈
影响重复博弈均衡结果的主要因素,是博弈的次数和信息的完备性。重复次数决定了局中人在短期利益和长期利益之间的权衡,当博弈只进行一次时,每个局中人都只关心一次性支付;如果博弈重复多次,局中人可能为长远利益而牺牲眼前利益。就信息的完备性而言,当一个局中人的支付函数还不为其他人所知时,该局中人可能有积极性建立一个良好的声誉以换取长远利益。以产品定价为例说明博弈次数对局中人策略选择的影响,见表9-4。
表9-4 产品定价博弈
低 价 低 价 局中人A 高 价 -5,10 5,5 0,0 局中人B 高 价 10,-5
在表9-4中,如果只进行一次博弈,则占优策略均衡为(低价,低价)。而从企业的角度看,这并不是一个理想的结局。但在博弈重复无穷次时,若满足下列条件,将会出现相互勾结的均衡(高价,高价)。第一,双方都采取“冷酷的策略”,即:①从选择合作(高价)开始。②只要对方一直选择合作(高价),便一直合作;如果对方在某一阶段博弈中选择不合作,就将选择永远不合作。第二,贴现因子??1(r?1)(r为利率)足够大。这意味着将来的收益贴现后价值较大,人们对时间比较有耐心,而不是贪图眼前利益。