前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的博弈论的概念主题范文,仅供参考,欢迎阅读并收藏。
1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合着的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。该巨着汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨着的出版视为数理经济学确立的里程碑。
接下来的一段时期对合作博弈的研究有了长足进步。按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。如意愿表示不可强制执行,则为非合作博弈。非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。事实上,合作博弈可视为非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。为了解决合作博弈中所遇到的问题,这一期间提出了联盟博弈、稳定集、解概念、可转移效用、核心等重要概念与思想。1950年代是博弈论的成长期,纳什为非合作博弈的一般理论奠定了基础,提出了博弈论中最为重要的概念——纳什均衡,开辟了一个全新的研究领域。非合作理论发展起来,如阿尔·塔克的囚徒困境、重复博弈概念等。合作博弈理论在这个阶段得到进一步发展,如沙普利值概念、核概念等。博弈论的研究队伍开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为博弈论的研究中心。此经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论的成熟期。不完全信息与非转移效用联盟博弈那样的扩充使理论变得更具广泛应用性。常识性的基本概念得到了系统阐述与澄清。博弈论成了完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重要解概念之间的对应关系。豪尔绍尼与泽尔滕正是在这一时期开始他们的工作,豪尔绍尼提出了不完全信息理论,泽尔滕开始其均衡选择问题的研究。1970年代至今是博弈论的丰富壮大期。博弈论在所有研究领域都得到重大突破。博弈论开始对其它学科的研究产生强有力的影响,计算机技术的飞速发展使得研究复杂与涉及大规模计算的博弈模型发展起来。在理论上,博弈论从基本概念到理论推演均形成了一个完整与内容丰富的体系。在应用上,政治与经济模型有了深入研究,非合作博弈理论应用到大批特殊的经济模型。同时博弈论应用到生物学、计算机科学、道德哲学等领域,如随机策略这样的概念得到了重新解释。渐渐地,博弈论变得大众化起来。不再是仅为少数研究者所知。要对每年所发表的有关博弈论数以千计的文献进行了解已不是件容易的事。至今,博弈论仍在不断发展与深化,预测其可能出现的创新与成就是很困难的。
在博弈论的发展过程中,纳什奠定了非合作博弈的理论框架与概念基础,他的名字与博弈论的中心概念——纳什均衡联在一起;豪尔绍尼与泽尔滕则致力于博弈论的进一步发展与应用。
在非合作博弈论和经济分析里所应用的博弈论思想中,纳什均衡都处于核心地位。克雷普斯(D.Kreps)教授认为,如今在每一个经济学领域及与其相关的金融、会计、市场学甚至政治学等领域,在消化其近期研究成果过程中,对纳什均衡概念的理解均起着重要作用。虽然作为先驱者的古诺(Cournot)已在其研究中开创这一思想的先河,但其目前的形式则是纳什独立完成得出的卓越成就。美国普林斯顿大学的数学家和统计学家纳什。从1950年至1954年,他发表了多篇论述博弈论的文章,为非合作的一般理论和合作博弈的谈判理论奠定了基础。他规定了非合作博弈的形式,并定义了着名的“纳什均衡点”。纳什最先对合作与非合作进行了区别。纳什认为以前的理论包含着某种被称为合作类型的n人博弈思想,它以一种对能由局中人形成的不同合作之间相互关系的分析为基础;与此相反,纳什认为他自己的理论则“以缺乏合作为基础,在其中假定每个参与者都各行其是,与其他人之间没有合作与沟通”。该思想拓展了博弈论的研究范围,并增强了其应用性。在阐明了合作与非合作之间区别的基础上,纳什定义了着名的“纳什均衡点”,并对它的存在进行了证明。纳什均衡的定义一般是通过简单确定一个正常形式的有限局中人和行动的博弈来给出的。在纯策略中,它是指这样一种策略分布:假使其他局中人不变换其策略,则任何一个局中人都不能以单方面变换自己的策略来增加其效用。纳什还证明,在一个有限局中人和行动的博弈中,至少总存在一个纳什均衡,虽然当我们考察混合策略时才能完全保证其存在,因为有例子表明,存在着没有纯策略均衡的对策。这一定义实际上包含着一个前提假定,即局中人对游戏结构有充分的了解,也就是说拥有完全信息,以便能够导出他们自己的预测。纳什均衡的意义直到现在仍是探讨与争论的题目。一般认为,它是随不同情况而变化的一种过程。例如,假设在某种博弈中,局中人通过某些非强制手段就局中人的策略选择达成协议,这项协议具体确定了每个局中人选择的策略。由于协议无强制力量,局中人如果能通过违背协议而获得利益,则该协议无效。所以,为了保证协议有效,必须有一种局中人不可能因单方面违背协议而获益的机制,即形成一种纳什均衡。即,纳什均衡使得协议能够自我约束,无外力作用下也能保证协议的生效。这里纳什均衡的意义在于保证协议的自我强制执行。但这并不是说每个纳什均衡都具有自我强制性,就多个局中人背信问题而言可能得出不同的结论。此外,这里并未讨论协议如何实施及无协议时的情况。纳什均衡在上述情况中的含义是有差别的。纳什均衡刻画了人们理性选择的结果:利益冲突达到一种稳态以至无人会单方面加以改变。纳什均衡并未对这一结果做出福利上即总体上优与劣的判断。这就允许存在一种情形:由于人们的不合作使得每个人都达不到可能的最大收益。在囚徒困境中表现得十分明显,其中唯一的纳什均衡是双方均交待,因为在其它策略组合下均有一方能因改变策略而获益。但是这一局势中的帕累托最优是双方均不交待。这表明,帕累托最优并不一定能在纳什均衡点上实现。也即,在存在利益冲突的情况下,利己主义个人理性选择的结果在总体上可能并不是最有效的。进而,西方经济学中在经济人假设下,市场经济会达到或者趋向帕累托最优这一结论在引入利益冲突后有可能无法成立。在囚徒困境中,双方虽可在均不交待的情况下达到帕累托最优,却难以实现这一结果。这是由于缺乏对对方的信任。因对方可把策略改为交待而使自己获释得利,故无法信任对方会信守承诺。每个人追求自身利益最大化这个理性人假设更使这种信任失去基础。这说明,个人利己的理性选择并不能保证人们的处境都得到改善,结果可能对大家都不利。就此而言,纳什均衡揭示了利己理性的弱点。在人人求得自利的同时,如何防止对一切人均不利的结果出现,这已成为今天博弈论和经济学中研究的热点问题。
关键词:经济博弈论 语义分析 经济学方法论 实证分析 语言转向
“囚徒博弈”、“智猪博弈”、“懦夫博弈”、“协调博弈”等许多经典案例,被广泛运用于经济学、决策论、管理学等各学科领域;而这些虚构的案例能否用来说明博弈理论引发了学者们激烈的争论。直至今日争论看似逐渐平息,经典案例仍在使用,但争论其实仍是无果而终或只是暂时表面的平静,而相类似的讨论不断在经济科学的其他领域重演。必须认识到,这场争论归根到底是方法论问题。按照传统方法论提出的规范与实证二分法无法处理这一问题,本文试图从语义学的视角进行分析。
争论双方的观点
(一)质疑者的观点
较为温和的批评者认为,“囚徒博弈”等所谓的“案例”不真实,只是一个故事或寓言,不在现实中发生。激进的批评者指出,不仅上述案例是虚构的,经济博弈论中一些所谓真实的案例,也包含有假设和抽象的成分。极端反对者不仅把焦点放在质疑案例本身,而且通过分析案例与模型、现实与理论的关系,进一步对博弈论的整体研究方法提出质疑。
从理论角度看,博弈理论和模型中包含有假设的变量,这些变量无法在现实中进行观察。从案例角度看,在案例中被忽略掉的变量对结论不一定是无关紧要的,相反可能是必要的甚至是决定性的。因此整个博弈论漠视了变量可观察的重要性,无论理论建构还是案例实证都需要做出改进。
(二)支持者的观点
对案例使用的辩护者则直接从研究方法出发,首先强调博弈论研究中使用假设和抽象是不可避免的。任何一门科学研究都需要假设和抽象,抽象和假设并不是博弈论的局限性,而是任何理论的局限性。经济学科的研究方法如同物理学、生命科学的研究方法一样,通过抽象和假设从万千变化、纷繁复杂的社会经济现象中找寻本质的经济规律,经济学家使用博弈模型的目的是试图完成一种可解释不同经济现象的一般理论或机制体系的建构,通过博弈模型抓住诸多现象的本质机理。
(三)观点比较及本文的思路
通过以上双方观点分析可以总结出双方的三点同识和一点分歧,如表1所示。同识在于:第一,双方都同意博弈论属于实证分析而不是规范分析;第二,无论反对者还是支持者都认同博弈理论的正确性需要在现实中得到验实;第三,真实的案例有证实或证伪博弈理论的作用。而分歧主要在于:虚构的案例能不能用以论证博弈理论?支持者表示同意,反对者坚决抵制。
传统的经济学规范和实证的二分法并不能处理关于博弈论案例使用的争端。而如果将博弈论作为一类知识,从知识论的角度对实证知识的语义进行分析,则实证知识可进一步划分为综合知识和分析知识,它们都属于实证知识的范畴,但有着不同的命题性质。本文旨在介绍实证知识二分法,阐明分析命题与综合命题的命题性质与逻辑关系,论证经济博弈论属于分析命题的范畴,划清了博弈论案例使用的合法范围,以避免研究中的方法误用。
经济学实证知识的二分法
(一)经济学实证与规范二分法
经济学以实证方法描述经济事实、发现经济规律。实证与规范二分法最早追溯到休谟(D.Hume),休谟砍刀(Hume`s guillotine)提出不能从是中推出应当,经济学实然知识与应然知识是截然不同的,需要分别采取各自不同的方法进行研究。穆勒(J.S.Mill)、韦伯(M.Weber)、西尼尔(N.W.Senior)和凯恩斯(J.N.Keynes)的著作对这个划分进行了进一步的阐述与运用。弗里德曼(M.Friedman)著名的论文“实证经济学方法论”中再次提出,并且对它进行了详细地讨论,“斯诺命题”加深了人们对两类知识差异的认识。当前关于实证分析和规范分析的二分法,在经济学领域是被普遍接受的。
(二)经济学实证知识二分法的提出
将经济学知识视为整体知识体系中的一类,则按照研究方法将经济学实证知识划分为分析知识和综合知识。在第一个层次,经济学理论作为一门学科是通过命题语言来表达,命题语言既包括文字语言,也包括符号语言、数学模型或公式。在第二个层次上,按照传统划分,经济学分析划分为实证分析和规范分析。在第三个层次上,经济学实证命题可划分为分析命题和综合命题,同时根据实证原则将命题划分为无意义的实证命题和有意义的实证命题。
经济博弈论实证知识类型证明
(一)从主词指称上
从语义学上看,命题的主词是概念词或是专名。概念词表述某类事物或属性,专名表述个体事物。弗雷格对命题主词的涵义与意谓做出明确划分,指出在数学中,a=a和a=b之间的差别,只是表达形式上的差别。前者使用相同的符号,后者使用不同的符号。由于它们表示相等的数量关系,所以可以用a代替b,或者用b代替a,等式仍然成立。但是在命题语言中情况就不同了。在命题中要考虑语义的关系,即同时要考察主词的意义与意谓,这不像代数的等式中那样只考虑数量间的相等关系。
主词的意义是主词表述的思想,主词的意谓是主词指称的对象。“苹果”是有意义且有意谓的概念,“理性”是有意义但无意谓的概念,“地球”是有意义且有意谓的专名,“智猪”是有意义但无意谓的专名。对于任何一个有意义的命题,主词必然有意义,但不一定都有意谓。有意义的命题,主词一定有意义,但不一定有意谓。综合命题的主词必须同时有意义与意谓,即在实现中的相对应的对象。
根据命题主词指称分析,经济博弈论属于分析命题。从博弈理论看,理论的真与主词的意谓无关;从案例看,如“智猪博弈”中用任何一个概念代入x或y,或替换“大猪”和“小猪”,案例结论仍成立。
(二)从命题与现象的时空关系上
在命题与现象的时空关系上,又体现了分析命题与综合命题的根据不同。引用张庆熊等学者说明赖尔(G.Ryle)“范畴错误”所使用的五个命题:“(1)一只苹果正挂在树上。(2)苹果服从万有引力定律。(3)我剪断了它的柄。(4)苹果因为万有引力掉到地上。(5)苹果掉到地上因为它的柄被剪断了”。
分析命题具有超时空性,分析命题的真包含一切可能的世界,求证分析命题的真与时空无关。时空是综合命题真的必要条件,综合命题描述的对象一定位于现实世界。时间、空间是综合命题必然的、普遍有效的形式,是因为综合知识如果是可以理解的话,或者说如果是综合命题的话,就必定带上时间、空间和因果性的印记。空间、时间和因果性是综合命题的可能性的条件。
于是,句(1)、(3)与句(2)在逻辑上是不同范畴的实证命题。句(1)和(3)属于综合命题,它们报道发生的事情,人们可以提问句(3)在什么地方剪断苹果柄,它在什么时候发生,它花了多少时间等。句(2)不是综合命题而是分析命题。句(2)是理论或假设而不是一个事件,它并不发生,它假设命题在一切可能世界都为真。对这样的句子不能提问在什么时候、在什么地点发生了什么事情,它是理论或假设。根据命题与现象的时空关系分析,经济博弈论属于分析命题。从博弈理论看,命题的真与时空无关;从案例看,案例的发生与时空无关。
(三)从命题间的因果关系上
从命题间的逻辑关系上分析,用分析命题作为原因的命题仍是分析命题,用综合命题作为原因的命题是综合命题。句(4)和(5)都在解释苹果掉到地上的原因,都属于实证分析范畴。用句(4)作为苹果落地的原因,再用句(2)作为句(4)的原因,是采用逻辑演绎方法进行推理,因此句(4)是分析命题。用句(5)作为苹果落地的原因,再用句(3)作为(5)的原因,是通过经验观察获得的知识,因此句(5)是综合命题。尽管句(4)和句(5)中都有“因为”这两个字,都属于实证分析的范畴,但是这两个“因为”在各自的句子中所起的逻辑上的作用是不同的。但前者是分析知识,后者是综合知识,不能犯“范畴错误”。
与此相联系,分析知识的真是必然的,综合知识的真是偶然的。用句(2)作为句(4)的原因是必须的,它的反面是不可能;用句(3)作为句(5)的原因是偶然的,它的反面是可能的,即苹果有“我剪断了它的柄”之外的原因落地。分析命题的真假通过逻辑规则推论出来,综合命题是建立在经验事实的基础上,其真假通过经验加以检验。
根据命题间的因果关系分析,经济博弈论属于分析命题。从博弈理论看,命题间的因果关系是必然的;从案例看,案例的结论与前提的关系是必然的。
(四)从命题的验证方法上
从命题的验证方法上分析,分析命题通过逻辑规则,综合命题通过实际观察。分析命题依据矛盾律从一些先天的概念、原则演绎出来;综合命题通过归纳一类事物的性质或事物间的关系得到结论。验证分析命题,只要看看它们是否在逻辑上自相矛盾;验证综合命题,则要看看它们是否与现实中情况相符合。
对此托马斯·谢林(T.C.Schelling)也指出,博弈论是抽象的和推论的,而不是一门研究人们如何决策的经验主义科学,但它是一种附有以下相关条件下的演绎原理,即参与者的决策必须是“理性的”、“一致的”或“非矛盾的”。
根据命题的验证方法分析,经济博弈论属于分析命题。从博弈理论看,它不能被综合命题证明或证伪,因为它的检验不依赖于经验事实而依赖于逻辑规则。从案例看,无法被经验观察所证明或证伪,因为它的检验来源于理论模型内部的正确性。
通过综合命题和分析命题的五个性质区分(见表1),本文证明了博弈论及其所使用的案例均属于分析命题的实证知识范畴。
结论及启示
(一)结论
经济博弈论属于分析知识。根据传统方法论分析,经济博弈论属于实证知识而不是规范知识,是关于“真”的知识。而根据语义分析,在知识类型上经济博弈论属于分析知识而不是综合知识。如图1所示,分别用实线框和虚线框表示属于和不属于经济博弈论的语言区域。在求真方法上,经济博弈论通过演绎、推理获得,而不是通过经验观察从现象中获得。
不仅是虚构的案例,任何案例运用于博弈理论研究中,既无效又无益。本文业已证明博弈论知识属于分析命题范畴,博弈论的真与案例无关,试图用空想的案例或抽象的案例来“实证”博弈理论的做法是无效。用案例去论证博弈理论,是用综合知识的研究方法去处理分析知识,是对博弈论研究方法的破坏,对整个博弈论研究是无益的。
博弈论案例使用争论双方的观点都是对的。反对者绝不允许用虚构的案例去论证实证知识的做法是正确的,是对实证精神和实证方法的捍卫。支持者绝不允许实证知识只停留在抽象思维的层面,坚持用案例证实或证伪理论的做法是正确的。产生争论的真正原因是误把作为分析知识的博弈论当作综合知识。如表2所示,争论双方的观点都是对的。
联盟的稳定性是联盟博弈中一个重要的概念。传统的联盟博弈理论是假设每一个人的偏好都是公开的,但是在实际应用中,不少软件人的应用系统并不符合这个前提,他们往往是拥有私人信念的个体,因此他们不是按照全体人拥有的共同信念来行动的。针对以上的问题,本书对传统的稳定性概念中的“核”概念进行扩充,提出一套新的概念,分析了带有不确定性并且以信念为基础的联盟的稳定性,并展示这套新概念如何应用于一类新的联盟博弈――以信念为本位的联盟博弈。
本书共分7章:1.多合作及稳定性。介绍了本书所讨论的博弈理论的有关概念,引入了博弈论;2.不可转让的实用程序(NTU)博弈及联盟形成机制。在回顾了相关文献的基础上,讨论了合作博弈理论和多人联盟形成问题。本章主要内容包括不可转让效用合作博弈、可转让效用合作博弈、联盟形成机制以及信念与不确定性等;3.两类稳定性。讨论了博弈的稳定性问题以及信任不确定性所带来的影响。在此基础上,本章提出了一种基于规则的方法,并引入了强核心以及弱核心的概念。进而,本章末还讨论了信念联盟的稳定性精制程度的影响;4.基于信念的联盟稳定性。将私人信念引入到不可转让的实用程序(NTU)博弈中,使得人的偏好不再是公开的。此外,本章还对信任精确度稳定性的影响进行了进一步测试;5.应用实例介绍。本章介绍了基于信念稳定性概念而提出的一个应用实例:买方联盟问题。进而,本章对如何有效地应用概念解决此类多联盟形成问题进行了评估;6.sb核以及wb核。在前面章节所述内容的基础上,引入并详述了本书核心概念:在不可转让的实用程序游戏中引入私人信念。包括不确定的意见及私人信念、NTUBU博弈、性能对比与检测等;7.总结与展望。对本书进行了总结,并且对不可转让的实用博弈理论(NTU)未来可能的发展方向作了展望。
本书篇幅较小,内容生动活泼,语言通俗易懂,不是简单地罗列博弈论相关理论,而是突出新亮点,并辅之以清晰的例证.本书适合对人工智能、博弈论等领域感兴趣的读者阅读。
(中国科学院国家空间科学中心)
维特根斯坦是学界倍受关注的大师,其前后期思想的迥异恰当地诠释了他的哲学主题:“哲学不是一种学说,而是一种活动。”①有趣的是,辛提卡博弈论语义学所强调的也是动态的理解命题,这与维特根斯坦哲学在本质上殊途同归。
维特根斯坦哲学的主要贡献之一就在于提出了著名的“图象论”。维特根斯坦前期哲学和后期哲学的目的都在于通过研究语言的结构和界限来理解思想的结构和界限。维特根斯坦工作的基点,就是回到逻辑的出发点,即考虑命题的性质。这样,真的界限就构成了语言的界限,维特根斯坦所考虑的就是关于事实的话语。“人给自己造出事实的图象”②。维特根斯坦指出:命题是实在的图象,“图象是实在的一幅模型”③。“图象是一种事实”④。“图象所表现者即是其意义”⑤。“图象的真假在于其意义与实在的符合与否”⑥。维特根斯坦认为,图象与它所图示的事实之间的关系包括两个方面:一是这种关系“由图象元素与物项的配合而成”⑦,这种关系本身也是一种图象;二是“凡图象,不论只有什么型式但要能表象实在———对或错———所必须与实在共有的东西,即是逻辑型式,亦即实在的型式。”⑧所以,“每个图象亦是一逻辑图象”⑨。“对象是简单的”⑩。“对象构成世界的本体。因此不能是复合的。”
一切复合物必然可分解到不可再分的部分,这就是绝对简单的对象,那么,这种绝对简单的对象是什么?很显然,维特根斯坦这一思想的形成深受罗素和弗雷格的影响。罗素对客体进行了区分,一类是亲知的客体,一类是描述的客体,通过“亲知还原”,描述的客体可以转化为亲知的客体,维特根斯坦对罗素的客体进行了扩展,认为属性和关系也是一种客体。语言中的一个名称来表示一个简单的客体,通过这些客体的结合方式,指称客体的名称可以相互组合成句子。对于简单的客体,我们无法定义它们是什么,我们仅仅能够指示它们,这样,我们也就无法言说这些客体是存在的,因为定义一个客体就是意谓着被定义项的存在。维特根斯坦的绝对简单的对象实质上是罗素亲知客体的变体,是经验的客体。图象论的主旨是说明图象如何具有命题的内容,图象可以看成一个句子,一个句子也可以看成图象,这对于解释最简单句子的合理性是显而易见的,那么如何处理复杂的句子呢?
维特根斯坦最开始的设想是用合取和析取处理一切复杂句子,这也是辛提卡采取斯科伦前束式处理量词句的直接思想来源,但是维特根斯坦后来采取了另一个思路,代之以集成的图象法,“凡对于复合体的陈述,都可解析成对于其成分的陈述,解析成一些把复合体完全摹状了的命题。”即一个复杂的表达式的真值取决于组成它的表达式的真值,即命题就是基本命题的真值涵项,这样,维特根斯坦就完成了语言的运作方式。维特根斯坦的这一思想源于罗素和弗雷格的启发,罗素和弗雷格两人都认为命题才是最基本的意义单位,主张将命题形式化,即用数学中的函数表示命题。维特根斯坦对这一思想的运用是水到渠成的。维特根斯坦认为,“命题是原初命题的真值函量”。“原初命题是命题的真值函目”。换句话说,“一切命题都是对原初命题做真值运算的结果”。“命题就是从一切原初命题的总和(自然也从其确是一切原初命题的总和)而得出的一切。所以,从某种意义可以说,一切命题都是原初命题的总括。”
命题与世界的图象论包含了两层含义:一是图象的元素与事物之间具有对应关系;二是图象与事实之间具有相同的逻辑形式。由此,在维特根斯坦看来,“图象是实在的一幅模型”,“图象是一事实”,“图象所表现者即是其意义”。
正是因为命题具有相同的结构,才使得我们可以将其形式化,并且可以进行变项替换。那么,图象如何与世界相联系?在维特根斯坦早期哲学中,这种关系由名称—客体的关系来决定,但是名称如何与客体相联系?与其说维特根斯坦后期哲学是对前期哲学的反叛,不如说是进一步的深入,在维特根斯坦的语言游戏说中,名称与客体的关系被受一定规则支配的人类活动所确定。在完成这个思想转变之后,维特根斯坦不需要图象论了,取而代之的是语言这种被规则所支配的特征。
辛提卡的博弈论语义学是将博弈的方法引入命题分析,他的研究涉及两个问题,第一个问题就是命题的构成和命题的真假,第二个问题就是如何确定命题的真假。第二个是维特根斯坦后期哲学讨论的一个主要问题,其前期哲学为解决辛提卡的第一个问题提供了思想元素。命题是由概念构成的,而博弈语义学中的概念则直接对应维特根斯坦意义上的存在。值得注意的是,维特根斯坦的存在是与事实相对应的存在,是以现实世界为界限的,所以辛提卡用他的可能世界改造了维特根斯坦的客体。在辛提卡看来,很多情况下,人们的语言交流所涉及的客体多是描述的客体,这些描述的客体有些能转换为亲知客体,有些不能,如“结构为H3O的水”,但是人们在日常的交流中又会涉及这些概念,自然在定义域D中也就应该包含这些元素,可以看出,辛提卡的客体是对维特根斯坦客体的扩展。辛提卡的客体分为存在的和可能存在的两类,即在现实世界中存在和在可能世界中存在。而且很明显的是,辛提卡的存在概念不是语义学层面上的,而是语用学层面上的语义,这在博弈论语义学的操作性中得以体现。在辛提卡的博弈论语义学中,定义域D中的个体必须能与可能世界中的对象一一对应,脱离了这种对应关系,我们就不可能知道自己在言说何物,更不用说判定言说语句的真假。正如DanaScott所指出的那样,语义确定一个实现不是必需的,它应该为证实一个实现是正确的提供标准。
在确定了命题的构成之后,需要解决的问题是命题真假的标准是什么。辛提卡认为,命题是有意义的,命题的意义就是命题的真假值。博弈论语义学的处理方法是找到一个体用概念的名称代入量词所约束的变元,即参与人“我”在定义域D中找到相关的个体以证实语句,而参与人“自然”则企图找到范例来证伪语句。那么,如何才是找到相关的个体呢?或者说,怎样才知道代入个体后的语句为真?如前所述,辛提卡在扩展了维特根斯坦概念的基础上明确了命题的构成问题,相应的,辛提卡的命题范围较之维特根斯坦就宽泛的很多。辛提卡将博弈论语义学称为“寻找并找到的”逻辑,寻找并找到了什么?就是找到一个适当个体代入后的原子句所反映出来的图象与现实世界相符合。这不仅直观,而且符合人们的日常交流。可见,在确定命题真假的标准上,辛提卡与维特根斯坦是一致的,就是采用图象论的符合标准。辛提卡自己也曾明确指出,“博弈语义学不排斥图示的(同形的)关系理论,图示的(同形的)关系理论在原子句和现实之间建立了联系。”从这句话我们可以看出,要确定命题的真值,只要将命题与图象做个比较就可以了。用辛提卡的话说就是,“名称-客体关系曾经被建立,仅仅需要一件事,这件事就是将原子句和现实相比较。”
辛提卡指出:“维特根斯坦的图像理论和逻辑语义学之间的相似性和非相似性更有趣。最重要的大范围相似性之一,就是在两个理论中,语言的基本元素和现实的特定方面之间的代表关系,用任何的方式都不能进一步的分析。”罗素指出,事实是意指那种使一个命题真或假的事物。而一个命题的本质就在于:它可以两种方式,即以人们所谓的真的方式或假的方式对应于一个事实。最基本的事实是原子事实,与原子事实相对应的是原子命题,它肯定某物具有某种性质或某些事物具有某种关系。原子命题的真假取决于它是否与原子事实相符合。在原子命题的基础上,借助逻辑联结词就构成了分子命题。分子命题的真假取决于组成它的原子命题的真假,是原子命题的真值函项。在分子命题的基础上,借助逻辑量词可以构成更高一级的概括命题。其真假最终也取决于原子命题的真假。维特根斯坦继承了这一思想,认为任何复杂命题经过分析都可以还原为最基本的原子命题。辛提卡由此得出结论:“一个指示性句子的表达在通常的本质上不是这些语言博弈的一个回合,在这些语言博弈中,给出了几个构成成分的词语,并且因此给出了整个句子的内涵。”在辛提卡的博弈论语义学中,我们根据可能世界理论可以确定定义域D,根据维特根斯坦的图象论可以处理命题,并且将命题的具体处理方法转化为真值函项的求解,那么,接下来要考虑的是,我们究竟应该如何为真值函项求解,并且这个方法是否可以形式化。遵循维特根斯坦的哲学思路,辛提卡找到了博弈论。
二“语言游戏说”与语义博弈
维特根斯坦的“语言游戏”说中的所谓“语言游戏”,实际上是把游戏当成是运用语言的比喻,即强调语言的使用,他指出:“我将把由语言和行动(指与语言交织在一起的那些行动)所组成的整体叫做‘语言游戏’”。维特根斯坦认为,语词的意义在于使用,运用语言是一种活动,我们使用的语词在不同的场合会有不同的意义,必须根据具体的使用环境才能确定语词的意义,试图通过孤立的逻辑分析来揭示语词的意义,结果只能误入歧途。维特根斯坦对语言的这种处理方法,实质上是从具体的语境动态地观察语词的用法,我们不能孤立地去问“什么是意义”这一类的问题,而应该说“什么是意义的解释”。弄清一个语词代表什么之前,必须首先掌握包括这个语词在内的那种语言游戏,一个词语的意义也就是它在语言游戏中的实际用法。维特根斯坦对于语言及其意义问题的思考,得益于一场足球比赛的启发,同时,相较于足球比赛,语言游戏也存在规则,在维特根斯坦看来,遵守规则是语言游戏的灵魂,也是一切人类行为的必要条件。维特根斯坦用了很多篇幅讨论规范和遵守规则。“遵守规则,做报告,下命令,下棋都是习惯(习俗,制度)。
“遵循规则类似于服从命令。人们是被训练这样做的;人们是以特定的方式对命令做出反应的。人类共同的行为方式乃是我们据以解释陌生语言的参考系。”可见,规则和遵循规则是人们在实践和交往中形成的相对稳定的行为准则和行为模式。这种语言游戏所遵循的规则究竟是什么?是否就是逻辑必然性?“维特根斯坦最终在他的认识论斗争中失败了”。
其实[论/文/网LunWenNet/Com]只要留意维特根斯坦前期哲学,我们不难发现维特根斯坦在处理这个问题上的缺陷,维特根斯坦指出:“我的根本思想是‘逻辑常量’不代表任何东西。事实的逻辑不可能为任何东西所代表。”“没有‘逻辑的对象’、‘逻辑常量’(照弗雷格与罗素的意义),于此便显然可见。”虽然维特根斯坦不承认逻辑常项的存在,但是认为客体具有逻辑形式,这种形式使得客体能够聚拢。
辛提卡认为维特根斯坦的语言游戏受到博弈论的影响。“游戏概念的主要用法如此多地分享了像冯·诺意曼(vonNeumann)和约翰·纳什(JohnNash)那些数学家构建一个详细的游戏的一般理论的结构,那个理论旨在帮助科学家与哲学家理解有趣的问题的范围。它们甚至包括了真理与意义的问题(以及其他的语言—世界关系)以供讨论,维特根斯坦从中提出了他的语言游戏观念。”
与维特根斯坦相同,辛提卡在确立了命题和世界的图示关系之后,需要研究的就是这种关系是如何建立的,“处于这些描述关系之间的关系是什么?”在辛提卡看来,单纯的图像论已经不能解释这个问题了,图像论的任务是描述关系,那么对关系的关系的刻画,则需要另一个理论。辛提卡指出:比起那些为解释语言与现实结合所需要的思想,维特根斯坦经常包含更多的语言博弈思想。“为了理解(一个给定的一阶逻辑语句)F,我们显然没有足够的时间和记忆空间,事实上,我们对一阶语句的理解必须建立在对语句和世界的有限的逐步比较之上,而不是(潜在的)F的图像本质。”“有时语言博弈能够明显的被发现用于提供词语和它所刻画之间的关联”。
这里我想指出的是,或许我们用图像论处理语句理解的时候已经不足道了,但更为恰当。辛提卡认为自己受到“维特根斯坦有关思想的启发,强调受规则支配的人类活动,亦即寻求和发现语言游戏的重要性。”但是,辛提卡“比维特根斯坦走得远得多,因为后者的思想是轮廓性的且不系统。”“在我没有有效的方式找到我的下一步该如何行动时,我怎么可能在实践中采取一个策略?”
这里有几种选择。也许有人会像在非确定性证据系统内所做的那样提出某种思路,但是辛提卡建议把我的策略限制在递归中。这种限制的方法是非常精致的,它注意到了维特根斯坦对语言游戏中实际可游戏性的思考。辛提卡坚持认为语言目标导向语言本质,这可以帮助我们重新认识处于维特根斯坦形式化时期的游戏概念的意义。当时,维特根斯坦使用“游戏”来指称目标导向的活动,诸如证实或者证伪的活动。辛提卡延用了这一思想,他说:维特根斯坦的“用法”概念强调的是一种活动,是一种构成一个词的自然环境并使该语词从中获得其意义的活动。
因此,在他的博弈论语义学框架下所研究的语义博弈,可以被看作是“维特根斯坦意义上的一类语言游戏”。维特根斯坦认为逻辑常项不存在,在这点上,辛提卡与维特根斯坦所持的观点不同,辛提卡认为逻辑常项是存在的,并且将逻辑常项与博弈规则做了比较,认为逻辑常项等同于博弈规则。与经典逻辑一致,辛提卡认为逻辑常项与自然语言中的连接词是一致的。这样,辛提卡就为博弈论语义学找到了至关重要的一环———规则的确定。辛提卡将维特根斯坦的语言游戏说与博弈的数学理论概念直接结合,“其结果就是那个既适用于自然语言又适用于形式语言的最现成的语义理论”。辛提卡认为,与一个语词相关的语言博弈就是围绕该词发生的使该词活动意义的活动,语词的意义同样需要在相应的使用中才能确定。我们所言说的语句是可以分解简化的,而行之有效的方法就是用博弈论,通过将句子简化为原子句,再依据名称与所指的对应关系,我们就可以确定句子的真假。
辛提卡在吸取维特根斯坦哲学思想精华的基础上提出了博弈论语义学,作为当代语义学发展的一个重要方向,博弈论语义学的运用并不仅仅局限于逻辑学的范畴,可以说,博弈论语义学的哲学意义与它的理论特征是密切相关的。理清其背后的哲学思想,不仅有助于帮助我们更好的理解这一理论,并且大大扩展了我们思考语言和世界关系的哲学和逻辑学空间。
Abstract: With the development of economy, the construction market has become regular. The bidding legislation play an important role in equity, public, quality and against illegal competition and corruption. Although the enterprise spent a lot of material, time on a complex bidding, but usually the end is not desirable. On the basis of bidding evaluation analysis, a set of suitable bidding game model methods are considered, which is useful for scientific decision on bidding practice in construction enterprises.
关键词:建筑市场;招投标;评标办法;博弈论
Key words: construction market;bidding;bidding evaluation method;game theory
中图分类号:TU71 文献标识码:A文章编号:1006-4311(2010)08-0100-02
0引言
工程项目建设招标投标是国际通用的、比较成熟的而且科学合理的工程承发包方式。承包商投标的目的是能够制定科学合理的技术方案并报出一份既有最大中标可能性又可以赢利的最佳的报价。
我国目前建筑市场竞争日益复杂和激烈,施工企业在注重提高企业内在素质的同时,加强工程投标工作的研究,优化投标决策,提高投标质量,是在市场竞争中生存和发展的重要保证。
我国的工程招标评估一般采用综合评估法,即对工程质量、施工工期、投标价格、施工组织设计或者施工方案、投标人及项目经理业绩等提出要求,并确定评价标准。这些要求和标准的确定也是因为业主的要求不同,所以各个标准也不尽相同。。一般以评分方式进行评估,得分最高者中标。采用经评审的最低投标价法,是在投标文件能够满足招标文件实质性要求的投标人中,评审出投标价格最低的投标人,但投标价格低于其企业成本的除外。
招标投标是为了营造公平、公开、公正的竞争环境,进一步规范我市建筑市场秩序,加快培育市场机制,遏制腐败现象发生,培育和建立统一开放、竞争有序的建筑市场,保证工程建设的顺利进行和建筑业的健康发展。但由于旧体制的功能与惯性还未消失,新体制的功能尚不完善,致使建筑市场交易成本过高,交易秩序出现混乱,影响了招标投标制度的效率。
本文认为,要对工程造价作出科学合理的评估,需要建立严密的数学模型,而根据实际情况,显然选择博弈理论更加合理。基于博弈论建立适应不同评标办法的投标模型,为施工企业的投标工作提供一些具有理论和实质意义的参考。
1博弈论投标报价建模的基本要素
1.1 博弈论在投标报价建模应用中的适宜性博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈论的基本概念包括:参与人、行动、结果、信息、战略、支付函数、均衡。博弈分析的目的是运用博弈规则预测博弈均衡。
工程投标是一种对策行为,众多投标者之间就是一场博弈。投标人往往不具备甚至完全不具备竞争对手的投标信息资料,施工企业在与对手参与投标活动时可以认为是同时选择行动,因而可以运用不完全信息静态博弈理论来描述和解释工程竞标博弈。
1.2 博弈论基本要素概述从理论上讲,博弈分为四种类型,分别为:
1.2.1 合作博弈――研究人们达成合作时如何分配合作得到的收益,即收益分配问题;
1.2.2非合作博弈――研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题;
1.2.3 完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息;
1.2.4 静态博弈和动态博弈:静态博弈指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。动态博弈指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。
为了说明博弈的各个类型,我们可以在这里举个例子:a、b、c、投票决定如何分配100万,他们分别拥有50%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0……
权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。
夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。
次序:abc acb bac bca cab cba ,关键加入者:a c a c a b ,由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 。所以a,b,c应分别获得100万的2/3,1/6,1/6。
以下结合具体实例,对博弈论涉及的各个要素进行逐一分析:
(1)参与人是指一个博弈中的决策主体,它的目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。参与人可能是自然人,也可能是团体,如企业、国家,甚至若干国家组成的集团。在本文中,一般用i=1,…,n代表参与人。除了一般意义上的参与人之外,在博弈论中“自然”作为“虚拟参与人”来处理。
(2)信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。信息集是博弈论中描述参与人信息特征的一个基本概念,是参与人在特定时刻有关变量的知识。
(3)战略战略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。一般地,用si表示第i个参与人的特定战略,Si ={si}代表第i个参与人的所有可选择战略的集合。如果n个参与人每人选择一个战略,n维向量S=(s1,…si,…sn)称为一个战略组合,其中si 是第i个参与人选择的战略。
(4)支付在博弈论中,支付是指在一个特定的战略组合下参与人得到的确定的效用水平或者是指参与人得到的期望效用水平。参与人的目标是选择自己的战略以最大化其期望效用函数。在博弈论中,支付或者是指在一个特定的战略组合下参与人得到的确定的效用水平或者是指参与人得到的期望效用水平。
(5)结果是博弈研究者所感兴趣的分析,例如均衡战略组合,均衡行动组合,均衡支付组合等。
(6)均衡是所有参与人的最优战略组合,博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的(理性是指有一个很好定义的偏好,在面临给定的约束条件下最大化自己的偏好)。博弈论中的均衡概念与一般均衡理论中讨论的均衡概念是不同的。
在博弈论里一个博弈可以用两种不同的方式来表述,一种是战略式表述;另一种是扩展式表述(或称为展开式表述),更适合于讨论动态博弈。因为本文中基于博弈论建立的报价模型都是静态博弈,下面仅给出适合于静态博弈的战略式表述(又称为标准式表述):
博弈的参与人集合:i∈Γ,Γ=(1,2,…,n)
每个参与人的战略空间:Si,i=(1,2,…,n)
每个参与人的支付函数:ui=(s1,…si…,sn),i=(1,2,…,n)
用战略式表述的博弈为:G={Si,Sn;ui…,un}
在这种表述中所有参与人同时选择各自的战略。所有参与人选择的战略一起决定每个参与人的支付。
2不同投标报价评分方法下的建模方法分析
目前,我国施工企业参与投标的项目报价评分办法主要有两种:一是经评审的最低价法;二是复合标底法。根据评分办法及可获取的数据类型应建立不同的博弈模型。具体来说,综合评估法采用较多,即对工程质量、施工工期、投标价格、施工组织设计或者施工方案、投标人及项目经理业绩等提出要求,并确定评价标准。这些要求和标准的确定,因业主的期望值、业主的管理水平、工程项目和建筑市场的实际情况的不同而不同。一般以评分方式进行评估,得分最高者中标。
2.1 基于合理最低价法的成本分布函数博弈模型(信息较对称时)适用于合理最低价法投标的博弈模型在求最优解的过程中,成本分布函数的确定是关键。确定竞争对手承包工程的成本分布函数f(x),需要参考对手以往的设计报价记录,结合投标者现在的发展,运用一定的数理统计方法抽象得出,从而可以将企业的投标价格和具体的环境条件联系起来,具有动态性。
在具体方法上,首先研究只有两个投标者的成本分布函数博弈模型建模过程:只有两个投标者参与投标,即i=1,2。令bi为投标者i的报价,ci为投标者i的承包成本。假定ci只有i自己确切知道。竞争者之间都相互知道自己和其他投标者的ci独立地取自定义在区间[m,n]上的分布函数f(x)。则由以上定义可知投标者i的支付ui如下:
u(b,b,c)=b-c,if,b>b0.5×(b-c),if,b=b0,if,b
这是最简单的投标报价博弈模型。投标者i面临的问题是:
max ui=(b-c)f(x)dx,
其中:b为最优报价,c为实际成本,Φ(b)=f-1(b)。
2.2 基于合理最低价法的模糊预测博弈模型(信息不对称时)
投标人投标决策分析时往往并不具备完全的资料信息,且竞争对手的投标策略是变化的。经实例证明采用基于“概率模型”的投标报价模型误差较大,偏于保守;而采用基于博弈模型和模糊预测的投标报价决策方法,更符合信息不完全情况下的投标竞标实际情况,其得出的最优报高率f更大,比前者为投标人带来更大的期望收益。因此,在信息不完备情况下的投标报价决策中,该投标报价决策方法更为有效。
具体方法是,通过研究收集竞争对手以往的投标报价分布情况的统计资料来作为分析的基础,直接建立报高率f与赢标率T的函数关系。
对很少遇到的或没有遇到的对手,则可以运用模糊数量法来确定其报高率f与赢标率T的关系。模糊预测模型为:T=A0+Aigf,其中A0=(a0,c0),Ai=(ai,ci)是模糊数,ai为模糊数的中心值,ci为模糊数的模糊幅度。
如果投标人在某次投标竞争中有m个已知竞争对手,n个未知对手,对成本的估算为c,则对于该投标者而言,是首先分别分析已知竞争对手和未知竞争对手总体赢标率,并取其大者作为最优投标报价报高率f*的函数输入,求得最优报价。
3结论
在博弈模型建立与应用中,成本分布函数模型及模糊预测模型均是基于已有较成熟的概率统计方法的报高率f的研究,适用于经评审的最低价法项目,能够较好地指导实践。因此合理最低价法投标报价博弈模型的研究具有很强的现实指导意义。
由于对最低投标价的合理性评判尚缺少一致的理想标准,复合标底法被广泛应用。由于复合标底可采用多种复合形式,很难取得这样的记录;如果拥有以往与当前评标方法完全相同的项目,则借助评分矩阵模型,根据不同的复合公式建立不同的矩阵模型,分析采集自投标报价与标底比价的区间历史记录,进而确定最佳报价。因此,对复合标底法投标报价的评分矩阵博弈模型的深入研究具有广泛的现实意义。
我国的招投标制度虽然已实施多年,但有许多的内容还需要不断的完善和补充,本文区别目前通用的评标办法,针对性地建立博弈模型,对提高招投标在综合决策中的科学性的有益尝试,在今后的研究可以通过待实际经验数据的积累来进一步验证其有效性和可靠性。
参考文献:
[1]袁建波,丁夏淑.博弈论在复合标底投标中的应用[J].中外公路,2005, (8):199-201.
受到近年来理论界多视角和多元研究方法的启示,作者认为,高校的学生教育管理就其实质来说,是学校和学生双方在一定规则下各自寻求最优理性决策的互动行为,是双方为各自利益最大化所进行的利益博弈。
关键词: 博弈 高校学生 教育管理
博弈论(game theory)又称对策论,它是研究决策主体(决策者)在冲突或合作中的策略选择的理论。它要解决的主要问题是,当两个主体的行为互受对方行为的影响时,各方应该选择何种行动方案,才能实现各自收益的最大化。
在我国,虽然博弈论的研究起步很晚,但博弈的思想却源远流长。早在两千多年前的春秋时代,著名的“田忌赛马”就是一个经典的博弈事例。它揭示的是,在给定齐王的比赛策略不变的情况下,田忌应该采用何种策略才能取得比赛的胜利。这实际上就是现代博弈论中的完全信息条件下的两人博弈问题。我国古代典籍中的《孙子兵法》、《三十六计》以及《三国志》中都有大量的博弈事例,蕴育了丰富和深刻的博弈论思想。
博弈论作为一种理论最早是由美国数学家冯・诺依曼(Von Neumann)在1937年提出的,而冯・诺依曼(Von Neumann)和摩根斯坦恩(Morgenstern)于1944年合著的《对策论与经济行为》概括了经济主体的典型行为特征,提出了多种基本的对策模型的概念和分析方法,创立了对策论的科学体系从而成为博弈论诞生的标志。50年代,纳什(Nash)等人奠定了现代博弈理论的基石;60年代,泽尔腾(Selten)将纳什均衡的概念引入动态分析,提出了“精炼纳什均衡”概念;海萨尼(Harsanyi)则把不完全信息引入博弈论的研究。80年代,克瑞普斯(Kreps)和威尔逊(Wilson)发展了动态不完全信息博弈论,将博弈论的研究提高到一个崭新的水平。
博弈论作为一种方法,最重要功能就是为其他学科提供研究方法。实际上,博弈论的应用范围不仅包括经济学,在政治学、社会学、管理学、生物学、心理学、犯罪学、军事、外交、国际关系、公共选择和法律等诸多学科和领域,博弈理论也得到了广泛的应用。之所以如此,主要是由博弈论的特殊视角和特殊方法决定的。博弈论研究决策与其他理论研究决策的最大区别是,博弈论研究的决策是在一种互动状态下的策略选择,而不是一种孤立和静态的策略选择。比如,微观经济学研究消费者的消费选择,就是在给定一个价格和收入参数的情况下来说明消费者怎样实现效用最大化的问题,在这里,个人效用函数只是价格和收入的函数而不是其他人的选择的函数。而我们知道,一定时期的价格实际上是市场上所有人行为选择的结果,当每一个市场参与者都根据价格来进行选择的时候,价格就会发生变化,这就意味着,单个主体进行决策所依据的价格参数中,包含着其他无数主体的决策过程。因此,单个主体的效用函数不仅依赖于他个人的选择,而且也依赖于他人的选择。但微观经济学则没有考虑这一问题,它仅仅是把其他人的选择后果归结为一个价格参数,这样,单个主体决策时面对的就是一个价格,而不是其他的决策主体。他既不会考虑自己的选择对别人选择的影响,也不必考虑别人选择对自己选择的影响。博弈论则正好相反,它强调是,单个主体间的选择是互相联系互相影响的,个人的效用不仅依赖于自己的选择,而且也依赖于他人的选择。因此,博弈论研究的决策实质上是一种存在外部经济条件时的个人决策。正是由于博弈论研究的“决策”更接近现实且普遍存在于各个领域,因而博弈论的应用十分广泛。
虽然博弈理论的应用非常广泛,但是用博弈论作为分析方法运用在高校学生教育管理研究中的文章却很少。
高校学生教育管理问题的研究主体,过去多由从事学生教育管理的人员组成,其研究多数局限于实际工作的对策性研究领域。但最近几年高校学生教育管理研究的主体数量迅速扩大,且日益多元。一批经济学、社会学等领域的学者从不同学科的视角和方法介入这一领域,为这一领域的研究开辟了更加广阔的前景。正是在这样一种背景下,博弈论作为一种研究方法,也被运用高等教育管理的研究之中,并且取得了值得注意的研究成果。如吴晓莉,黄芳在其《高等教育与博弈》提出的“高等教育领域存在许多对博弈的组合”的观点;郭萍,胡军对高等教育服务中的信息不对称及规制的分析以及“教育评估中介应该与政府、市场互补,进行合作规制”的主张,都为运用博弈论进一步研究教育管理问题提供了有益的启示。作者认为,大学生是高校教育管理的主要对象之一。学生的教育和管理是高等教育管理工作最重要的内容。对高校学生的有效教育和管理有助于提高学生学习的积极性、主动性和自觉性,促进学生的思想道德的提升,提高学生的生活能力及素质,从而有助于高校管理目标的最终实现。因此,在已有研究成果的基础上,运用博弈论的方法进一步开展高校学生教育和管理问题的研究,从新的角度来审视高校的学生工作,它可以帮助人们拓展学生管理工作的思路,提高高校学生学习、生活以及思想政治工作的水准和质量,有利于学校培养更多更好的人才。同时也可以创新学生管理研究的方法,拓展了学生管理研究的理论视野,对于加强和改进大学生思想政治工作,提高教育质量,建设和谐校园都具有十分重要的意义。
高校学生教育管理涉及的主体就是学校和学生。作为学校来说,进行学生管理的目的就是引导学生努力学习,力争使最多的学生达到自己的人才培养规格,引导学生努力学习,实质就是要求学生增加学习成本,即学生的时间成本,物质成本以及克制某种欲望而付出的精神成本等等。而在假定学生都是理性经济人的前提下,学生的目的则是以尽量少的成本来取得学校的认同,这种认同的直接表现就是顺利毕业。学校希望学生顺利毕业,学生也希望学校能允许自己顺利毕业,这一点决定了二者之间具有合作关系,其次,双方都对对方有要求,学校要求学生通过增加学生的成本来使学生顺利毕业;而学生则希望在不增加自己成本的情况下自己也能顺利毕业。由于二者要求的对立,因而使二者之间具有竞争关系。这种竞争的实质就是争夺决定学生学习成本增加或减少的主动权。在这种合作与竞争的关系中,双方也有不同的手段和对策,学校的手段就是在符合国家学生管理规章的前提下,通过制定激励和处分制度来引导和约束学生的学习行为、思想道德和生活行为,包括设立奖学金,评优和进行违纪处分等等。学生则是在认可学校学生管理工作的前提下,努力寻求有利于既能减少成本,又能达到自己目的的对策和手段。在这种情况下,学校和学生的任何一种行为都会影响双方进一步的行动以及未来的对策,从而影响学生的潜在资源在学习和休闲两种用途中的分配。从理论上说,当我们把教育看成是一种社会公器时,只有学校拥有主导权才符合权利配置最优原则。而由于学生作为受教育对象的不成熟性,又决定了这一配置过程必然充满了竞争和不确定性。因此,学校学生管理中学校和学生的关系,必然是围绕争夺决定学生潜在资源分配的主导权而展开的博弈关系。
同时,我们还要看到,在高校学生教育管理中,不仅存在着学校和学生之间的博弈,而且也存在学生之间的博弈,比如,在学校对学生实施奖励和处分时,就存在学生与学生的博弈。当学校要对表现好的学生进行奖励时,由于名额有限,学生之间必然存在为获奖而展开的竞争,在竞争中也就必然存在个人竞争策略的选择问题。同样,当学校要对各种违纪行为进行处罚时,违纪学生中也存在一个如何逃避处罚或减轻处罚的策略选择问题。
总之,高校学生教育管理过程,决不是一种单向的管理与服从的过程,而是各主体之间互相影响的一个互动过程。一方面,学校的选择要主导学生的行为和选择,但同时,学生的选择也要影响学校的选择以及学生之间的选择。
参考文献:
[1]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,2001:35-45.
[2]谢识予.经济博弈论[M]. 上海:上海复旦大学出版社,1997:21-22.
[3]林勇娟,倪水雄.大学生管理工作中的博弈思想[J].高教论坛,2004(1):5-8.
[4]邬补科,沈晓敏.新时期高校学生管理工作的现状及创新[J].财经论丛,2003(9):13-15.
[5]岳超源.决策理论与方法[M].北京:科学出版社,2003:45-47.
[6]刘青秀,贾云鹏.论高等教育中供求双方权利和义务的不对等[J].江苏高教,2004(4):35-38.
【关键词】初步博弈论,基本理论,日常应用
前言
博弈论是二人在平等的对局中为达到取胜的目的而各自利用对方的策略变换自己的对抗策略的思想。博弈论思想古已有之,我国古代的《孙子兵法》就是最早的一部博弈论著作。最初主要研究象棋、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,奠定了这一学科的基础和理论体系。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。
一、博弈论的概念
博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。这里,策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个要根据其他人的可能反应来决定自己的决策和行动。
二、博弈论的类型
博弈论有两种基本的类型,即“同时博弈”和“序贯博弈”。前者是参与人同时进行决策或行动的博弈,后者是参与人的决策和行动有先有后的博弈。这里,所谓的“同时”或“先后”主要是看参与人在决策时是否知道其他参与人的决策,而并不一定取决于物理意义上的时间。当然,除了上述两种基本的类型,还有其他不同的分类方式。
三、博弈的要素
博弈的目的是利益,利益形成博弈的基础。经济学中最基本的假设就是经济人或理性人的目的在于使收益最大化。参与博弈者正是为了自身收益的最大化而相互竞争。也就是说,参与博弈的各方形成相互竞争、相互对抗的关系,以争得利益的多少来决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。博弈的要素大致上可以包含以下四点:⑴2个或2个以上的参与者;⑵要有参与各方争夺的资源或收益;⑶参与者有自己能够选择的策略;⑷参与者拥有一定量的信息。
四、日常生活中的博弈策略
正如王春元在其编著的《博弈论的诡计》中所言“博弈论的目的在于巧妙的策略,而不是解法”。学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就既可以用数学工具来高度抽象地表述,又可以用日常事例来具体说明并运用。博弈时时存在,它就在你的身边。
在博弈论中,一个著名例子就是塔克给出的“囚徒困境”模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设警察怀疑甲乙两人作案,但他们手中并没有掌握确凿证据,于是警方将两人分别置于不同的两个房间内进行审讯,并分别告知两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认。
两名囚徒面临的选择及带来的后果组合可以查看下表。
从上表中可以知道:每个犯罪嫌疑人都有两种可供选择的策略:供认或不供认。而且,每个犯罪嫌疑人选择的最优策略不依赖于同伙的策略选择。基于人是理性的这一前提,由于犯罪嫌疑人不知道对方的想法,最理性的博弈策略,就是选择供认。这时的策略,可称之为占优策略。不管甲乙两人谁供认,都将得到减轻惩罚的结果。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与者的占优策略。但值得注意的一个问题是,采用优势策略得到的最坏结果,并不一定比采用另外一个策略得到的最佳结果要好。
除了上例,博弈论在生活中的应用还有很多,譬如:重复博弈的应用。以我国俗语“以牙还牙,以眼还眼”来说,在没有法律和道德的约束下,对自己最有利的一种策略是一报还一报。重复的博弈理论导致了合作的产生,但是谁也不能保证合作的继续,因为合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或背叛当前收益大于未来收益则背叛风险将仍然存在。
五、博弈论的局限性
“任何一个理论体系必定是不完全的,任何理论都包含了既不能证明为真也不能证明为假的命题,对这个世界的最好描述可能只有其本身。”博弈论也是如此,其基本假设之一就是人是理性的。所谓理性的人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。而现实生活中,人们在做决策时往往是有限理性的。因为人类的精力和时间是有限的,人不可能具备完全理性,不可能掌握所有知识和信息。花费大量的时间、财力、物力去寻求所有信息,企图做出最优决策,有时反而是最不理性的举动。
六、博弈论的意义
从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等并被各社会科学所应用。
博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者保罗·萨缪尔逊如是说“要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解”,也可以这样说,要想赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。
参考文献:
[1]王春永(2007.1).博弈论的诡计.北京.中国发展出版社[M]
引言
一、两个简单的例子
1.1 老鹰(Hawk)与鸽子(Dove)博弈
1.2 系统选择博弈
二、进化博弈理论的产生及其发展
2.1 理性的由来及其缺陷
2.2 心理学研究成果及有限理性概念的提出
2.3 进化博弈理论的产生及其发展
三、进化博弈理论的基本内容
3.1 进化博弈理论基本模型分类
3.2 进化博弈理论基本均衡概念-----进化稳定策略
3.3 进化博弈理论基本动态概念----模仿者动态
四、进化博弈理论的应用
五、传统方法的缺陷及进化博弈理论研究方法的现实性
5.1 新古典经济学均衡分析法的缺陷
5.2 经典博弈理论的策略互动分析法及其缺陷
5.3 进化博弈理论局部动态分析方法的现实性
5.3.1 局部动态分析法的均衡观
5.3.2 局部动态法的时间观
5.3.3 局部动态法的均衡选择观
5.3.4 局部动态法的特殊性
六、结论
参考文献
摘要
本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。
关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法
引言
为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。
本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。
一、两个简单的例子
为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。
1.1 老鹰(Hawk)与鸽子(Dove)博弈
假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:
操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。
二、进化博弈理论的产生及其发展
进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。
2.1 理性的由来及其缺陷
经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。
经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。
由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。
2.2 心理学研究成果及有限理性概念的提出
随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。
进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。
2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。
2.3 进化博弈理论的产生及其发展
进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。
进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。
1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。
1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。
三、进化博弈理论的基本内容
进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。
进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。
3.1 进化博弈理论基本模型分类
进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。
多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。
按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。
3.2 进化博弈理论基本均衡概念-----进化稳定策略
进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:
说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。
要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。
最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。
经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。
3.3 进化博弈理论基本动态概念----模仿者动态
进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:
化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。
5.2 经典博弈理论的策略互动分析法及其缺陷
考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。
经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。
与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。
5.3 进化博弈理论局部动态分析方法的现实性
进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。
5.3.1 局部动态分析法的均衡观
传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。
5.3.2 局部动态法的时间观
传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。
5.3.3 局部动态法的均衡选择观
新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。
5.3.4 局部动态法的特殊性
新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。
六、结论
进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。
注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献
[1] 王则柯(1999):《博弈论平话》,中国经济出版社。
[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。
[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。
[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。
[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。
[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。
[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。
[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.
[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.
[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.
[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.
[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.
[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.
[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.
[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.
[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.
[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.
[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.
[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.
[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.
[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.
[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.
[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.
[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.
[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.
[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.
[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.
[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.
[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.
[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.
[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.
[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.
[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.
[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.
[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.
[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.
[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.
[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.
[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.
[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.
关键词:博弈论;君臣博弈;不完全信息静态博弈;不完全信息动态博弈
近年来,博弈论在西方世界发展迅速,应用广泛。而在中国,博弈论并没有得到长足的发展,现有的博弈论教材也多是翻译国外学者的著作或引用西方学者的理论。实际上,中国并不是没有博弈论,中国历史上发生的一幕幕历史事件,其精彩程度远远高于西方学者构造的博弈论模型。中国的博弈论只是没有被作为一门系统化的学科单独提炼出来而已,它隐含在史学家的笔下,埋藏在中国古典文化里,流传至今。
一、历史背景
在司马迁的《史记》中,关于汉高祖刘邦和丞相萧何,有这样一段记载:汉十一年,陈反,高祖自将,至邯郸。未罢,淮阴侯谋反关中,吕后用萧何计,诛淮阴侯,语在淮阴事中。上已闻淮阴侯诛,使使拜丞相何为相国,益封五千户,令卒五百人一都尉为相国卫。诸君皆贺,召平独吊。……召平谓相国曰:"祸自此始矣。上暴露於外而君守於中,非被矢石之事而益君封置卫者,以今者淮阴侯新反於中,疑君心矣。夫置卫卫君,非以宠君也。愿君让封勿受,悉以家私财佐军,则上心说。"相国从其计,高帝乃大喜。汉十二年秋,黥布反,上自将击之,数使使问相国何为。相国为上在军,乃拊循勉力百姓,悉以所有佐军,如陈时。客有说相国曰:"君灭族不久矣。夫君位为相国,功第一,可复加哉?然君初入关中,得百姓心,十馀年矣,皆附君,常复孳孳得民和。上所为数问君者,畏君倾动关中。今君胡不多买田地,贱贳贷以自污?上心乃安。"於是相国从其计,上乃大说。上罢布军归,民道遮行上书,言相国贱强买民田宅数千万。上至,相国谒。上笑曰:"夫相国乃利民!"民所上书皆以与相国,曰:"君自谢民。"相国因为民请曰:"长安地狭,上林中多空地,弃,愿令民得入田,毋收稿为禽兽食。"上大怒曰:"相国多受贾人财物,乃为请吾苑!"乃下相国廷尉,械系之。数日,王卫尉侍,前问曰:"相国何大罪,陛下系之暴也?"上曰:"吾闻李斯相秦皇帝,有善归主,有恶自与。今相国多受贾竖金而为民请吾苑,以自媚於民,故系治之。"……是日,使使持节赦出相国。相国年老,素恭谨,入,徒跣谢。高帝曰:"相国休矣!相国为民请苑,吾不许,我不过为桀纣主,而相国为贤相。吾故系相国,欲令百姓闻吾过也。"(《史记o萧相国世家》)
上述文字记载的是汉高祖刘邦和丞相萧何的一系列的博弈过程,下文将从博弈论的角度加以分析。
二、基于不完全信息静态博弈的分析
1.不完全信息静态博弈
假设博弈参与人的支付函数是所有参与人的共同知识,这样的博弈被称为"完全信息博弈"(game of complete information),而在刘邦与萧何的博弈中,信息是不完全的,这一博弈是"不完全信息博弈"。
规定一个参与人所拥有的所有私人信息(private information,即所有不是共同知识的信息)是他的类型(type)。"不完全信息"表示至少有一个参与人有多种类型,也就是说其他参与人可能不知道这个参与人的类型,反过来,这一参与人也不知道其他参与人是否知道自己的类型。
在"不完全信息博弈"的基础上,经济学家海萨尼提出了"贝叶斯纳什均衡",即在静态不完全信息博弈中,所有参与人同时行动,没有机会观察别人的选择。给定别人的战略选择,每个参与人的最优战略依赖于自己的类型,他不可能准确地知道其他参与人实际上会选择什么战略;但是,他能准确地预测到其他参与人的选择是如何依赖于其各自的类型的。这样,他决策的目标就变成了,在给定自己的类型、别人的类型以及别人类型依从战略的情况下,最大化自己的期望效用。
2.刘邦与萧何博弈的贝叶斯纳什均衡
《史书》记载,萧何是位忠臣,对刘邦忠心耿耿,用古代的道德观念来评价,萧何是一个有道德的人。但刘邦身居高位,高处不胜寒,不能确定萧何是否忠心耿耿。从博弈论的角度讲,刘邦不知道萧何的类型。古人是很看重后人对自己的评价的,例如曹操为了不留下"乱臣贼子"的骂名就没有杀汉献帝。对于萧何而言,造反是有成本的,这些成本不但包括一旦失败会被诛杀灭族,还包括自己的名誉,所以如果萧何是一个有道德的人,他的造反成本就高,相反,如果萧何不是一个有道德的人,那么他的造反成本就低。双方的支付矩阵如表1所示。
现对这个博弈做出假定:第一,博弈参与人有两个,分别是皇帝刘邦、丞相萧何;第二,刘邦的决策变量是"杀萧何/不杀萧何",而萧何的决策变量是"造反/不造反";第三,双方都以实现自身效用最大化为最终目的;第四,双方同时行动,但信息并不完全,即萧何了解刘邦的类型,但刘邦不了解萧何的类型。
表 1 刘邦与萧何的君臣博弈
如果萧何是一个有道德的人,那么他的造反成本会比较高,即使刘邦选择杀他,他为了留下"忠臣"的美名也不会造反;如果萧何不是一个有道德的人,那么即使刘邦不杀他,他也会选择造反。
另一方面,在刘邦看来,萧何属于"造反成本高"的类型的概率是p,属于"造反成本低的概率是1-p。那么刘邦究竟该做出什么样的选择呢?由于刘邦并不确切的知道萧何的成本是高是低,所以刘邦的选择依赖于他在多大程度上信任萧何造反是高成本的。如果刘邦选择不杀萧何,那么刘邦的期望效用是:100p-100(1-p)=200p-100。如果刘邦选择杀萧何,那么刘邦的期望效用是:50p+50(1-p)=50。
令200p-100=50,得到p=3/4。这一结果说明,刘邦的最优选择是:如果p≥3/4,不杀萧何;如果p
上文引述的史料中提到,刘邦曾两次试探萧何,第一次是召平提出的"祸自此始矣。上暴露於外而君守於中,非被矢石之事而益君封置卫者,以今者淮阴侯新反於中,疑君心矣",其大意为"您的祸患从此开始了。皇上在外作战风餐露宿,而您留守京城,并不需要冒着矢石去冲锋陷阵,但皇上却要给您加封食邑、设置卫队,这是因为淮阴侯刚刚在关中谋反,皇上对您也起了疑心。"第二次是萧何的门客提到的:"君灭族不久矣。夫君位为相国,功第一,可复加哉?然君初入关中,得百姓心,十馀年矣,皆附君,常复孳孳得民和。上所为数问君者,畏君倾动关中。今君胡不多买田地,贱贳贷以自污?上心乃安";其大意是:"您要不了多久就会遭受灭族的惨祸了。您位为相国,功居第一,难道功名还能再增加吗?但您从刚进关中的时候起,就深得民心,到现在已有十多年了,百姓们都拥戴您,您总是勤勉办事,深得民心。皇上之所以屡次派人来问您的情况,是怕您利用自己的威望动摇关中。现在您不如多买些田地,并低价赊购、借贷,以此来玷污自己,这样皇上对您就放心了。"刘邦之所以一再地试探萧何,就是为了确定萧何作为博弈参与者的类型--萧何到底是属于造反成本高的类型还是造反成本低的类型。
三、基于不完全信息动态博弈的分析
1.不完全信息动态博弈
在动态博弈中,行动次序有先有后,后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息,修正自己的判断。先行动者知道自己的行为有传递信息的作用,就会有意识地选择某种行动来揭示或掩盖自己的真实面目。不完全信息动态博弈的均衡概念是"精炼贝叶斯均衡"(perfect Bayesian equilibrium)。精炼贝叶斯均衡的关键在于后行动者要根据所观察到的他人的行为来修正自己对他人类型的"信念"(主观概率),并据此选择自己的行动。修正过程使用的是"贝叶斯规则",即每个参与人都假定其他参与人选择的是均衡战略。具体而言,精炼贝叶斯均衡是所有参与人战略和信念的一种结合,他满足如下条件:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。
2.刘邦与萧何博弈的精炼贝叶斯均衡
一种行动要起到传递特定信息的功能,行动者必须为此付出足够的成本,否则行动者的行动就不可信。对于萧何,简单的向刘邦诉说"我是忠臣","我不会谋反","我是个品德高尚的人"是起不到传递信息作用的,因为这种行动不花费任何成本。所以萧何每次向刘邦表明自己的忠诚时都花费了很大的成本:刘邦第一次试探萧何,萧何"悉以家私财佐军",就是把自己家里全部的私有财产拿出来资助军队,表明自己没有私心,结果"高帝乃大喜";刘邦第二次试探萧何,萧何"多买田地,贱贳贷以自污",通过低价赊购、借贷来玷污自己的名声,以表明自己贪图小利,没有争夺天下的野心,结果"上乃大说",刘邦很开心。以上这两种行为虽然在一定程度上减少了刘邦对萧何的猜忌,但要让刘邦彻底对萧何放心,还是不够的。要想达到最佳的信息传递效果,萧何就必须付出更大的代价--"乃下相国廷尉,械系之",意思是"于是就下令把相国交给廷尉拘禁起来,还给他上了刑具"。萧何通过这样三次传递信息终于使刘邦对他彻底地放心,使自己避免了杀身灭族之祸。
刘邦要试探萧何,也并不是不耗费成本的。第一次试探,刘邦"使使拜丞相何为相国,益封五千户,令卒五百人一都尉为相国卫",派遣使者拜丞相萧何为相国,加封食邑五千户,命令安排五百名士兵由一名都尉率领充任相国的卫队;第二次试探,刘邦"数使使问相国何为",多次派遣使者探问相国在做什么;第三次把萧何打入监狱,要背负"暴君"的恶名。这些都是搜索信息所必须付出的成本。
按照贝叶斯规则,刘邦与萧何博弈并得出均衡解的过程如下:在博弈的第一回合,萧何知道自己的类型,但刘邦并不知道。假设在刘邦看来,萧何属于第一种类型(即造反成本高的类型)的概率和属于第二种类型的概率都是1/2,。此时刘邦向萧何发出了第一次试探,萧何作为理性的参与者,向刘邦传递信号--舍弃自己的家财,证明自己的衷心。刘邦收到信号后,依据自己的判断,将自己对萧何的信念修正,假设修正为3/5,这一概率大于刘邦试探之前对萧何的信任程度,双方进入第二回合的博弈。刘邦再次做出试探,萧何通过"自污"的方式向刘邦传递信号,刘邦收到信号后再次修正自己的信念,假设修正为7/10,双方进入第三轮博弈。在第三轮博弈中,刘邦虽然将萧何打入监狱,但实际上是刘邦主动发出信号,考验萧何的忠诚度,萧何出狱后,谦恭谨慎,进宫拜见刘邦时,光着脚步行表示谢罪,表现出绝对的服从,这时,刘邦终于将自己对萧何的信念修正为3/4或更高的水平,相信萧何属于造反成本高的类型,选择不杀萧何,最终得到的均衡解是(不杀,不造反)。
四、结语
本文结合了博弈论的基本理论,通过引述历史资料,对博弈参与人提供基本假定,构建博弈论模型,以及对博弈过程的分析,试图从博弈论的角度阐释历史事件。虽然博弈论这一理论产生自西方,并且在西方发达国家得到了快速的发展和高度的重视,但事实上,有五千年光辉历史的中国早已形成了自己的博弈论,只是它没有形成独立的学科,而是产生于历史人物的不朽的思想之中,通过历史人物自觉地或者不自觉地运用而流传下来。
参考文献:
[1]张维迎.博弈论与信息经济学[M].上海:上海三联书店,1996.
[2]张元鹏.微观经济学(中级教程)[M].北京:北京大学出版社,2007.
[3]司马迁.史记[].韩兆琦,注.北京:中华书局,2007.
[4]胡兴华.论萧相国在《史记》中的形象[J].魅力中国,2010,(6).