博弈论（经济学学科分支）

由网友(源来玺欢凯i)分享简介：专弈论又被称为对于策论（Game Theory）既是古代数教的1个新分支，也是运筹教的1个沉要教科。专弈论首要研究私式化了的激励布局间的彼此做用。[一]是研究具备妥协或者竞争性子征象的数教实践以及要领。专弈论思量游戏中的个别的预测举动以及现实举动，并研究它们的劣化计谋。熟物教野应用专弈实践去懂得以及预测入化论的某些成果。专弈论...

博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。^[1]是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。

博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。

中文名

博弈论

别名

对策论^[2]、赛局理论

创始人

冯·诺依曼与奧斯卡·摩根斯特恩

最基本要素

局中人、策略和收益

外文名

Game Theory

所属学科

应用数学、运筹学

应用范围

金融学、生物学、经济学等

博弈规则

局中人、行动和结果

博弈论概念

《博弈圣经》博弈论的定义：我们把动物利用大自然移动的瘾魂，在决策人期待的空间里，形成相对均衡的语文学理论，称为博弈论。（摘自《博弈圣经》中《人类未知的蓝色档案》一文）。

博弈论（Game Theory）又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。博弈论又被称为对策论(Game·Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。

博弈论就是研究互动决策的理论，所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

博弈的发展

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

近代对于博弈论的研究，开始于策梅洛（Zermelo），波莱尔（Borel）及冯·诺依曼

（von Neumann）。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。博弈论已发展成一门较完善的学科。

诺贝尔奖

从1994年诺贝尔经济学奖授予3位博弈论专家开始，共有7届的诺贝尔经济学奖与博弈论的研究有关，分别为：1994年，授予加利福尼亚大学伯克利分校的约翰·海萨尼（J.Harsanyi）、普林斯顿大学约翰·纳什（J.Nash）和德国波恩大学的赖因哈德·泽尔滕（Reinhard Selten）。以表彰这三位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了的重大影响。1996年，授予英国剑桥大学的詹姆斯·莫里斯（James A. Mirrlees）与美国哥伦比亚大学的威廉·维克瑞（William Vickrey）。前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论，后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。

2001年，授予加利福尼亚大学伯克利分校的乔治·阿克尔洛夫（George A. Akerlof ）、美国斯坦福大学的迈克尔·斯宾塞（A. Michael Spence ）和美国哥伦比亚大学的约瑟夫·斯蒂格利茨（Joseph E. Stiglitz）。他们的研究为不对称信息市场的一般理论奠定了基石，他们的理论迅速得到了应用，从传统的农业市场到现代的金融市场，他们的贡献来自于现代信息经济学的核心部分。

2005年，授予美国马里兰大学的托马斯·克罗姆比·谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(Robert John Aumann）。二者的研究通过博弈论分析促进了对冲突与合作的理解。

2007年，授予美国明尼苏达大学的里奥尼德·赫维茨（Leonid Hurwicz）、美国普林斯顿大学的埃里克·马斯金(Eric S. Maskin）以及美国芝加哥大学的罗杰·迈尔森(Roger B. Myerson）。三者的研究为机制设计理论奠定了基础。

2012年，授予美国经济学家埃尔文·罗斯（Alvin E. Roth）与罗伊德·沙普利（Lloyd S. Shapley）。他们创建“稳定分配”的理论，并进行“市场设计”的实践。

作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。

2014年，授予法国经济学家梯若尔。他在产业组织理论以及串谋问题上，采用了博弈论的思想，让理论和问题得以解决。在规制理论上也有创新。

博弈要素

1.决策人：在博弈中率先作出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。（博弈圣经）

2.对抗者：在博弈二人对局中行动滞后的那个人，与决策人要作出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，占去空间特性，因此对抗是唯一占优的方式，实为领导人的阶段性终结行为。（博弈圣经）

3.生物亲序：所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。在博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。（博弈圣经）

4.局中人（players）：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

5.策略(strategiges)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

6.得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

7.次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。

陈旧理论

博弈论(Game Theory)，有时也称为对策论，或者赛局理论，应用数学的一个分支, 目前在生物学，经济学，国际关系，计算机科学, 政治学，军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构（游戏或者博弈（Game)）间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure)，所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。生物学家使用博弈理论来理解和预测进化论的某些结果。例如，John Maynard Smith 和George R. Price 在1973年发表于Nature上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还可以参见进化博弈理论（evolutionary game theory）和行为生态学（behavioral ecology）。博弈论也应用于数学的其他分支，如概率，统计和线性规划等。

发展史

对博弈论的研究可以追溯到19世纪，甚至更早。对于博弈论的研究，开始于策墨洛(Zermelo1913)，波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928)，后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern，1944，1947)（《博弈论与经济行为》）首次对其系统化和形式化（参照Myerson, 1991）。随后约翰·福布斯·纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。直至《博弈圣经》

的出现，《博弈圣经》与原有博弈论书籍最大的不同就在于，独创了国正论、国正双赢理论和粒子行为论，书中博弈取胜的文化理论统一了人类的博弈占优行为。更重要的是，它让博弈理论终于可以在现实生活中具体操作，让普通大众通过研习，成为真正的博弈高手。因此，《博弈圣经》中的博弈理论在政治、经济、文化、生活、娱乐等社会的各个领域具有可应用性，并且对于个人的工作、生活也有具体的指导意义。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已经开始向博弈哲学的方向发展，将来，它将成为一门较完善的的学科。

博弈哲学

《博弈圣经》的博弈哲学是当今最为实在的输赢与均衡的政治经济哲学，也是未来世界上任何人都无法逃避的博弈实体经济学。科学发展观背后的哲学思想，可以让更多的高官进入一个思考创新的空间。他们工作中的一举一动，都包含了文明或野蛮的创作，也是一次次博弈或赌博的创作。博弈是阳光下的赌博，赌博是隐蔽下的博弈，博弈与赌博的区别就是一个实体法则在飞秒瞬间界定的。也就是说，同样的事情，法定允许就是博弈，不允许就是赌博。

博弈类型

博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解：“囚徒困境”就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。

经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium），子博弈精炼纳什均衡（subgame perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium），精炼贝叶斯均衡(perfect Bayesian equilibrium）。

博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型；以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。

中的国正论

国正论，国正双赢理论、粒子行为论，是博弈论的重要理论，出自著名经济学高级学术著作一书，为博弈论理论打下了坚实的基础。

国正论释义：它是一个实体性质的地域似的区间，具有复杂的结构，用情、理、法、力都不容易分割的一个不知大小的抽象体。从中我们可分出正确和期望得到的那一小部分，与反相对、与负相对，又可以判断事物的道理。世界上的万物、事件的结果，都是不平等的、非绝对对立的两块，大的那部分是国，小的那部分是正。

《博弈圣经》中的国正论

人的行为互相作用，互相影响，高熵赛棋─—就是研究判定人的行为，互相作用时的决策和结果之间的关系，是国是正，没有任何决策能独立于国正大小不同的两块之外，博弈结果的国正论显得更为重要而广泛。

世界上的任何事情，都可以看成是博弈，把世界看成是一个大的博弈场。发明家的粒子行为论、国正论、博弈的正理理论，正在启迪人们，并逐渐地感觉到那是博弈的大发明，并告诉所有的人，去除一切传统的博弈思想，改用新的博弈行为，对待每一个事情，找到一个最好的单方占优的博弈正理的决策立场，可以对未来一切的事物进行因特分配。

理解国正论的发明，再用国正论理解决策人和对抗者，解释现在和未来。用国正论解释不绝对对立的现象十分恰当，当人们涉及到过去，把它看成和现在或未来相关，实际这是混为一谈。整个过去、现在、未来失去了各自的位置，陷入了混沌无序之中，有时候人们把过去当成未来，有时又把现在和二者混起来。一个真切的感觉是它们实现真理的一致性，国正论就是实现它们真理的理论，先进行体验，辨别出或然性真理，再把未来博弈正理推导出来。我们说国正论是来自大自然，国正论必须被当成自然的教令加以接受，我们注意到，越是崇高神圣的东西越不太容易被接受。国正论的国，指的是包含了负的意思，决策人作出赞成的决定，是国（博弈的结果是负），决策人作出反对的决定也是国（博弈的结果也是负），国与正本身就是一个难以理解的分配结果的博弈的词汇，一个人决策，两个以上的人对抗，就有可能会出现双赢，就是大于两个以上的合作者才会出现双赢。

释义

《博弈圣经》中《人类未知的蓝色档案》一文中写道：

“谁能让现代的博弈行为接近野蛮，谁能让友善与凶残之间的距离大到令人不解，谁就在博弈中取胜。”

博弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样，都是从复杂的现象中抽象出基本的元素，对这些元素构成的数学模型进行分析，而后逐步引入对其形势产影响的其他因素，从而分析其结果。

基于不同抽象水平，形成三种博弈表述方式，标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲，博弈论是研究理性的行动者相互作用的形式理论，而实际上正深入到经济学、政治学、社会学等等，被各门社会科学所应用。

经济战略版本

《博弈圣经》中说："一个民族博弈知识的落后，也会落后其他民族。无论是穷国和富国，还是穷人和富人，都会要求改善博弈的结果。""穷富的区别就在于分享博弈正理的多少。"科学发展观正在利用道德与博弈的版本作为战略；整合人才、知识、科技、创新的一切优势，推进着国家的富强，并向未来发出挑战。一个国家的高端人群和各界精英如果掌握了更多的博弈知识，掌握了博弈方，就会表现出令人难以置信的经济成就。也许在某一时期，他们参与世界博弈的混战，世界经济也会为此颤抖。

道德与博弈的共存一元论是经济学里的默认定律。

对纳什的嘲讽

我们用高熵赛棋认识粒子行为，就是认识人的行为，它和各单元之间的相互作用就是提示我们认识人和社会的关系，就不是部分之和那样简单。其实，它包含了无数个体单元性质的主题，它们相互嵌套在一起，是实体的概念。科学发展观就是这个博弈实体的概念，《博弈圣经》上说：“实体一元论在数目上的同一性，发生的因果次序不属于个人的部分本性，这种属性是实体的性质。”由此看出，人是代表了实体。如果认识科学发展观是用博弈实体的理论，就可以确定人性与物的对局是决策粒子二特性，也是大自然的平行法则。如果我们用科学发展观的定义，理解科学发展观和博弈实体相关联的许多事物并把它应用到社会中的具体事件上，用四种量具作出的区分，那才是完美的知识论。由此，我们也看出了三笔糊涂账：

一，中国的孙子兵法：运筹帷幄，审时度势，权衡利弊，知己知彼，至今却没有形成标准化的尺度，也没严格的数据。如果我们用科学发展观的定义度量它们，它是一笔糊涂账。

二，现代人对社会的认识：什么是各部门之间加强沟通、协调与综合平衡，什么是精确思维和模糊思维的对立统一，什么是个人目标与组织目标综合思考，什么是定性定量相结合，什么是相互合作又相互竞争，什么是单极思维与综合思维。我们对每一句话进行追踪，发现它们抽象、空洞，没有具体内容。谁也不知道表述的一大半一小半是什么结构，没有实体，就没有性质，没办法定性就没办法区分，没办法量化就没办法计算。如果我们用科学发展观的定义度量它们，它又是一笔糊涂账。

三，近代科学家的理论：广义相对论和狭义相对论、牛顿的力学和绝对时空观、弯曲时空、坐标对应、平衡对称、四维时空、场属性等这些概念，如果我们用科学发展观的定义度量它们，它是科学家的一笔糊涂账。

无论他们用什么方法，都是在用不同的方式进行排列，也是在进行博弈的重组。几百年来，人类探索博弈取胜之道毫无进展，理论思维极度混乱。从纳什发表他的文章60多年以来，并没有带来纳什热，他的纳什均衡取胜理论，一定不是量的平均，他自己就不知道纳什均衡是博弈实体里的大自然特性，所以纳什就根本不知道在博弈中怎样取胜，因此，他在世期间不会向世人做出博弈取胜的解释。今日我们用科学发展观的定义再看博弈论、矛盾论、概率论，还有所谓的经济学名著，无论多么伟大的经济学天才，使用上述的这些理论，都不知道怎么占优，不知道怎么能赢。

既然他们在预测未来上毫无进展，那么在科学发展观的时代，就应该对高熵赛棋研究博弈单方占优的理论有所关注。即使总统竞选也是使用了高熵赛棋二人对局的博弈机制。以往谈囚徒困境和纳什均衡的人都是用一个模糊的概念搬来搬去，坐在办公室里凭空假想，对天论道，从无知到无聊争论了半个多世纪。博弈论是赌徒理论，是真正赌徒的矛盾对决，用筹码表现输赢与均衡结果的语文学理论那才是真正有价值的经济学理论。看看《博弈圣经》，怎样区分决策人和对抗者的先后次序，为什么对它们进行了不同的称呼，满足了托马斯•谢林多年的困惑，实现了它们的单方占优。更为讽刺的是，一本本博弈论著作，古老的内容千篇一律，里面没有几句精彩的话，没有几个经典的词，更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。从《博弈圣经》的出版，人们才知道博弈的二人对局中一个是决策人，一个是对抗者，《博弈圣经》在166节中写道：“那些身穿黑色礼服，年迈的绅士们，为博弈的进步捧走了人类最高的诺贝尔奖，这是人类博弈的最高水平，假如他们进入娱乐场，在百家乐的赌台上搏击，我想他也会像拳击运动员一样被击败在拳台上，这一定是一个事实，他必须接受这个事实，一定会被裁判渎秒。”

以往经济学家为了降低风险，建议投资多元化，“不要把鸡蛋放在一个篮子里”。这种分散投资的经济思想，实在是经济学家对博弈取胜的无奈。我们把科学发展观的理论特征和高熵赛棋的实际相结合，从实际操作的输赢结果中得出结论：一个资深的经济学家在高熵赛棋上的表现比一个智力不全的人还占弱势，这是无情的博弈事实。《博弈圣经》在453节有一段风趣的表述：“我们根本不能完全理解大自然，或许人们不如老鼠在寻找食物时能选择最近的路程，那是大自然的拓扑几何图像的捷径。”

西方死亡博弈

非白即黑的矛盾论辩证法已经受到时间、空间和博弈实体特性的极大限制，而博弈论、矛盾论、概率论和西方经济学一样都不是完美的理论，已经不能指导博弈实体向更高文明的发展，更不能指导未来。科学发展观的博弈实体知识论、国正论哲学辩证法、矛盾论经验对决，它们共同的结构可以构筑未来科学、自然哲学博弈实体经济学。

我们应用科学发展观的博弈哲学思想，阐明了博弈论、矛盾论、概率论的战术性质。

博弈论是二人对局，一个叫决策人，一个称对抗者。

矛盾论是两个同性质的二人对决。

概率论则是通过二人对局的个数之比得出。

博弈论、矛盾论、概率论各自都是两个相同性质的对决只能提供经验，只有对

实体与性质的区分才能称为知识。西方文化大宗教理论都是极其渺小的个体性质的战术属性，决不能处理博弈实体里的战略。在任何博弈实体的系统里，在具体事件中，用矛盾论建立的二人博弈对局都是在悖论中自圆其说，都不能通达博弈实体的事实真相。博弈论、矛盾论、概率论这些文化大宗教理论已经不能解决未来博弈实体里的文明，到了极不正常的历史死亡阶段。因为这些抄来抄去的非物质文化概念，界定模糊，无法定性，无法区分，无法操作，无法验证，不能证明，又不能证伪。它让人没有自在，没有自我，没有哲学，更没有科学。科学不是为哪个阶级服务的，科学是大自然前进的规则，科学又像似监工，《博弈圣经》中说：“科学是专门批判他人的。”任何邪恶和迷信都会后退，科学的任务是如实地让人们认识自然本来的面貌。粒子行为论、国正论、国边常数1.992187是对政府和人民的提醒，也是让怀疑论者百口难辨。博弈圣经著作人在他的另一部《货币的威力》一书中写到：“怀疑论者是“人格宗教”，孤立成神，他永远向实体战略宣战。”博弈粒子基因取胜的理论会引发更多人对战略文化的思考。

单方占优模型

高熵赛棋这个单方占优的理论模型，把百家乐赌台当棋盘，把赛棋“红方、蓝方”转换成“庄、闲”，一旦特性移植的取胜理论被验证，那些无知又无聊的一维思想，那些忽悠人的博弈论、矛盾论、概率论将被彻底否决。

《货币的威力》一书中说：“哪里有生命，哪里就有事件的开端。哪里有矛盾，哪里就有死亡。哪里有非绝对对对立的国正论，哪里就有粒子行为的碰壁而终结，哪里就有新体制、新结构和新事物的创生。”

21世纪是科学发展观的时代，与此同时各种错误的观念都在转变。未来的专家不必用围棋、象棋和多米诺骨牌表示博弈对局，这些都不是博弈的实战模型。那些在媒体上拿着棋子在棋盘上比来比去做广告的人，没有一个人能讲出什么是战略，什么是战术，什么是决策人和对抗者，他们怎么能单方占优，怎么才能赢。更为滑稽的是，一个博弈论专家、矛盾论专家、概率论专家，竟没有创造一个词，也没发明一句经典的话，更不要说定理、定律、定义和法则，所以没有一个人敢公开说怎么赢。

未来的政治家、军事家不能仅仅喊几句博弈口号或知道一点散落在民间的博弈小常识和几个博弈词汇，也不是讲几个博弈的小故事。如果不知道高熵赛棋具有极其重要的军事战略文化价值，没有真正用高熵赛棋的二人对局对其进行深入地实战性研究，就不知道在二人对局中如何战胜对手，更不知道在未来的大博弈中取胜，对一个国家的各级CEO，那将是一个灾难性的未来。《博弈圣经》上说：“21世纪博弈的大事是精确地测量，科学家可以对未来100年的科学进行预测，没有一个人敢预测博弈的未来，可见难度非同一般。不经过测量的东西是粗糙的、杂乱的、不符合意愿的、难以控制的。”《博弈圣经》阐述的理论和高熵赛棋，这不是虚构的文学故事，也不是官员的形式空话，更不是大学里抄来的论文，这是公开于世的发现，它所有的理论都受到知识产权的法定保护。

连胜法则

成语：（1024连胜法则）

高熵赛棋是一个大发明，它是一个博弈的取胜模型，

总统候选人用它获得竞选宝座，科学家用它有所发现，傻子用它改变智力的结果

麻将店老板得知这一消息，就买了几套高熵赛棋放到店里，结果很少有人玩，该店就决定通过一次竞赛让人们了解高熵赛棋。当竞赛信息发出后，奇怪的是前来报名参赛的人有总统候选人、科学家、还有一些傻子。由于赛期和总统竞选日期冲突，候选人就不来了，科学家担心自己发现的成果会泄漏，科学家也不来了，最后有1024个傻子参加竞赛，他们使用末尾淘汰制，经过八轮淘汰之后，剩下四个傻子连续八次不败，让人无奈的是他们遵照了“1024连胜法则”，其中的一个傻子对麻将店老板说：“博弈不讲智力，只要参与就有机会。”

映射均衡

《博弈圣经》里《人类未知的蓝色档案》一文中说：“想赢得未来，不是数学家的映射方程，而是映射均衡。”在高熵赛棋上每一次发生的事件分别用红蓝粒子进行记录，可以看成是一个粒子行为的一次涨落，也是自己的智慧作出与大自然竞赛结果的记录。当同色粒子连续出现三次之后就另外加上一个粒子，通过这样一个粒子插值，有可能产生一个基本粒子单元，也就相当于结束了一个事件或一个阶段。这个虚拟的粒子插值组成了一个粒子大分子，这个插值相当于正常机体里的癌细胞，它的增值会使这个健康的大分子染上与它同样的性质，已经失去真实大分子的价值，根据国正论系统的辩证法原理，人们把这个虚拟癌化的大分子看成“国”，把它映射均衡的空间看成一个“正”的稳定区间，这是博弈取胜的空间，在事件发生之前一大半的信息可以被人掌握。

人的行为表现自然科学一切创新的文化，借用高熵赛棋这个二人博弈对局的模型认识粒子行为基因的映射均衡原理，它证明了自然界的一切事物不可约化的复杂性，科学家越来越多的努力在这里遭到了莫名奇妙的失败。我们从科学的定义里可以看出，任何一个人在博弈实体中发生的事件都是前所未有的，也不可预测。谁通过观察高熵赛棋上的粒子状态，谁用历史上自然显示出来的粒子规律和经验预测未来，谁将失败。创新的设计和预测没有固定的章法，也没有不变的模式。

经验是个人可复制的历史文明行为。

规律是领袖对未来秩序的文化思考。

博弈实体兵法

20世纪缺少博弈实体的理论，实体是战略，性质是战术。实体是组织，性质是个人，实体是宏观，性质是微观。博弈实体的文化结构只是知识论的区分，不是两个性质的矛盾对决。哪里使用矛盾论绝对平等，哪里就有纠缠;哪里把矛盾论看成是哲学的思辨，哪里就有争吵;哪里用矛盾论解决两国实体观念的静止，哪里就有战斗。

过去的东德和西德，现在的中国大陆和台湾，南韩和北朝鲜，都是实体分离不变的性质，只是区分，不是对决。任何三者插手他们的政治主权，都有博弈的动机，这种战术行为，只能得到阶段性利益，当然也会留下博弈“囚徒困境”的后患。

我下面的表述，不是战略和战术，也不是宏观经济学和微观经济学，相当于实体与性质在第三空地里的混合性表述，用矛盾论对立思维理解它，会带来带来困难；未来战争的目的不是占领，而是毁灭性打击。减少对手，独自掠夺，这是未来战争的博弈取胜法则。博弈单方占优的理论告诉我们，未来战争是最短时间的战斗行为。核弹的相互威胁，也不是无止境地威胁下去，只要有，就会发生，因为小规模的冲突与发展不是一个梯度的边界，而是一个射度现象。人们在处理恐怖和危机时，没有一个博弈高手敢说在射度的未来会发生什么，人对未来的判断都是决策人的性质，没有人懂得对抗者的空间才是最终占优，所以决策人的一大半行为都是错误的，都是以不愿看到的一大半失败而告终。

假如一个强大的国家受到他国的威胁，这时就要用《博弈圣经》的博弈理论把来自威胁的地方看成决策人，应该做出对抗者的行为，先发制人，一举毁灭。《博弈圣经》的博弈哲学思想表明：如果一个弱小的国家利用博弈的战术能够拥有与大国同归于尽的战争意识，并拥有同归于尽的能力，他们将成为伙伴。 《博弈圣经》中说：“优先预测悲剧后作出的忍让是道德。优先预测胜利前作出的竞争是博弈。”这种博弈协同将转为道德协同，道德协同也会上升为博弈协同。

战争发生——当可利用的能量和自信超越对死亡的恐惧，战争就不可避免。

贪污腐败——当自信超越对意外发生的恐惧，贪污就不可避免。

执法犯罪——当利益与卖法超越对犯罪的恐惧，执法犯罪就不可避免。

国家领导人应该对道德与博弈的配比完全根据现实临时进行调整，让每一个人建立博弈实体世界观，让每一个人懂得，未来的政治是博弈实体政治，接受实体特性与两灵性的分离不变性学说，体现科学发展观时代执政的科学理念。未来世界评比各国领袖的治国战略，就是看他应用道德与博弈的水准作为他个人的综合竞争力，无论他是显示人性的和平或者发动残酷的战争，都是文明与野蛮的创作，它们同是博弈的性质，都可能得到好评。

我们把统治者模仿大自然博弈实体的秩序，外在于个体的一个整体结构，称为政治。大自然的实体已经内化到了个体的人性。

人的理性就是来源于自然实体瘾魂的秩序，自然的秩序高于理性。

如果理性符合自然的要求，自然的要求就自然地实现

假如理性违反自然的秩序，自然的秩序就强制地实现

这就是在博弈实体中解释人与自然的意图。

这些军事价值应用的博弈理论属于首脑和防长的智库理论，未来每一个国家的最高司令部都要秘密地成立战略博弈司令部，这是未来博弈实体政治之上的政治博弈。

其实，所有的问题都具有国正论非绝对对立的哲学结构。国正论的上一级为实体特性，国正论的下一级为矛盾性质，博弈实体、国正论、矛盾论都是在相对比较时产生的结论。人们在观察世界时临时凝结成的一个组织可能是博弈实体，可能是国正论，可能是矛盾论。

博弈实体是世界观，国正论是系统论，矛盾论是辩证法，它们都是哲学的范式。

博弈实体经济学

《博弈圣经》博弈实体经济学的定义：

“我们把博弈实体政治分离不变性学说，能容得下宏观经济实体与微观经济性质的语文学通论，看成博弈实体经济学。”

人们看到博弈实体经济学的兴起，它是把政治经济学、宏观经济学，微观经济学合为一体，用博弈实体知识论的政治概念，对所谓的宏观经济学和微观经济学进行特性的的区分，建立博弈实体经济学。人们看到一分为二的国正论非绝对对立性，是真正用哲学认识事物。人们看到矛盾论同性质会产生斗争和娱乐两大不同特性，这将是人类走向文明进步首先遇到的最新文化课题。科学理论家、优秀的政治家、银行家、军事家、法学家，对它们不同层次的相对性进行完整的思考和语文学表达，一定会形成科学的统一理论，让人们看到真实世界的本质。

十部经典著作

1、亚当.斯密（英国）《国富论》。斯密此书是现代经济学的奠基之作，也是最伟大的经济学著作。他的劳动价值论，分工与专业化是经济效率之源的理论，“看不见的手”经济自由主义理论，都睥睨古人，下开百世。对经济学的贡献堪比牛顿对物理学的贡献。　　

2、《博弈圣经》（新加坡）。独创了国正论、国正双赢理论和粒子行为论，是一部影响人类的非物质文化的经济学高级学术著作，它的粒子基因的映射均衡理论，单方占优理论，引起世界经济学、军事科学、自然哲学、博弈论界的极大关注。

3、大卫·李嘉图（英国）。《政治经济学与赋税原理》（第一卷）。李嘉图是伦敦交易所里成功的投机商人，又能在理论经济学领域做出不朽贡献，真是绝顶的天才。本书中他阐明的比较优势理论是现代自由贸易政策的理论基础。

4、马克思（德国）《资本论》。马克思的剩余价值理论撇开学理而言，就其改变世界的力量之大，够入选最重要的经济学著作。

5、瓦尔拉斯（法国）《纯粹经济学要义》。现代经济学的主观价值（效用）论、边际革命、经济学数理化的转向通过本书而系统化，熊彼特曾赞誉此书为经济学作为严密科学所取得的最高成就。　　

6、费雪（美国）《利息理论》。在我看来，此书是迄今为止最伟大的关于资本理论的研究，在马克思发现剩余价值的地方，他看见的是放弃当前消费而承担未来的不确定性的风险的报酬。张五常认为本书驳倒了《资本论》。　　

7、凯恩斯（英国）《就业、利息和货币通论》。在我看来，尽管被称为宏观经济学的奠基者，他最重要的贡献也许是对个人理性通过自由竞争自然产生社会理性（斯密“看不见的手”理论的核心）这一理论的质疑和批判，只是其建设性的部分即国家干预政策争议很大。

8、马歇尔（英国）《经济学原理》。马歇尔的最主要著作是1890年出版的《经济学原理》。该书在西方经济学界被公认为划时代的著作，也是继《国富论》之后最伟大的经济学著作。该书所阐述的经济学说被看作是英国古典政治经济学的继续和发展。以马歇尔为核心而形成的新古典学派在长达40年的时间里在西方经济学中一直占据着支配地位。

9、萨缪尔逊（美国）《经济学》。把一本教科书选为最重要的经济学著作，会遭到很多人的质疑。本书作为最成功和发行量最大的经济学教科书，在把经济学知识标准化、体系化方面的贡献比当代任何一个人都多。就其改变经济学知识的传播和复制方式的力量之大，入选最重要的经济学著作。　　　　

10、布坎南（美国）《同意的计算》。本书开创的“公共选择”理论，使宪政民主制可以用数理工具定量分析，为经济和政治的制度研究开辟了全新的路径。

博弈案例

这零和游戏的原理

当你看到两位对弈者时，你就可以说他们正在玩“零和游戏”。因为在大多数情况下，总会有一个赢，一个输，如果我们把获胜计算为得1分，而输棋为-1分，那么，这两人得分之和就是：1 （-1）=0。

这正是“零和游戏”的基本内容：游戏者有输有赢，一方所赢正是另一方所输，游戏的总成绩永远是零。

零和游戏原理之所以广受关注，主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面，胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。从个人到国家，从政治到经济，似乎无不验证了世界正是一个巨大的“零和游戏”场。这种理论认为，世界是一个封闭的系统，财富、资源、机遇都是有限的，个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺，这是一个“邪恶进化论”式的弱肉强食的世界。

但20世纪人类在经历了两次世界大战，经济的高速增长、科技进步、全球化以及日益严重的环境污染之后，“零和游戏”观念正逐渐被“国正双赢理论”观念所取代。人们开始认识到“利己”不一定要建立在“损人”的基础上。通过有效合作，皆大欢喜的结局是可能出现的。但从“零和游戏”走向“国正双赢理论”描述的博弈结果，这就要求各方要有真诚合作的精神和勇气，在合作中不要耍小聪明，不要总想占别人的小便宜，要遵守游戏规则，否则“国正双赢理论”的局面就不可能出现，最终吃亏的还是自己。

合作互助的模式

在现在高度竞争的社会里，生存的游戏就是利己主义和利他主义之间的博弈，人性中的合作互助的模式，不是有意的，而是生物亲序防止衰变的本性。科学发展观的均赢文化，在《博弈圣经》中这样描述："真正体会到博弈的乐观主义和伟大高尚的利他主义行为，博弈的取胜结果就无可争议。"从每个人的精神到行为，处处表现出利他主义，会提升被别人帮助的几率。

华盛顿合作规律

华盛顿合作规律说的是：一个人敷衍了事，两个人互相推诿，三个人则永无成事之日。多少有点类似于我们“三个和尚”的故事。人与人的合作不是人力的简单相加，而是要复杂和微妙得多。在人与人的合作中，假定每个人的能力都为1，那么10个人的合作结果就有时比10大得多，有时甚至比1还要小。因为人不是静止的动物，而更像方向各异的能量，相推动时自然事半功倍，相互抵触时则一事无成。我们传统的管理理论中，对合作研究得并不多，最直观的反映就是，目前的大多数管理制度和行业都是致力于减少人力的无谓消耗，而非利用组织提高人的效能。换言之，不妨说管理的主要目的不是让每个人做到最好，而是避免内耗过多。21世纪将是一个合作的时代，值得庆幸的是，越来越多的人已经认识到真诚合作的重要性，正在努力学习合作。

邦尼人力定律：一个人一分钟可以挖一个洞，六十个人一秒种却挖不了一个洞。

合作是一个问题，如何合作也是一个问题。

奥卡姆剃刀定律

如果你认为只有焦头烂额、忙忙碌碌地工作才可能取得成功，那么，你错了。

事情总是朝着复杂的方向发展，复杂会造成浪费，而效能则来自于单纯。在你做过的事情中可能绝大部分是毫无意义的，真正有效的活动只是其中的一小部分，而它们通常隐含于繁杂的事物中。找到关键的部分，去掉多余的活动，成功并不那么复杂。

奥卡姆剃刀：如无发要，勿增实体。

奥卡姆剃刀定律在企业管理中可进一步深化为简单与复杂定律：把事情变复杂很简单，把事情变简单很复杂。这个定律要求，我们在处理事情时，认清博弈实体，区分出实体与性质，解决最根本的问题。尤其要顺应自然，不要把事情人为地复杂化，这样才能把事情处理好。

蝴蝶效应

蝴蝶效应是气象学家洛伦兹1963年提出来的。

其大意为：一只南美洲亚马孙河流域热带雨林中的蝴蝶，偶尔扇动几下翅膀，可能在两周后引起美国德克萨斯引起一场龙卷风。其原因在于：蝴蝶翅膀的运动，导致其身边的空气系统发生变化，并引起微弱气流的产生，而微弱气流的产生又会引起它四周空气或其他系统产生相应的变化，由此引起连锁反映，最终导致其他系统的极大变化。

此效应说明，事物发展的结果，对初始条件具有极为敏感的依赖性，初始条件的极小偏差，将会引起结果的极大差异。

“蝴蝶效应”在社会学界用来说明：一个坏的微小的机制，如果不加以及时地引导、调节，会给社会带来非常大的危害，戏称为“龙卷风”或“风暴”；一个好的微小的机制，只要正确指引，经过一段时间的努力，将会产生轰动效应，或称为“革命”。

青蛙实验

19世纪末，美国康乃尔大学做过一次有名的青蛙实验。他们把一只青蛙冷不防丢进煮沸的油锅里，在那千钧一发的生死关头里，青蛙用尽全力，一下就跃出了那势必使它葬身的滚烫的油锅，跳到锅外的地面上，安全逃生！

半小时后，他们使用同样的锅，在锅里放满冷水，然后把那只死里逃生的青蛙放到锅里，接着用炭火慢慢烘烤锅底。青蛙悠然地在水中享受“温暖”，等到它感受觉到热度已经熬不住，必须奋力逃命时，却发现为时已晚，欲跃乏力。青蛙全身瘫痪，终于葬身在热锅里。

猴子道德实验

科学家将四只猴子关在一人密闭房间里，每天喂很少食物，让猴子饿得吱吱叫。几天后，实验者在房间上面的小洞放下一串香蕉，一只饿得头昏眼花的大猴子一个箭步冲向前，可是当它还没有拿到香蕉时，就被预设机关所泼出的滚烫热水烫得全是伤，当后面三只猴子依次爬上去拿香蕉时，一样被热水烫伤。于是众猴子只好望“蕉”兴叹。

几天后，实验者换了一只新猴子进入房内，当新猴子肚子饿得也想去吃香蕉时，立刻被其他三只老猴子制止，并告知有危险，千万不可尝试。《博弈圣经》中说： 优先预测悲剧后作出的忍让是道德。

博弈是决策优先，道德是对抗默认。理性是说教，道德是展现。道德与自信没有法纪，是第三空地里游荡的个人意志，可以自我鉴别，自我判断，自我鼓励，自我惩罚。

实验者再换一只猴子进入房间内，当这只猴子想吃香蕉时，有趣的事情发生了，这次不仅剩下的三只猴子制止它，连没被烫过的半新猴子也极力阻止它。

实验继续着，当所有猴子都已换过之后，没有一只猴子曾经被烫过，上头的热水机关也取消了，香蕉唾手可得，却没有一只猴子敢前去享用。

博弈圣经中说：忍让是道德

农夫的爱情

有些人牺牲现在而倾向于将来，像一位农夫辛勤地喂养自己的绵羊，突然有一天，毫无敌意的绵羊被砍下了头颅。这是博弈精神伟大之处，也是令人不解之处，这就是爱情。其实这是一种自私，一个接一个爱情的连续，游戏才继续下去。

农夫的爱情

我们把文化进程中被瘾魂驱动的欲望抛弃了自我之后，自由给予的真、善、美，定义为爱。

爱是精神文化过程，真、善、美表现出的高尚感，在瘾魂的作用下，它会俘获，也会出现极小极大地自由跟随，暂时的信任就变成了全部意义。

信任并自由地给予和欲意的收入，定义为幸福。

人们提倡的浪漫与自由，是动物的本能特性。一个人和多少异性对局，就有多少个行为印象，男女之间对这种印象行动称为感情。

感情是依赖，是瘾魂驱动欲望过程中的殷勤创作。

感情是精神疫情，发作时使人疯癫成为怪物，这种怪物行为的畸变反而成了鲜活浪漫的感情作品，不然会导致xx、婚变、家庭悲剧、自杀、情杀、道德和法制压力。爱的文化进程就是博弈，它的结果是情，爱与情是一个象物又象魂的物势影像，我定义为爱情。所以，谁也说不清人的一生在寻找什么，最终好像在寻找一种废物。

摘自《博弈圣经》曹•国正著（新加坡）经济学高级学术著作世界十部经典著作之一

世界著名图书馆、著名大学收藏----海外中文图书

博弈的类型

(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。

　　(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。

(3)完全信息不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；反之，则称为不完全信息。

(4)静态博弈和动态博弈

静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。

动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

财产分配问题和夏普里值（Shapley value）

考虑这样一个合作博弈：a、b、c、投票决定如何分配100万，他们分别拥有50％、40％、10％的权力，规则规定，当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配，a50万、b40万、c10万c向a提出：a70万、b0、c30万b向a提出：a80万、b20万、c0……

权力指数：每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数，这个“关键加入者”的个数就被称为权利指数。

夏普里值：在各种可能的联盟次序下，参与者对联盟的边际贡献之和除以各种可能的联盟组合。

次序 abc acb bac bca cab cba

关键加入者 a c a c a b

由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6

所以a,b,c应分别获得100万的2/3,1/6,1/6。

历史意义

《博弈圣经》中也说到：21世纪，应站在博弈论的前沿。尽管博弈经济学家很少，但其获诺贝尔奖的比例最高。最能震动人类情感的是博弈，对未来最有影响力的还是博弈。评论一个人和一个国家的穷富，就看他分享博弈正理的多少。

博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博弈论是个非常重要的理论概念。

什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法…

面对如许重重迷雾，博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) ，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解” 或“平衡” ，也就是对参与双方来说都最“合理” 、最优的具体策略？怎样才是“合理” ？应用传统决定论中的“最小最大” 准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对于每一个二人零和博弈，都能够找到一个“最小最大解” 。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在于，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望，做最坏的打算” 。

博弈论--这是一个热得烫手的概念。它不仅仅存在于数学的运筹学中，也正在经济学中占据越来越重要的地位（近几年诺贝尔经济学奖就频频授予博弈论研究者），但如果你认为博弈论的应用领域仅限于此的话，那你就大错了。实际上，博弈论甚至在我们的工作和生活中无处不在！在工作中，你在和上司博弈，也在和下属博弈，你也同样会跟其他相关部门人员博弈；而要开展业务，你更是在和你的客户以及竞争对手博弈。在生活中，博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。

诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：

要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。

也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。

博弈论很深奥吗？通过本教材你将发现深奥的博弈论原来也可以这么生动、通俗和易懂。大量的案例、平实的语言，将帮助你轻松掌握博弈论这个今天最时髦的工具。

经济学中的“智猪博弈”（Pigs’payoffs）

这个例子讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。

那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的食物数量和踏板与投食口之间的距离。

如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。

改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。

改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。

对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。

改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。

对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。

许多人并未读过“智猪博弈”的故事，但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。因此，对于制订各种经济管理的游戏规则的人，必须深谙“智猪博弈”指标改变的个中道理。

原理与应用

　　1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。然而，纳什天才的发现却遭到冯·诺依曼的断然否定，在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性，使纳什坚持了自己的观点，终成一代大师。要不是30多年的严重精神病折磨，恐怕他早已站在诺贝尔奖的领奖台上了，而且也绝不会与其他人分享这一殊荣。

纳什是一个非常天才的数学家，他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而，他的天才发现———非合作博弈的均衡，即“纳什均衡”并不是一帆风顺的。

1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论，而且提出了计算机的基本原理。早在20世纪初，塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达，直到1939年，冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)，并与其合作才使博弈论进入经济学的广阔领域。

1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版，标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如，1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，片断的研究，带有很大的偶然性，很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，诺依曼的博弈论的局限性也日益暴露出来，由于它过于抽象，使应用范围受到很大限制，在很长时间里，人们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响力很有限。正是在这个时候，非合作博弈———“纳什均衡”应运而生了，它标志着博弈论的新时代的开始！纳什不是一个按部就班的学生，他经常旷课。据他的同学们回忆，他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课，但纳什争辩说，至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者，可是，没上几次课，纳什就认定这门课不符合他的口味。于是，又走人了。然而，纳什毕竟是一位英才天纵的非凡人物，他广泛涉猎数学王国的每一个分支，如拓扑学、代数几何学、逻辑学、博弈论等等，深深地为之着迷。纳什经常显示出他与众不同的自信和自负，充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试，他的博弈论研究工作被迫中断，他感到这是莫大的浪费。殊不知这种暂时的“放弃”，使原来模糊、杂乱和无绪的若干念头，在潜意识的持续思考下，逐步形成一条清晰的脉络，突然来了灵感！这一年的10月，他骤感才思潮涌，梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文，1950年11月刊登在美国全国科学院每月公报上，立即引起轰动。说起来这全靠师兄戴维·盖尔之功，就在遭到冯·诺依曼贬低几天之后，他遇到盖尔，告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域，找到了普遍化的方法和均衡点。盖尔听得很认真，他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况，而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表，以免被别人捷足先登。纳什这个初出茅庐的小子，根本不知道竞争的险恶，从未想过要这么做。结果还是盖尔充当了他的“经纪人”，代为起草致科学院的短信，系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多，就那么几篇，但已经足够了，因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授，要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。

囚徒困境博弈

在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”（prisoners’ dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。

表2.2 囚徒困境博弈 [Prisoner's dilemma]

——————————————————————————

┃　B　┃　B　┃

————————┃————————┃————————┃

┃　坦白　┃　抵赖　┃

————————┃————————┃————————┃

A　坦白　┃　–8, –8　┃　0, –10　┃

————————┃————————┃————————┃

A　抵赖　┃　–10, 0　┃　–1, –1　┃

————————┃————————┃————————┃

我们来看看这个博弈可预测的均衡是什么。对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。

要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。

博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

价格战博弈：

现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论(vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

污染博弈：

假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。

贸易战博弈论

这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个“纳什均衡”，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。

诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：

要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。

也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。

企业博弈

博弈论是分析寡头垄断企业市场行为的有力工具。博弈论研究机智而又理性的经济活动主体，在其行为相互影响时的决策以及这种决策的均衡问题。

老三论小释

信息论

是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。

信息论将信息的传递作为一种统计现象来考虑，给出了估算通信信道容量的方法。信息传输和信息压缩是信息论研究中的两大领域。这两个方面又由信息传输定理、信源－信道隔离定理相互联系。

什么是信息？

信息现代定义。[2006年,医学信息(杂志)，邓宇等].

信息是物质、能量、信息及其属性的标示。逆维纳信息定义

信息是确定性的增加。逆香农信息定义

信息是事物现象及其属性标识的集合。2002年

控制论

是研究动物(包括人类)和机器内部的控制与通信的一般规律的学科,着重于研究过程中的数学关系

协同论

主要研究远离平衡态的开放系统在与外界有物质或能量交换的情况下，如何通过自己内部协同作用，自发地出现时间、空间和功能上的有序结构。协同论以现代科学的最新成果——系统论、信息论、控制论、突变论等为基础，吸取了结构耗散理论的大量营养，采用统计学和动力学相结合的方法，通过对不同的领域的分析，提出了多维相空间理论，建立了一整套的数学模型和处理方案，在微观到宏观的过渡上，描述了各种系统和现象中从无序到有序转变的共同规律。

协同论是研究不同事物共同特征及其协同机理的新兴学科，是近十几年来获得发展并被广泛应用的综合性学科。它着重探讨各种系统从无序变为有序时的相似性。协同论的创始人哈肯说过，他把这个学科称为“协同学”，一方面是由于我们所研究的对象是许多子系统的联合作用，以产生宏观尺度上结构和功能；另一方面，它又是由许多不同的学科进行合作，来发现自组织系统的一般原理。

系统论

是研究系统的一般模式，结构和规律的学问，它研究各种系统的共同特征，用数学方法定量地描述其功能，寻求并确立适用于一切系统的原理、原则和数学模型，是具有逻辑和数学性质的一门新兴的科学。

博弈论的主要范式

囚徒困境：这个简单的例子，几乎是博弈论的代名词。两个基于“坦白从宽，抗拒从严”审讯的囚徒，从理性的角度出发，会产生怎样的结局？结果若是，从个人理性并追求个人利益最大化，那么二人皆坦白，也就是背叛。这在四种策略中并不占优，那为什么不采用集体最有策略呢而合作。很简单集体的优化，必然侵害个人利益的最大化。当然这一切前提是理性假设，也就是著名的经济人假设：经济学中的人都是“小人”（管理学则认为人是“君子”，有意思而有道理的比喻）。破解这一困境的途径则是打破信息孤立，而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作，谁在这里面坚持到最后，谁将取胜。

重复博弈：囚徒困境，砸了传统经济学的场子。因为个人的自利行为，并不一定导致集体利益的最大化，“看不见的手”拉不住，人类向堕落之城下滑的趋势，难道这真是一个悲哀？索性并非如此，撇去博弈论的理性假设不说。博弈论者很快发现囚徒困境只在单次博弈情形下明显，一旦博弈的开始陷入重复，合作将到来。因为，未来的收益将左右目前的决策。

以牙还牙：重复的博弈理论上导致了合作的产生，但是谁也不能保证合作的继续，因为之前已经说过，合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或当前背叛收益大于未来收益，背叛的风险仍然存在。那么在重复博弈中怎样的策略才是最优。若干睿智而复杂在经过计算机中PK之后，极其原始的“以牙换牙”策略脱颖而出，固然这个策略简单至极，其威力却无穷，以至于人们在短暂的欣喜之后，发现这把太阿指之剑倒持的可怕，一旦重复链条中出现一次（也许不经意的）背叛，那据此原则行事的博弈将永无止境的背叛下去，个人利益极度膨胀的同时，集体利益无限衰微。幸好，这个世界不是模型，也不是如此简单。很多时候，我们不必以牙还牙，第三方的规范：道德与法律就是我们的假牙，他们更加有利、有理、有节。

人质困境：一场憋屈的博弈。抢打出头鸟，人质联合固然可以制服歹徒，但是谁愿出头。这一点给了无数处于劫持者地位的一方以机会，类似于秦的远交近攻、各个击破的策略，将最终全盘赢下。人质可有反制的策略，当然有，不过艰难至极。人质可以选择沉默，这样他有一定时间苟延残喘；或者联合劫持者对付人质，结局还是取决于劫持者，万一他过河拆桥怎么办；同时反抗，集体将获得左右策略，但是这需要壮士断腕的勇气，部分人可能因此受伤。这里是实力与勇气的较量，而且实力暂居上风。

酒吧博弈：如果人人理性，那么每一天到达酒吧的人数将是差不多正好的，但是人非圣贤，往往是有限理性的。第一次到酒吧的人多，那么大多人人认为酒吧人太多，太挤。第二次决定的时候，参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少，感觉很爽，第三次将继续回来，并重新带回许多人……循环就此开始。酒吧博弈一方面显示，现实的博弈参与者，是极其有限理性的，其理性只前延后伸一小段。历史数据只对计算机有用，对人，则不一定。

另一个方面，酒吧博弈指出，胜利者永远只是少数。尽管酒吧存在调谐的可能，譬如发短信时时提醒，但成本恐怕太高。而在其他场合，少数派可能更加会设置种种障碍阻止后进者的上升。也就是说，我们的世界仍然是操弄在少数派的手中。不过，总算这个世界不是模型，少数派的道路到底还是有迹可循的。老练的将军仍旧会在八卦迷阵中找到唯一的生门。若你想要，必须做一个更加老练的将军。

枪手博弈：王者的悲哀。三人对枪自决，甲乙丙枪法优劣递减。最后无奈而神奇的结局，将不取决于同时开枪还是先后开枪，最优良的枪手，倒下的概率将最高；而最蹩脚的枪手，存活的希望却最大。因为没有人会把威胁最小的枪手列为一号清楚目标。在这里，后发制人的弱势者将胜出。以弱胜强，绝不是神话。

难道王者的命运就真如此不堪，呵，道别忘了每个理论模型都是有其前提的，击破之中任何一个，王者仍将归来。这就是先发优势。假设这是一场类似CS的竞技，优秀的枪手击倒二号枪手，立刻获得奖励：盾牌。那么三号枪手将陷入绝境。不过，不管怎样，这个博弈模型，到底给了弱势者一份希望。机会永远存在。

猎鹿博弈：两个猎人合作猎鹿获得的收益将远大于分别猎兔的收益，战略联盟将开始。这或许是件好事，不过有取决于最后猎获的鹿——这一公共资源的分配，如果分配得当，整体的效率将增加。如果一方主导，另一方受损，那么帕累托改善无法进行，合作可能终将破裂。

另外一个问题，更加大局的问题。合作的示范性将使得更多的猎人加入，猎获的鹿将大大增加，人类的利益短期内将呈几何级数增长。但是最后，确是生态失衡，鹿群灭群。短暂的繁华之后，猎人将再一次回归于原始猎兔生活。尽管为了避免这一悲剧，人类还有最后的希望：制度经济学的法宝——科斯定理以产权归属来解决外部经济问题。但由于谈判成本以及可行性，人类社会的公共悲剧仍将不断上演。

智猪博弈：混沌之前最后的博弈。小猪和大猪住在猪圈的一边（食槽在这里），开启食物的开关在另一头，谁去踩，谁丧失先机。结果怎样？是小猪选择“搭便车”，大猪勤跑。因为小猪无论跑还是停，大猪的最优策略都是策略都是去踩机关。不过在实际生活中。这里依旧存在两种策略。

小猪的“搭便车”。大猪有的时候，自觉或不自觉地自封“侠之大者，为国为民”，并因此承受一些不能承受之重。《博弈论的诡计》指出美国战后的行为极似大猪，战后的美国竭力宣传自己的普世价值观，并深入到海外事务，甚至不惜重金协助小国防务。这样小国不自觉地对大国进行了“剥削”。

大猪在击破模型的一个假设之后，仍然有一个后发制人的机会。因为大猪和小猪的耐饿能力不一样，大猪完全有能力撑得更久，小猪如果不想饿死，那只有一条豪赌的路子：龟兔赛跑式的豪赌，但愿大猪打了个盹儿，他回来的时候，还能吃上一两口，要不然真是赔了夫人又折兵了。据此，再也不难解释为什么很多人切齿的腾讯，毫无顾忌地跟风，做QQ旋风，做拍拍，做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了，大猪们只需要悄悄跟随，适当的时候踢开挡路的，就可以了。

大猪在这里的后发制人和枪手博弈的后发并不一致，枪手后发是建立在他人恶斗的基础上，大猪后发完全是以自身实力为基础。而且大猪完全不必采取任何激进措施，只要跟随就好。因为小猪获胜的条件不是接近，还是距离。

警察与小偷：令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地，那么警察应该为了保护价值大而一直保护A地吗。博弈论认为当然不是，警察的合理策略应当是有倾向于A以一定概率的随机巡查。这个概率就是：p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是，此时的小偷谋求的是，最小得手几率的最大化。也就是说，警察的最优策略将把小偷的最差策略改良！这个便是冯·诺伊曼提出的“最小最大定律”。

我们必须再一次感谢这个不完美的世界，因为现实之中，类似的现象，对于一方仍然可以设法找到对手致命的规律性行动（当然必须考虑到对方是不是一个更加老练的猎手，故意放出的诱饵）。而保持自己的行动的无序性，则有可能成为欺骗策略的武器，这倒似张三丰所言道的：无招胜有招。

斗鸡博弈：两只斗鸡在决斗的时候，无论选择进或退都是一个难题，因为纳什均衡已经给出了一胜一败的最优策略。在很多较量下，死拼将是得不偿失的，因为很可能给第三者机会。因此，两个已经在战场的强势力很可能自觉的遵循纳什均衡，当一方攻击时，另一方暂退。虽然可能某方暂时受损，

但较之于两败俱伤是好得多的。不过，要维持这一状况，必须保证下一次先期受损的一方发动攻势的时候，另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”，没有人真正流血。这只不过是两个巨头玩弄的游戏，目的是警告后来者，想进来，那么也得陪我们一起玩，可是你玩的起么？这正是百事的广告，即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。

协和谬误：欧洲政府在大量投资协和飞机后，终于不能自拔。即使前景黯淡，也撑着面子投下去，非要走头无路才放弃。而这时投入的成本已经全打水漂了。如果，发现不能继续的时候，就果敢放手，损失会小得多。可是他们会、能这么做么？壮士断腕，是何等的壮烈，却也是何等的艰难！

沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃，可惜大部分有赌徒式的心理，相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆的支点之前，已经窒息了。

协和谬误，倒是给了人们半途而废的理由，会不会有人担心它的滥觞会左右一些本该坚持的目标？的确有这个可能，但是应该相信人们足够理智，完全可以比较沉没成本、机会成本与未来收益的关系。看清了的，必定会坦然地走出协和谬误。

蜈蚣博弈：一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略，因果相报，把握好因缘，自有好结果。它的另一个好处，就是使得未来的计划明晰化，是你不再徘徊。只可惜，很多时候，碌碌无为的我们并没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。

蜈蚣博弈也有一个致命的悖论，仍旧是个人利益和集体利益的冲突，因为最后一次的背叛收益始终优于合作。可悲的是，这一次背叛将由于人性的理智，穿越时光隧道，回到原始的地点：人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧，事实上人们很少这样做。当然合作到最后的也很少，这意味着，倒推法只在中间阶段突然发生了作用，只不过谁也不能预测，中间一步在哪里。在那里，我们只有冀望信任、道德、良知等等。

分蛋糕博弈：两个小孩怎么分蛋糕？经典的故事，经典的解答：一个分，一个选。现实多如此，权利的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得经济更加活力。不过分蛋糕的进阶模型却强调了讨价还价的策略，分蛋糕不是一次性的，而是多回合的，而且出现成本：蛋糕在融化。

时间称本的加入，将使得分配变得复杂化。双方如果不能及时达成交易，不仅集体的收益将减量，而且个体的收益也将减少。在此情况下，利用时间称本以及威胁、承诺将对其中一方极其有利。顾客可能迫于情势，必须尽快结束谈判，这时卖方却不慌不忙，故意拖延，顾客一方将不得不在价格上作出妥协。

顾客一方当然也有策略，它的策略就是货比三家，要求承诺或威胁。这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力，这就是顾客有权投诉商家。

鹰鸽博弈：这个博弈很多人等同于斗鸡博弈。不过，斗鸡是两个兼具侵略性的个体，鹰鸽却是两个不同群体的博弈，一个和平，一个侵略。在只有鸽子一个苞谷场里，突然加入的鹰将大大获益，并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场，而是一定比例共存，因为鹰群增加一只鹰的边际收益趋零时（鹰群发生内斗），均衡将到来。

由此产生了ESS进化上的稳定策略，也就是说一旦均衡形成，偏离的运动会受到自然选择的打击。也就是鹰群饱满后，再试图加入的鹰将会被鹰群排挤。

进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖，也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉，这是个体的失败，集团的胜利以及集体的止步不前。

脏脸博弈：恍然大悟的博弈。三个人在屋子里，不许说话。美女进来说：你们当中至少一个人脸是脏的。三人环看，没有反应。美女又说：你们知道吗？三人再看，顿悟，脸都红了。为什么？因为美女后一句废话点破天机，三个人都知道脏脸的存在，而且推测知道对方也知道了脏脸的存在（因为另两人脸没红，说明他们看到脏脸了），而且知道对方知道自己已经想到上一步……循环开始，知识开始共同化，真相大白：三个人都是脏脸，所有人都脸红了。

这就是共同知识的作用，它的作用显得有点可怕的强大。几乎是一招无影腿，杀人不见血。在台面上的博弈之前，私下的算计已经置对手于死地。不过，很可能对方也预料到这一点，早也想到这一点，同时杀来。终于，形成双死局面。

当然，现实虽然存在类似现象，不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知，双方只要各自依之行事就可以了。

信息均衡：很想然，信息的作用在博弈之中非常重要。将博弈论还原到现实，人们不再完全理性，信息存在不对称，博弈就需要在抢占信息高地上作出努力。

信息不对称，是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”，前者事前，后者事后。信息不对称短期内对某一方会有利，但最终会破坏整个市场。于是有两个解决策略。

信息传递：传达你的正面的信息的策略，也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。

信息甄别：诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜，保证顾客不会走到其他柜台去。这种策略显然更加有效，不过风险也更大：万一顾客用放大镜看出了了自己的瑕疵怎么办？

应用

《孙子兵法》是中国乃至世界最早的一部经典博弈论著作，

近几年由于博弈论在全球的大范围流行，出现了多部收集整理博弈论知识的书籍，如《博弈论的诡计》、《最神奇的博弈论定律》等。中国经纬智库是最早研究新型博弈理论的民间智库之一，由理事宋雪峰牵头研究以公布的《多腿凳定律》《定量无穷大》《十字弓博弈基础》已经被引用到社会经济发展的方方面面。

“博弈论”与传统咨询工具相结合，可以帮助企业开启解决战略定位、股权分配、股权融资、价值塑造、商业模式等疑难杂症的新视角。

阅读全文

相关专题：发布时间：2023-10-12 01:45:47