这本书通过书写博弈论之父“冯·诺依曼”的人生经历穿插着用简单的方式阐述了博弈论的基础知识、讲述了著名的囚徒困境以及其在二战与冷战时期的应用。整体来说这本书相对通俗易读,内容主要以故事描述为主,讲述了很多博弈论的经典案例。但是由于多线描述,所以我觉的这本书在叙事上存在一些混乱,似乎没有侧重点,所以如何从这种混乱中抽取符合逻辑的表述是一件想对苦难的事。以下的叙述是我对这本书主要内容的描述,尽可能的做到调理清晰,姑且作为一篇读书笔记吧(写这篇笔记完全是因为需要而进行的应付,所以写的又长又臭,姑且一看)
天才的一生,开启博弈论的大门
冯·诺依曼(John von Neumann)是一位二十世纪的重要科学家,他在多个领域做出了突出的贡献,特别是在数学、物理学和计算机科学。他是建立现代电子计算机原型及其架构的重要人物,也被认为是博弈论的重要开创者被称为“博弈论之父”。他于1903年出生在匈牙利的布达佩斯,原名叫做约翰·诺伊曼。
他的家庭有两点值得论述,一个是从宗教上来说,他出生于一个正宗的犹太家庭,可是却是我听过最特殊的犹太人。他们家会过每个基督教的节日,在圣诞节布置圣诞树,交换圣诞礼物与牧师一起唱圣诞歌曲。在婚礼上,冯诺伊曼名义上皈依天主教,可等他中年却成为一位不可知论的信仰者;其次冯诺伊曼的家境优越,他的父亲是成功的银行家非常有钱,有钱到在一战期间花钱购买了一个贵族头衔,因此也让小约翰成为贵族,有了后来人们所熟知的冯诺伊曼这一名字。有钱到在冯诺伊曼很小的时候就购买了一整个图书馆供他阅读,让他能够在那个时代那个年纪遨游在书籍的海洋。
小时候的冯诺伊曼有着照相机式的记忆天赋,被人称为神童。在小学期间就受到数学老师的极大赏识,为他制定特制的数学学习计划。在大学热爱数学的他迫于父亲的压力选择了化学专业,就读于当时的布达佩斯大学。他的大学生涯跨越三个国家从布达佩斯到德国的柏林再到瑞士的苏黎世,并最终在这里获得学位。在1926年又回到布达佩斯大学获得数学博士学位,在这之后成为柏林大学最年轻的助理教授,这标志着他短暂讲师生涯的开始。
在担任助理教授期间,他接受洛克菲勒的资助在哥廷根大学,跟随着伟大的数学家大卫-希尔伯特从事博士后研究,当时与他一起跟随希尔伯特的还有有著名的奥本海默等人。到1929年,他被邀请到普林斯顿大学讲授一年量子理论。在1933纳粹政权上台的那一年,年轻的冯诺伊曼放弃了在德国的一切职业关系,正式入职普林斯顿大学,成为新成立的普林斯顿高等研究院一名教授,与爱因斯坦成为同事。由于此时的他成为一名研究人员,所以他这短暂讲师生涯就此结束,未来一直都没有进行教职。
在普林斯顿时期的冯诺伊曼在量子力学数学基础、爆炸理论,流体动力学等多个领域做出了众多的开创性研究。在二战时期,冯诺伊曼投身于军事研究,参与了当时美国的原子弹计划-曼哈顿计划,为原子弹的冲压装置的研究做出了重大成就。战后的冯诺伊曼还成为美国氢弹的主要人物,为美国氢弹的设计研究做出突出贡献。由于他提出的存储程序概念以及对二进制的大力倡导,使其成为计算机的发展过程无法缺失的人物。
在冯诺伊曼硕果累累的一生中,博弈论属于特殊的那一颗果实。博弈论之于冯诺伊曼的特殊之处在于,它似乎是冯诺伊曼理论研究之外的产物。他的研究动机可以追溯到小时候与兄弟们玩的策略游戏Kriegspiel,可以追溯到他会打却不是很擅长打的扑克牌游戏,同样可以追溯到他与妻子之间理性而又不相信任的日常冲突。以至于在他的助手看来,他当时在博弈论研究上所做的一切不过是在游戏一样的事物上浪费宝贵的时间。可就是在如此的错综复杂不经意间,开创了一门后来影响世界的独立学科。
博弈论的出现最早可以追溯到法国数学家埃米尔-博莱尔的研究,冯诺伊曼对于博莱尔及其的研究却带有一丝不屑,甚至可以会刻意忽视博莱尔的相关研究。博弈论的开创性论文是冯诺伊曼在1928年所发表的“Zur Theorie der Gesellschaftspiele” (“Theory of Parlor Games”)。在这篇文献中,他证明了著名的minimax theorem(最小极大值定理),为博弈论奠定了数学基础。
在冯诺伊曼看来,博弈论将会是一门比数学更大众的学问,并且眼光独到的认为博弈论将在经济学中得到广泛的应用。后来他与奥地利经济学家莫根斯坦合作出版了被认为是20世纪最有影响力的一本书籍之一,也是博弈论的经典之作:《博弈论与经济行为》(“Theory of Games and Economic Behavior)。在这本书中,他希望与莫根斯坦做他为量子力学所做的贡献,为经济行为奠定数学基础。可是他们的努力似乎并没有成功,他们在这本书中所做的努力并不是最有用且具有启发意义的,相反走了一条后来被证明的弯路。但是不管怎样,冯诺伊曼开启了博弈论研究的大门。
博弈论也可以非常简单
在这本书中,通过简单的经典范例讲述了博弈论的基本内核,分蛋糕问题便是其中之一。在这个范例中,讲述的是父母希望将一块蛋糕均等的分配给两个孩子,可以看到似乎无论他们怎么分割都无法做到公平公正,让每个孩子都称心如意。从冯诺伊曼博弈论的视角来看,解决办法非常简单:让一个孩子切,另外一个孩子选。切的那个知道他后选,如果他切不好,他的兄弟肯定会选那块大的,所以对于他来说最好的切割方式就是尽他最大努力平等分割。这背后体现的就是博弈论,所应用的是博弈论中基本的定理之一,也是冯诺伊曼在该领域最早一篇文献中所证明的minimax theorem。
博弈论(Game Theory)也被称为游戏理论,但是并不是所有的游戏背后都能体现出博弈论,都可以用博弈论来分析。博弈论必要的前提条件是要求他的玩家是完全理性,任何一方都以理性的思考,理性的行为方式希望赢下游戏。他们对整个游戏的规则了如指掌,对于自己过去的行为记忆在心,对于自己每一个行为后果他们都有理性的认识。由于完全理性的假设,可以想象对于很多的游戏如国际象棋等,都存在一个唯一解。两个完全理性的人下国际象棋,最后的结果一定是平局。冯诺伊曼对此有简单的证明,他认为在一定的平局规则下,5000步一定可以结束比赛实现平局。
零和博弈
零和博弈是是指在竞争中,一方利益的增加必然导致另一方的利益的减少,总利益为零。因此在零和博弈中,参与者的利益是相互对立,他们之间的关系是竞争而非合作,甚至是不存在合作的可能。对于这一类博弈行为冯诺伊曼给出了一个简明的解决方案:minimax theorem。回到最开始的那个简单分蛋糕范例。这个博弈行为属于两人零和博弈,蛋糕只有一块,一个孩子多点另外一个必然会少点。切蛋糕的孩子有无限种选择,这些选择本质上可以分为两种:均等切割与不均等切割。在这一设定下,选蛋糕的孩子也存在两种选择:要么选大的要不选小的。
我们可以通过表格的形式描绘出所有的可能博弈结果,总共的结果有四种,而在两个小孩的理性分析下,最后将必然指向于特定的一个:切蛋糕的人选择尽可能均等分配,选蛋糕的人选择他能选的最大的那个。通过minimax theorem这一结果很好理解。对于切蛋糕的那个来说,他知道选蛋糕的那个会留给他切下的两块中最小的那个,因此对于他来说,他的最佳选择就是最大化这块最小的蛋糕,因此也叫做minimax theorem最大化最小值原理。通俗点讲就是你最好的选择是避免最坏的结果,这一结果被冯诺伊曼称为saddle point。
混合博弈
在现实中,很多的博弈没有一个冯诺伊曼称为saddle point,不存在确切的解。混合策略就是这么一种博弈行为,它是指在博弈论中,玩家采取一定概率选择不同纯策略的策略。所以它的决策是一一个概率分布所对应的纯策略,区别于确定性的纯策略。在这本书中,通过了一个例子:“便士匹配”(Matching pennies)来说明混合策略。
便士匹配是指两个玩家同时抛掷一枚硬笔,若硬币同时朝上同时朝下相互匹配时,一位玩家获利一单位;若硬币无法匹配,则另外一位玩家获利一单位。通过分析可以看到对于每个玩家来说,不管是采取什么策略都有50%的概率获利或者是损失。所以对于每一位玩家来说,最好的策略是随机的选择成为第一位玩家还是第二位玩家。冯诺伊曼和莫根斯坦在书中对这类博弈进行了分析,并且给出了自己的解决方案同样。
最小极大值定理
该定理是冯诺伊曼在其有关于博弈论的第一篇文献“Theory of Parlor Games”中证明出来的,也是冯诺伊曼被认为是博弈论创始人的重要依据。对于冯诺伊曼本人也非常重视这一定理,他认为没有他所证明的这个定理,将不存在其他基础的博弈理论。该理论认为在一个有限两人零和博弈中,总是存在一个纯策略或者是混合策略形式的理性解。冯诺伊曼的最小极大值定理不仅在博弈论中有着广泛的应用,而且在其他领域中也有着重要的作用,例如在经济学、计算机科学、管理学等领域中都有着广泛的应用。
多人博弈
冯诺伊曼和莫根斯坦的目的是为经济学成为一门精确科学奠定基石,然而现实中的经济行为往往涉及到多人之间的相互博弈,所以他们的在《博弈论与经济行为》一书中也花了大量的篇幅来论述多人博弈,首先是三人博弈行为。对于这类博弈,冯诺伊曼仍然希望通过最小极大值定理给出一个理性的解答,他的解决方式是认为一个三人博弈可以被分解为一个潜在两人联盟与第三者之间的博弈。通过这样的转变,三人博弈变为双方博弈,可以使用最小极大值定理进行理性求解。
冯诺伊曼的这一解决方案理论上来说可以扩展到n人博弈行为,而不仅仅是三人博弈。任何的n人博弈都可以进行分割“降解”为一个低级别的博弈,直到降解为一个两方博弈,采用最小极大值定理求解。但是现实是,很明显冯诺伊曼的这种解决方式不具有实际可操作性。经济行为之间的博弈涉及的参与主体千千万万,这种“分解”的操作不具有实际意义,似乎只是提供了一个理论上的参考。这一问题的界定留给后人解决,因为二战的爆发在某种程度上推迟了博弈论的发展,博弈论与其创始者一样被卷入了战争之中。
战争期间的博弈论
在冯诺伊曼对博弈理论做出开创性的研究之后不久,博弈论还未来得及快速发展时,就与他的开创者一样被卷入了第二次大战。现实的冲突在某种程度上推迟了博弈论的发展,可是却也给博弈理论实际应用提供了场景,让战后的博弈理论获得足够的重视。在珍珠港事件后,美军开始打算对日本进行军事袭击。作为冯诺伊曼学生的梅里尔-弗拉德(Merrill Flood),同时也是日后囚徒困境共同提出者的他被安排对这一军事行动进行分析。
他发现这一问题其实与冯诺伊曼在《博弈论与经济行为》书中提到的一个博弈行为非常类似,他将美国和日本分别视为两个博弈者,美国的目标是最大化对日本的打击,而日本的目标是最小化受到的打击。在实际的设计中,他还考虑了各种不同的因素,如轰炸高度、轰炸密度、轰炸目标等,将这些因素作为博弈中的策略。
通过分析博弈模型,Flood设计了一种风险最小的轰炸策略,按照设计意图,这种轰炸策略将可以大大降低轰炸机被击落的风险,可以最大程度地减少平民伤亡,同时也能够对日本的经济和军事实力造成巨大的打击,从而迫使日本投降。后来史料表明,冯诺伊曼也对使用原子弹轰炸日本提供了些许战略意见,曾经帮助选择日本的轰炸地点。1945年8月6日和8月9日Flood的轰炸策略得到了美国政府的认可分别被用于对广岛和长崎进行了原子弹袭击,彻底改变了世界的格局。但是,这一应用只是博弈论在二战期间的一个重要案例之一,博弈论在战争及冷战的广泛应用才刚刚开始。
早在二战并未结束时,同盟国就开始为战后的格局进行分析。以罗素与冯诺伊曼为代表的一批著名人物认为,战后的苏联将成为以美国为首的西方国家主要敌人,美国与苏联的战争将无法避免。罗素在他的文章中写到:“我认为斯大林继承了希特勒对世界独裁的野心。我们必将面对美国和苏联之间的战争,它将以彻底摧毁伦敦开始。我认为这场战争将持续30年,并留下一个没有文明人的世界,一切都将不得不重新建立”。或许出于儿时的经历,冯诺伊曼也是属于对苏的强硬派,极力主张对苏进行打击。
到了1949年的8月,苏联在西伯利亚地区爆炸了自己的第一颗原子弹。这标志着美国对核武器垄断的结束,标志着世界上出现了两个拥有原子弹的国家,似乎也标志着人类来到了生死绝亡的关头。世界来到了一个无法接受的困境,在这一困境中存在两个国家,而任何一个国家的先发打击都能将另外一个国家从世界彻底抹去。美国军备竞赛的开启与囚徒困境的提出几乎同时出现,对于美苏来说,他们面临的就是囚徒困境般的境地。任何一方都倾向于选择先行进行核打击,先行核打击对于任何一方来说都似乎是理性的最优选择,而对于人类来说是彻底的毁灭。为此以罗素,冯诺伊曼等人为代表极力主张实行对苏预防性战争,在必要的情况下实施先行打击。
通过囚徒困境,也可以预示着未来几十年冷战时期美苏之间长期军备竞赛,对于任何一方来说,进行军备竞赛相比不进行军备竞赛都是更好的选择。所幸的是,历史证明人类并没有陷入真正的困境中,最终的博弈结果以苏联的解体,冷战的结束而终止,人类万幸的躲过一劫。尽管如此,由于博弈论在战争及冷战时期的应用使得其得到相应的批评,有大量的人认为博弈论是为战争或不道德行为辩护的马基雅维利式的做法。博弈论的有效性只在纯数学的推到中存在,而在现实世界中博弈论毫无用处。
兰德公司与囚徒困境
人很多时候都是非理性的,即使看似理性的选择背后可能也是非理性的表现。兰德公司的Merrill Flood并不是第一个意识到这一点的人,但他可能是最早用博弈论来分析这种非理性的人之一。Merrill Flood在兰德公司期间进行了大量的博弈实验,在1950年,他与自己的同时Melvin Dresher一起合作完成了一项实验“A Non-cooperative Pair”,这次实验是对“囚徒困境”这一博弈的首次讨论,但似乎不是最佳的案例。
后来,他们二人向兰德公司的另一位顾魏Albert Tucker展示了自己的研究,Albert Tucker是普林斯顿大学的一名数学家,也是著名的博弈专家纳什的老师。在1950年Albert Tucker在斯坦福大学心理学的一个讲座上,对Merrill Flood和Melvin Dresher两人的小实验进行了重新表述,并且正式命名为囚徒困境。Albert Tucker初期的表述讲述的是两位囚犯面临指控,若同时认罪各自都要收到惩罚,若同时不认罪两人都讲取消指控,一方认罪另外一方不认罪,认罪的一方得到惩罚而不认罪的一方得到奖励。后来,Albert Tucker的表述得到不断的改进成为如今我们熟知的那样,将奖励与惩罚明确的表述为对应的监禁期限。
在囚徒困境被明确提出后,对社会科学现实问题产生了巨大的影响。它揭示人类理性选择的非理性一面,不是任何情况下双方的理性选择都能带来最优的结果。囚徒困境的解决需要社会规范,通过一定的规范可以避免双方处于理性的考虑陷入两败的困境,所以推动了社会规范形成。作为博弈论最经典最广为流传的案例,囚徒困境的出现大大推动了博弈理论的发展。在现实的生活中,存在大量的囚徒困境的案例。而对于大多数人所熟知最受大众喜爱的博弈论应用应该前面所讲的在美苏冷战时期,双方之间军备竞赛中的使用。