h

首页 > 剧情分集介绍 > <三天读懂博弈学>续三

<三天读懂博弈学>续三

发表于:2010-03-10 01:16:24   点击: 33

第11节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(1)

第2章 囚徒困境:傻作精时精亦傻,输为赢处赢还输

◆预备知识

在博弈中,你在采取行动时,一定要考虑对方会采取怎样的行动;在博弈中,假定每个人都是理性的;每个博弈参与者都会采取最优策略反应,以使自己在博弈中的预期收益最大化。(第1章)

◆本章重要概念

◎囚徒困境:在博弈论中最常被研究的,也是20世纪最有影响力的博弈实例。它由美国普林斯顿大学数学系教授阿尔伯特·塔克提出。囚徒困境通俗化的表达就是"在一场博弈中,每个人都根据自己的利益做出决策,但最后的结果却是谁也捞不到好处。"

◎优势策略:是指在一个博弈中,不论对方采取哪个策略,我的这个策略总是显出优势。

◎收益矩阵:由著名经济学家托马斯·谢林教授提出,用矩阵的形式直观地表示两个参与者在博弈中的得失。收益矩阵在博弈论中至关重要,在本书的许多章节中都会涉及。

■囚徒困境:忠诚还是背叛?这是一个问题

在了解"囚徒困境"之前,让我们先看一下发生在我国古代的一个小故事。

春秋时期,贫士玉戭生与三乌从臣二人相交甚好,由于没有钱,他们就以品性互勉。玉戭生对三乌从臣说:"我们这些人应该洁身自好,以后在朝廷做官,绝不能趋炎附势而玷污了纯洁的品性。"三乌从臣说:"你说得太有道理了,巴结权贵绝不是我们这些正人君子所为。既然我们有共同的志向,何不现在立誓明志呢?"于是二人郑重地发誓:"我们二人一致决心不贪图利益,不被权贵所诱惑,不攀附奸邪的小人而改变我们的德行。如果违背誓言,就请明察秋毫的神灵来惩罚背誓者。"

后来,他们二人一同到晋国做官。玉戭生又重申以前发过的誓言,三乌从臣说:"过去用心发过的誓言还响在耳边,怎能轻易忘呢!"当时赵盾在执掌晋国朝政,人们争相拜访赵盾,以期能得到他的推荐,从而得到国君的赏识。赵盾的府邸前车子都排出了很远。这时三乌从臣已经后悔,他很想结识赵盾,想去赵盾家又怕玉戭生知道,几经犹豫后,决定起早去拜访。为避人耳目,当鸡刚叫头遍,他就整理衣冠,匆匆忙忙去拜访赵盾了。进了赵府的门,却看见已经有个人端端正正地坐在正屋前东边的长廊里等候了,他走上前去举灯一照,原来那个人是玉戭生。
这则颇具意味的故事出自明代学者宋濂的《宋文献公全集》。宋濂在作品中评论道:"二人贫贱时,他们的盟誓是真诚良好的,等到当了官走上仕途,便立即改变了当初的志向,为什么呢?是利害关系在心中斗争,地位权势使他们在外部感到恐惧的缘故。"或许我们要问,地位和权势是怎样使他们感到恐惧的?或许博弈论中的"囚徒困境"理论可以给出合乎情理的解答。

1950年的一天,美国斯坦福大学客座教授、普林斯顿大学数学系主任阿尔伯特·塔克给一些心理学家做讲演,为了避免使用繁杂的数学手段而能更加形象地说明博弈的过程,他提出了囚徒困境的理论模型。

塔克以下面这则小故事作为开始:

鲍勃和埃尔两个窃贼在偷盗地点附近被警察抓获,分别关押。每个窃贼必须选择是否供认并指证同伙。如果二人都不供认,将被指控非法携带武器,入狱1年。如果二人都供认并指证同伙,将入狱10年。如果一人供认,一人不供认,则鉴于供认者与警方合作的表现,无罪释放,其同伙将遭到严惩,判入狱20年。
第12节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(2)

我们用收益矩阵分析囚徒困境的情况(如下表):

埃尔

供认 不供认

鲍伯 供认 10年,10年 0年,20年

不供认 20年,0年 1年,1年

收益矩阵可以这样解释:囚犯的战略是供认或不供认,每个囚犯选择其中一种战略。竖列代表埃尔的战略,横行代表鲍勃的战略。矩阵中的每组数字是两个囚犯选择不同战略得到的相应结果,逗号左边的数字为鲍勃的收益,右边数字为埃尔的收益。以第一列为例,若两囚犯都认罪,都被判入狱10年;若埃尔认罪,鲍勃不认罪,鲍勃入狱20年,埃尔获释。

那么,到底应该如何解决这一博弈问题呢?如果二人都想入狱时间最短,什么样的战略才是理性的呢?埃尔可能作如下思考:"有两种可能性会发生:鲍勃认罪或保持沉默。假定鲍勃认罪,则我不认罪将入狱20年,认罪将入狱10年,所以该情况下最佳的选择是认罪。相反,假定鲍勃不认罪,则我不认罪将入狱1年,认罪将获得自由,认罪还是最佳选择。总之,我应该认罪。"

⊙托马斯·谢林的博弈收益矩阵

托马斯·谢林教授对博弈论的重大贡献之一就是首先用矩阵形式的表格表示两个参与者的博弈所得。谢林教授曾经说过:"假如真有人问我有没有对博弈论做出一点贡献,我会回答有的。若问是什么,我会说我发明了一个矩阵反映双方得失的做法……我不认为这个发明可以申请专利,所以我免费赠送,不过除了我的学生,几乎没有人愿意利用这个便利。现在,我也供给各位免费使用我发明的矩阵。"

上文中我们所用的用来表示囚徒困境的矩阵,就是谢林教授"免费"提供给我们的。

同样,鲍勃也将按照相同的思维确定自己的行为选择,其结果是两人都认罪,被判入狱10年。然而,如果二人非理性行事,保持沉默,每人只会入狱1年。

由此可见,对于鲍伯来说,无论埃尔采取什么策略,他坦白总是对自己有利的,两相比较,坦白是他的优势策略;对于埃尔同样如此。因此,在这个博弈中,坦白是双方的优势策略,那么,抵赖就是劣势策略。

实际上,囚徒困境正是个人理性冲突与集体理性冲突的经典情形。正因为在囚徒困境中,每个人都根据自己的利益做出决策,但最后的结果却是谁也捞不到好处。这种情形在生活中也会遇到,比如排队购物时,如果大家都在排队而只有一个人挤上前去插队,他将得到好处;可是如果大家都蜂拥而上,将会出现混乱无序的局面,此时你只能跟着大家一起挤才有可能尽快买到你想要的东西,否则你将成为最后一个--也是最吃亏的一个。
第13节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(3)

学习了囚徒困境理论,我们在回过头来看一下本文开头的小故事,相信会有豁然开朗的感觉。首先,赵盾的权势对玉戭生与三乌从臣而言是不可忽视的外在资源,赵盾是否赏识,将决定他们的仕途是否顺利。这种情形之下,巴结赵盾与不巴结赵盾的选择,就与二人的现实利益息息相关。对于二人而言,无论对方是否选择巴结,自己只有选择巴结才有可能升官。
因此我们不能说趋炎附势是性格软弱而导致的惯性举止,实际上它是为了维护自身利益而进行的一种博弈选择。如果他们信守誓言,就肯定与升迁无缘;而背叛誓言,则有可能得到现实利益。因此,在没有良性竞争的机制下,背叛无疑是利益最大化的选择。因为如果自己坚守,而又没有一种机制能保证对方也同样坚守,那么坚守者就有可能成为被牺牲的傻瓜。学习囚徒困境的理论模型,并非鼓励人们背叛,而是让我们知道,在面临一个决策时,如果没有十全十美的办法,我们不妨权衡一下利弊,从而做到"两害相权取其轻"。

⊙阿尔伯特·塔克(Albert tucker,1905-1995)

阿尔伯特·塔克出生于加拿大的安大略,1929年到普林斯顿大学从事研究工作,后来担任该大学数学系主任--当时普林斯顿大学的数学系是世界上最富创造力的数学系之一。

1950年,塔克在作为斯坦福大学的客座教授给心理学家们讲理博弈论时,创造了囚徒困境。囚徒困境的例子虽然简单到用一页纸就可以写完,但却对20世纪后半叶的社会科学产生了深远的影响,塔克本人也因其在博弈论和数学优化领域的贡献而为世人敬仰。

■军备竞赛、价格战与学生减负

"妈妈,我要买耐克运动鞋,脚底有透气孔的那种!"

"多少钱?"

"一千两百多。"

"这么贵?赶上我半个月工资了呢!"

"同学们都有,我也要!"

以上是14岁的初二学生小明放学回到家里和妈妈的对话。对此,大多数朋友会指责小明不懂事、爱慕虚荣、喜欢攀比、不体念父母赚钱养家的艰辛。但这只是表面现象。目前学生穿的校服是学校统一制作的,单从衣服上看,学生无法分出三六九等,不知道谁的父母更有钱、谁在家更受宠。那么比什么?比学习好当然太"老土",于是比鞋子、比手机、比MP4。大刘的儿子今年上高二,让大刘哭笑不得的是,儿子早上上学走的时候穿的是两只一样的鞋,晚上回到家里一只脚耐克一只脚阿迪达斯--不懂?这是时尚!你要穿个稍微次点的鞋,还没人和你换着穿呢!你说要孩子不要和人攀比?那你无疑是把孩子推到另一个体系--大多数同学之外的体系。这是家长的无奈,也是社会的无奈。
第14节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(4)

这就是囚徒困境在现实生活中的生动写照。同学间的攀比,其结果是对大家都不好;但是别的同学都有了,你也得有,否则你就是同学中的"另类",你就会遭多数同学的白眼。

国家之间军备竞赛的例子与此类似,同样可以用囚徒困境来描述。展开军备竞赛的两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的"理性"行为,但结果却显得"非理性"(例如会对经济造成都有损坏等)。比如冷战时期的美国与苏联。

商业领域,囚徒困境在商业领域也不鲜见,比如价格战、广告战等。让我们看下面一例:

2007年夏,中国食品行业普遍刮起了涨价风。6月21日,光明、蒙牛、伊利、三鹿等14家国内外乳品企业聚集南京签署"乳品企业自律南京宣言"。约定取消特价、降价销售等促销方式,这被认为是一种变相的联合涨价。7月26日,统一、康师傅、日清、今麦郎、华龙等方便面生产企业宣布集体涨价,幅度为20%至40%。对于联合涨价,厂商们给出的统一理由是:遏制低价竞争,维护行业长远发展。

但是结果怎样呢?

不到两个月,在超市的货架上,方便面"涨价联盟"成员之一某品牌的葱爆羊肉方便面就搞起了促销活动--买两包方便面即可获赠一副扑克牌;而有的超市中,某著名品牌方便面则是买五连包送一个酱罐;还有方便面展开了"买五送一"的活动。

再看牛奶,"买一箱伊利纯牛奶送3袋250毫升牛奶"、"光明利乐枕原价22.8元,现价18元"、"原价3.2元特浓纯牛奶现仅售2.2元""蒙牛买一箱送一袋"……乳制品业的知名品牌无一例外,全部参加了促销活动。而且超市的促销广告牌上标明促销活动时间为7月24日至8月10日,是在乳制品业"涨价联盟"形成之后。

为什么这些当初如此高调、如此信誓旦旦的价格联盟是这样的不堪一击?博弈论中的"囚徒困境"能给出令人信服的解释。假设乳制品市场有两个寡头同时面临着降价与不降价的选择,如果双方都不降价,则双方都保持原来的销售利润,增加的赢利为0;如果双方都降价,则各增-50个单位;如果甲厂降价而乙厂不降价,那么甲通过降价扩大了市场份额,赢利增加100个单位,而乙因为坚持不降价而失去了市场,赢利增加-100个单位;反之,如果乙降价而甲不降价,而乙赢利增加100个单位,而甲赢利增加-100个单位。那么从双方最好的结果来看,就是双方都不降价(相当于"囚徒困境"中的两个人都不招)。但如同囚徒困境一样,只有降价才是每个企业的优势策略--如果对方不降价,我最好降价(我不降价得0,降价得100);如果对方降价,我更得降价(我不降价得-100,降低得-50)。
第15节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(5)

显然,从参与竞争各方最好的结果来看,就是都不降价。而在现实中,几乎所有的公司都不可避免地陷入了价格战的囚徒困境中。

囚徒困境中在现实生活中的另一个例证是学生减负的问题。众所周知,目前我国的"应试教育"备受诟病,但孩子们无一例外地在接受着这种教育。为什么会出现这种情况呢?我们试着用"囚徒困境"来分析一下:

现实中,学生(或家长)有两个策略可供选择:"减负"与"增负"。选择"减负"策略,学生则有更多的时间学习课本以外的东西,这样学生的综合素质得到提高;选择"增负",学生花大量的时间做大量的习题,以"学透"、"学精"课本规定的东西,此时,学生没有时间学习课本以外的没有规定的内容。"减负"的结果是学生的全面发展;而"增负"的结果是学生获得高的分数。

在这样的博弈结构下,学生(或学生家长)如何选择呢?每个学生这样想:如果其他人采取的是"增负"策略,我采取"减负"策略,我的考试分数不如他人,接受不了好的教育,在未来求职时我也赶不上他人;如果其他人采取的是"减负"策略,我采取的是"增负"策略,我的考试分数会比其他人高,我会上好的学校,在未来的职业竞争中我会处于优势。因此,无论其他人采取的是什么策略,我采取"增负"策略都是最好的。

说到底,路只有一条,不管别的学生增负还是减负,你都得选择增负,因为这是你的"优势策略"。这就如同看足球赛,如果前排的人为了看得更远而站起来,后排的人必须也得跟着站起来,如果不站起来你就看不到--而人人都站起来,实际上相当于人人都没站起来来--即便如此,你还是不得不跟着站起来。

所以,在应试教育的体制下,"学生减负"只能是一句美妙的口号,没有家长会真正让自己的孩子"减负"的。

■旅行者困境:聪明反被聪明误

有一位因车祸而住院的老大爷,想借此机会敲诈肇事司机,于是就在医院开了许多与车祸创伤无关的营养药品,花了许多不该花的钱。他认为这些钱都应该由肇事司机出。结果交通队查明了事故原因,老大爷承担60%的责任,也就是说,他花的越多,自己承担的也越多。得知这个消息后,老大爷一脸的沮丧:"早知道是这样,我不开这营养药啊,医院的药这么贵!真是聪明反被聪明误啊!"

聪明反被聪明误,我们每个人对这句话都不陌生。究其出处,原来却是出自宋代大文豪苏轼口中:"人皆养子望聪明,我被聪明误一生。"生活中的人们,谁都希望自己聪明,聪明的人希望自己更加聪明,没有人愿意自己是个傻子。聪明不是坏事,但自以为聪明,总认为自己了不起,往往就会做出"聪明反被聪明误"的事情来。正如孔子所说:"人皆曰:予知。驱而纳诸罟擭陷阶之中,而莫之知辟也。"意思是说:每个人都说自己聪明,可是被驱赶到罗网陷阱中去却不知躲避。


第16节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(6)

武则天时的周兴和来俊臣,二人是著名的酷吏,成千上万的人冤死在他们手下。有一次,周兴被人密告伙同丘神绩谋反。武则天便派来俊臣去审理这宗案件,并且定下期限审出结果。来俊臣深知周兴为人感到很棘手。他苦思冥想,生出一计。一天,他准备了一桌丰盛的酒席,把周兴请到自己家里,酒过三巡,来俊臣叹口气说:"兄弟我平日办案,常遇到一些犯人死不认罪,不知老兄有何办法?"周兴一向对刑具很有研究,便很得意地说:"我最近才发明一种新方法,不怕犯人不招。用一个大瓮,四周堆满烧红的炭火,再把犯人放进去。再玩固不化的人,也受不了这个滋味。"来俊臣听了,便吩咐手下人抬来一个大瓮,照着刚才周兴所说的方法,用炭火把大瓮烧得通红。然后站起来,把脸一沉对周兴说:"有人告你谋反,太后命我来审问你,如果你不老老实实供认的话,那我只好请你进这个大瓮了!"周兴听了惊恐失色,知道自己在劫难逃,只好俯首认罪。

⊙旅行者困境

由哈佛大学教授巴罗提出,它通过一个生动的虚拟案例,揭示了如果是人彻底理性、能够算计到十几步甚至几十步的话,那么他推论出的结果,很可能并不符合自己的现实利益。

如果周兴自己不给来俊臣出馊主意,自己或许能躲过一劫,但倒霉就倒霉在他太"聪明"了。由此可见,吃亏的人,常常是自认为自己聪明、然后自恃聪明且不知适可而止的人。对于上述论断,哈佛大学教授巴罗在研究囚徒困境时,给出了一个著名的"旅行者困境"模型。两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是航空公司请两位旅行者在100元以内各自写下自己花瓶的购买价格,如果两人写的一样,航空公司将认为讲的是真话,则如数赔偿;反之则价格写的低者为真话,按写低者的价格赔偿,并奖励其2元,对写高价格者认为是讲假话而罚款2元。

这样就开始了一场博弈。本来,为了获得最大赔偿,双方最好的策略就是都写100元,获赔100元。但甲却精明地认为如果写99元而乙会写100元,这将得到101元;可是乙却更聪明,他算计到甲会算计他写99元,而准备写98元;可甲更聪明一个层次,算计到乙会写98元而准备写97元……如此重复博弈下去,两人都"彻底理性"地能看透对方十几步甚至上百步的博弈过程,最后落到每个人都写0元。

可能你会想,生活中不会发生如上述例子中的事情,但巴罗教授提出这个案例旨在告诉我们:一方面,人们在为私利考虑的时候不要太"精明",因为精明不等于高明,太精明往往会坏事;另一方面,它对于理性行为假设的适用性提出了警告。比如我们的古语说"逢人只说三分话,未可全抛一片心",这当然足够理性,甚至可以说是"真理",但如果每个人都这样"理性"的话,那么每个人得到的都将是"三分真话",这无疑会极大地增加人们的交际成本。所以,对于纯粹的"理性",我们也是要辩证地看待的,否则事情的结果会与初衷大相径庭,非但损人,而且不利己。


第17节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(7)

■"撑死胆儿大的"与"饿死胆儿小的"

始于上世纪80年代初期的中国经济改革的一个主要成就,就是打破"大锅饭"。那么,"大锅饭"到底是怎么回事呢?

"大锅饭"最早可追溯到1958年下半年开始的"人民公社"化运动。在那场声势浩大的全民运动中,口粮由公社、生产队掌管,农民不在自己家里吃"小锅饭",而要一起到公共食堂吃"用一个大锅煮的饭"。后来,"大锅饭"发展为对分配领域存在的平均主义现象的一种形象比喻和概括,它在生产中体现为团队生产。而团队生产最大的麻烦就在于,人们能观察到的只是团队的成果,对于每个人的努力和成果难以观察。其导致的结果就是"干好干坏一个样,干多干少一个样",最后所有的人都没有积极性,勤劳的人也就变成了"懒汉"。后来改革开放,农村实行家庭联产承包责任制,打破了"大锅饭",我们看结果怎样呢--用课本上的话说是"扩大了农民的自主权,调动了农民的生产积极性,发挥了小规模经营的长处,促进了农业生产的发展,解放与发展了生产力。"

为什么两种制度会有如此截然不同的结果?我们可以用博弈论中的囚徒困境来进行探析。在"大锅饭"的机制下,由于对劳动成果的考察落实到团队而非个人,这就发生了以下的情形:假设团队中有100个人,每个人选择"努力工作"都要承担10元钱的成本,同时为团队的预期产出增加20元;而每个人偷懒则无须支付任何成本,也不会增加团队的预期产出。结果我们会发现:如果其他99个人努力工作,而自己偷懒将是最优的选择,因为可以不付出成本就享受到好处。而如果其他人都偷懒,则自己更应该偷懒,因为自己努力工作付出了10元钱成本,但为团队增加的20元收益中,只有很少的一部分是属于自己的。这样,偷懒就成了"大锅饭"(团队生产)中每个成员的优势策略。

明白了上面所讲的,我们就会明白为什么几乎所有的公司、企业都要对员工实行岗位责任制、实施绩效考核。因为只有这样,才能保证分配的公平,才能以多劳多得的机制来促使能者多劳。否则谁也不愿意让他人来分享自己的劳动所得,其结果必然是陷入囚徒困境。

为了弄清楚机制是如何对效率发生作用的,让我们再来看一则《韩非子》中所讲的故事:

齐宣王使人吹竽,必三百人。南郭处士请为王吹竽,宣王说之,廪食以数百人。宣王死,愍王立,好一一听之,处士逃。

以上这则精短的寓言后来演变成了更为精短的成语--滥竽充数。如果把 "大锅饭造就懒汉"中的结论应用到"滥竽充数"的故事中来,我们会发现,每个乐师最合算的选择都是不吹--因为这是他们的最优策略。但结果为什么只有南郭先生一个人在"滥竽充数"呢?因为有惩罚机制在起作用。如果一旦做假被发现,齐宣王一怒之下,十有八九会要了这个人的脑袋,所以大多数人不敢冒这个险。
第18节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(8)

那南郭先生为什么敢于做假呢?就在于他发现了"机制"中的漏洞。我们谈论"滥竽充数"这个成语的时候,总是充满了贬义,把南郭先生作为典型的反面教材,其实南郭先生是个很聪明的人。他根本不会吹竽,却敢于到齐宣王那里自荐而且把自己的技艺吹得天花乱坠,因为他很明白这样做固然有风险,但风险不大,他了解在现有的机制下,他的做法是不太容易"穿帮"的。而机制一变--当继承王位的齐愍王喜欢听独奏、南郭先生发现老办法行不通时,他溜之大吉了。在这个博弈中,南郭先生白吃白拿了好几年,到最后也没有任何损失。

这就是老百姓们通常所说的"撑死胆儿大的,饿死胆儿小的"。南郭先生胆子大,所以他占足了便宜。而现实生活中的成功者,大多是"胆儿大"的、敢空手套白狼的。比如刚刚创业的史玉柱在深圳开发M-6401桌面排版印刷系统时,手里只有4000元,却敢向《计算机世界》定下了一个8400元的广告版面,唯一的要求就是先刊广告后付钱。他的期限只有15天,前12天他都分文未进,第13天他收到了3笔汇款,总共是15820元。大多数人都不敢这样做,因为没有人能确保15天之后一定会有进账。但史玉柱做了,并且因此捞到了第一桶金。我们反过来假设一下,假如15天之内没有进账,史玉柱没钱向《计算机世界》支付广告费怎么办?广告已经做了,他没有损失;天也不会就此塌下来--最坏的结果不知道是什么,但一定是在人能承受的范围内的,至少要比南郭先生当初冒的风险要小得多。

对此我们也可以试着用"囚徒困境"来加以解释:胆儿大,可能有风险,也可能没有风险,但收益可观,而且即使有风险,也是在自己心理预期范围内的;胆儿小,没有风险,也没有收益。或者换句话说,胆儿大是找死,但可能死中求活;胆儿小是等死,而且必死无疑。那么"胆儿大"和"胆儿小"哪个是博弈论中的"最优策略"呢?当然是"胆儿大"。所以人们说"撑死胆儿大的",如果你是"胆儿小"的呢?虽然不一定真的会被饿死,但一生充其量也只是忙忙碌碌地找饭吃,不会有太大的成功。

■美忠啊,你慢些跑来慢些跑!

第二次世界大战时,有一个青年向哲学家萨特提出过一个问题。这个青年人面临着这样的选择:是参加抵抗运动,离开自己年迈的、需要照顾的母亲;还是留下来和母亲在一起,听任德国占领者的肆虐。无论选择哪个行为,都会产生严重的后果。

萨特的思想以"自由"闻名,他认为凡是追求自由的行为都是道德的行为,也是值得肯定的和有价值的行为。比如为了别人的幸福而牺牲自己的幸福,与为了自己的幸福而牺牲别人的幸福,这两种对立的道德是等同的。理由是在这两种选择中,压倒一切的目的都是自由。基于此,萨特这样答复年轻人:"没有一般的道德准则供你参考,你是自由的,所以你自由选择吧。"


第19节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(9)

人的选择真是的绝对自由吗?在选择上,是否会遭遇类似"囚徒困境"的情形呢?我们来看一下2008年在汶川地震中一个因"追求自由与公正"而引发全国人民热议的事件。

2008年5月12日,四川省汶川县发生特大地震。地震后,都江堰一位名叫范美忠的中学教师在网上发帖详述自己在地震中弃学生而逃的经历,其中称:"我是一个追求自由和公正的人,却不是先人后己勇于牺牲自我的人!在这种生死抉择的瞬间,只有为了我的女儿我才可能考虑牺牲自我,其他的人,哪怕是我的母亲,在这种情况下我也不会管的。因为成年人我抱不动,间不容发之际逃出一个是一个,如果过于危险,我跟你们一起死亡没有意义;如果没有危险,我不管你们你们也没有危险,何况你们是十七八岁的人了!"

范美忠此帖颇为符合萨特的"自由主义"论点。此帖一发,一周内在天涯社区上的浏览量达14万余次。范美忠从默默无闻的中学教师,变成民众热议的焦点人物,更被义愤的人们讥称为"范跑跑"。一时间,"范跑跑事件"沸沸扬扬,举国皆知。

显然,萨特所倡导的"绝对自由"在现实中不太可能,因为自由必然会受到责任、法律或者道德的约束,萨特本人最终也放弃了"绝对自由"学说。但是,在经济学领域,假定"人是理性的经济人",而以博弈论中的"囚徒困境"来分析范美忠此帖中的言论,倒是颇有一番道理。我们可以看到,当那地动山摇的一刻猝然来临时,范美忠与学生们都面临着跑与不跑两个选择。这就出现了下面的四种可能:

1、 范美忠与学生们都在第一时间跑,大家都有存活的机会;

2、 范美忠先跑,学生后跑,则范美忠存活,学生遇难;

3、 范美忠后跑,学生先跑,则范美忠遇难,学生们存活;

4、范美忠与学生都后跑,或者说范美忠留下来组织同学们一起跑,则有可能因为时间耽误,大家一起遇难。

由此我们可以看出,无论学生是否跑,对范美忠而言,先跑都是生存的可能性最大的选择。第一章中已经讲过,博弈论的基本假定是"所有人都是理性的",这一假定排除了人的道德因素,即:不考虑职业道德的情况下,范美忠当时的行为是符合博弈论的"优势策略"原理的。

那么范美忠为何又因其生死关头的"脚底抹油"之举而遭受千夫所指呢?我们可以设想,假设你是一个士兵,与你的战友们在战场上遇到了敌军。因为你们都是"理性经济人",活命是你们的最高目标,这时逃避危险的最好办法就是只有你逃跑,其他的战友都留下来战斗。当然,如果其他战友也选择逃跑,那么你选择逃跑就更显得明智了,因为当敌军打过来时,你一定不希望只剩下自己在应战。因此,不管其他战友怎么做,逃跑都是你所能采取的最优策略。

第20节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(10)

当然现实中很少出现战场上一方的所有士兵都逃跑的理象,因为排除军人荣誉、爱国心等主观因素,部队以战场纪律打破了上述囚徒困境--如果有士兵在战斗中逃跑,就会被"就地正法",或者事后被送上军事法庭,因为在战斗中,除非接到"撤退(逃跑)"的命令,"不跑"乃是军人的职责。也就是说,如果在战场上逃跑,会被人视为"可耻的逃兵",会受到军纪、法律及道德的三重制裁。

我们可以以此来解释范美忠为何因其"跑"而遭受的指责与非议,正如北京大学哲学系教授王海明在2008年6月6日接受《中国青年报》就范美忠事件采访时所说的那样:"作为一名教师,他享受了权利,如工资、福利等等,却没有履行义务和责任。这就是只索取不奉献,这就是不公正。

职业道德最基本的境界是责任,高一点的境界是"分外善行"。救助素不相识的路人是"分外善行",是道德的最高境界。作为一名教师,在地震的情况下救助学生,是一种责任和义务,不是"分外善行",是分内的事情。这种境界固然高尚,但它属于公正的范畴,属于履行责任的范畴。逃跑这种行为本身,属于最严重的不道德行为,是不可原谅的。"

■如何使对手陷入囚徒困境?

当你处于绝对劣势时,只有借助其他人的帮助才能扭转局面,而其他人又不愿意出手相助,你有办法"迫使"那个人与你站在同一条船上吗?博弈论中,的确有一种给对方设置囚徒困境、从而"逼迫"对手与自己达成合作的方法。让我们先来看一下金庸的小说《神雕侠侣》中所描述的一段情节吧。

忽必烈率蒙古大军进攻南宋,大侠郭靖、黄蓉夫妇率军民固守军事重镇襄阳城。郭靖、黄蓉刚出生的女儿郭襄落入李莫愁手中,李莫愁误以为此女为杨过与小龙女所生,欲以此女为"人质"逼师妹小龙女交出古墓派的武功秘笈《玉女心经》。而蒙古国师金轮法王知道此女是郭靖的骨肉,也想抢到郭襄以此胁迫郭靖投降。杨过因自小受郭靖抚养,又被郭靖的恩义感动,誓死要保郭襄周全,不能让她落入坏人之手。

就这样,一场博弈在杨过、李莫愁、金轮法王三人中展开。当时郭襄在杨过手中,金轮法王要抢到郭襄正与杨过打斗,而李莫愁欲借金轮法王之手除去杨过,故此在旁"坐山观虎斗"。只有与李莫愁联合,才能击败金轮法王,可是李莫愁偏偏不肯与杨过联合,杨过该怎么办呢?金庸先生这样写道:

三人中法王武功最强,李莫愁最毒,但论到诡计多端,却推杨过。他一阵伤心过了,随即筹思脱身之策,心想:"郭伯母当年讲三国故事,说道其时曹魏最强,蜀汉抗曹,须联孙权。"李莫愁既不肯相助自己,只有自己去助李莫愁了,当下刷刷两剑,挡住了法王,疾退两步,突将婴儿递给李莫愁,说道:"给你!"


第21节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(11)

这一着大出李莫愁意料之外,一时不明他的用意,顺手将婴儿接过。杨过叫道:"师伯,快抱了孩子逃走,让我挡住贼秃!"奋力刺出两剑,教法王欺不近身来。李莫愁心道:"原来他想我总还顾念师门之谊,不致伤了孩子,危急中递了给我,那真是再妙不过。"她哪想到这是杨过嫁祸的恶计,刚提步要走,法王回过手臂,银轮砸出,竟是舍却杨过,击向她后心。这一招来得好快,她身形甫动,银轮已如影随形的击到。李莫愁无奈,只得回过拂尘挡架。

杨过见计已售,登时松了一口气,他顾念婴儿,却不肯如李莫愁般袖手旁观,以待二人斗个两败俱伤,才出来收渔人之利,呼吸稍一调匀,立即提剑攻向法王。(《神雕侠侣》第二十二回》)

金庸先生的这段描写对于我们每个人处于劣势时转换思维方式都是很有启发的。创造一种使对方陷入与你一样无法全身而退的困境,那么即使他本可以夺走你所有的优势,此时他也只能被迫与你合作,做出有利于自己也有利于你的决策。李莫愁本来想看着杨过与金轮法王"鹬蚌相争",她好来个"渔翁得利",杨过已处于绝对的劣势。可是聪明绝顶的杨过却把郭襄给了李莫愁,使得金轮法王将攻击的目标也转向了李莫愁。此时李莫愁面临以下几种情形:

第一种情形是把郭襄交给金轮法王,但她想要以郭襄交换《玉女心经》的打算也就落了空;

第二种情形是李莫愁把郭襄再还给杨过,还是看着杨过与金轮法王拼杀,但她又舍不得轻易到手的郭襄;

第三种情形是李莫愁得到郭襄,杨过与金轮法王都不来抢,任她把郭襄抱走--但实际上这是不可能的;

第四种情形是与杨过协力打退金轮法王,至少比起与金轮法王争夺郭襄,与杨过争夺的胜算要大一些。

我们可以看到,只有第四种情形才是对李莫愁最有利的,所以李莫愁不得不选择与杨过合作的策略。而杨过正是因为看穿了这一点,巧妙地转换了自己的劣势处境,并对把自身的困境与李莫愁的困境"绑"在了一起,迫使李莫愁做出了帮助自己解围的理性选择。

与上述情形类似的是东汉时期班超出使西域斩杀匈奴使者的故事。班超受命率领使节团出使西域,联合西域各国共同抗击匈奴。到了鄯善国,起初几天鄯善王对班超一行还很友好,可是过了几天态度突然冷淡,班超得知原来是因为匈奴的使者也到了鄯善,而鄯善一直惧怕匈奴。这时的局势对于班超很不利,很有可能鄯善王会把他们抓起来献给匈奴使者。班超当即作出决断,冒险率人乘夜杀了匈奴使者,然后拿着匈奴使者的头去见鄯善王,说:"匈奴使者已经被我杀了,匈奴一定会怪罪你。从今以后,只要你一心一意跟着汉朝抵抗匈奴,匈奴自然不敢来侵犯你们。"鄯善王见此情形,也只得与汉朝合作、与匈奴决裂了。在这个故事里,班超也是巧妙布局,把鄯善王陷入了一种没有其他退路的困境之中,从而只能选择与汉朝合作,与匈奴断交。



第22节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(12)

杨过为李莫愁设置困境以及班超为鄯善王设置困境的做法,在现实生活中对我们多有启发。比如张三借了李四钱一万元钱,李四讨要,而张三无力归还。假如这时张三对李四说:"我现在有一笔稳赚不赔的生意,但是缺少本钱,只要五千元就够了。如果你能再借给我五千元作为本钱,我赚了钱就把这次借的五千及上次借的一万一起还给你。否则那一万元钱我现在没法归还,只能等以后有钱时再还你了。"如果李四经过考察确认张三所说属实,那么作为一个理性经济人,为了收回他以前借出去的一万元钱,李四一定会做出把五千元钱再借给张三的选择。另有在商业中,如图书出版行业,发行商往往不及时给出版商结算书款,即使书卖出去了也不肯结算。只有当出版商在发行商那里有了一定的"账底"之后,发行商才陆续给出版商结算"账底"以外的书款。如果此时出版商不再与发行商合作,那么以前的账底就成了"千年不还,万年不赖"的长期烂账,出版商永远也别想再要回来。在这里,发行商就成功地给出版商制造了一个迫使其合作的"囚徒困境"。(著名出版家张静庐先生就在其著作《在出版界二十年》当中叙述了他在20世纪初做出版时所遭遇的这种困境。当然,要打破这个困境,只有期待游戏规则的改变。)

说了这么多,其实是想告诉读者:在孤立无援的时候,不要一味悲观失望,而是要想办法把你的对手绑在自己的船上,让对手和你陷入同样的困境,没有人面对危害而不自私自利的。此时,他为了保全自己的利益,就会无奈地做出与你合作的选择。

■胜利大逃亡:带你走出囚徒困境

我们已经知道,囚徒困境是每个人都在根据自己的利益做出决策,但结果是谁也得不到好处,也就是每个人在自利心理的驱使下,导致的结果是所有的人利益"同归于尽"。那么,能否打破囚徒困境,使处于囚徒困境中的人彼此协调自己的行动,从而使双方的利益都达到最大化呢?答案是肯定的,以下就是走出囚徒困境常见的法则。

1、施以报复:让背叛行为不敢发生

假如每一个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复 (比如杀他全家),那么每个囚徒就可能因担心未来的报复而在现在选择拒供,使得"拒供,拒供"成为均衡的结果。合作达成了。

在本章"囚徒困境:忠诚还是背叛?这是一个问题"一节塔克所描述的囚徒困境事例模型中,假设二人是加入黑手党犯罪,反而可以走出这个"囚徒困境"。电影与文学作品中描述的黑手党,都会对与警方合作、出卖同伙的行为进行严惩(一般情况下是处死)。为了避免被处死,两个犯人应该拒绝与警方合作,这样他们就可以只坐1年的牢(而不是双双招认结果大家都坐10年的牢)。
第23节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(13)

司法实践中我们的确可以看到有很多犯罪团伙的成员,被捕后拒不坦白。这在很大程度上与惩罚机制有关。因为在犯罪团伙、黑社会中,如果出卖"兄弟",将永远无法在江湖立足,并且其家人也将受到黑社会的追杀。正由于这种报复与惩罚机制的存在,使得囚徒间彼此合作,从而打破了"囚徒困境"的局面。这与我们前面所说的职业道德约束、战场纪律等如出一辙。

2、契约合作:建立相互信任的关系

在囚徒困境中,假如每个人都彼此相信对方不会招供,那么合作拒供的结果也可以出现。因此,合作的关键是相互的信任,也就是说,如果能够达成一种信任关系,那么也就可以达成合作。

如何达成相互信任的关系呢?一个很有效率的方案是:签订一份对双方都有约束力的、且对背约者进行严厉惩罚的契约。比如在商业领域,即使是未曾有过合作关系的人,也能通过订立合同而相互信任,进而达成合作。因为合同中会带有违约条款,谁不遵守合同,谁就将承担对自身极为不利的法律后果(如支付违约金、赔偿损失等)。

当然,签订合同与诚实信用地去履行合同是两回事,也就是说,并非签了合同就能使双方建立相互信任进而达成合作,但比起没有合同来,签订合同显然更有利于打破(背叛,背叛)这一囚徒困境。

3、忠诚文化:打造"嗷嗷叫"的团队

电视剧《亮剑》受到很多观众的喜爱。尤其是独立团的战士们在战斗中不怕牺牲、争先恐后地"嗷嗷叫着往前冲"给人留下了深刻的印象。

我们知道,在一场战斗中,冲到最前面总是最危险的,相对落后就意味着相对安全,而且你不能因为某个士兵相对落后就说他胆小怕死或者临阵脱逃,因此军法是用不上的。根据囚徒困境,如果士兵有足够的理性,那么是没有人愿意冲在最前面的,因为每个人都会等着他人冲锋陷阵。

那么,李云龙的独立团战士们为什么还要"嗷嗷叫着往前冲"呢?政委赵刚的一席话道出了其中的秘密:"一支部队,也是有气质有性格的。而这种气质和性格,是与首任的军事主官有关。他的性格强悍这支部队就强悍,就嗷嗷叫。这支部队就有了灵魂。从此以后,这支部队不管换了多少茬人,它的灵魂仍在。"

这就是一个军队的忠诚文化,对国家的忠诚、对军人职责的忠诚、对战友的忠诚。有了这样的文化,战士们在冲锋时自然是争先恐后,囚徒困境的问题也不复存在。而没有这种文化的军队,在战斗中则往往一触即溃。

忠诚文化对于企业也同样适用。本来"大锅饭"中的偷懒行为是难以破解的囚徒困境,可是一旦植入企业文化,则情形就会大大改观。经济学家莱宾斯坦就曾建议培育合作的企业文化,以此来克服团队生产中的囚徒困境。

第24节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(14)

4、长期关系和重复博弈

我们都知道,吸烟可以满足一时的快感,但却会导致日后的健康问题。对于只顾眼前而不管将来的人来说,吸烟将是他的最佳选择。同样的道理,在囚徒困境中,如果人们只顾眼前而不顾将来,则背叛是最好的选择。尤其是博弈只是一次的情况下,背叛简直就成了不二的选择。

可事实上,有的博弈是重复的。比如商业合作,往往不仅限于一次。如果你这次选择了背叛,虽然就这一次博弈考察你占到了便宜,但你失去了以后合作的机会,从长远考察则是吃了亏。因此,一个理性的人为了从合作中持续不断地获得利益(而不是"一锤子买卖"),则必然会选择忠诚而非背叛。也就是说,对于理性经济人而言,他会为了长远的将来利益而牺牲眼前的利益。事实上,重复博弈(建立长期合作关系)正是破解囚徒困境的又一个良策。有关重复博弈的更详细论述,我们将放在下一章中专门去讲。

第24节:囚徒困境:傻作精时精亦傻,输为赢处赢还输(14)

4、长期关系和重复博弈

我们都知道,吸烟可以满足一时的快感,但却会导致日后的健康问题。对于只顾眼前而不管将来的人来说,吸烟将是他的最佳选择。同样的道理,在囚徒困境中,如果人们只顾眼前而不顾将来,则背叛是最好的选择。尤其是博弈只是一次的情况下,背叛简直就成了不二的选择。

可事实上,有的博弈是重复的。比如商业合作,往往不仅限于一次。如果你这次选择了背叛,虽然就这一次博弈考察你占到了便宜,但你失去了以后合作的机会,从长远考察则是吃了亏。因此,一个理性的人为了从合作中持续不断地获得利益(而不是"一锤子买卖"),则必然会选择忠诚而非背叛。也就是说,对于理性经济人而言,他会为了长远的将来利益而牺牲眼前的利益。事实上,重复博弈(建立长期合作关系)正是破解囚徒困境的又一个良策。有关重复博弈的更详细论述,我们将放在下一章中专门去讲。




0 投票
标签: 军人荣誉全集


e

发表评论
称呼: 主页:
g