波波小说

波波小说>中国热 > 第1部分(第1页)

第1部分(第1页)

政治博弈(1)

密歇根大学政治学教授罗伯特·阿克塞尔罗德于20世纪70年代末举行的一次电脑程序比赛,已成为成功的社会研究的一个经典故事。它激起了人们深刻的思索,被公认为20世纪最重要的实验之一。阿克塞尔罗德当时是对国际政治形势,尤其是对核战争的危险感到担心,因而研究博弈论以及重复进行的“囚徒困境”游戏。他研究了人工智能,再研究电脑棋赛,然后想到邀请专家们以电脑程序的形式提出他们各自所主张的战略,通过多次重复的“囚徒困境”进行较量,可以有效地对这些战略作出评估。

在第一轮比赛中,他邀请的14位专家各自以电脑程序的形式提出自己的战略。这些专家包括政治学、数学、心理学、电脑科学和经济学的教授。阿克塞尔罗德自己又添加了“随机程序”,即以50%的概率选取“合作”或“背叛”。14种战略加上“随机战略”均一对一进行重复的“囚徒困境”比赛,即15×15共225场比赛,每一配对对弈200次。每次按照以下四种情况给每一程序打分:

a。“彼此合作”:各得3分;

b。一种情况是甲方“背叛”乙方“合作”,另一种情况是甲方“合作”乙方“背叛”:“背叛”一方得5分,“合作”一方得0分(作为易受骗者的代价);

c。“彼此背叛”:各得1分。

“囚徒困境”是一种非合作性、非零和博弈的游戏,并不是每次都一胜一负,不是一方之所得即另一方之所失。“一方背叛”得分最高,“彼此合作”次之,“彼此背叛”再次之,“一方合作”而一方受骗则垫底,但“一方背叛”与“一方受骗”二者相加除以2的平均分低于“彼此合作”的得分:(5+0)÷2<3,这一点成为合作的刺激因素。“困境”在于,你不知道对方打的是什么牌,所以从利己着想,选择“背叛”最合适:你“背叛”对方“合作”,你可得5分;若对方也选择“背叛”,你仍可得1分。如此看来,理性的博弈者似乎都只会选择“背叛”,但双方都各得1分,并非最佳结果,不如“彼此合作”的各得3分。

在比赛中,一种战略可能达到的最高分为15000分(15×200×5),最低则是0分。但能指望得到的最高分,即200次均得3分,共600分。每次都指望对方受骗而自己总得5分是不可能的,因为对方也会以“背叛”进行报复,结果只有各得1分。

在全部比赛结束后,得分最高的是多伦多大学心理学和博弈论教授阿纳托尔·拉波波特所提交的“一报还一报”战略,它简便易行,即头一回选择“合作”,然后,对方选择什么,自己下一回也选择什么。

具有讽刺意味的是,除了“随机程序”以外,得分最差的一个程序恰恰是设计得最复杂的一种程序。15种战略中,有8种是首先选择“合作”,被列为“善战略”,另外7种战略是首先选择“背叛”,而且总想诱使对方受骗,被列为“恶”战略。最后,“善战略”总分均高于“恶战略”。书 包 网 txt小说上传分享

政治博弈(2)

“一报还一报”不仅善良,而且不刻意追求高分,又能宽容(一开始虽然报复对方,但对方态度变好了,就不再记仇)。宽容心差,就容易陷入双方老是“彼此背叛”的状态。“一报还一报”是15种战略中最简易又最善良的一种,它最后得分最高,是许多人所未想到的。“一报还一报”的特点:一是“善良”,决不首先“背叛”。二是“反应快”,对方若“背叛”,马上就以“背叛”还击,决不犹豫。三是“宽容”,对方若是态度变为“合作”,就不记前仇,立即回应以“合作”。四是“无忌妒之心”,不因对方玩弄心计一时得分高而自己也玩弄心计。五是“简便易行”,始终坚持“一报还一报”,易于坚持到底,态度明朗,对方明白了也会照样做。

阿克塞尔罗德总结了第一轮比赛的结果,宣布举行第二轮比赛。这次参赛的程序有63个,其中包括那个“随机程序”,还有约翰·史密斯提出的一种更宽厚的“一报还两报”,即遭到对方两次“背叛”后才予以还击。这一轮的场次不加限制,阿克塞尔罗德在他于1984年出版的《合作的进化》一书中指出这样做是因为对未来的关注可以促进合作。有些人读了阿克塞尔罗德对第一轮比赛的分析以后,研究了怎样利用那些“善战略”和“宽容战略”的方案,提出了一些新的“恶战略”,但最后还是输了。拉波波特的“一报还一报”再次获胜。得分最高的前15名中,有14名都是“善”的,而得分最少的15名当中,则有14名都是“恶”的。“一报还两报”的战略未能获胜,因为许多“恶战略”都费尽了心机来利用对方的宽容。

这一事实导致一个重要的发现:一种战略的成功取决于它与之较量的那些战略的性质。理查德·道金斯在他那本深受读者欢迎的《自私的基因》(1974年初版,1990年、2006年再版)一书中指出,阿克塞尔罗德举办的比赛是像橄榄球联赛一样采用了循环赛制。参赛的每一战略都需要跟别的战略交锋,全赢者才胜出。“一报还两报”若在第一轮推出,可能胜出,但是它在第二轮推出就不行了,因为第二轮“善”者比例低于第一轮。“一报还一报”能胜出,是因为“善”者在第二轮毕竟也还多于“恶”者,否则它也会败。循环制不同于道金斯所说的“进化上的稳定策略”(ESS),道金斯说,凡是种群的大部分成员采用某种策略,而这种策略的好处为其他策略所比不上的,这种策略便是进化上的稳定策略。

阿克塞尔罗德仍然用第二轮参赛的63种战略进行了第三轮比赛,以寻找一种能反映达尔文学说“自然选择”原则的“进化稳定策略”。在这新的一轮比赛中,63种电脑程序被列为“第一代”。“第一代”比赛结束时,记录下每一种电脑程序及其“后裔”的百分比。几代之后,有些程序比例减少,到了“第200代”,多数“恶战略”已遭淘汰,别的战略继续比赛。到了“第1000代”左右时,每一战略在总数中所占百分比停止变化,终于达到了稳定状态。在6场比赛中,“一报还一报”胜了5场。另5种类似的战略成绩也不错,其中一种在第六场获胜。有一种叫做“哈林顿”的“恶战略”熬过了“第200代”,但随后一些“善”的和“宽容”的战略败出了比赛以后,这一“恶战略”找不到它易于击败的靶子,终于在接近“第1000代”时败亡。

政治博弈(3)

阿克塞尔罗德把“一报还一报”称做“集体稳定战略”,因为当“恶战略”全部消失以后,剩下的全是“善战略”,只会彼此合作和共存。换句话说,“一报还一报”不是真正的“进化稳定策略”(ESS),尽管“恶战略”甚至是最恶的“永远背叛”(一种真正不受侵犯的ESS)都侵犯不了“一报还一报”,但“永远合作”(又称做“一味相信别人的傻子”)之类的“善战略”却能够侵犯它。罗伯特·博伊德和杰弗里·洛伯鲍姆遵循阿克塞尔罗德的研究,考察了“一报还两报”与“有疑心的一报还一报”(与“一报还一报”相同,但第一步不是“合作”而是“背叛”)二者的混合。“有疑心的一报还一报”一开始出“恶”招,引来双方“彼此背叛”,因此在“一报还一报”占绝大多数时情况不妙,但更有宽容心的“一报还两报”却让它有胜出的机会。这意味着“一报还两报”与“有疑心的一报还一报”的混合能使“一报还一报”受渗透。因此,博伊德和洛伯鲍姆认为类似的“善宽容”与“微恶”战略的组合能有侵犯力(渗透力),在人类生活中可能亦是如此。

阿克塞尔罗德还通过第一次世界大战期间西线停火这一著名事例,谈到“自己活也让别人活”战略。这一事例表示“一报还一报”甚至能渗透到战争期间彼此“永远背叛”的人群之间,合作能出现在彼此毫无友谊的人群之间。在《自私的基因》一书中,道金斯进一步探讨了“永远背叛”和“一报还一报”组成的“双稳定系统”。他发现这取决于“一报还一报”的最初数量及其优于“永远背叛”的效果如何。

若“永远背叛”占统治地位,“一报还一报”就可能通过“亲密度”和“粘连度”而“串在一起”(这听起来颇像是中国人的关系文化,是吧?),表现为“人们倾向于继续生活在故乡及其附近”。①相形之下,“永远背叛”却做不到这一点。因此,“一报还一报”享有较高的稳定性,几千年之后可能最终在数量上超过“永远背叛”。

那么,以上这些想法对于理解中国的文化,尤其是理解中国的政治文化,有什么意义呢?以下几点应有助于我们理解中国政治文化的现实、中国公民文化的改善,以及未来的不同文化(包括中美两国文化)之间的合作方向。

一、阿克塞尔罗德研究的主题是在一个没有中央权威的利己主义者世界上出现合作的条件。在他看来,合作是有持续力的,而最大的问题是怎样让合作开一个头。促进合作的原则是“使未来比现在更加重要,改变博弈者每走一步的4种可能结果的得益;让参赛者懂得促进合作的价值、事实和技巧”。②就中国的政治社会风气而言,这几条原则似乎都不足以起作用(如交通秩序,公交秩序,以及下文分析的中国历史上代际和代中的“虎斗”和所谓海外###中的“内斗”),所以最重要的是需要核心权威的推动,这就是使合作得以开始的“第一推动力”。在无法树立权威的地方,中国人(包括海外华人)的社会就真像是“一盘散沙”。许多华人社会就因此而缺乏像样的自我组织,美国的华人社会亦是如此。

二、尽管“一报还一报”是“集体稳定策略”,但“一报还两报”和“有疑心的一报还一报”的混合仍可成功渗透,这说明“一报还一报”的优势有赖于每一种战略的起始比例。即使“一报还一报”一开始就占主导地位,轻微恶战略仍可存在。

三、作为一种真正不可渗透的“进化稳定策略”的“永远背叛”,与具有“局部集结”能力的“一报还一报”,这二者构成的“双稳定系统”,最适于用来说明中国人的“关系文化”和中国人的“有小忠而无大忠”。然而,阿克塞尔罗德的“齿轮效应”(Ratchet effect,即认为合作使成效递增)和道金斯的“高阶稳定性”这两种观点都是意味着直线式进步的自然选择过程,其进化方向是走向日益增进的合作③,但这种看法是成问题的(不妨想想以色列—阿拉伯对抗,以及美国的反恐怖战争)。正如本章所述,中国的历史表明,在这种“进步论的进化”之内并不存在任何机制或进化基础来推动一直不停的进步,而是只有这样一个过程,它产生局部的适应,而不是全面的前进。不少人持有全球民主化的直线思维,即使“道义进步”能有明确定义,他们也需要认真琢磨上述情形,这对他们来说是极其重要的。

四、博弈论以及重复的“囚徒困境”实验具有令人鼓舞的启发价值。然而,“模式世界”与“现实世界”之间毕竟存在着差距,对于“现实世界”中的角色,还必须看到他们和他们的战略背后起作用的因素。其中有以下“八大因素”:博弈者的关系、声誉、技巧、赌注、资源、风险、学习,以及决策过程。④“模式世界”中的例子都可能是存在的,因为他们背后的这些因素的作用可能正好被中和了。而在现实中,这“八大因素”却往往能决定博弈的性质。比如,人们在政治中可能运用一种战略,而在商业或社会生活中可能又运用不同的战略。他们会不时地变换战略。他们还可能用各种不同的策略来欺骗或误导其对手,中国有名的“三十六计”即是如此。博弈环境决定博弈策略,制度决定行为。自然进步论的模式过于理想化了,它很难适用于复杂的现实世界。

。 想看书来

鸿门宴(1)

对于中国的持续繁荣以及中国的政治未来而言,中国的政治文化有三个方面尤其重要,它们是:一、朝代之间的“天下”之争;二、朝代内部的权力之争;三、“接班继承”制度以及中国的“朝代轮回”逻辑。

中华帝国始于秦朝(公元前221—前206年),在它之前有过夏、商、周三个朝代。中国历史上时间最长的朝代是周朝(公元前1046—前256年),正是周朝的统治者最早以“天命” ——即“受命于天”的君权神授之说来证明自己统治的合法性,同时证明夏、商亡国的合理性(商是中国第一个有文字记载的朝代)。

周朝建立了中国式的封建制度,把土地分封给君王的宗室。⑤周朝中央权力衰弱后,这些诸侯国纷纷自视为独立王国,这就是中国地方主义的起源。几个强大的王国彼此征战不休,形成“春秋战国时代”。此时诸子百家,主要是法家、儒家和道家,异彩纷呈,学术之盛在中国历史上可谓空前绝后。秦国利用了法家思想最先建立了中央集权制度。

秦国强大起来后灭了其他各国,其统治者嬴政于公元前221年宣布自己为一统天下的“始皇帝”,这就是秦始皇。中国两千年的帝国篇章由此开始。但是秦朝的“法治”暴政刚实行12年就爆发了陈胜、吴广领导的农民起义,农民、囚犯、士卒以及原先各诸侯国统治者的后裔都纷纷起来造反。

在当时的起义队伍中,原楚国的兵力最强,它的统帅项羽骁勇善战,在巨鹿之战中大败秦军。当时起义者推举的名义上的领袖楚怀王与各路队伍约定,谁先攻占秦国心脏地区关中及其都城咸阳,就立谁为关中王。项羽大军在北面忙于与秦军主力交战之际,另一支起义队伍在沛公刘邦率领下首先攻进关中,秦帝国最后一名统治者子婴于公元前206年投降了。

“鸿门宴”的故事正是在这种形势下发生了。项羽认为灭秦功劳应该属于他,不能让刘邦当上汉中王,否则他项羽就太丢脸了。他的大军于公元前206年进抵关中,他的谋士范增建议他设宴会见刘邦,乘机杀掉刘邦。以优势兵力占领关中。

项羽的叔叔项伯是项羽军中一员大将,又是刘邦的谋士张良的多年至交。他获悉项羽和范增的密谋,就连夜潜入刘邦军中会见张良,建议张良随他转入项羽一边以保安全。忠于刘邦的张良谢绝了项伯的好意,请项伯会见了刘邦。临机善变的刘邦曲意奉迎项伯,向项伯表白他一定尊重项羽,追随于项羽之后。项伯显然听信了刘邦的甜言蜜语,回去劝说项羽善待刘邦。项羽虽凶暴残忍,却又易萌恻隐之心,听了项伯一番话,就开始犹豫不决了。

第二天,刘邦到鸿门晋谒项羽,花言巧语恭维项羽。宴会期间范增多次示意项羽赶紧下手杀刘邦,项羽却下不了决心。范增遂召来项羽战将项庄,叫项庄以表演舞剑为名伺机杀掉刘邦。“项庄舞剑,意在沛公”。项伯见状,遂拔剑“伴舞”,实则小心掩护刘邦。 txt小说上传分享

鸿门宴(2)

在这危急时刻,张良到帐外叫刘邦的连襟和侍卫长樊哙进帐保驾。项羽赐酒,樊哙饮酒后义正词严斥责有人阴谋加害于刘邦,令项羽无言以对。在张良安排下,刘邦以入厕为托词离席,在樊哙护卫下轻骑简从,逃离而去。

待刘邦走远后,张良返回帐内,替刘邦向项羽道歉,说刘邦因不胜酒力,故未能亲自告辞。他代表刘邦向项羽敬献白璧一对

https://www.du8.org https://www.shuhuangxs.com www.baquge.cc

abxsw.net dingdianshu.com bxwx9.net

kenshu.tw pashuba.com quanshu.la

tlxsw.cc qudushu.net zaidudu.org

duyidu.org baquge.cc kenshuge.cc

qushumi.com xepzw.com 3dllc.net

已完结热门小说推荐

最新标签