文章吧-经典好文章在线阅读:合作的进化的读后感10篇

当前的位置:文章吧 > 经典文章 > 读后感 >

合作的进化的读后感10篇

2018-02-03 20:07:02 来源:文章吧 阅读:载入中…

合作的进化的读后感10篇

  《合作的进化》是一本由罗伯特·阿克塞尔罗德著作,上海人民出版社出版的平装图书,本书定价:23.00元,页数:168页,文章吧小编精心整理的一些读者的读后感,希望对大家能有帮助

  《合作的进化》读后感(一):非零和博弈下的合作演化——《合作的进化》有感

  非零和博弈下的合作演化——《合作的进化》有感

  2016.02.10

  Axrlrod 的《The Evolution of Cooperation》,合作并不是凭空产生的,有其产生的原因稳定和不稳定的合作的判别,处于合作与否的个人和决策者的可能方案。很多内容,Axrlrod是从合作的角度阐述,这些内容在其他学科中也有合理解释

  Axrlrod 抛出这样的一个问题 :在每个人都有自私动机的情况下,怎么样才能产生合作?这个问题的答案,会极大地影响了个人在对于社会经济政治方面行为思维。合作博弈出现个体间,同样也出现在国家间(例如军备竞赛、区域冲突等问题)。

  Axrlrod 采用了博弈论中著名的“囚徒困境”(Prisoner's dilemma)来研究合作。“囚徒困境”不同于一般的游戏,如国际象棋——对抗者双方利益完全对立的,双方的利益不是完全对抗冲突的,而是取决于双方所采用当前和后续策略。“囚徒困境”是不同于利益完全对抗的非零和博弈(Non-zero-sum game theory)。通过计算机竞赛,模拟决策双方的行为,遍历每个对手的相遇,从结果中研究合作进化的机理。

  ---

  对策者双方的再次相遇给合作带来了可能,同时当前的合作也会给未来带来影响。

  gt; 有两个原因使得现在比未来更为重要。首先,对策者倾向于认为未来所得的价值随着时间的推移而减少。其次,对策者总有些机会不再相遇。这种持续的关系会由于其中一个对策者迁移、改变职业、去世或破产而结束。

  那么我们为何会倾向决策的当下性?我们认为初始机遇影响未来的发展,即机遇存在时效性;其次,当一个群体中进入持有相同策略的个体时,会隐性地改变每个个体在群体中的收益值。

  策略制定具有历史性。“一个策略在某个相互作用格局下可能合作,在另一个格局下则可能背叛”;当然在制定策略过程中也可以使用概率(马尔可夫过程、贝叶斯分析),即制定策略的过程是可分析的。

  在制定策略的过程中,可以运用数学方法去描述以往合作的历史性以及判断再次合作的可能性大小。数理分析和统计理论可以帮助我们进行科学决策。

  我们作为决策的参与者,当我们与其他决策者相遇时,可以选择合作或者背叛以获得属于自我某方面的效益。以个体间的合作或背叛情况进行研究,首先是样本容量得足够大,但这类信息的获取存在一定的难度及偏差性;其次两者间的关系是混杂很多因素(种族、历史、个人特质匹配等)的,对研究问题存在一定的干扰作用;以人为样本研究这类问题,时间消耗也是个需要考量的因素。选用计算机竞赛进行模拟,能消除个体因素对研究的偏见且具有快速、直观的因素。

  ---

  在计算机竞赛中,对双方合作奖励每人3分,对对方背叛只给1分,如果一个人背叛而另一个人合作,背叛者得5分,合作者得0分,循环进行竞赛。乍一看,决策者一方的背叛和另一方的合作能获取最高的得分,但相同的情况对另一方也是适用的,如果双方都希望得到较高的得分而选择背叛,那么将会得不偿失——双方背叛各得1分。

  研究人员还故意设置*随机程序*来检验与其他程序的相遇情况。影响排名的规则是以“结果最大化”原则基础的。通过200轮循环竞赛的方式进行比赛,“一报还一报”策略与其他策略相遇时,整体的得分是较好的。“一报还一报”是开始选择合作,然后就按照对方上一步的选择去做。当然存在的一个问题是当这个程序与其他善良程序比较时,结果最大化就显得苍白无力(因为两种善良程序得分相差不多),研究人员设立了另一个评价标准:它们与不善良规则相遇时的得分。

  重复第二轮实验,即参赛者都知道第一轮“一报还一报”策略赢得了第一轮竞赛,针对修改过的程序再次进行测试,但这次比赛没有人知道最后一步会什么时候到来(这消除了游戏最后一步的影响)。但是结果还是类似,“一报还一报”表现的很好。

  ---

  Axrlrod 也列举出第一次世界大战堑壕战中的“自己活也让别人活”的系统,论述了合作也能在在敌对双方中产生;同时与Williams·D. Hamilton合著的关于生物系统中的合作进化。

  gt; 生态分析表明,与那些本身得分并不佳的程序相遇时干的不错,这只不过是经历一个自我毁灭的过程。非善良者在开头还显得挺有希望的,但是**时间一长就摧毁了它自己赖以成功的基础**。

  gt; “一报还一报”不是得到和对方一样多的得分,就是比对方略少。“一报还一报”赢得竞赛不是靠打击对方,而是靠从对方引出使对方有好处的行为。

  “一报还一报”的策略并不是以结果最大化为目标的,而着眼于营造一种“双赢”的局面,是双方都受益。“一报还一报”是以善良为前提,但同时对对方的挑战迅速可靠地做出反应,正是通过这样“可被激怒的”性质,大多数程序才愿意和“一报还一报”合作从而达到“共赢”。

  ---

  在持续的“重复囚徒困境”中,针对参赛者有以下四个建议: 1. 不要嫉妒;2. 不要首先背叛;3. 对合作与背叛都要给以回报;4. 不要耍小聪明

  gt; 人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功联系起来。这种标准导致了嫉妒,嫉妒有导致企图抵消对方已经得到的优势

  在实际生活中,和别人做比较很容易使得自己进入一个嫉妒的恶性循环,但是,两者之间的利益并不一定是零和博弈状态(只有输赢),也可以通过双方的合作达到非零和博弈,实现双方共赢。不要过多地注重利益,这样会产生自我毁灭的嫉妒。一个更好的相对标准是把你所做的与处在相同情况下的其他人所做的作比较。

  不要耍小聪明。从时间角度而言,自己的行为将会反射到自己身上,通过耍小聪明获得一时的收益,但造成的后果也会馈赠于你。

  参考:

  [1] https://en.wikipedia.org/wiki/Prisoner's_dilemma

  [2] https://en.wikipedia.org/wiki/Zero-sum_game

  [3] https://en.wikipedia.org/wiki/Markov_chain

  [4] https://en.wikipedia.org/wiki/Bayes'_theorem

  《合作的进化》读后感(二):合作的前提:读《合作的进化》

  [美]罗伯特.阿克塞尔罗德:《合作的进化》,吴坚忠译,上海世纪出版集团2007年版

  这本书最早的译名是“对策之中的制胜之道”,不仅有点“媚俗”,而且还有点引人误解,因为人与人的“合作”关系与力求“制胜”的竞争关系有显著的不同,而书中所谓的“一报还一报”行为策略,并不是一个一心争胜的策略,事实上,它在单次博弈中的得分从不会“超过”对方,其竞争优势在于能促使合作秩序扩展从而能够和合作伙伴一起胜过“总是背叛”或“一有机会就背叛”的“小人”。这次再版,书名更为“合作的进化”,要确切多了,但更恰当的译名似乎应该是“合作的演化”。

  按照自利理性人的假设,在人类社会中广泛存在囚徒困境(双方合作比不合作好;但一方背叛一方合作时,背叛方得分高于合作时得分;结果双方出于“理性”都选择背叛)是不足为奇的,陷入困境的“囚徒们”不互相背叛反而彼此合作,才是一件很奇怪而需要解释的事。

  而本书中,密歇根大学政治学家罗伯特·阿克塞尔罗德(Robert Axelrod)有关“重复囚徒困境”的计算机程序比赛得出了极有意思的结果:合作,更确切地说,不是那种“打左脸,把右脸也转过去给他”的善良,而是“人不犯我,我不犯人;人若犯我,我必犯人”的合作,在不同行为策略竞赛中胜出了。被淘汰的策略不仅仅包括了总是背叛的“小人”策略,还包括了总是合作从不背叛从而被“小人”占尽便宜的“善人”策略、一旦被背叛就永远不再合作的“记仇”策略、完全随机背叛或合作的任性策略、因“老谋深算”而过分复杂的种种策略……

  返观现实,在人类社会生活中,合作的确是再寻常不过的现象——至少,比迷信理性自利假定的经济学家们推断的要多得多。

  所以,不愿意修正自利人假定——他们很乐意将理性修正为有限理性——的科学家们不能不追问:人与人之间合作在一个广泛不合作的环境里是怎么发生的?合作产生后又怎么能在动态的多样化的“任何情况都可能发生的”社会环境中持续下去?已经在持续中的合作又怎么能避免被(背叛)破坏?

  书中,这三个问题被分别称为“初始成活性”、“鲁棒性”和“稳定性”问题。

  第一个问题:初始成活。

  看来,一个合作取向的行为策略可以通过有意的分析、试错或仅仅是幸运而出现。而合作的出现,只需要一个采取合作策略的个体与另一个采取合作策略的个体相遇即可。

  第二个问题的答案是:长期的相互关系是合作策略胜出的必要条件

  也就是说,继续打交道的机会对于合作的发展是必要的(这并不是说,它是充分的)。一次性的博弈,就是当知道以后“再也不见”的时候,自利者一有机会就会“宰你没商量”,合作看起来是“傻瓜”的选择。用书中的专业语词表达,就是“只要个体再也不相遇,背叛策略就是唯一稳定的策略”[1]。或者“未来相对于现在不是足够重要时,没有任何形式的合作是稳定的。”[2]

  具体说来,在竞赛中胜出的“一报还一报”策略,因为从不先背叛,所以在每一局博弈中,其得分或者与合作对方一样多,或者低于首先背叛的对方。只有博弈者之间的接触不是一次性的,而是持续或反复发生的,背叛者因背叛而得到的好处,才有可能在未来的接触(被报复)中被抵消,而合作者才有足够的时间在后续合作中使其合作收益超过其因被背叛(以及实施后续报复)而产生的损失

  已知次数的多次博弈,按书中的说法,结果和一次性博弈是一样的:只要参与者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,参与者没有一次会合作。[3]对此,我持怀疑态度。因为这种倒推,逻辑上看来无懈可击,但不仅和生活经验不符,与其主要论点“长期关系有利于促成合作”也是不一致的。

  首先,这个推理过程,立基于博弈双方能够预知对方在最后一局“必然”背叛,但是,这忽略了“未来”本身的不确定性。没有人真的能够确知“未来”,已知的未来博弈次数越多,双方就越是不能确定对方在最后一局是否会背叛——谁知道以后会发生什么呢?事实上,即使是一次性的博弈,也只是合作“很难”达成,而并非“一定不能达成”。我们都知道在旅游点买东西很容易上当,但并不是每次都会上当。要是没有这种不确定性,就根本无法想象在一个普遍不合作的世界怎么会有合作得以首次出现的机会了。

  更容易理解的是,多次博弈给参与者提供了报复的机会。已知次数的博弈参与者不得不考虑,如果自己第一次不合作,第二次就会被报复。[4]所以,在对方失去报复机会之前,也就是最后一次之前的多次博弈中,合作比不合作明智。(用书中的词语来表达就是:博弈次数增加,会改变“未来”的重要性。)

  第三个问题的答案是:报复对方的背叛。

  “一报还一报”策略在对方第一次背叛时就报复。假如一个合作程序从不报复或者只在对方第N次背叛时才报复,就会被那些只背叛或只在第N-1次背叛的策略侵入。所以,对背叛的报复不仅必要,而且必须是及时的。

  然而,对背叛的报复应当是有节制的。若报复被对方认为超过了挑衅,极有可能导致对方的进一步报复,由此陷入无止境的背叛振荡。由此,本书作者分析了,[5]假如“一报还一报”策略在报复时表现得更宽容,比如,报复反应稍稍少于挑衅的话,合作的稳定性将会增强。

  如此这般的合作理论的确是鼓舞人心的:

  “即使是在一个其他人不愿合作的世界里,合作仍然可以通过一小群准备回报合作的个体来产生。分析还表明合作能发展的两个关键前提是合作要基于回报和未来的影响就足够重要以使得回报稳定。但是,基于回报的合作一旦在群体中建立,它就能保护自己不受非合作策略的侵入。” [6]

  值得注意的是,书中关注的行为策略软件竞赛不仅假定了个体是自利的,同时还假定了个体具有识别和记忆对方的能力,这使得该书的评论者很容易忽略在该书至后面[7]才突出强调的:个体能够识别和记忆曾相遇的其他个体也是合作的必要前提。

  在本书的研究中,这一条件其实是合作的所有其他前提的前提。如果不能记忆和识别其他个体,个体不仅“不可能使用任何形式的回报,因此也就不能鼓励对方合作”;[8]而且也不能实施有效的惩罚,以迫使对方合作,并通过“杀一儆百”让自己的立场被其他参与者(实际或可能的合作对方)所了解。就“引入未来考虑”或令“未来具有足够大的影响”而言,只有两个个体在将来仍会再相遇时未来才具有影响,而未来将要相遇的这个两个个体,只能通过彼此过去的行为表现才能被辨认出来。归根结底,个体之间的合作,不能基于“我为人人,人人为我”这样抽象空泛的考虑,而只能是特定化为“我为你,你也为我”。

  在转型社会,合作的不出现,或合作之被破坏,最常见的原因恰恰是缺乏这样的前提条件。这也是为什么与传统熟人社会相比,作为“陌生人世界”的现代工商社会中合作秩序的扩展更像是“奇迹”。当然,这也可用来解释在现代工商社会中商标、商号、身份证、信用等制度的重要性。

  同样基于对转型社会里合作问题的关注,我们可以很容易地注意到本书中一再提到而许多评论者忽略的另一个前提:必须存在以相互回报合作作为宗旨的群体,合作才能在普遍不合作的世界中出现、存续并繁荣。

  书中强调了,[9]在一个背叛广泛存在的世界中,有回报合作意向的单个个体或分散的孤立个体之存在,是不足令合作出现的。这些合作者必须有机会彼此交往,结成“群体”,哪怕是极小的群体,才有可能侵入一个以彼此背叛为均衡的“恶棍世界”。

  很容易明白,在一个大家都采用“总是背叛”策略的群体中,孤独地与人为善(采取合作策略)的话,是无法避免吃亏上当的。“一报还一报”作为从不先背叛的策略也不例外。如前所述,“一报还一报”,在单次博弈中得分从不会超过对方,其优势只在于引发并扩展合作而与合作伙伴一起胜过不合作者;而这就意味着,即使是在这次比赛中脱颖而出的“一报还一报”,如果不是遇上同样采取合作策略的伙伴,也不可能有好的表现。[10]

  仅仅就这一前提而言,道金斯对《合作的进化》的解读是不准确的,——这本书并传递如下“令人振奋的信息”:从“极端自私的、对苦难无情地冷漠、残忍地损人利己”这一扭曲的起点开始,“即使不是刻意的、类似于友善的兄弟姐妹般的伙伴关系也会出现”。[11]这本书说的不过是:假如有一个以合作为宗旨的群体存在,哪怕只是一个小小的群体,那么“合作可以在一个无条件背叛的世界里产生”,[12]并且以不可逆转的趋势扩展开来,占据优势。

  我们这些为背叛所苦并期望促进合作的人,特别想知道的恰恰是:这样的合作者群体怎么会出现?或者说,这样的群体出现的现实条件是什么?而这是本书的研究不曾关心,当然也未作说明的。

  众所周知,作为理论研究出发点的基本假设是非常重要的,它决定了你能提出什么样的问题,而问题本身又规定了探索答案的方向。《合作的进化》是基于自利个体的研究,所以才会将“合作怎么可能”当成问题。如果换个前提,像《走向统一的社会科学》、《人类的趋社会性及其研究》里提出的一样,把“强互惠”(reciprocity)以及“利他”作为人类独有的属性(attribute),那么人与人之间合作就不再成其为问题,成问题将是:人与人之间怎么会出现背叛呢?或者是:人与人之间的合作怎么会被破坏呢?

  在我看来,最有意思的是:这两种针锋相对的假定,以及南辕北辙的提问方式,在关注当下合作与背叛并存的现实社会之问题,例如“如何才能促进合作避免背叛”时,看来会走到相近的结论上去。

  《合作的进化》读后感(三):“人不犯我我不犯人,人若犯我我必犯人”的博弈解读

  在上《博弈论》时,囚徒困境就是博弈论的一个代名词,老师只是简单说了说“以牙还牙”是重复囚徒困境博弈时的最好策略,并没有深入,老师更愿意花时间讲静态纳时均衡和动态博弈。

  首先,当自己听到“以牙还牙”是最好的策略,不仅怀疑了一会,西方文化不是宣传博爱和宽容吗?中国人甚至放弃了向日本索要赔款的好事,只是为了显示一种宽容的精神。我也经常被一些小人搞得很窝火,现在看来也有解决办法了。前面5章都是实验分析和理论和事例,第六章开始总结了一下。“以牙还牙”是一种和直觉不太一致的方法,在一对一时它没有胜过任何一种规则,因为它首先选择合作,然后复制对手的选择;它最后获胜是因为它总分最高,因为阴险规则相遇时会火并,所以“以牙还牙”渔翁得利,靠敌人消灭敌人。如果我们留意生活的话,在日常生活中可以找到做到“以牙还牙”的人,他一定不是一个耍小聪明的人,而且他的原则性很强,熟知“人不范我我不范人,人若范我我必范人”理论(佩服老毛的策略了吧,早了作者50年)。

  做大智慧的人,就要开始选择合作,并内心平气和地接受对方的背叛,然后选择对手上一步一样的选择。如果对手选择合作,就要忘记以前被背叛时的愤怒,选择合作(需要好的心态)。切忌不要产生和对手同归于尽的心态,对手比我们多一点就多一点,我们是靠总体来取胜的,对手和对手相残的概率更高,我们可以坐山观虎斗。老好人和刺头都是环榜样,鬼难缠才是正确的。

  “以牙还牙”策略有很多前提条件,无限次重复,合适的权重。如果是有限次博弈,最优策略是“总是背叛”;如果背叛能带来百年一遇的好处,也应该选择背叛。博弈论简直就是学术界的厚黑学,承诺和合同都只是一种策略,只要报酬够高而惩罚相比较不大,就应该选择背叛。只要缺乏监督或者相应惩罚,政府可以堂而皇之背叛老百姓,高官可以背叛组织纪律,基金经理可以背叛投资者,三鹿可以背叛良心,因为博弈论指出选择背叛时他们最优策略。

  希望有机会中国人在重复作作同样的测试,样本应该更大一些(上千),我估计不善良程序比例可能比作者实验中要高一些,毕竟很多人都看过《三国》。另外一些想法:背叛的后果可以随机(一两次)加上直接置对手于死地(不给他继续生存的机会),不知道哪种策略更好一些。

  http://comm.dangdang.com/member/5092681341813/reviewdetail/1654516/

  《合作的进化》读后感(四):轻舟可过万重山

  《合作的进化》是一本把存在我脑子中关于“合作”的一些模糊概念变清晰的书,相当于加固了思维体系中“合作”的模块,方便以后按套路出牌。

  一、问题的提出

  “合作”这个词,大家现在都听得耳朵起茧子了。从记事开始,家长、老师就告诉我们要合作,到找工作面试时,大谈对团队合作的理解。“合作”很重要,对于怎么产生合作和加强合作,大家的概念是比较模糊的。也就是说,我们抱着“合作”的心态,就可以得到“合作”的效果吗?就比方说,你“啪”一下跪客户面前,脑门上顶着“合作”两个字,对方就把业务给你了?你藏的私房钱被老婆发现了,你说以后肯定合作乖乖上缴,她就信了?

  很幸运地遇到了《合作的进化》这本书。《合作的进化》是行为领域的经典之作,主题是合作的产生和进化。它在一定程度上解答了这个问题。当然它聚焦的是市场中的合作,不是战场的合作,也不是政府体制下的合作。我自己读这本书时,带的问题是两个:一是如何加强客户与我们之间的合作? 二是市场处于下行周期,如何制定操作策略?

  二、一个有意思的人写了这本书

  书的作者是罗伯特·阿克塞尔罗德,密歇根大学政治学与公共政策教授,美国科学院院士,著名的行为分析及博弈论专家。作者上学和写书时代是历史上著名的冷战时期。当时最热的议题莫过于核对抗。作者主要的研究对象就是国际冲突,包括军备竞赛和不断升级的对抗危机。比方说,几十颗核弹就可以毁灭对方,为什么美苏还要造几千颗核弹?因此,作者写书的目的,即问题的提出,是如何避免这类冲突,如何产生合作?作者在30年后也写文章回顾了当时写这本书的动机。 那么把这个问题上升到一般层面后,直指经济学、社会学最核心的问题之一:在市场中,每个人都有自私自利动机的情况下,怎样才能产生合作?

  此外,译者也是个很有意思的人。译者吴坚忠是作者的学生,也是物美创始人、前副总裁,翻译得非常流畅。这哥们现在离开物美,在做一个基金会,致力于举办类似TED的论坛。

  三、用了一个有意思的研究方法

  经常听到“好的开始是成功的一半”。那什么是“好的开始”呢?通常的理解包括两部分,一是有勇,有勇气去迈出第一步;二是有谋,有智慧去制定一个有效的方法,最好这个方法还很有意思,能让你坚持下去,因为坚持是剩下的另一半。

  阿克塞尔罗德也是用了一个很有意思的方法——“重复囚徒困境*”的计算机竞赛方法来研究“合作”的问题。大家是不是隐约有种国际警察的感觉,把美国和苏联分别关在两个屋子里,拷问他们,你投不投核弹?这就是好方法能达到的效果!

  作者假设“重复囚徒困境”方法的对局收益分别为:合作得3分,背叛成功得5分,被背叛得0分,共同背叛得1分,同时假设1)每个行为的得分有序列,欺骗得到奖励最高,被骗的得分最低;2)对局2人不能通过轮流背叛来摆脱困境,也即假定2人合作的共同得分要高于不合作。这个研究方法简单、有效。首先,“重复囚徒困境”不是零和博弈,零和博弈犹如战场厮杀,非生即死;其次,这种研究方法框架简单,假设少 ,具备一定的现实特征:一是对策者的收益不必是可比较的。收益值只是相对的,不是绝对的,不必追求对称。分数只是个象征意义的东西;二是决定是否合作不必顾忌他人的看法,不必假设对策者是理性人,对策者的行为不必都是有意识的选择(作者在后续研究中意识到误解和执行不到位两类问题,没能提出更好地方案)。

  四、得到一个很有意思的竞赛结果

  作者将竞赛分为二轮。第一轮竞赛采取的是对局得分制。获胜者是“一报还一报(tit for tat)”,即第一步合作,后面每一步采取对手上一步的策略。成功是因为具备四方面要素:一是善良性,一开始就抱着合作的态度,防止陷入不必要的麻烦;二是反击性,一旦对手采取不合作的态度,立马就反击,树立自己明确的风格,使得对方不敢再背叛;三是宽容性,在给予对方反击后,对方一旦采取合作的态度,立马就合作,不计前嫌,有助于恢复合作;四是清晰性:行为简单清晰,风格明确,使对方能适应你的行为模式,引出长期合作。

  第二轮竞赛采取的是生态模拟制(淘汰赛制),模拟适者生存的机制,一个在当前规则分布中平均来说是成功的规则将在下一代规则分布中占更大的比例。开始时成功规则都成长很快,但当不成功的规则消失后,就要求成功的规则有能力与其他成功规则抗衡,也即要求策略需要持续成功,即与其他成功规则可以很好地相处。最终,tft再次获胜,证明tft策略具有稳健性。

  第一轮对局得分制的目的很好理解,就是看什么策略好。第二轮的生态模拟制更是让人激动不已。因为,生态模拟制非常具有现实意义,并且从学术角度看,马歇尔曾提出进化方法也是经济学最终走向之一。进化代表着优胜劣汰,因此进化的方式是成功的东西更有可能在将来经常出现,如基因的遗传。在人类活动中,一个得分不佳的规则在未来出现的几率会降低。当然,这也有一点作者没考虑到的是,现实中人类大脑是愚蠢的,还是存在再次犯错的可能。

  当然,这本书也有些局限,忽视了群体行为(心理)对于竞赛结果的影响;在竞赛中未能考虑信息传递成本,也激起了对于如何产生与促进政府(除市场外另一种通过制度来建立合作方式 )与市场之间的合作的思考。

  五、思考两个核心问题

  第一个问题:如何加强客户与我们之间的合作?

  首先,要明白合作的产生是有原因的。一是客户与我们将不停地交道,为什么你和奸商之间是不会有合作的,因为他就打算这个东西卖你一次。二是双方得有个预期,即未来也保持合作带来的收益占比较重,以w来表示每一步的收益相对于前一步收益的折扣程度,w必须大到使得未来收益在全部收益计算中显得很大。

  其次,对于产生合作的思考与建议。一是不要嫉妒,避免零和博弈的思路。为了你自己做得好,没必要非得比对方做的更好,其他人的成功是自己成功的前提。这也是一条非常重要的管理建议。二是一开始要抱着合作的态度,不要首先背叛。在书中的竞赛中,区分得分高低的直接指标就是善良性。参赛者为了自己的利益太富于竞争性会影响到合作及结果,这也是战略论常说的间接路线好于直接路线。三是要宽容。所有善良性的规则中,得分最低就是缺少宽容性的规则。例如“一报还俩报”的宽容性就差于“一报还一报”,最后得分就差些;与之相对,“两报还一报”的宽容性就好于“一报还一报”,最后得分可能高些。四是让对方清晰认识到你的风格,对合作和背叛都要给予回报。一个人的信誉体现在其他人对他采用的策略的信心上。信誉是通过观察这个人与其他人的相互作用时的行为来建立的。五是不要耍小聪明。

  最后,对于加强合作的思考与建议 。一是增大未来的影响。二是使相互作用更加持久。三是使得接触更加频繁,如与客户打交道;把难题分解为若干部分,这次改进意见的征求意见稿就采取了这个方法。四是改变收益值w,提高未来收益的占比。五是教育、宣传合作的理念。六是提高辨别能力,区分好人坏人,对坏人谈啥合作呢?

  写完上面这些很理论的话后,对比现实,有个让人很沮丧的问题,就是博弈之后的得分归属问题?也就是常说的产权问题以及委托-代理的问题。这个得分是否归你,将很大程度上影响到你的决策。如果我是代理人,那么我不会把委托人的利益放在第一位,很关注眼前自身的利益,这种情况下w值就会非常低,最佳选择就是背叛。

  第二个问题:如何执行tft策略呢?

  每个人思考问题的角度不一样。如从我个人角度看:

  最容易做到的恐怕是“善良”,即一开始抱着合作的态度。需要时刻提醒去做到的是“清晰”。为什么要警醒自己?因为人会变,人会受环境的应发生变化,变成一个自己不喜欢的人,这也是电影的老桥段了。因此,要做到不忘初心。逆着性子、咬咬牙可以做到的是“宽容”。 人不是机器,有的时候就是会犯情商低的问题,要不也不会那么多男女吵架分手的例子,也没那多小说可以写了。因此,宽容也是锻炼自己的情商。最后,你以为容易做到,但其实很容易做错的是“反击”。原因有两点:一是反击需要抗压能力,因为有的时候会选择逆来顺受;二是反击需要策略,你说耍大刀就耍大刀啊,小心遇上绣花针。

  掩卷感慨,套路满满,内心也轻快不已。有句话与大家共勉:轻舟可过万重山。

  《合作的进化》读后感(五):读完《合作的进化》的感想

  书的内容是说,有人办了一个关于重复囚徒困境的计算机程序竞赛,结果在众多程序中,一个非常简单的名为“一报还一报”的程序获得了胜利。而它只是选择在第一步合作,自此之后就一直模仿对方的上一步行为而已。

  (名词解释:囚徒困境:一种非零和博弈,举例来说,双方合作双方皆获3分,双方背叛双方皆获1分,A背叛B则A得5分B得0分,反之亦然。想知道详细的话可以去查,百度就行了,说的挺清楚的。)

  类似于囚徒困境的非零和博弈在生活中其实比零和博弈更普遍(我看了书是这么理解的),而如果你要和对方长期接触的话,除非你只看当下不看未来(而这显然非常蠢),否则你就没有一个独立于对方的选择的最优策略。(书中有个名为W的折扣系数,它代表一局囚徒困境中每一步相对于上一步的重要性,只要W足够大时,“一报还一报”就能取得胜利。)

  这本书还有一些前提,这个前提是重复囚徒困境下的合作不需要某些前提,包括:是否在一个集权下,双方是否有友谊,是否对合作的产生有预见性,是否具有足够的理性等等(我确定有等等)

  这个名为“一报还一报”的程序在多次情况不同的竞赛中都获得了胜利,获胜的关键因素被归纳为它的可激怒性、清晰性和宽容性。

  所谓可激怒性,就是被背叛了以后会报复(并且是及时迅速基本等量的报复)。

  所谓宽容性,就是报复完以后对方只要传达抱歉并想再次合作的意愿,它将欣然接受,当然这也包括从一开始它对一个陌生程序的预判是乐观和善良的,它的第一步必然选择合作,它从不首先背叛。

  所谓清晰性,就是它能很快让对方明白它的行为模式,它的宽容性和可激怒性,即使在竞赛中加入了1%的误解可能后,它依然是得分最高的那一个程序。

  然而从单次比赛流程来看,它的得分永远都不可能比对方高,最好的情况是持平。

  所以“一报还一报”的胜利不在于它在每一场比赛中比对手得分高,而是所有的得分加起来的绝对值最大。

  也有一些以占别人便宜来获得高分的程序排名比较靠前,然而将这种竞赛模拟为一个生物进化的优胜劣汰的环境后,随着能被占便宜的程序的逐渐消失,剥削型的程序本身也因为失去赖以生存的基础而灭亡了,而“一报还一报”一直活得很好。

  书中还证明了,即使在“总是背叛”的群体中,只要一个“一报还一报”有足够的几率与另一个善良程序相遇(只要5%,即每20个人中有一个不首先背叛的好人就行了),它就能最终活下来并且侵入这个总是背叛的群体。

  这两件事让我觉得很有意思。

  而因为这样的结果,作者对如何促进合作提出了一些建议,在这些建议中有两个分别为“教育人们要相互关心”和“教育人们要回报”。

  我有一点点惊讶:因为我原以为只是“要回报”而已。

  涉及到“教育”了,就有那么点点百年大计的味道了。

  相互关心和回报合作不必多谈,而“惩罚不合作”也是要坚持的,这样可以避免鼓励他人来占你的便宜,并且宠坏对方,让他再去剥削下一个无辜者。

  其实说白了,就是鼓励人们要学会报复,并且要注意是基本等量的报复。大概如此经过几个世代后,就可以像那个模拟生物进化的结果一样,随着滥好人的被淘汰,剥削者也被淘汰了。

  当然,“一报还一报”的方式可能会造成一个仇恨永久延续的僵局。如果是由于误解造成的把对方的合作理解为不合作,那么只有寄希望于下面的某一回合中双方再有一方把对方的不合作误解为合作(囧)。

  所以作者关于这一点提出的建议是,把宽容性适当加强,比如说改变为“十报还九报”。

  其实讲到这里,这个过于简单的策略解决问题的能力已经到了极限了(虽然它已经做得非常好了)。在双方都是自私者的情况下,合作依然能够稳定地形成,作者将这一策略上至国家下至细菌的情况都作了阐述证明,在某种程度上,类似于给了人们一种“希望自在人间”的感觉吧。

  “进化”这个词其实很难定义,我个人概括为“群体为适应环境而产生的变化”,我自己对这个定义并不满意,不过暂时拿来用吧。

  其实读这本书的时候我应该和当时参加那个竞赛的其他程序设计者一样,觉得“一报还一报”这种程序太简单,很傻,很“没劲”,完全不显得有自主思考能力,这算什么策略?作为人就是没智商了吧!

  看完书我承认它的神奇,不过我其实还是这么想——很“没劲”(尽管我觉得这书相当有趣)

  它的“没劲”在于它更像是一种生物本能,不需要借助思考就可以完成。而且表现出一种顽固的不可训练性。

  这实际上是一种“装傻”的策略。

  于是我们知道了,我们经过了“进化”,经过了对环境的长期的适应和改变后,在经常遇到的普遍的问题中所能采取的最好的方法是装傻——这个消息究竟使你感到更高兴还是更悲哀呢?

  我对“权力”这个词很敏感,不是说我想要追逐权力,我从大一接触管理学以来,就一直对权力造成的影响的方方面面很感兴趣,并且我同时也知道,它和责任、利益是不可分割的。

  书中有谈到信誉和成见、地位和等级对重复囚徒困境造成的影响,当然没有太详细(但它能顾及到这种影响本身就已经值得称赞了)。书中是说,假设人们都倾向于对自己的地位高的人展现出更多的宽容性,而对地位低的人则采取原本就带有浅的剥削性质但一旦遭遇不合作则永久报复的手段,那么,来自底层的反抗几乎是无效的。

  而事实上,如果把关于博弈的双方不仅仅看成是两个个体,也允许一个个体和一个具有相同需求的群体分别作为博弈双方的话,事情就更可能产生变化(在这里我把能够与两个及两个以上的个体成为博弈双方的个体看作为一种权力,事实上,它们确实很相似。)

  虽说囚徒困境本身并不要求双方的收益绝对相等,只是要求每种情况的收益值的排序满足条件,但我觉得为了例子好懂一些,这里就当成是相等的吧。

  甲个体与乙群体处于重复囚徒困境中。乙方有十人,每有一人与甲合作,则该乙方个体视甲方反应得到合作鼓励3,或笨蛋的报酬0;若该乙方个体选择背叛,则得到背叛的诱惑5,或双方背叛的惩罚1。而甲方作为个体,只能对乙方这十人表现出同样的态度(换言之,甲方如果决定报复,他可能会伤害到乙方群体中的一些无辜的个体,他若是决定合作,则可能便宜了一部分小人),而他的收益则可以近似地看作他化为十个个体与乙方的每一个个体博弈后的收益(如果乙方全部选择合作,甲方也合作,那么甲的收益就是30)。

  在这种情况下,作为乙方的一员,其群体策略是否具有宽容性或可激怒性,都需要相当大数量的采取同样行为的个体才可以得到体现,而且最致命的一点是,失去了策略模式的清晰性。

  这里面可能存在着乙方内部间的沟通和相互合作的关系,而如果要促进这样的双方合作,甲方必须展现更大的宽容性,要容许对方群体中有小人的存在,不能想着要把小人都灭光了或者调教光了。

  而这也符合我一贯坚持的“报复是弱者所为,宽恕的人才是强者”。

  当然我这个例子可能已经脱离了《合作的进化》这本书所要阐述的范围了,人家说的清清楚楚是讨论个体间的博弈,就算是两个大的民主制国家间的,投完票后还是只能展现一种态度,少部分人的意见会被忽略。感觉好象是我把一个微观的问题放到宏观世界去看了。

  况且其实我也只是想尽办法想要找出“一报还一报”的不可忽略的缺陷。在我看来,找到“最好的方法”未必是一件好事,效率往往意味着单调死板,尤其是当我还觉得这个“最好的方法”实际上很反智的时候……

  然而这或许也不是“最好的方法”?它只是在尽力寻找一种平衡和公正,没有什么道德和智力上的追求。

  假如说面对一个“悲观的一报还一报”,即从第二步起会重复对方上一步的反应,但是在一开始持不合作态度,“一报还一报”与之相遇的结果就是两个人交替地相互背叛。而如果能在一开始多宽容一步,则完全可以诱发出“悲观的一报还一报”的合作性,从而很好的相处下去。

  那么作为一个大的社会环境来讲,能够诱导悲观者的环境一定比严厉呆板的一报还一报型环境更是我们所想要的。当然,书中提到了,一个不能被第一步背叛所激怒的群体一定会被小人侵入。

  选择总要付出代价。

  然后说信誉的问题,这一点也很有意思。

  “一报还一报”成功的原因的三点中我一直认为最重要的是它的清晰性,很多比它复杂的程序应当比它具有更好的对对手的判断能力,然而它们无法同时作到清晰地表达自己。

  但是,现实情况与这不同,人类是具有沟通能力的。他完全可以通过沟通的方式把自己的合作模式告知给对方,虽然可能会被误读,但是如果不拘泥于“一报还一报”的做法,有时候也可以利用这种误读。

  而建立信誉则主要有两种目的,书中只提到威慑,我认为还有增加自身被选中为博弈对象(其实是合作对象)的机会。(可能又有点偏了,因为书中的前提博弈双方是自私的……然如果处于下层的人能够选择让一个怎样的上层和自己处在囚徒博弈中的话,建立相关的信誉应也是对双方都有益的事情。)

  建立美名可以吸引善良的程序前来合作(也可能吸引剥削者来占便宜……好吧我完全在想着公司啊、招标啊什么的了……),但是要建立威慑力则需要建立恶名,书中也承认“永久报复”的威慑力远大于“一报还一报”,但是书中认为建立“永久报复”的信誉所需要付出的代价也同时远比“一报还一报”来得要大。

  我却觉得假如其他个体确实对信息的接收能力非常地良好,且没有相对于“永久报复”的其他明显优势,也无法避免与“永久报复”接触,“永久报复”实际上才是充分的运用了重复囚徒困境中“未来”的价值,而一次良好的代价惨重的威慑能避免之后大量试探性的背叛,不能说这代价一定比“一报还一报”来得大。

  而且,没有道理说之前缺乏宽容的表现渐渐转化为宽容的表现时,会不被接受,但反过来就难说了。

  《合作的进化》读后感(六):不适合实用主义读的理想主义之书

  1、不要妒忌

  2、不要首先背叛

  3、对合作与背叛都要予以回报

  4、不要耍小聪明。

  不知道有多少人能够独立的读明白这本书?就没有人打1颗星?而我看了书评后,很是想笑。而我想到的是《影响力》里权威理论。不用大脑去思考的人,都觉这本书的价值所在在为以上结论。

  本书的重点结论却是几个重要的命题。

  感慨中国传媒越来越厉害了,知道如何避重就轻传播想要传播的观点,知道如何利用专家优势让受众接受想要传播的观点,可笑的是,豆瓣这么有思想的豆油居然轻易就能接受以上观点。

  “善良策略”“背叛策略”换句话说,在何种情况下“合作”和“背叛”是可以选择的最好相处方式。而非在任何情况下,合作都是最好的方式。而这本书纯理论解读,给出的答案其实也有点模棱两可,或者诸多条件限制,不适合想要在生活中寻找策略的人阅读。更适合纯理科生通过推理论证的一个经典案例来阅读。

  《合作的进化》读后感(七):世界哪有那么简单啊,本书的局限

  本书中遇到的程序都是独立的,你对这个程序的做法不会影响另一个程序对你的反应。一报还一报很容易实现。

  但是,假设一下下面的情景:

  A是个恶棍。B,C, D是好人。A和他们关系很好。

  A曾经害过我,BCD曾经帮过我。

  我如果要找A复仇,就会伤害B,C, D,让B,C, D也找我复仇。

  而如果我要找B,C, D其中一个报恩,B,C, D必然会叫来A,这样A又有机会占我的便宜。

  愁。这样我该怎么实现一报还一报?我过去的策略有两种1、不断与BCD合作,但无法避免地被A占便宜。2、对ABCD皆不理睬。我的策略是最佳策略吗?

  第二种:E和FGH有仇,但EFGH都对我有恩。

  如果我对E报恩,则FGH开始报复我。如果我对FGH报恩,则E开始报复我。我该怎么办?我过去是选择了其中更善良的一边报恩,对另一方弃之不顾。我的策略是最佳的吗?

  当“一报还一报”遇到的程序不是独立状态,你对一个程序的背叛会影响另一个程序的做法时,它还是最佳策略吗?

  即使在续作《合作的复杂化》中,这个问题依然没有解决。作者只是对“一报还一报”做更精致的修饰而已,例如随机性出错之类的,还是没有脱离1V1的定式,并没有解决更有挑战性的问题。倒是有提出“元规范”的概念,有涉及到我提出的例子,但是作者非常轻视它,没有做严格的计算机模拟实验,没有得出什么有力的结论,仅仅停留在猜想阶段。

  计算机程序是无法跟复杂的现实比拟的。“一报还一报”在现实中并不是万金油,尤其是在中国。

  也许是因为作者是美国人吧,美国文化倡导自由独立,个体之间不会互相影响。他应该来中国,尝尝这个神秘古老国度的人情世故,绝对会对他的第三本写作有很大的帮助。

  不管怎么说,这种“一报还一报”策略,还是局部有效的,但只在那些倡导独立、自由、公平,公正的国家才行。想用只能等出国到欧美国家再用了。

  《合作的进化》读后感(八):读书笔记——将社会模型化

  这本不到200页的小书很像作者的博士学位论文,因为各个章节的编排很有我写的博士论文的样子——不是很系统,是某一个idea在各个领域的应用和延伸思考。这个idea就是:“一报还一报”(英文名Tit for Tat)这样的具有“善良性”、“可激怒性”、“宽容性”、“清晰性”的策略在“重复囚徒困境”中具备“优势”和“稳定性”。

  以下是几个定义:

  1. 囚徒困境:

  A、B两人分别被警察质询,如果双方守口如瓶,则两人都只能轻判(情况1);如果A供出B,B不认罪,则A释放,B重判(情况2);如果A、B互相供出对方,则量刑高于情况1,低于情况2中的B。显然,对个人来说,最佳做法是出卖对方;但如果双方都这么想,则双方都没讨到好,还不如都不出卖对方。没人知道对方是否会出卖自己,所以,才会出现选择上的“困境”。

  用本书中的描述方法来描述囚徒困境,如下:对策者之间有“合作”、“背叛”两种策略选择,其配对关系包括“合作vs合作”、“背叛vs合作”、“合作vs背叛”和“背叛vs背叛”四种,分别获利为(R,R)、(T,S)、(S,T)、(P,P),通常设定T>R>P>S,也就是说,最佳结果是背叛对方而对方选择和自己合作(所谓笨蛋),次佳情况则是双方形成合作的默契。

  2. 重复囚徒困境

  单个的囚徒困境很难有什么理性的选择,本书研究的是一种同样两个对策者长期、多次、反复、无止境经历的囚徒困境(重复囚徒困境),为了让这一研究能够得出一个有理性意义的结论,作者设定了两个假设:

  折扣系数w:未来的选择所获得的收益对于当前收益来说有一个w的折扣系数,即下一步收益是上一步收益与w的乘积,也就是说,所有囚徒困境的收益会形成一个等比数列。显然,如果w小于1,则收益会逐渐减少,即使是一个无穷的囚徒困境,最终收益也是一个定值(收益/(1-w))。w越小,则做出选择时考虑未来的情况就越少,而w越大,则本次选择与未来选择之间的关联度就越大。很多情况下,w=1是一种比较容易理解的折扣系数,就像真正的囚徒所面临的选择一样。

  R>(T+S)/2:本书在引出这一假设时的文字有些模糊(“对策者不能通过轮流背叛对方来摆脱‘困境’。这个假设意味着,交替地背叛对方和被对方背叛的收益没有双方合作好。”),或者说我不太理解。我这么理解这个假设:既然本书是研究“合作的产生和演化”的,那么,如果合作的奖励比交替背叛和被背叛还要少,那么双方就都没有寻求合作的意愿了。但这个理解有点牵强。另外,我觉得P也应该有一个约束,不能太大,比如需要P<(R+S)/2,否则选择“总是背叛”似乎更有好处。

  3. 善良性

  一个策略是善良的,指的是它不首先背叛。书中两次实验证明,首先背叛的策略得分普遍偏低,且多轮之后均被淘汰,也就是说只有善良的策略才具备鲁棒性。

  4. 可激怒性

  一个策略是可激怒的,指的是它会对对方的背叛做出反应。只有能够惩罚背叛的策略,才会促成对方的合作。

  5. 宽容性

  一个策略是宽容的,指的是惩罚了对方的背叛之后,能够重新主动选择合作。只有宽容的策略,才不至于陷入持久地报复。

  6. 清晰性

  一个策略是清晰的,指的是它的做法及其规律很容易被对方识别出来,从而能够采取相应的措施来追求合作。

  7. 优势

  一个优势策略能够逐渐淘汰其他策略,或使其他策略保持在一个比较小的比例范围内。也就是说,在团体概念里,采用优势策略会获得较大的收益。

  作者给出了一个定理,来表明不可能有一个“最优策略”存在:

  命题1:如果折扣参数w足够大,则不存在独立于其他人所采用策略的最佳策略。

  8. 稳定性

  一个稳定的策略是指采用这一策略的群体能够排斥采用其他策略的个体的侵入,也就是说,在一个使用某一具备集体稳定性的策略(A)的团体中,偶尔有一个持有另一种策略(B)的个体进来与团体中各个成员接触,则该新个体不会获得比团体中原有成员更高的收益。

  以小群体而不是个体方式侵入,且采用策略B的小群体中间的各个个体有一定的机会相遇,则有可能破坏原有团体的策略A的集体稳定性。

  书中给出了多个定理来描述“稳定性”的概念:

  命题2:“一报还一报”是集体稳定的,当且仅当w至少比(T-R)/(T-P)和(T-R)/(R-S)中较大者更大;

  特性化定理:B是集体稳定策略,当且仅当,在对方累积得分足够大的第n步时B采取背叛,即当Vn(A|B)>V(B|B)-w^(n-1)[T+wP/(1-w)];

  命题3:任何可能首先合作的策略B,只有在w足够大时,才能是集体稳定的;

  命题4:一个善良策略要成为集体稳定的,它必须能被对方的第一个背叛所激怒;

  命题5:“总是背叛”的策略总是集体稳定的;

  命题6:能以具有最小的p值的小群体侵入“总是背叛”的策略是那些具有最大区别力的策略,如“一报还一报”;

  命题7:如果一个善良的策略不能被一个单一的个体侵入,它也就不能被这种个体的任何小群体侵入;

  命题8:如果一个规则是集体稳定的,它也是领地稳定的;——领地模型是指那种个体接触范围固定,即每个人只和邻居打交道的模型。

  作为个案,“总是背叛”的策略是集体稳定的,而“一报还一报”则可以以一个较小的相遇几率(p)实现对“总是背叛”团体的侵入,而它本身则满足“如果采用新策略的个体无法侵入,则采用该策略的小群体也无法侵入”。

  书中第一、二章引出问题,第三章立论,第四、五章分别举了两个比较典型的例子(一个是战争中基于预见性的合作,一个是生物界没有预见性的合作),第六、七章分别探讨个体如何寻求合作以及团体如何促进合作,第八章则描述了一些影响合作模式的几种交往属性。

  1. 如何寻求合作

  从“一报还一报”策略推广出去,尽管它不是一个“最佳策略”(命题1即证明了不存在单独存在的最佳策略),但仍然对指导个体如何与人打交道有重要意义:

  a. 不要嫉妒:实际上是指“坚持自己的策略”而不要轻易受环境影响而调整;

  . 不要首先背叛:做一个“善良”的人;

  c. 对合作与背叛都要给以回报:做一个可激怒的人和一个宽容的人;

  d. 不要耍小聪明:做一个清晰的人,即非零和博弈(如重复囚徒困境)中,最好让所有人都知道自己真实的行为模式,而不是欺骗或想像自己比别人聪明。

  2. 如何促进合作

  同样也是围绕提高“一报还一报”策略的有效性,假定每个人都是采用类似一报还一报这样的策略。书中给出了几种方法:

  a. 增大未来的影响:即增大w,否则所有人都会在考量本次合作对未来的影响上犹豫;作者给出了两个操作方案,即使相互作用更持久和使相互作用更频繁,为了实现“更频繁”,有时需要制造频繁接触的机会,包括将一件事分成很多阶段来交互;

  . 改变收益值:即调整T、R、S、P的大小,使之更接近于“一报还一报”可发挥最佳作用的“重复囚徒困境”;

  c. 教育人们相互关心:这实际上是促成“善良”成为一种美德,——孔子和耶稣都是这么说的;

  d. 教育人们要回报:促成“可激怒”和“宽容”成为美德,——孔子和耶稣又一次不约而同地站到了一起;

  e. 改进辨别能力:使个体历史行为模式更清晰,——实际上就是在鼓励过程的公开、透明。

  书中第八章给出了一些社会结构因素,这些因素都影响者“囚徒们”的行为模式:

  a. 标签:给个体贴上明显的标签,指出他的行为模式,这是提高“清晰性”的一种办法,这种标签包括外貌(尤其是肤色)、成见(常常变成了受教育内容之一的常识)、地位等;

  . 名声:这也是一个标签,但它更强调贴的过程——通常首先需要证明自己的标签;“永不宽恕”实际上是一个比“一报还一报”更好的名声,可惜的是,建立它的过程相当危险;

  c. 政府:典型的一对多模型,所采用的策略并无二致;

  d. 领地:特殊的交互模式——每个个体只与邻居发生关系,命题8证明了在领地中维持规则并不比自由接触模式下更难。

  第九章是回顾。

  《合作的进化》读后感(九):清晰胜于机巧

  什么样的合作策略是最优策略?是最善良的策略,以德抱怨?还是最聪明的策略,机关算尽?或者干脆拒绝合作,永远的背叛?

  计算机模拟的实验结果的胜出策略确是“一报还一报”,也就是所谓的人不犯我,我不犯人,人若犯我,我必犯人,在尝试了各种各样复杂聪明的策略后,计算机模拟研究给出的建议确像是常识:

  1.不要嫉妒

  2.不要首先背叛

  3.对合作和背叛都要给予回报

  4.不要耍小聪明

  一报还一报的合作策略蕴含了4个基本合作原则:

  善良:永远不首先背叛,人不犯我,我不犯人。

  惩罚:对于合作方的行为有快速清晰的反应,人若犯我,我必犯人。

  宽容:对每一次背叛只做有限度的惩罚,只要对方不再犯就既往不咎。

  清晰:可识别,或者说可预测,合作方完全可以根据自己的行为就可以预测你要采取的行动,这样就引导他能理性的选择自己的行为。

  最后一点尤其有意义,清晰胜于机巧,清晰意味着信誉,不仅仅是善良的信誉,对对方的贡献给予回报,惩罚的信誉更不应被忽略,即对对方的背叛给予必要及时的惩罚,而且书中通过折扣系数证明,这种反应越迅速越好。当然宽容原则也重要,这种反应需要合理有限度。

  相对于维护这种惩罚信誉来说,成本和收益并不是重要的,某一些惩罚措施从单例来说可能得不偿失,但重要的是有能力执行这种惩罚措施的信誉更有价值。

  书中也同样提到了以德抱怨这种策略的问题,它使得对弈者无法识别自己行为选择的后果区别,那么根据囚徒困境原理,会自然的倾向选择更有粘性的背叛。这或许也证明了在人类进化到今天,这种策略虽然道德上被认同,但始终不是主流,如果这样的一群人在一起,通常能形成很好的合作,但是这种合作的结构的鲁棒性很差,很容易被入侵。

  合作进化的推演展示了在背叛倾向中,合作是怎么产生,一报还一报策略怎样在各种随机策略中最终占优,并获得稳定,作者更用这些进化的基本原理解释了一些社会现象:官僚组织结构是怎么进化出来的?为什么大型谈判和项目合作中要分解成很多步骤?为什么那些有助于识别背叛行为的技术发展大大促进了合作?看看书中基于博弈理论的解释。

  互联网今天的技术正在根本性的改变人的合作方式,但合作的进化原理依然适用,而且在互联网上,合作的进化速度明显有加速迹象。

  维基百科,Facebook,到处有大规模合作,KK说人类的行为在快速的数字化,而数字化的行为的一大特征就是可以快速识别,如果一个人有了不符合团体公约的行为(背叛),可以被迅速的被识别(Google/Facebook)出来,而Facebook的另一大革命在于提供了持久的唯一真实身份,世界上任何两个人只要有一次合作,就有无数的重遇机会,按照博弈理论,这增大了未来的权值,也就是书中所说的折扣系数。

  这样按照书中的观点,我们可以推导出来合作的促进程度将被极大幅度的提升,实际上,我们已经看到Facebook对北非和中东的影响,在<Facebook效应>这本书里已经描述了合作形成的速度远远超出了人的想象,在OpenStreetMap上我们看到短时间内一群人重新绘制了全世界的地图。

  生物系统的合作进化花费了几亿年,而人类的合作进化的速度则在加速上升。

  《合作的进化》读后感(十):善良、邪惡策略抑或利他、利己主义

  善良策略是什麽意思呢?英文中good便是善良是件很有意思的事情。就如同伊壁鳩魯哲學認爲凡是令人快樂的便是善的,一般人若未深究都會不認同這樣的觀點,因爲他們認爲善似乎縂是和某种規範性的東西聯係在一起的,而凡是规范便会让人觉得有某种束缚感,從而產生某种不適。但是,若說凡是快樂的便是好的,似乎這種説法倒是可以考慮的,然而好和善如何聯係在一起的,我也不是很清楚。

  quot;以牙还牙"是一个善良策略,而且善良策略一般会比邪恶策略取得相对较好的成绩。这恐怕是作者的一个重要的结论,所以類似的,以牙還牙策略的確是一個好的策略,但是如果稱之爲善良策略的话真的合适吗?注意到在囚徒困境中,局中人選擇背叛的原因是無論對方做出何種選擇,背叛的收益縂是相對較高的。也就是說,所謂的囚徒困境其局中人都是以自己利益為上的利己主義者。換句話來説,在这里,善良和邪恶并不意味着某种利己主义或者利他主义。事實上无论何种策略,它们都是利己主义的,因为它们的目的都是为了在重復博弈中获胜。所以如果將邪惡策略稱之爲bad strategy似乎也没有什么不妥。

  考慮若有一个纯然的利他主义策略,他的行爲方式是什麽?毫无疑问它将选择合作,因为在这种情况下,另一局中人总能获得相对更多的收益。回過頭來看整個囚徒困境的邏輯方式,為什麽沒有人考慮如下的情形,即對方可能故意選擇合作讓我取得較多的收益,在這種情況下,若我是利己主義者將會選擇背叛,若我是利他主義者則會選擇合作。若要举这样的例子,可以考虑若局中人A、B是親戚關係,在這種情況下他們就很有可能會成爲利他主義者。如常見的,有時候一個嫌疑犯會情願犧牲自己也要讓另一人與案件脫離關係。

  所以,個人認爲值得著重説明的一點就是,依照作者的邏輯,合作的起點和基石並非是利他主義,而是利己主義的充分發揮。那麽第一步選擇合作的good strategy的意义是什么呢?如同作者所說,"以牙还牙"並非是為了戰勝對手,因爲它永遠無法戰勝如同"永遠背叛"这样的策略。他的目的是誘導對方与之合作,從而戰勝不与之合作的策略。這不由我不想到奧維爾的一句話,這是個黨同伐異的世界。

  事實或許的確是如此的,本书另一个让我感到受益非浅且印象深刻的结论就是,"永远背叛"的策略是集体稳定的。作者在這個問題上做出了非常多的解釋,例如"以牙還牙"容易侵入"永遠背叛"這樣的策略,但同樣的,作者不得不承認這樣一個事實,在領地問題上,"以牙還牙"未必能取得好成績。這之間的矛盾個人認爲其實是基於最初的支付矩陣與博弈次數之間的關係,"以牙還牙"之所以容易侵入"永遠背叛",那是因爲在支付矩陣中,被對方背叛導致的懲罰相較于合作的好處相对于博弈次數來説並不那麽顯著,而非策略本身具有某种絕對的優越性。其實"永遠背叛"正是黨同伐異的一種絕對形式,在那裏,任何一個試圖合作的笨蛋都將會導致最無情的懲罰。

  如同我一直覺得的,类似的问题很有可能会由于条件中数字的变化而得到不一样的结论。最初的支付矩陣與博弈次數之間的某种微妙關係以及環境兩者會對實驗結果造成非常大的影響。前者导致侵入的概率,正如同固定次數博弈的情况下"永遠背叛"看起來是唯一的選擇。 而後者則導致其存活性,就如作者所言,善良策略之间相遇的概率是其存活的重要条件。類似正回饋系統的某种自我实现的特征,事實上"以牙還牙"策略在第一次競賽中的胜出必然導致在第二次競賽中善良策略居於多數,從而更加鞏固了其地位。

  如果真是如此,那麽這種基于利己主義的合作本身就是不穩定的。而現實亦正是如此。現實中,往往博弈次數是可知的,或者根本就不符合囚徒困境的條件,即背叛的好處往往要比兩人合作的好處多得多。所以如果不是從他人的利益出發,那麽就不可能出現真正的合作。事實上,若兩個利他主義者相遇,他們只可能做出合作的選擇。也只有這種層次上的合作才具有某种絕對的穩定性。

评价:

[匿名评论]登录注册

评论加载中……