吗,它是否应该对对手的举动报之以更为复杂的举动7如果是.那会是怎么
样的举动呢?
第一轮游戏有14个程序参加,其中包含了各种复杂的策略。再加上爱克斯
罗德自己的一个随机程序(即以50%的概率选取合作或背叛)。使爱克斯罗德和
其他人深为吃惊的是.竞赛的桂冠属于一个被称为“一报还一报(Trr FOR
TAT)”的策略.它是由多lún多大学的数学教授阿纳托拉波波特提jiāo上来的。
有意思的是,在科学家们上jiāo的14个程序中有8个是“善意的”,但正是
这些永远不会首先背叛的善意程序.轻易地赢了6个非善意的程序。
因为参与竞赛的程序为数不多,一报还一报策略的胜利也许只是一种侥幸。
为了进一步验证上述结论.爱克斯罗德决定举行第二轮竞赛.邀请更多的人
I M
一报还一报:出来混迟早要还的
再做一次游戏,并把第一次的结果公开发表。这一次有62位科学家递jiāo了改
进的程序,其中包括多个以上一次的策略为基础的改良品种。加上爱克斯罗
德自己的随机程序.63个程序又进行了一次竞赛。竞赛结果表明.在63个程
序的前15名里.只有第8名的哈灵顿程序是“非善意的”;在最后15名中,
只有1个总是合作的程序是“善意的”。而且,夺魁的仍然是一报还一报策略。
这种让几十位科学家的智慧相形见绌的神奇策略到底是怎样的呢?
说起来很简单,简单到有些不可思议:第一步合作,此后每一步都重复
对方上一步的行动:合作或背叛。如此简单的程序之所以反复获胜,是因为
它奉行了以其人之道还治其人之身的原则,并且用如下特征最有效地鼓励其
他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。
善良,是指它第一步总是向对方表达善意。它坚持永远不首先背叛对
方,开始总是选择合作,而不是一开始就选择背叛或主动作弊。
可激怒,是指对方出现背叛行动时,它能够及时识别并一定要采取背
叛的行动来报复。不会让背叛者遣遥法外,
宽容.是指它不会因为别人一次背叛。长时间怀恨在心或者没完没了
地报复.而是在对方改过自新、重新回到合作轨道时,能既往不咎地
恢复合作;
简单.是指它的逻辑清晰.易于识别.能让对方在鞍短时间内辨识出
来其策略所在:
不妒忌,是指它不耍小聪明,不占对方便宜,不在任何双边关系中争
强好胜。
其他各种策略输就输在上述五个方面做得不够好。在比赛结果中,所有
恶意程序(第一步背叛)都未进前10名;而某些程序太过好脾气。被对方背
叛之后不立即反应,结果鼓励菜些狡猾的程序反复占它的便宜;某些程序对
于过往关系的“好坏”太过执著,一旦被别人欺骗就很难宽容,结果使得很
多本来可能恢复的合作关系永久xìng断绝;还有一些程序把自己搞得太复杂,
总是试图通过某种机巧来占人便宜.尽管在与某些“傻”程序接触中得了高
分,但一旦碰到个xìng“刚烈”的程序就会搬起石头砸了自己的脚。而从最后
的总分来看,它们的小聪明得不偿失。
"I