第 5 章 - 博弈论的诡计免费阅读 - 其他类型

  126

    重复博弈；一夜慵与地老天荒

    家都满意呢?

    在这个问题中．存在着老师与学生、学生与学生之间的博弈。实际上也

    是一种多人的囚徒困境。因为每个学生都知道，其他学生的占优策略是选择

    到达集合地点的时间，既不能太早，以免白白浪费等待的时间；又不能太晚，

    以免承担耽误大家时间的责任。

    要破解这个困境，老师有两个策略选择：一是只要过了集合的时间，就

    不再等下去，让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造

    成很大的损失，他们就不会再迟到了。二是如果迟到的学生比较多。那么等

    某个数量的学生到齐以后马上出发，而让迟到时间过长的那些同学承担责任。

    一般说来，博弈中双方合作时得益最大，但若一方不遵守台作约定．必

    定是另一方合作者吃亏。所以需要引入惩罚机制：谁违约，就要处罚他，使

    他不敢违约。一位玩家之所以会与另外一位合作，只是因为他知道，如果他

    今天被骗．明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无

    名氏定理”。

    只有对迟到的学生进行惩罚，迟到问题才能解决，一句话，也就是实行

    一份带剑的契约。从囚徒困境中我们可以悟出一条真理：合作是有利的“利

    己策略”。但它必须符合以下定律：按照你希望别人对你的方式来对别人，但

    只有他们也按同样方式行事才行。

    带剑的契约才有效

    在每一个鼓励合作的方案里，通常都会包古某种惩罚作弊者的机制。

    一个坦白且供出合作伙伴的囚徒可能遭到对方朋友的报复。若是知道外

    面会有什么报应等着自己，尽快逃脱牢狱之灾的前景也就不会显得那么诱人

    了。人人都知道，警察会威胁dú品贩子说如果不坦白就要释放他们。这种威

    胁的作用在于，一旦他们被释放，卖dú品给他们的人就会认定他们一定是招

    供了而加以报复。

    在最初博弈之上增加惩罚机制的做法，其目的就是为了减少作弊的动机。

    在博奔的结构里还存在其他类型的惩罚。一般而言，这种机制生效的原因在

    27 l

    女☆∞j}舻

    于博弈反复进行，这一回合作弊所得将导致其他回合所失。

    归纳起来，在一次xìng的博弈当中没有办法达成互惠合作。只有在一种持

    续的关系中才能够体现惩罚的力度．并因此成为督促合作的”术棒”。合作破

    裂自然就会付出代价．这一代价会以日后损失的形式出现。假如这个代价足

    够大，作弊就会受到遏制，合作就会继续。事实上，法国哲学家卢梭早就指

    出了这一点，他曾经有一本《社会契约论》，认为契约是整个人类社会存在的

    前提条件之一。

    前面已经分析过，如果囚徒困境只是一次xìng的博弈，那么签订协议是毫

    无意义的，其纳什均衡点并不会改变。可以签订协议的一个最基本的条件，

    就是博奔需要重复若干次，至少大于一次。

    重复博弈与一般xìng的动态博弈是不同的。多轮动态博弈中，参与者能够

    了解到博弈的每一步中其他参与者的在自己选择某种策略下的行动，而重复

    博奔的参与者无法了解到在任何一步中，其他参与者的策略选择。