字体
第(2/5)页
关灯
   存书签 书架管理 返回目录
  126

    重复博弈;一夜慵与地老天荒

    家都满意呢?

    在这个问题中.存在着老师与学生、学生与学生之间的博弈。实际上也

    是一种多人的囚徒困境。因为每个学生都知道,其他学生的占优策略是选择

    到达集合地点的时间,既不能太早,以免白白浪费等待的时间;又不能太晚,

    以免承担耽误大家时间的责任。

    要破解这个困境,老师有两个策略选择:一是只要过了集合的时间,就

    不再等下去,让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造

    成很大的损失,他们就不会再迟到了。二是如果迟到的学生比较多。那么等

    某个数量的学生到齐以后马上出发,而让迟到时间过长的那些同学承担责任。

    一般说来,博弈中双方合作时得益最大,但若一方不遵守台作约定.必

    定是另一方合作者吃亏。所以需要引入惩罚机制:谁违约,就要处罚他,使

    他不敢违约。一位玩家之所以会与另外一位合作,只是因为他知道,如果他

    今天被骗.明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无

    名氏定理”。

    只有对迟到的学生进行惩罚,迟到问题才能解决,一句话,也就是实行

    一份带剑的契约。从囚徒困境中我们可以悟出一条真理:合作是有利的“利

    己策略”。但它必须符合以下定律:按照你希望别人对你的方式来对别人,但

    只有他们也按同样方式行事才行。

    带剑的契约才有效

    在每一个鼓励合作的方案里,通常都会包古某种惩罚作弊者的机制。

    一个坦白且供出合作伙伴的囚徒可能遭到对方朋友的报复。若是知道外

    面会有什么报应等着自己,尽快逃脱牢狱之灾的前景也就不会显得那么诱人

    了。人人都知道,警察会威胁dú品贩子说如果不坦白就要释放他们。这种威

    胁的作用在于,一旦他们被释放,卖dú品给他们的人就会认定他们一定是招

    供了而加以报复。

    在最初博弈之上增加惩罚机制的做法,其目的就是为了减少作弊的动机。

    在博奔的结构里还存在其他类型的惩罚。一般而言,这种机制生效的原因在

    27 l

    女☆∞j}舻

    于博弈反复进行,这一回合作弊所得将导致其他回合所失。

    归纳起来,在一次xìng的博弈当中没有办法达成互惠合作。只有在一种持

    续的关系中才能够体现惩罚的力度.并因此成为督促合作的”术棒”。合作破

    裂自然就会付出代价.这一代价会以日后损失的形式出现。假如这个代价足

    够大,作弊就会受到遏制,合作就会继续。事实上,法国哲学家卢梭早就指

    出了这一点,他曾经有一本《社会契约论》,认为契约是整个人类社会存在的

    前提条件之一。

    前面已经分析过,如果囚徒困境只是一次xìng的博弈,那么签订协议是毫

    无意义的,其纳什均衡点并不会改变。可以签订协议的一个最基本的条件,

    就是博奔需要重复若干次,至少大于一次。

    重复博弈与一般xìng的动态博弈是不同的。多轮动态博弈中,参与者能够

    了解到博弈的每一步中其他参与者的在自己选择某种策略下的行动,而重复

    博奔的参与者无法了解到在任何一步中,其他参与者的策略选择。

上一页 目录 下一页