乱自己的巡逻目标才能降低小偷盗窃成功的概率。这么一来,他会让小偷永
远处于迷茫之中.也就没有办法获得准确预测的优势了。
从警察和小偷的不同角度计算最佳混合策略,会得到一个有趣的共同点:
同样的成功概辜。也就是说,警察若采用自己的最佳混合策略,就能将小偷
的成功概率拉到他采用自己的最佳混合策略所能达到的成功概率。
这并非巧合.而是两个选手的利益严格对立的所有博弈的一个共同点。
这个结果称为“最小最大定理”.由数学家约翰冯诺伊曼(John Von
Neumann)刨立。这一定理指出,在二人零和博弈中。参与者的利益严格相反
(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而
他的对手则努力使自己的最小收益最大化。
他们这样做的时候.会出现一个令人惊讶的结果.即最大收益的最小值
“I
潦‰翟邕型
(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改
善自己的收益,因此这些策略形成这个博奔的一个均衡。
最小最大定理的证明相当复杂,不过,其结论却很实用。假如你想知道
的只不过是一个选手之得或者另一个选手之失。你只要计算其中一个选手的
最佳混合策略并得出结果就行了。
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己的任何
具体策略。一旦有必要采取混合策略,找出你自己的策略的方法,就是让对
手觉得他们的任何策略对你的下一步都没有影响。
这听上去像是朝向混沌无为的一种倒退.其实不然。因为它正好符合零
和博弈的随机化动机:一方面要发现对手任何有规则的行为,并相应采取行
动。假如他们确实倾向于采取某一种特别的行动,这只能表示他们选择了最
糟糕的策略。反过来,也要避免一切会被对方占便宜的模式,坚持自己的最
佳混合策略。
因此.采取混合或者随机策略,并不等同于毫无策略地“瞎出”,这里面
仍然有很强的策略xìng。其基本要点在于,运用偶然xìng防止别人发现你的有规
则行为井占你的便宜。
不可预测的算计
在传统政治中,有所谓“君臣一日而百战”的说法.来形容国君与大臣
之间博弈的激烈程度。因为激烈,所以其层出不穷的招式,给博弈论的研究
提供了丰富的案例。
《吕氏春秋》中记载了这样一个故事。战国时,宋康王极端变态,整天
喝酒,异常暴虐。凡群臣中有来劝谏的,都被他找理由撤职或者关押起来。
臣下也因此对他更加反感,经常非议他。他十分苦恼地对宰相唐鞅说:“我处
罚的人很多了.但是大臣们越发不畏惧我,这是什么原因呢7”唐鞅说:“您
所治罪的,都是一些犯了法的人。惩罚他们,没有犯法的好人当然不会害怕。
如果您要让您的臣子们害怕,就必须不区分好人坏人,也不管他犯法没有犯
法.髓便抓住就治罪。这样的话,大臣们就知道害怕了。”
警察与小偷博弈:猜猜猜与换换换
唐鞅提出的这个建议.虽然缺德了一些,但却不能不说是深刻地把握住
了混合策略博弈的精髓之处。能够预测的惩罚