产价格为2万元.
酒馆的财产价格为l万元。警察怎么巡逻才能使效果最好?
一种最容易被警察采用而且确实也更为常见的做法是.警察对银行进行
巡逻。这样,警察可以保住2万元的财产不被偷窃。但是假如小偷去了酒馆,
偷窃一定成功。这种做法是警察的最好做法吗?答案是否定的.因为我们完
全可以通过博弈论的知识,对这种策略加以改进。
警察的一个最好的策略是,抽签决定去银行还是酒馆。因为银行的价值
是酒馆的两倍,所以用两个签代表,比如抽到l、2号签去银行,抽到3号签
去酒馆。这样警察有2,3的机会去银行进行巡逻,l,3的机会去酒馆。
而在这种情况下,小偷的最优策略是:以同样抽签的办法决定去银行还
是去酒馆偷盗.与警察不同的是抽到1、2号签去酒馆,抽到3号签去银行。
这样小偷有v3的机会去银行,2,3的机会去酒馆。
警察与小偷之间的博弈,提供了混合策略的思路,但更形象的样板是“剪
刀、石头、布”的游戏。在这样一个游戏中,不存在纯策略均衡。对每个小
孩来说,出“剪刀”、“布”还是“石头”的策略应当是随机的.不能让对方
知道自己的策略,甚至是策略的倾向xìng。一旦对方知道自己出某个策略的可
能xìng增大,那么在游戏中输的可能xìng也就增大了。因此,每个小孩的堆优策
略是采取每个策略的可能xìng是¨。在这样的博弈中.每个小孩各取三个策略
的l,]是纳什均衡。
障弈论的雄计
还有一种常见的混合策略样板就是猜硬币游戏。比如在足球比赛开场.
裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下后朝上的是正面还是
反面。由于硬币落下地的正反是随机的,概率都是1,2。那么.猜硬币游戏的
参与者选择正反的概率都是1,2,这时博弈达到混合策略纳什均衡。
这一类博弈与囚徒困境博弈辜例有一个很大的差别.就是投有纯策略纳
什均衡点,只有混合策略均衡点。这个均衡点下的策略选择是每个参与者的
最优(混台)策略选择。
所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,是参与
者一次xìng选取并且一直坚持的策略;而混合策略是指参与者在各种备选策略
中采取随机方式选取并且可以改变,而使之满足一定的概率的策略。
在每个参与者都有优势策略的情况下,纯策略均衡是非常合乎逻辑的。
一个优势策略优于其他任何箫略,同样。一个劣势策略则劣于其他任何策略。
假如你有一个优势策略.你可以选择采用,并且知道你的对手若是有一个优
势策略他也会照办;同样,假如休有一个劣势策略,你应该避免采用,并且
知道你的对手若是有一个劣势策略他也会规避。
但通过警察与小偷博弈我们看到,并非所有博奔都有这样优势策略.哪
怕这个博弈只有两个参与者。实际上,纯策略只是博弈论的一种特例。特别
是当博奔是零和博弈,即一方所得是另一方的所失时,只有混合策略均衡。
对于任何一方来说,都不可能有纯粹的占优策略。
看到这里,我们就可以明白,“警方版”的肪小偷地图.从博弈策略的角
度来考察