察局警方对两名犯罪嫌疑人实行隔离关押.隔离审讯,每个犯罪嫌疑
人都无法观察到『司伴的选择
警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知
两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己
的供认如果其中一方与警方合作,供认偷窃之事.而对方抵赖.供认打将
不受惩罚,无罪释放.另一方则会被判重刑10年;如果双方都与警方合作共
同供认,各被判刑5年;而如果双方均不认罪.因为警察找不到其他证据.
则无罪释放
两名囚徒面临的选择及其带来的后果组合可以用表2I来表示-
表2.1
囚徒困境博弈憧盐矩阵
哪一种选择对犯罪嫌疑人更有利呢?
从上表中可以知道:每个犯罪嫌疑人都有两种可供选择的策略:供认或
不供认而且,每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。
如果甲选择抵赖.那么就可能会出现两种情况:如果乙选择供认.那么
甲将被加重惩罚.判刑10年.而乙则无罪释放:如果乙也同样选择抵赖,那
么他们两个都将因证据不足而被释放。很显然.这第二种结果对于两个人都
是最有利的但是.因为警方没有把两名嫌疑人放在一间囚室里.因而这种
合作难以顺利进行.使得结果预测的不确定xìng加大.或者说增加了抵赖合作
的风险xìng
因此.基于人是理xìng的这一前提.由于犯罪嫌疑人不知道对方的想法.
最理xìng的博弈策略.就是选择供认。这时的策略.我们可以称为占优策略
一
《砬
囚徒困境:自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在,那么博弈将在所有参与人的占优策略
的基础上达到均衡.这种均衡称为占优策略均衡。
在囚徒困境中“甲供认,乙供认”的占优策略均衡中,不论所有其他参
与人选择什么繁略,一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认.都将得到减轻惩罚的结果:如果甲供认了,乙抵赖,甲将免于惩
罚.如果乙也供认了,那么罪名各担一半,从甲个人看来。也减轻了惩罚;
甲乙互换位置,结果依然是一样。显然,这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
与占优策略相对应,劣势策略则是指在博弈中,不论其他参与人采取什
么策略.某一参与人可能采取的策略中,对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
有一个要注意的问题是,采用优势策略得到的最坏结果,并不一定比采
用另外一个策略得到的最佳结果要好.这是很多博弈论普及书中容易出错的
一个问题。应该说,参与人采用优势策略时.无论对方采取任何策略总能够
显示出优势。
由于囚徒困境的模型是如此有趣和简洁.不仅给人们留下了深刻的印象,
而且迅速不胫而走.成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中,克格勃们的思路是这样的乐队指挥知道我们抓住了“柴
科夫斯基”,就必然会考虑:这个“柴科夫斯基”如果jiāo代,我有两种选择
不ji