第11章第6节海盗分金与分租方案——动态博弈
海盗分金是经济学中讲动态博弈的经典案例。假设船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,以此类推。
我们先要对海盗们做一些假设:
1.每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性,也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而做出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信。
2.一枚金币是不能被分割的,不可以你半枚我半枚。
3.每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的。
4.每个海盗当然希望自己能得到尽可能多的金币。
5.每个海盗都是功利主义者。如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理。总而言之,他们相信二鸟在林,不如一鸟在手。
6.每个海盗都很喜欢其他海盗被丢到海里去喂鱼。在不损害自己利益的前提下,他会尽可能投票让自己的同伴喂鱼。
现在,如果有5个海盗要分100枚金币,结果将会怎样呢?
从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号唯有支持3号才能保命。
3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各1枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局由3号来分配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号1枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了。答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。
这个看起来似乎是自寻死路的方案实际上非常精确。前提在于,五个强盗个个工于心计,能够准确地预测分配过程中每一步骤将会发生的变化;而且全都锱铢必较,能多得一枚就绝不少得,能得到一枚也绝不放弃。这是一场精彩的博弈。
在博弈中要掌握几点:第一,在竞争中要掌握主动权。1号强盗看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大的收益。5号强盗看起来最安全,丝毫不用担心被扔进大海,还有可能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹,甚至两手空空。第二,在竞争中最重要的是规则。如果规则改变了,这道题的解答就完全是另一码事。当然有了规则,还必须要遵守。第三,在竞争中要保持头脑清醒。要善于分析得失,学会满足,不然可能一无所得。当然,这里不是说那种糊里糊涂的满足,应得的一定要努力争取。
海盗分金其实就是一场动态博弈。动态博弈指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人会采取什么行动。
刚到美国的中国留学生大都是两人或三人合租公寓的,这就有个分房租的问题。通常都是互相商量一下,大致双方都认为比较合理就行了。这种办法一般都能行得通,但最多也就是“比较合理”,很少有人以为自己占了便宜的,相反的情形倒是不少见。
而有个人却运用博弈论的思想设计了这么一个合理的分摊房租的模型。学生A和B二人决定合租一两室一厅公寓,房租费每月550元。1号房间是主卧室,宽敞明亮,屋内套一单独卫生间。2号房间相对小一些,用外面的卫生间,如果有客人来当然也得用这个。A的经济条件稍好,B则穷困一些。现在怎么分摊这550元的房租呢?
按照模型的第一步,A、B两人各自把自己认为合适的方案写在纸上。A1,A2,B1,B2分别表示两人认为各房间合适的房租。显然,A1+A2=B1+B2=550。第二步,依照两人所写的方案来决定谁住哪个房间。如果A1大于B1(必然B2大于A2),则A住1号B住2号,反之则A住2号B住1号。比如说,A1=310,A2=240;B1=290,B2=260(可以看出,A宁愿多出一点儿住好点儿,而B则相反),所以A住1号,B住2号。第三步,定租。每间房间的租金等于两人所提数字的平均数。A的房租=(310+290)/2=300,B的房租=550-300=(240+260)/2=250。结果:A的房租比自己提的数目小10,B的房租也比自己愿出的少了10,都觉得自己占了便宜。
按这一模型分租,每个人都觉着自己占了便宜,而且双方占了同样大小的便宜。最坏的情形也是“公平合理”。如果有谁吃亏了,那一定是他奸诈想占便宜没占到,因此吃亏也是说不出口的。如果运用博弈论的思维来进行分析,我们可以得出如下结论。
1.由于个人经济条件和喜好不同,两人的分租方案就会产生差别,按照普通的办法就不好达成一致意见。在模型中,这一差别是“剩余价值”,被两人分红了,意见分歧越大,分红越多,两人就越满意。最差的情形是两人意见完全一致,谁也没占便宜没吃亏。
2.说实话绝不会吃亏,吃亏的唯一原因是撒谎了。假定A的方案是他真心认为合理的,那么不论B的方案如何,A的房租一定会比自己的方案低。对B也是一样。
什么样的情形A才会吃亏呢?也就是分的房租比自己愿出的高。举一例,A猜想B1不会大于280,所以为了分更多的剩余价值,他写了A1=285,A2=265,那他只能住2号房间,房租是262.5,比他真实想出的房租多了22.5。可他是因为想占便宜没说实话才吃了哑巴亏的。
3.从博弈论上分析这一模型说实话不一定是最佳对策,特别是对对方的偏好有所了解的情况下。但是说实话绝不会吃亏,不说实话或者吃亏,或者分更多的剩余价值。
4.三人以上分房也可用此模型,每间屋由出最高房租者居住,房租取平均值。
这个案例也是一种动态博弈。动态博弈的困难在于,在前一刻最优的决策在下一刻可能不再为最优,因此在求解上发生很大的困难。动态博弈行动有先后顺序,不同的参与者在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择。因此,为了做最优的行动选择,每个参与者都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?在动态博弈中,每个局中人的举动显然是先根据对方的行动做出的,就如下棋一样,你走一步,对方走一步,行动策略上有一个先后顺序,这就给了被动方反被动为主动的余地。
【相关词语链接】
动态博弈 是指参与者的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此做出相应的选择。