其实,在我们的生活中,到处都有博弈论运用的例子。我们经常看到某些垄断行业为了追求利润而结成联盟,不允许降价促销;但总有一些商家试图把自己的商品卖得更快些,偷偷降价促销。所以,这个联盟是不牢固的,这种现象与博弈论里有名的“囚徒困境”问题类似。这个问题,也有点像今天小胡所面临的,竹笋价格默契问题。
“囚徒困境”是这样表述的:假定有两个小偷被抓住了,如果他们都不坦白也不揭发对方,有可能得到最轻的处罚;如果有一人坦白,另一人不坦白,那么坦白者可以获得较轻的处罚,不坦白者就要加重处罚。在没有事先同谋的情况下,最优策略是二者都坦白并揭发对方。
这就是非合作博弈的“纳什均衡”,它是各自最优策略,但并不是总体最优的。总体最优策略是各自都不坦白也不揭发对方,但这种策略组合是不稳固的,就如同上面所说的“价格联盟”。
我们在平时,有很多人爱占小便宜,大家都看不起这种行为,但身边始终有这种人的存在。我们把这种行为,称之为搭便车。如果从博弈论角度来说,这要从博弈论中著名的“智猪博弈”故事说起。
该故事有多种版本,其大意是:在一个猪圈里,有一头大猪和一头小猪。猪圈一端有个踏板,需要多次费力踩踏板,猪圈另一端才会落下一些食物。如果小猪去踩踏板,大猪会在小猪跑到食槽之前就吃完落下的九成食物,小猪只能得到一成食物;如果大猪踩踏板,则小猪能吃到三成落下的食物,大猪吃到七成食物。
假定踩踏板要消耗相当于二成食物转化的体能,两头猪各自会采取什么策略?在这种情况下,对小猪而言,等待大猪去踩踏板是最优策略,这就是所谓的“搭便车”策略。对大猪而言,虽然知道等待是小猪的最优策略,却不得不去踩踏板。这是它的唯一选择,否则它也要和小猪一样挨饿。所以,最终小猪搭了便车,可以不劳而获。
在现实社会生活中也有投机取巧的人,他们从生活经验的积累中学会了“搭便车”策略,因此就会出现能者多劳、强者多尽义务和“鞭打快牛”的现象。从博弈论观点来看,搭便车现象是不可避免的。
我在部队时,战术课上,队长讲到一个问题在战场上面临敌机轰炸,是否躲在最好的掩体里最安全?
有人回答“是”,但队长的答案是:“不一定”。因为敌人如果知道你躲在最好的掩体里,他就可以对这一掩体集中轰炸。明智的策略是以某种概率随机选取不同的掩体,让敌人不知道你躲在哪个地方。这就是博弈论里所谓的“概率策略”。我不知道队长学没学过博弈论,但他又提出了另一个方案。说:“你躲在已经炸过的弹坑里,被炸的几率估计要小些。”
当我问队长原因时,他解释到:“从概率来说,两颗炸弹落入同一个弹坑的机率是极小的,这种小概率事件,可以当成不可能。况且,如果炸在弹坑旁边,而弹片作为最大杀伤力的东西,是向上飞的,你在老弹坑的底部,被弹片杀伤的可能性就很小了。”
他后面的解释,就不属于博弈论了,虽然有数学知识,但更多来源于经验,属于实践论。
原来李茅给我上过课,我们和小苏三人组成一个公司时,我们股比是各占三分之一,这没什么博弈。因为感情因素和团结考虑。但当那个技术团队加入后,如何确定他们的分配比例,这就涉及到博弈论的问题了。为此,李茅也给我们普及了相关理论。
这个问题归结为如何计算成员对联盟的贡献大小。美国数学家和经济学家沙普利建立了一个数学模型,可以计算每个成员在合作联盟里的贡献大小,即计算“沙普利值”。沙普利是博弈论专家,2012年获诺贝尔经济学奖。
沙普利值是对边际贡献的加权平均,满足如下几条公理:第一、若某参与者的所有边际贡献为零,则分配给他的收益也为零;第二、参与者分配的收益之和等于联盟的总收益;第三、若两个参与者在联盟中地位相同,则分配给他们的收益也相同;第四如果联盟有两个博弈,参与者分别在两个博弈中分配的收益之和等于在合成博弈中的收益。沙普利证明了一个定理:沙普利值是唯一满足上述公理的分配方案。
沙普利值的计算可以应用到如何评估投票规则中的权力分配问题。例如:联合国安理会由5个常任理事国和10个非常任理事国组成,提案仅当全部常任理事国和至少4个非常任理事国赞成时方可通过。在这个规则下,常任理事国有一票否决权。计算沙普利值,每个常任理事国的权力是0.196,每个非常任理事国的权力只有0.002。如果把规则修改为:提案仅当全部常任理事国和至少7个非常任理事国赞成时方可通过,则每个常任理事国的权力降为0.170,每个非常任理事国的权力上升为0.015。
博弈中,纯粹的数学运算,很容易破坏信任和感情。比如,当年如果我与李茅、小苏之间争论谁的贡献大小,谁的利润多少,那么,我们三人就会都是失败者。因为,很容易滑向分脏不平先打架的地步,结果利润还没挣到,公司就散了。
博弈问题在日常生活中经常会遇到