无人售报摊背后的博弈

    梁捷

    

    囚徒困境是一个假想出来的经典思维实验,用于描述个人理性下合作行为的困难。如果人的行为是绝对理性的,那幺每个人都会选择背叛。如果有人选择合作,那就意味着他/她缺乏运用自己理性的能力。

    囚徒困境在日常生活中有非常多的应用。比如你经营了一家奶茶店,而在同一条街道上,一般也都会有一家竞争对手。你们曾经有一种默契,就是各做各的,但绝不打价格战。奶茶的成本很低,利润率很高,如果大家都把价格定得偏高,那大家都可以享受到较高的利润率,反之则两败俱伤。

    最近市场上出现一款爆款产品,在别的城市卖得很好。你们两家自然都注意到了这一点,都准备推出类似的爆款奶茶。如果做得好,估计这款奶茶可以每天为自己带来一半的营业额。那幺,你是否还要遵守原先的默契,把价格定得偏高?

    如果你们双方还是遵守默契,那幺皆大欢喜。但如果有一方意识到,这是一次极好的机会,假如自己对这款奶茶的定价偏低,接近成本,对方还是傻乎乎地维持高价,那幺自己就可以趁机把整条街的市场抢过来。你会这样想,对方同样也会这样想,如此一来,最终结果就是双方同时背叛,同时制定低价,同时在价格战中损失惨重,谁也没有获得任何好处。

    这样的例子还有很多。在西方有些国家,报亭是既没有管理员也不上锁的,买报纸的人自行放下钱后就可以拿走报纸。当然某些人有可能取走报纸却不付钱,但这样的人非常罕见。因为大家知道,如果自己这样做了,报亭不得不派一个管理员看管,管理员的工资可是要摊到每一份报纸上的,对所有人都不利。这也是一种囚徒困境的博弈。

    在囚徒困境的实践中,大多数人都会选择背叛吗?那种明明更好的双方合作的结果是否会出现呢?电视编导比经济学家更早注意到这个问题。英国BBC搞过一个真人秀节目,叫做《金球》(golden balls)。

    《金球》每一集节目的总体规则大致是这样的:开始有4个选手参加,然后有大量的交流讨论时间,接着是匿名投票,排除一位选手。类似的情形再来一遍,再投票排除一位选手,最终剩下两人。这样就进入第二阶段,剩余的两人面对一大笔钱,进行囚徒困境式的博弈,最终决定各自的收益。

    具体来看,一开始有100个价值在10英镑到7.5万英镑的金球被放在一个叫golden bank的东西里,这有点像我们熟悉的扭蛋机。工作人员随机从里面抽出12个球打乱顺序,并加入4个额外的“杀手球”,总共16个球,随机分配给4位选手。

    然后所有选手会一起探讨,并且介绍手里的金球价值多少,当然也可能存在欺骗瞒报。大家的共同愿望是,手里金球加起来的价值越高越好,因为最终要分的钱与第一阶段攒了多少钱有关。然后每个人匿名投票,根据投票结果把一位选手淘汰出局。接着再来一次,再把一位选手淘汰,最终只剩下两人。

    然后进入到这一集最精彩的部分——囚徒困境博弈。两位选手有两个可能的选项,分别是“分”(split),或者是“偷”(steal),这两个都是s开头的词。如果一个人选择分,另一个选择偷,则选偷的人将获得全部奖金,选分的人分文不得。如果两个人都选择偷,那幺两个人都分文不得,空手而归。如果两人都选分,那幺每个人都会获得其中一半的奖金。

    整个节目最精彩的部分,就是双方在作出选择之前的对话。很多人都选择从陈述家史开始,“我从小父母双亡,无依无靠,但是周围有很多好心人帮助我,使我活了下来。所以我很感恩,这个社会上有很多好人,我也要做个好人,把这份善意流传下去。所以,你可以充分地相信我,我一定会选择分而不是偷。”

    又比如:“你知道吗,我的孩子刚刚出生。他还那幺小,也许长大了以后会看到我们今天这期节目。我很清楚这一点,也希望他未来能成为一个好人,所以今天我一定会给他做一个榜样。因此,你可以充分地相信我,我一定不会欺骗你而选择偷。”

    还有这种,“我是一个非常虔诚的基督徒。我们的一举一动都在上帝的注视下。你绝不可能欺骗上帝。所以我一定会选择分而不是偷。”

    所有这些陈述的真实性都并不可考。很多人的表现称得上是情真意切,有的眼泪都快流下来了。但所有这些陈述和表演与最后的选择并没有直接的关系。有时候,前面一分钟还在以上帝的名义赌咒发誓,下一秒开出结果,他选择了偷而对方选择了分,这时候选手兴奋地跳了起来,上帝就不知道在哪里了。

    而在另一些时候,选择偷的人获胜了,对方选择了分。自己明明赢了,但是表情却有些僵硬,有些尴尬,不好意思注视对方,甚至不好意思再与对方握手。主持人总结一句,“这就是游戏”,一集节目就此结束,留给观众默默体会之前选手的精彩表演。

    《金球》总共有300多集,相当于做了300多次囚徒困境博弈的实验,已经能够满足统计学的最低要求,可以拿来进行研究分析了。

    着名的实验经济学家,也是诺贝尔经济学奖得主泰勒系统性研究了这300多集《金球》节目。下面我们就来看一看他们从电视节目中发现的一些规律。

    第一,个人选手平均有53%的时间会选择合作。这就证明,人们并不总是在囚徒困境中选择背叛。而且,存在事先沟通的情况下,选择合作的可能性甚至还超过了选择背叛的可能性。这个结果,当然又一次动摇了理性人假设。

    人们并不总是在囚徒困境中选择背叛。而且,存在事先沟通的情况下,选择合作的可能性甚至还超过了选择背叛的可能性。这个结果,当然又一次动摇了理性人假设。

    第二,参赛选手的合作倾向与金额有关。但这个金额并不是一个绝对金额,而是一个相对金额。比如过去几集节目里,大家最终要分的钱都是上万英镑,而这次我们要分的钱不过是3000英镑。3000英镑从世俗意义看来,绝对也是一笔不小的钱了。但参赛选手会与过去的节目相比,而不是从自身情况出发,于是会看轻这笔钱。泰勒把这种现象称之为“大花生现象”。选手就像是在竞争一颗大一点的花生而已,既然如此,为什幺不对对方好一点呢?如此一来,双方合作的可能性极大地增强了。

    第三,如果他们的对手在游戏前两轮中,试图将自己从节目中淘汰,那幺参赛者就不太可能合作。这是一种互惠的内在偏好,过去你对我好,现在我也对你好。既然过去你对我不好,那现在也别想我对你好。

    第四,几乎没有证据表明,参赛者的合作倾向会与对手合作的可能性有关。泰勒几乎没有发现条件性合作的证据。也就是说,几乎不存在什幺通过证明自己会合作而吸引对方合作的策略。

    第五,也是很多人关心的角度,年轻的男性比年轻的女性更不合作。但是,这种性别效应对年长的参赛者来说是相反的,年长的男性比年长的女性更合作。随着年龄的增长,男性的合作性变得越来越强。

    泰勒的研究吸引了更多学者来关注这档节目。有两位生物学家研究了节目以后,也有很多新发现。他们的关注点与经济学家的发现不太一样。他们发现的内容包括:

    第一,当选手发现最终博弈的伙伴之前曾经对自己手上的金球的价值撒过谎,选手就不太可能选择合作。选手会认为,曾经撒谎的人是靠不住的。

    第二,两位选手在博弈之前都会有很长时间的对话交流。在交流中,往往一方主动,一方被动。主动的一方总是要承诺,自己一定选择分钱。而最终结果表明,这些主动承诺分钱的选手确实更有可能选择合作。

    第三,选手在交流的时候,有些选手会更多地笑,甚至发出大笑的声音。而另一些选手比较冷静,波澜不惊。最终结果表明,发出笑声的选手更有可能选择合作。

    第四,交流过程中,有些选手会主动作出一些身体接触,与对方握手,拍拍对方肩膀等等。结果表明,主动进行身体接触的选手不太可能选择合作,而被触摸的选手也不太可能选择合作。身体接触并没有增强双方信任的信心。

    最后介绍一期我认为的最精彩的《金球》节目。最终的囚徒困境博弈在一位叫尼克的选手和另一位叫易普拉辛的选手之间展开。尼克开门见山地说:“你一定要相信我,我保证我肯定会选择偷。”易普拉辛简直以为自己听错了:“你在说什幺?”所有选手上来都是承诺,我一定会选择合作,你怎幺承诺要选择偷。尼克说,我肯定会选择偷,但是我会在赛后把自己的奖金分给你一半。主持人都没有听过这样的言论,让双方确认,这种承诺是无效的,与节目组无关。如果事后尼克并不愿意把钱分给易普拉辛,节目组也无能为力。

    易普拉辛反复劝说尼克放弃这个荒唐念头。尼克毫不动摇,如果你信任我,你就选择分,这样我拿走所有的钱,事后会分你一半。如果你不信任我,你就选择偷,大不了我们双方什幺都没有,一拍两散。

    最终,双方开出结果。出人意料的是,易普拉辛和尼克最后都选择了分,选择了合作,两人意想不到地取得了最优结果。事后,尼克意味深长地说,他一开始就想选择合作了。但他只有坚持不合作的姿态,坚持要偷,最终才能保证取得自己希望的合作结果。

相关文章!
  • 受人类听觉系统的启发首次通过

    衣服可以像人的“耳朵”一樣,作为声音“ 收集器” 吗? 也就是说,人们可以通过衣服就能实现接听电话、定位、听诊心肺肠胃等生理信号、帮助听

  • 武汉光谷马鞭草花海在哪里 光

    近期武汉紫色花海火了!这是坐标于光谷边上的马鞭草花海,很适合小姐妹们打开拍照,已经成为网红约会胜地了!目前,光谷马鞭草花海是不收

  • 全球主要氖气供应商关停进一步

    据了解,由于目前的俄乌战事,供给全球50%左右半导体级氖气的乌克兰公司Ingas 和Cryoin,已于近日关闭生产。这两家氖气供应商的关停无疑