妙趣横生博弈论-第15章

小说：妙趣横生博弈论字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

…251001502610415427108
　　把这个表用下图表示出来，我们可以看得更加清楚，效果也更加明显：
　　这是博弈“事先设计好”的，目的是确保选择2（欺骗）的学生总是比选择1（合作）的学生多得50美分，不过，选择2　的人越多，他们的总赢利就会越少。假设全体27名学生一开始都打算选择1，这样每个人将得到108美元。现在，如果一个学生打算偷偷改变决定，选择2，那么，选择1的学生就会变成26名，每个人将得到104美元（比初步计划少了4美分），而那个背叛者将得到154美元（比初步计划多了46美分）。不管最初计划选择1而不是2的学生有多少，他们都一样。选择2是一个优势策略。每一个把选择1改成选择2的学生都使自己的赢利增加46美分，却使他的其他26个同学每人少得4美分，结果全班损失58美分。等到人人都采取自私的行动，都想使自己的赢利最大化时，他们每人得到50美分。如果他们成功地合谋起来，协同行动，不惜将个人的赢利减到最小，他们将各得108美元。如果是你，你会怎么选择？
　　演练这个博弈的时候，起初不允许集体讨论，后来允许一点讨论，以便达成“合谋”，结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里，选择1的学生总数是4，全体学生的总赢利是1582美元，比全体学生成功合作可以得到的赢利减少了1334美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么，他自己又是怎么选择的呢？“噢，我选了2。”他答道。尤塞里安一定早就知道这一点了。

解决困境的初步思想（6）
新近的关于多人囚徒困境博弈的实验室实验，采用了一种叫做捐款博弈的形式。每个参与者得到一笔初始资金：10美元。每人可选择保留其中一部分，再把另一部分捐给共同储金。然后，实验者把累积的共同储金翻倍，在所有参与者之间平分，捐款人和非捐款人都同等对待。
　　假设在这个组中总共有四个参与者：A、B、C和D。不论其他人怎么做，A只要向共同储金捐献1美元，共同储金翻倍后就会增加2美元。但是，增加的2美元中，会有15美元分给B、C和D；而A只能得到50美分。因此，A提高了其捐献量，最后却亏了本；相反，他减少捐献量反而会获益。不论其他人捐多少（如果有捐款的话），这一点都是成立的。换句话说，对A来说，一分钱也不捐是优势策略。对B、C和D来说亦是如此。这个逻辑是说，人人都应当希望成为一个分享别人成就的“免费搭车者”。如果四位参与者都采取他们的优势策略，共同储金便空空如也，每个人只保有他们的初始资金10美元。当人人都想成为免费搭车者时，车就会停滞不前。如果人人把他们所有的初始资金捐给共同储金，那么，翻倍后的共同储金将是80美元，每个人将分到20美元。然而，每个人都有背叛这样协议的个人动机。这就是他们的困境。
　　捐款博弈不仅仅是实验室或理论上的奇事；它还发生在现实世界的社交活动中——只要群体成员自愿捐款就能共同受益，但却不能阻止没有捐款的人也能享受到这些利益。村庄对洪水的控制、自然资源的保护就属于这种情形：不可能建了堤坝后，洪水就会有选择地绕道而行，只淹没那些没有捐款帮忙建设堤坝的人的田地；拒绝以后把鱼分给那些过去消耗太多的人，也是不可行的。这就产生了多人囚徒困境：每个参与者都有偷懒或保留贡献的动机，却指望能享受别人的贡献带来的利益。如果大家都这么想，总的贡献量就会很少甚至为零，结果大家都遭受了损失。这些情形普遍存在而且如此严重，以致所有社会理论和政策都需要深入思考才能走出困境。
　　在该博弈中的最有趣的变体中，参与者有机会惩罚那些背叛隐含社会合作契约的人。但是，他们必须为此承担个人成本。在捐款博弈结束后，参与者被告知其他参与者的个人捐款量。然后开始第二阶段的博弈，参与者可以采取降低其他人赢利的行动，而其他人的赢利每降低1美元，他自己要付出33美分的成本。也就是说，如果A选择把B的赢利降低3美元，那么A这样做之后，他的赢利就会减少1美元。这些减少的赢利不会再分配给其他任何人；而是返还到实验者的总资金中。
　　实验结果表明，人们对“社会欺骗者”实施了大量的惩罚，惩罚的可能性也大大提高了博弈第一阶段的贡献量。这样的惩罚似乎是促成合作、增进群体利益的一个有效机制。但是人们实施惩罚的事实首先就是令人惊讶的。以私人代价惩罚他人的行为，本身就是对集体利益的贡献，所以它是一个劣势策略；如果它以后成功地引导欺骗者采取了更好的行为，这将对整个集体有利，而惩罚者将只得到该利益中属于他的一小部分。所以，惩罚不是自私估计的结果。情况的确如此。在关于该博弈的实验进行的同时，参与者的大脑接受了正电子放射扫描仪的扫描。14结果表明，实施惩罚的行为会刺激某个大脑区域，该区域被称为背侧纹状体，它与体验快乐或满足有关。换句话说，人们从惩戒社会欺骗者的行为中，实际上得到了心理上的受益或满足。这种本能必定有着很深的生物根源，而且可能是因为其进化优势而被选择出来的。15书包　网　。　想看书来

解决困境的初步思想（7）
如何达成合作
　　这些例子和实验已经说明了成功合作的几个先决条件和策略。让我们更系统地介绍这些概念，并利用它们解决更多的现实生活实例。
　　成功的惩罚机制必须满足几个要求。下面我们逐一列出。
　　觉察欺骗惩罚欺骗之前，必须觉察到欺骗。如果觉察快速而且准确，惩罚的实施就能够即时无误。这在提高欺骗成本的同时，减少了欺骗的好处，从而提高了成功合作的可能性。比如，航空公司时常监视对手的票价；如果美国航空公司打算降低其纽约至芝加哥的票价，联合航空公司可以在5分钟内就做出反应。但是在其他情况下，想降价的公司可能会跟顾客秘密交易，或者通过一笔涉及飞行时间、服务质量、安全保证等许多方面的复杂交易来掩饰其降价。极端情形下，每个公司只能观察到自己的销售和利润，它们不仅取决于其他公司的行动，还取决于一些机会元素。比如，一家公司的机票销售量还可能取决于需求的变化，而不是仅仅取决于其他公司的秘密降价。这样，觉察和惩罚不仅变得缓慢，而且也不准确，更增强了欺骗的动机。
　　最后，当同一个市场上有三家以上公司同时行动时，他们不仅需要找出是否存在欺骗，还要找出欺骗者是谁。否则，惩罚不但不能针对性地惩戒坏人，而且会变得迟钝无效，或许还会引发价格战，以致伤害所有人。
　　惩罚的性质接下来是惩罚的选择。有时候，参与者会采取惩罚他人的行动，这些行动会被欺骗行为激发起来，即使在单次互动博弈中也是如此。就像我们在《洛城机密》中的囚徒困境中指出的，如果雷若伊因为替国家作证而从轻判刑，那么，他出狱后将遭到苏格和蒂龙的朋友的报复。在得克萨斯州A&M大学的课堂实验中，如果学生们可以觉察出是谁背叛了所有人的合谋而选择了1，他们就可能对欺骗者施以社会制裁，比如排斥这个欺骗者。这样，就不会有几个学生愿意为了多得50美分而冒这个险了。
　　在博弈的结构里还存在其他类型的惩罚。一般而言，这种情况发生的原因在于这个博弈是重复进行的，这一轮欺骗的所得将导致后面几轮的损失。这些是否足以觉察出哪个参与者打算欺骗，取决于得失的大小以及将来相对于现在的重要性。我们很快就会继续讨论这个方面。
　　清晰性可接受行为的界限，以及欺骗的后果，对潜在的欺骗者而言应当是清晰的。如果这些是复杂的、含糊不清的，参与者就可能因为失误而欺骗，或者不能做出理性的计算，而是根据某种直觉行事。举个例子，假设彩虹之巅（RE）和比比里恩（BB）正重复进行定价博弈，RE决定，如果RE过去17个月内的平均折扣利润比同期产业资本的平均真实回报率低10％，它就推断BB欺骗了。BB不能直接知道这个规则；它必须通过观察RE的行动来推断RE所采用的规则。但是，这里陈述的规则太复杂了，BB根本无法弄清楚。所以，这不是一个阻吓BB欺骗的好方法。而像以牙还牙这样的策略就表达得相当清楚：如果BB欺骗，它就会看到RE在下次降低价格。
　　确定性参与者应该确信，背叛将受到惩罚，合作则会得到回报。在像世界贸易组织（WTO）贸易自由化这样的国际协议中，这是一个主要问题。当一个国家投诉另一个国家违背了贸易协定时，WTO就会发起一个行政诉讼程序，而一拖就是几个月，甚至好几年。案件真相几乎对判决没有任何影响，判决通常更多地取决于国际政治规定及外交政策。这种强制执行的判决程序显然不可能发挥什么作用。

解决困境的初步思想（8）
规格这样的惩罚应该有多严厉？似乎没有限制。如果惩罚严厉到足以阻吓欺骗，惩罚就无须实际执行了。因此，要阻吓欺骗，最好把惩罚设定在尽可能严厉的水平。比如，WTO可以这样规定，任何国家要是违背了其将保护性关税维持在协定低水平之内的承诺，都会遭到核武器袭击。当然，大家会被这个规定吓得退缩不前，不敢欺骗；但大家至少部分会认为某个失误也可能导致核攻击的发生。在大多数情况下，当失误可能发生时，正如实际中常会发生的那样，惩罚的规格应该保持能够成功阻吓欺骗的尽可能低的水平。在极端情况下，原谅偶然的背叛甚至可能是最优的策略，例如，一家明显为生存而竞争的公司的对手可能会允许它降一点价，而不会进行报复。
　　重复性现在来考察一下RE和BB之间的定价博弈。假设一年又一年过去了，它们彼此相处愉快，一直都把价格维持在其联合利益的最佳点，80美元。有一年，RE的经理考虑降价至70美元的可行性。他们估计，70美元的价格将会给他们带来额外的利润110　000美元－72　000美元＝38　000美元。但是这可能导致彼此信任关系的瓦解。RE应该预计到，以后几年内BB也将选择70美元的价格，每家公司将每年只获利70　000美元。而如果RE遵守了最初的协议，每家公司本可以获得　72　000美元的利润。因此，RE的降价行为将给它带来以后每年72　000美元－70　000美元＝2　000美元的损失。为了38　000美元的一次性赢利值，BE值得以后每年损失2　000美元吗？
　　决定现在与未来的报酬是否均衡的一个关键变量是利率。假设年利率为10％。那么，RE可以把它赚的额外的38　000美元存进银行，然后以后每年赚取3　800美元的利息。这远远超过了以后2　000美元的年损失。因此欺骗符合RE的利益。但如果年利率只有5％，那么，在以后每年，38　000美元只能给RE带来1　900美元的利息，它小于协议瓦解后的2　000美元的年损失；这样，RE就不会欺骗了。使二者均衡的利率应为2/38＝00526，即每年526％。
　　这里的关键点在于，利率较低时，未来相对更有价值。例如，如果年利率为100％，那么未来相对现在而言价值很低，一年后的1美元只值现在的50美分，因为你可以在一年内把50美分变成1美元，另外赚到50美元的利息。但是，如果年利率为零，那么一年后的1美元的价值与现在的1美元相等。
　　如果大家读读财经报刊，就一定经常会看到如下表述：“利率与债券价格反向变动。”利率越低，债券价格越高。债券是未来收入的保证，反映了未来的重要性。这是牢记利率作用的另一种方法。在我们所举的例子中，当实际利率稍高于5％时，对每家公司而言，把他们的最佳联合价格80美元降低10美元的动机非常小，重复博弈中的合谋可有可无。我们将在第4章中探讨，如果没有对未来的顾虑，且欺骗的诱惑无法抗拒，价格会降到多低。
　　另一个需要考虑的相关因素是关系延续的可能性。如果这种衬衫仅仅是风靡一时的时尚商品，第二年可能根本卖不出去，那么，任何未来损失的可能性都不足以抵消今年欺骗的诱惑力。
　　但是除了衬衫外，RE和BB还销售很多其他商品。在衬衫价格上欺骗，将来会不会招致对于对其他商品的报复？这种极大报复的可能性是否大到足以吓阻背叛？唉，对维持合作关系而言，多产品相互作用的方法是否有用没这么简单。多产品报

返回目录上一页下一页回到顶部赞（2）踩（2）

第15章

妙趣横生博弈论-第15章

你可能喜欢的