《网络、群体与市场》书摘


网络、群体与市场:揭示高度互联世界的行为原理与效应机制/(美)大卫·伊斯利 (David Easley),(美)乔恩·克莱因伯格 (Jon Kleinberg) 著;李晓明等译. --北京:清华大学出版社,2011.10
ISBN 978-7-302-26417-0

下载 网络、群体与市场:揭示高度互联世界的行为原理与效应机制.pdf (访问密码:320860)


第 1 章 概述

  图论是研究网络结构的,博弈论提供了关于个体行为的一种模型,要点在于个体行为的结果取决于其他个体的行为。这两个理论是讨论本书其他内容的基础。

图论

  强联系(strongties),表示紧密和频繁的社会接触,倾向于嵌人在网络中联系密集的区域;弱联系(weakties),表示比较偶然和少有的社会接触,倾向于跨越这些区域的边界。它提供了一种了解大型组织中社会性概貌的策略,即要在网络中找到那些相互很少联系的不同部分之间的结构洞(structuralholes)。在一种全局的尺度上,它说明弱连接可以作为“超近道”使其不同部分连接起来的方式,导致俗称为六度分隔(sixdegreesofseparation)的现象。

博弈论

  在有些情形下,人们必须同时选择如何行动,并知道行动的结果将取决于所有人分别做出的决定。我们关于博弈论的讨论就从这样的观察开始。一个自然的例子是在交通高峰期在一个高速公路网络选择行车路线的问题。此时,对司机来说,他所体验到的延退取决于交通拥塞的情况,但这种情况不仅与他选择的路线有关,而且与所有其他司机的选择也有关。在这个例子中,网络的角色是一个共享资源,它的用户的综合行为既可以使它拥堵,也可能使对它的利用效率提高。而且,人们之间行为的相互作用可能导致某些违反直觉的结果。比如,增加一个运输网络的资源,可能事实上反而造成了严重影响网络效率的透因,这种现象称为布雷斯悖论(Braess’sParadox)。
  作为博弈论的一个基础,我们将这种情形抽象成在一个共同框架中相互依赖的行为,其中有一个个体的集合,每个个体必须认定一种策略(strategy),从而得到一个回报(payoff),而回报的多少取决于集合中每个人分别选择的策略。用这种观点来解释前面的例子,我们看到一个司机在高速公路上可采用的策略由他可能选择的不同路线构成,回报则是与他最后所花的行驶时间对应。对于拍卖来说,策略是不同的出价选择,对一个买家的回报则是其得到的物品的价值和所支付的价格之间的差别。这个通用的框架使我们能在许多这样的情形中预测人们的行为。这个框架的一个基本要素是均衡(cquilibrium)的概念,指的是一种“自我强化”的状态,在该状态上,任何人都不可能从单方面改变他或她的策略中得到好处,即便他知道其他人会怎么行为。

信息网络

  搜索引擎与网页作者之间的互动也是一个很有说服力的例子,反映出行为层次的联系可产生有趣结果。只要搜索引擎引入一种新的网页评价方法来确定哪些网页该放在搜索排序结果的高位,网页内容的创建者就会有反作用:他们会优化放到 Web 上的内容,试图在新的方法下获得较高的排序评分。这样,搜索引擎的改变从来就不能假设 Web 保持静止不变,实际情况是 Web 上的内容会不可避免地来适应搜索引擎对网页内容评估的方式。因此,在发展搜索方法的时候必须考虑这种反馈的作用。
  这种本质上具有博弈特性的互动,在早期 Web 的时候就以某种潜在的形式存在了。随着时间的演进,它通过基于搜索的广告市场的设计,以拍卖机制进行广告空间的分配(竞价排名)等措施,变得越来越显式和形式化了。今天,这样的市场是主流搜索引擎的基本收入来源。

网络动力学:人群效应

  如果长时间观察一个大的人群,会看到一个重复出现的模式,其中新的想法、观念、创新、技术、产品,以及社会习惯不断地涌现和演变。概括之,称它们为社会实践(social practices)。人们可以选择采纳或拒绝这些社会实践。新的实践在人群中扩散开来的方式,很大程度上取决于人们相互影响。当一个人看见越来越多的人在做某件事情,通常他也很可能会去做那件事。
  从表层来看,我们可以假想人们模仿他人,只是因为人类的从众心理,即我们本质上倾向于像其他人那样行事。这个观察显然是重要的,但为了能用它解释我们关心的现象,还有一些关键问题需要解决。不能因为认定了模仿是人类的天性,而不去探求人们为什么被他人影响的问题。虽然这是一个涉及面较宽,而且很难的问题,但事实上我们有可能认识到若千原因,回答为什么即便是纯粹理性的代理(指那些没有什么先验愿望要和别人保持一致的个体),也会复制他人的行为。
  一类原因是基于“他人行为传达信息”的事实。一个人可能基于某些私有的信息来在多种可能性上做出决定,于是当看到许多人都在做一个特别的决定,很自然会假设他们也都有各自的信息,试图从人们的行为来推测他们是怎么评估不同选择的。在 YouTube 和 Flickr 这类网站的情形,看到许多人都在用,会使人感到他们知道某些关于该网站质量的情况。类似地,看到一个餐馆每个周末都特别爆满,会使人感到许多人都认为它很好。但这种推理会产生一个微妙的问题,令人吃惊:由于许多人是随时间的推进相继做出决定的,后来的决定可能是基于私有信息和推理的一种复杂的混合物,而推理是从已发生的情况做出的。这样,许多人的行动可能事实上只是基于极少的本质信息。在这种现象极端的情形,我们可以看到信息连锁反应(informationc ascades),即使理性的个体也会选择放弃他们自己的私有信息,而去随大流。
  还有一个完全不同,但足够重要的理由,说明人们为什么要去模仿他人的行为。在一种直接利益驱使下,一个人可能会选择使自己的行为与他人一致起来,而不管他们做出的决定是否最好。回过头再来看社会网络与媒体共享网站的例子。如果那些网站对人们的价值在于和其他人互动、能够访问许多内容或者有大量的用户来注意到你上载内容等方面的潜力,那么网站会随着人们的加入变得越来越有价值。换句话说,不管 YouTube 和它的竞争者相比是否有更好的特点,一旦它成为最流行的视频共享网站,使用它就注定会提供附加值。这种网络效应(networkeffects)会放大那些已经很不错的产品和技术的成功。在网络效应起作用的市场,要取代领导者会是很困难的。然而,这种支配地位又不一定是永恒的,后面还将看到,如果新技术提供某些显著不同的东西,或者它始于网络中有空间让新技术立足的部分,新旧更替就是有可能的。
  这些讨论表明,流行性作为一般的现象是怎么被“富者更富”反馈过程所支配的,在这种反馈过程中,流行性倾向于自我提高。

网络动力学:结构效应

  信息与直接利益,作为人们相互影响的基本机制,在许多情形,相比整个人群,你会更在意你自己的行为是否与社会网络中直接相邻的人们一致。
  当个人有动机去采纳网络中邻居的行为,可能会出现连锁反应(cascadingcffects),即新的行为始于少量初始的实践者,然后通过网络迅速扩散。图 1.11 是一个小例子,说的是从 4 个最初的买者开始,一本日本图画小说通过电子邮件被推荐的情况。通过对背后的网络结构进行推理,会看到一种先进技术如果始于网络中能够引起增量推广的部分(每次增量不一定很大),是怎么取代尽管是广为使用但落后的技术的。技术的扩散,有可能被阻止在网络中一个密集相连的群集的边界,那样的群集即为一种“封闭的社区”,其中的人们有大量相互之间的联系,从而形成对外来影响的阻力。

机构和聚合行为

  考虑市场聚合与传达信息的作用。例如,在金融市场,市场价格聚合了人们关子交易对象价值的信念。在这个意义下,市场的总体作用是综合许多参与者所掌握的信息,因此当人们谈及市场“预期”,实际上说的就是这种信息组合所带来的预期。

第一部分 图论与社会网络

第 2 章 图论

  图(graph)是以一种抽象的形式来表示若干对象的一个集合以及这些对象之间的关系。一个图包含一组元素以及节点与节点之间连接关系的集合,这些元素称为节点(node),连接关系称为边(edge)。两节点间有边相连时称此二节点为邻居(neighbors)。以圆圈表示节点,以连接节点的线段表示边。
  路径(path)即一个节点序列的集合,序列中任意两个相邻节点间都有一条边相连。
  圈是至少包含三条边,且起点和终点相同,而除此以外的所有节点均不重复的路径。也就是“环状”结构。

  事实上,在 1970 年 ARPA 计算机网的例子中,每一条边均属于一个圈,而这是事先设计好的。这是因为,假设任意一条边失效(例如一条电缆因施工原因被意外切断),图中的任意两点间总有另外一条路径相连。一般而言,在通信和交通网中,圈通常意味着允许元余,它们通过圈提供了“另一条路”。类似的情况在社交圈或朋友圈中亦然,甚至于在日常生活中也普遍存在,尽管有时我们并没有察觉。例如,你太太的表弟高中时代的好朋友实际上是你哥哥的同事,这就是一个圈——包含你、你的太太、你太太的表弟、你太太表弟高中时代的好友以及好友的同事(也就是你的哥哥),最终回到你这里。
  连通分量(或称连通分支,connected component):若图 G 的节点子集满足如下两个条件:①子集中任意两个节点间均有路径相连;②该子集不是其他任何其他满足条件①的子集的一部分,则称该子集为图 G 的一个连通分支。

  路径的长度为其所包含的边数。

  假若你有一个出生在另一国家的朋友:通过他,到他父母,再到他们的朋友,仅仅三步,你就可能联系到世界上另一个截然不同的角落,路径终端的那些人很可能和你毫无共同点可言。这便是著名的小世界现象(small-world phenomenon)。当你发现,通过如此短的朋友路径,即可联系到几乎世界上的任何人,世界也因此看上去变小了。相比之下,与之相关的六度分隔理论也许为更多人所知。
  若我们把每个人看一个小型社交圈的中心,那么“6 小步的距离”即转变为“6 个社交圈的距离”,对于相同问题的不同视角让“6”在此听起来像是一个很大的数了。

第 3 章 强联系和弱联系

  三元闭包(triadicclosure):如果节点 B 和节点 C 有一个共同的朋友 A,则 B 和 C 之间一条边的形成就产生了三个节点彼此相连的情形。在网络中,称该结构为三角形结构。“三元闭包”名称的由来,源于 BC 边在该三角结构中为起到“闭合”作用的第三条边。当观察同一社交网在不同时间点的两个网络快照,则通常会发现在后来的快照中,有相当数量通过三元闭包产生的新边出现,即两个在前一张快照中有共同朋友的人,在后来的快照中也成为朋友。
  当 B 和 C 有一个共同的朋友 A,他们成为朋友的几率就会增加。原因之一在于,他们和 A 的关系,直接导致他们彼此见面几率的增加:如果 A 花时间同时与 B 和 C 在一起,则 B 和 C 很可能因此认识彼此,并成为朋友。另一个相关的原因是,在友谊形成的过程中,B 和 C 都和 A 是朋友的事实(假定他们都知道这一点)为他们提供了陌生人之间所缺乏的基本的信任。
  如果 A 同时与 B 和 C 都是朋友,则若 B 与 C 不是朋友的事实可能成为 A 与 B 和 C 友谊的潜在压力。

  为了简化概念,并与我们的朋友/熟人二分原则相匹配,将社交网中的所有关系归为两大类:强联系(较强的关系,相对应朋友关系)和弱联系(较弱的关系,相对应熟人关系)。

  捷径(localbridge):若边 A-B 的端点 A 和 B 没有共同的朋友,则称边 A-B 为捷径。换何话说,删除该边将把 A 和 B 的距离增加至 2 以上(不含 2),则称该边为捷径。我们定义捷径的跨度为该边两端点在没有该边情况下的实际距离。

  组织或公司的社会网络,其中的人们一方面为共同的目标而合作,另一方面为个人职业生涯的发展暗自竞争。

展开图片

  把网络想象成表示在大型公司内部管理者之间的交往和合作。节点 B 用与她有关的多条捷径跨越了组织里的一个结构洞(structuralhole)。结构洞就是存在于网络中两个没有紧密联系的节点集合之间的“空地”。节点 B 所处的位置在多个方面要比节点 A 的位置优越。第一种优势在于信息方面:节点 B 可以更早地获得来自网络中多个互不交叉部分的信息。每个人投入在维护组织中联系的精力有限,节点 B 通过积极联系多个不同的群体(而不是仅限于某个群体)更有效地投入自己的精力。
  第二种优势在于,处在捷径的一端对其创造性有放大功能。许多领域的经验表明,创新常常源自多个观点的意外合成,这里的每个观点本身或许是人们熟知的,但只是在不同且不相关的专业领域内部所熟知。因此,位于三个无交互群体交界处的节点 B,不仅可以得到这些群体的所有信息,还有机会整合来自不同群体的信息。
  最后,网络中节点 B 的位置意味着某种社交“把关”的机会,该节点不仅可以控制节点 C 和 D 访问她所属的群体,还可以控制她所属的群体从节点 C 和 D 的群体获取信息。这样,这个位置给予 B 一种权力资源。可以想象,B 会试图阻止他们所在的捷径周边形成三角形,例如从节点 C 或 D 产生一条到达 B 所在群体另一节点的边,很有可能会削弱 B 的社交“把关者”的地位。
  这最后一点表明了节点 B 的利益不一定与其所属的群体整体的利益一致。对于组织机构而言,促进不同群体间的信息交流是有益的,但联系桥梁的建立会有损 B 自身在这些群体边界的权力。
  总之,节点 A 和 B 的相对位置各有利整。节点 B 在群体间交界的位置,说明她的交往不是嵌人在单一群体里,于是也很少得到网络邻居们的保护。另一方面,这种较冒风险的位置为她提供了访问多个群体信息的机会,可以控制信息流和重新整合这些信息。

  社会资本代表着执行者通过在社会网络或其他社会结构中的成员地位保障其利益的能力。

第 4 章 网络及其存在的环境

  同质现象:我们和自己的朋友间往往会有相同的特点。总体上看,朋友在种族和观念方面有着很多相似之处;处于相当的年纪;还具有很多相似特征,包括居住的地方、职业、经济情况、兴趣、信仰及价值观。普遍的事实是,在社交网络中互相连接的人倾向于相似。

  人们通常会与同自己相似的人们建立社会连接,这是关于社会网络结构形成的一种认识。
  
  社会化:人们会因为需要和朋友们保持一致而改变自己的行为。这个过程被描述为社会化(socialization)和社会影响(social influence),由于网络中存在的社会联系影响了节点个体的特征。社会影响可以看成是和选择相反的观念:在选择中,个体的特征主导网络连接的形成,但在社会影响中,已存在的社会网络连接将会改变人们(可变)的特征。

  在青年人群中,他们的行为与其朋友很相似,选择和社会影响都在此情况下发挥作用:青年人在社交圈内寻找与他们相似的人,且他们会因同龄人的压力而追使自己改变行为,以便更适应他们的社交圈。来自同龄人间压力的外界因素(即社会影响)作用并没有那么大,而选择的作用实际上是与社会影响的作用相当(有时会更大)。

  研究发现肥胖人群和非肥胖人群在网络中都以与同质性一致的方式聚集。在一个社交网络中,人们的肥胖状况倾向于与周围的邻里相近。
  肥胖症显示出一种社会影响,你朋友的肥胖状况的变化也将间接使你受到影响。肥胖症可能像“传染病”一样传播:虽然你不一定像被传染流感一样从你的朋友那儿“感染”肥胖症,但你仍有可能因社会影响下的某种潜在机制被其影响。也许,该发现同样适用于那些具有明显行为特征的其他一些健康问题。

第二部分 博弈论

第 6 章 博弈

  博弈论是用来研究这样一种情境,即人们的决策结果不仅取决于他们如何在不同的备选项之间进行选择,而且取决于他们所互动的他人所做出的选择。博弈论的思想出现在许多不同的背景之中。在一些背景中表现为字面上的博弈,比如可以用博弈论的工具来分析如何选择球员罚点球以及如何进行防守。另外一些背量并不总是被人们称为博弈,但也可以用同样的工具加以分析。这样的例子包括:当市场上已经有某一产品时,生产相似新产品的定价问题;在拍卖会上确定如何投标竞价;选择因特网或者交通网络作为一种运输路径;在国际关系中选择一种比较强硬的立场还是比较温和的立场;在职业体育比赛中选择是否服用兴奋剂。在这些例子中,每一个决策者的选择结果都取决于别人的决策。这就为博弈论的分析提供了一种策略要素。

何谓博弈

  博弈论关注的背景是决策者彼此之间是进行互动的,即前言提到的行为的相互连通性。每个参与者对结果的预期不仅取决于自身的决策,而且取决于互动的他人所做出的选择。

  在博弈论框架中,没要求参与者只关心白已。假设存在利他主义者的参与人,则参与人可能不仅关心他/她自己的收益,还会关心其他参与人的收益。

  1. 第一个案例
  假设你是一名大学生,在规定的截止日期前一天,你有两项需要准备的工作。一是考试,二是报告。此时,你需要考虑在为考试而复习和为报告而准备二者之间做取舍。为使例子表达更加清晰,我们将利用一些假设。首先,我们假设你可以在为考试复习或者为报告做准备间进行选择,但只能选择一种。其次,我们假设在不同决策结果公布之前,你对预期成绩有准确估计。
  考试结果易于预测。假设进行复习,则预期成绩是 92 分。但是,假设没有复习,则预期成绩是 80 分。
  报告需考虑的因素稍为复杂。因为报告是你和拍档的联合性互动行为。假设你和拍档都做了充分准备,则报告会十分的完美,因而你们预期的共有成绩是 100 分。假设只有一人做了准备(另外一个拍档没有为报告准备),则你们的预期共有成绩是 92 分。假设两个人都不做准备,你们的预期共有成绩是 84 分。
  这个例子在推理时需注意,所有这些对你拍档也是一样的。对于考试,假设他会有同样的预期结果。假设进行复习,则会得到 92 分,假设没有进行复习,则得到是 80 分。同样地,他也必须在复习考试或是准备报告之间做出抉择。进一步假设,你们彼此不能相互接触,所以,你们不能共同商讨行为选择。而且,在彼此进行独立决策时,彼此都知道对方也在进行决策。
  假设你们都追求得到平均成绩的最大化,则可以通过上面的结论来理解,这种平均成绩是如何通过彼此之间投入的努力决定的:

  • 假设你们都选择准备报告,则彼此都将在报告得分 100 分,考试得分 80 分,每个人的平均成绩是 90 分。
  • 假设你们都选择复习考试内容,则都将在考试的得分是 92 分,在报告的得分是 84,每个人的平均成绩是 88 分。
  • 假设一方复习考试,同时另一方准备报告,则得分结果就如下所示:
    • 为报告准备一方在报告的得分是 92 分,但是在考试的得分是 80 分,这方的平均成绩是 86 分。
    • 另一方面,选择复习考试一方在报告的得分是 92 分,因为报告成绩是共有成绩,这方因对方的准备报告行为而获益,通过复习行为,这方在考试的得分是 92 分,所以他会获得的平均成绩是 92 分。
        如下所示,将通过简单的方法总结这些得分结果情况。此处,是通过 2×2 表格的行代表你的两种选择行为:是准备报告或是复习考试的选择。也同样通过 2×2 表格的列代表你拍档的两种选择行为。所以,2×2 表格中的每个单元格都代表你们的一种联合选择行为。在每个单元格中记录你们的平均成绩:左侧是你的成绩,右侧是你拍档的成绩。全部的记录结果,如图 6.1 所示。
      展开图片

        2×2 表格巧妙地表现了博弈论背景的设置。现在,需要决定行为选择:是准备报告,或是复习考试?很显然,各自的平均成绩不仅取决于个体在这两个备选项之间进行选择,还取决于你拍档的决策,即互动的他人的选择。因此,作为各自决策的一部分,参与方必须对对方可能性行为进行合理推理。当考虑自己策略的后果时,必须想到他人决策的影响,这正是博弈论的用武之地。所以,在分析考试或报告例子的结果之前,先介绍博弈论的一些基本定义,然后再继续用博弈论语言加以讨论。
        2. 博弈的基本要素
        刚描述的情景实际是一个博弈的例子。一般情况下,任何背景中的博弈都具有以下这三个方面特征。
        (1)存在一组参与者(不少于两个),不纺称之为博弈参与人。就上例而言,你和你的拍档就是两个参与人。
        (2)每个参与人都有一组关于如何行为的备选项,此处备选项指参与人的可能策略。在例子中,你和你的拍档彼此都有两个可能性策略。即准备报告和复习测试。
        (3)每个策略行为的选择,都会使参与人得到一个收益。当然,这个收益结果还受互动中他人策略选择的影响。一般用数字表示收益。每个参与人都倾向于更大的收益。在上例中,每个参与人在测试和报告上取得成绩的平均,就是参与人的收益。一般通过如图 6.1 所示的收益矩阵来记录不同收益情况。
        我们感兴趣的关注点是在给定的博弈中,推理参与人如何进行策略行为抉择。目前,讨论的重点将侧重在双人博弈类型。但是,这种分析观点可推广到任意数量参与人的博弈。同时,我们将会集中于简单的、一次性博弈。这种博弈类型的特征是,参与人会同时并独立的选择各自行为,并且他们的选择行为是一次性的。本章的 6.10 节还将讨论在分析动态博弈时,怎样重新解释这种理论。因为在动态博弈中,随着时间的推移,行为具有连续性。

博弈中的行为推理

  一旦我们确定了博弈类型、参与人构成、策略及收益等,便可以尝试探寻参与人的倾向性行为是如何取舍的,即他参与人的策略选择是如何确定的。
  1. 基本假设
  为了使探寻参与人的行为取舍问题易处理,此处需要有一些假设。首先,假设参与人最关心的是自身的最终收益。在图 6.1 描述的“考试—报告”博弈中,这个假设意味着两个参与人都仅仅关心自身平均成绩的最大化。然而,在博弈论框架中,没要求参与者只关心自已。假设存在利他主义者的参与人,则参与人可能不仅关心他/她自己的收益,还会关心其他参与人的收益。如果这样假设,则收益应该可以反映上面的事实。一旦收益情况被确定后,收益会构成一种完整的描述,有关博弈中每个可能结果都能反映参与人的取舍倾向的描述。
  其次,还假设每个参与人对博弈结构具有充分信息。首先,这意味着参与人都知道他/她自身的可能策略集。此处,在不同背景下,假设每个参与人都了解对方是谁(在双人博弈中)、对方的可用策略集以及他/她从任意策略选择中将会获得的收益,似乎也是合理的。在“考试—报告”博弈中,这个假设类似于假设你意识到你和你拍档都面临为复习考试或是准备报告的策略取舍,而且你们对不同行为的预期结果有准确的评估。尽管有这个假设,但是我们注意到有许多关于信息不完整博弈的研究工作。事实上,约翰·豪尔绍尼获得 1994 年诺贝尔经济学奖,就是因为他在不完全信息博弈上的贡献。
 最后,进一步假设每个个体策略的选择都是为了达到自身收益的最大化,假定他/她也知道其他参与人也会选择收益最大化的策略。有关个体行为策略模式,通常被称为是理性化模型,且个体行为模型实际上结合了两种观点。一是每个参与人都想要自已受益的最大化。因为个体收益被定义为是个体最在意的,这种假设看起来合理。二是每个参与人实际上都会选择最优策略。在简单的设置背景下,假设博弈中的参与人都是有经验的,这似乎就更加合理。在复杂博弈中,或者博弈中的参与人是经验比较少的,则确实是不够合理。有关参与人在博弈行为中出错并继续从中学习的思考,也是值得我们感兴趣的关注点。已有大量文献分析了这种性质类型的问题,但我们在此不加以讨论。
  2. “考试—报告”博弈中的行为推理
  通过上例的“考试—报告”博弈,探寻该怎样预测你和你拍档的行为,即预测博弈中参与人的行为。
  我们集中从你的角度加以分析。(对你拍档策略选择的推理是与你的策略选择推理呈对称性,因为从他的角度来说博弈也是一样的。)如果你可以预测你拍档的行为决策,则你的行为决策就容易决定。但是,还是先分析你拍档的每一个可能选择策略下你的反应行为策略吧。

  • 假设你得知拍档将复习考试内容。假设你也复习考试内容,则你的收益得分是 88 分;而假设你准备报告的话,你只能得到 86 分。所以,在这种背景下,你应该采取复习考试内容的策略。
  • 另一方面,假设你得知你拍档将准备报告。那么,假设你也准备报告,则你的收益得分是 90 分。但是,假设你复习考试内容,则收益得分是 92 分。在这种背景下,同样的,你也应该为考试复习。

  这种依次独立讨论你拍档选择策略的思考方法,在上面的情境中证明是一种有效的分析途径。它显示无论你拍档如何选择,你都应该选择为考试而复习。
  当无论其他参与人选择何种行为策略时,都会存在一个决策是最佳选择,则定义这个策略是严格占优策略(strictly dominant strategy)。当任意参与人有一个严格占优策略,则可以预期参与人会确定地选择它。在“考试—报告”博弈中,对你拍档来说,复习考试也是一个严格占优策略(在同样的推理条件下)。所以,可以预期结果将是你们都为考试复习,彼此都将得到 88 分的平均成绩。
  因此,这个博弈的分析过程是非常清晰的。它让我们很容易看到,博弈将会以什么样的预期结果结束。除了这点,还有一个与这结论有关的值得注意的情况,即如果你和你拍档商量好了,两个人都来准备报告,则双方都平均得 90 分。换句话说,双方的收益得分都会更高些。但是,尽管你们都理解这种潜在改进的事实,但这 90 分的收益是不可能在理性博弈中获得的。其中的原因,在前面的推理中已经显示得十分清楚。那就是即使你个人决定去准备报告,并且希望拍档也这么做从而都得到 90 分,可是即使你的拍档知道你在这么做。但他此时有动机去选择复习考试而不配合你来准备报告,因为前者会给他带来更高的收益 92 分。
  这样的结果取决于我们的假设,即个人收益是每个参与人评估博弈结果的唯一指标。对这个例子而言,就是你和你拍档只关心各自平均成绩的最大化。如果你关心你拍档得到成绩,则在这个博弈的收益情况就会不同,博弈结果也会不同。类似地,如果你想到你拍档可能会对你没有共同准备报告而生气,那么这个要素也应作为收益的一部分来考虑,就会再次潜在地影响到结果。但就前面讨论中的收益而言,我们看到了一个不可能通过理性行为博弈取得的更好结果(每人都得到平均 90 分)。
  
  这里的收益全是 0 或者小于 0,因为对于这两个嫌疑犯来说,这是负效益,只是不同程度的坏结果。
  假如嫌疑犯害怕坦白会带来另一个嫌疑犯的威胁报复时,则选择坦白策略不是一个理性的行为,那么这会影响到收益和潜在的结果。

  囚徒因境很好地刻画了有关个体私利前,建立合作是十分困难的模型。同时,在现实生活中,没有什么模型可以像囚徒因境这么简单而精确地刻画这种复杂的情景。所以,在大量不同的现实世界场景中,囚徒因境就长期被用来充当这些场景的途释性框架。
  比如,在专业性运动比赛中,服用兴奋剂也被构建成一种囚徒困境类型的博弈例子。在此,运动员对应参与人,服用兴奋剂与否对应两种可能策略。假设一方服用兴奋剂,然而对手方却没有服用兴奋剂,在比赛中服用方就会取得优势。但是,服用方自身将会遭受长期的伤害(而且,服用行为可能被检测到)。假设在一场比赛中,服用兴奋剂与否是很难被检测到的,进一步假设,相比起赛场得胜的获益情况,运动员认为服用兴奋剂的不利只是一个小因素。用数值来刻画这种收益情况,这里的数值是任意取的,我们只关注他们的相对大小。
  最佳结果(取得收益是 4)是当你的对手没有服用兴奋剂时,你选择了服用兴奋剂,因为这样会使你赢得比赛的机会最大化。但是,两个运动员都服用兴奋剂的收益(此时,收益是 2)却比彼此都不服用兴奋剂的收益(此时收益是 3)低,因为在这两种背景下,参与人彼此间的实力相当。但是在前一种背景下,参与人会对自身造成伤害。从上可知,服用兴奋剂是一个严格占优策略。因此,即使他们都知道对于他们来说,存在服用兴奋剂外的一个更优选择。但是在上述条件作用下,参与人还是会服用兴奋剂。
  一般而言,这种情形通常称为军备竞赛。在这种背景中,竞争双方为保持彼此实力相当,都会选择生产更具危险性武器。在上面提到的例子,兴奋剂就好比使用更具危险性武器。囚徒困境也已被用于在形式上解释敌对国家间的军备竞赛。在此,武器对应于一个国家的军事力量总和。
  事实上,即使是在博弈中出现极小的变化,也会使已有囚徒困境案例博弈变得比较温和。已有囚徒困境案例博弈变得比较温和。例如,回顾“考试—报告”博弈,假设保持其他因素不变,只是让考试更容易些,设任意参与人复习考试,则将会得到 100 分,否则可得到 96 分。因此,形成了新的收益矩阵。
  进而,我们可以考察新收益背景下的博弈行为。此时,准备报告成为严格占优策略。所以,完全可以预测到参与人都会采取准备报告策略,而且彼此都将从该策略选择中获益。前述情形的遗憾之处就会消失。同样,囚徒困境也只是在适当条件(某些特定的收益关系)下才显现出它的精妙之处。

最佳应对与占优策略

  在最佳应对定义中,参与人 1 可能存在不止一个策略,都是策略 T 的最佳应对。于是,很难预测参与人 1 究竟会在多个最佳应对策略中的具体选择。有时需要强调最佳应对的唯一性,即假设 S 会产生比任何和策略 T 相对应的其他策略都较高的收益,则参与人 1 的策略 S 是对于参与人 2 的策略 T 是严格最佳应对。
  在上一节中,我们发现,假设参与人有严格占优策略,则就可以预期他/她会采取该策略。占优策略概念也有小的不足。因为抗衡其他对立策略时,占优策略可能是一组最佳选项。自然地,参与人可能会有多个潜在的占优策略。在这种背景下,具体选择某个占优策略就不易预测。
  囚徒困境分析中,实际上也正是因为参与人彼此有严格占优策略,才会使分析过程简单化。因此很容易推导出可能会发生的策略选择。但是,多数背景不会如此明确。因此,现在有必要注意一些缺乏严格占优策略的博弈。

纳什均衡

  它的基本认识是:即使不存在占优策略,我们也可以通过参与人彼此策略的最佳应对,来预测参与人的策略选择行为。假定参与人 1 选择策略 S,同时参与人 2 选择策略 T。若 S 是 T 的最佳应对,同时 T 是 S 的最佳应对,则称策略组(S,T)是一个纳什均衡。这不是从参与者的理性行为中可以推导出来,这是一种均衡概念。均衡的观点是,假设参与人选择的策略彼此间都是最佳应对,即具有相互一致性。在一组备选策略中,任何参与人都没有激励动机去换一种策略。所以,该系统处于一种均衡的状态中,没有什么力量将它推向不同的行为结果。

多重均衡:协调博弈

  对于只有一个纳什均衡的博弈,比如上节提到的三客户博弈,如下预测每个参与人在均衡中将会采取的策略似乎是合理的:在博弈的其他任意应对方案中,至少存在一个参与人没有采用自己的最佳应对策略。但是,存在一些自然的博弈,可以有一个以上的纳什均衡。在这种背景下,很难预测博弈中理性参与人是怎样行为的。我们这里考虑一些基本的例子中也存在这个问题。

  假设丈夫和妻子想要一起看电影。他们必须在浪漫的喜剧片和动作片之间做出选择,而且也想要协调彼此的选择。但是(浪漫片,浪漫片)均衡给予他们中的一方较高收益,同时(动作片,动作片)均衡则是另一方有较高收益。在性别战中,则很难预测具体哪种均衡将会被采取。

  值得一提的是,在基本协调博弈中的一个最终变化,在近年得到了极大的关注。这个变化就是猎鹿博弈。该名称是在卢梭所写的例子中提到。假设两猎人外出猎物。若他们合作,则可以猎到鹿(这可以给猎者带来最高的收益)。但是猎人要是彼此分开猎物,则彼此只能猎到兔。棘手的问题是,假设一方想单独猎鹿,则他的收益是 0。同时另一方还能猎到免。所以,我们便得到一个博弈模型。猎人是两个参与人。猎鹿和猎免是参与人的两个策略。
  排除这两个参与人不合作的情况,该例子十分类似于不平衡协调博弈。尝试获得较高收益结果的一方比起尝试获得较低收益结果的另外一方,会受到更大的惩罚。(实际上,尝试获得较低收益的一方根本不会受到惩罚。)结果,在推理何种均衡会被选择时,就是要在获得高收益和由于另一方不合作造成损失之间进行权衡。
  有些人认为猎鹿博弈中也体现了囚徒困境博弈中的一些挑战。这两个博弈的结构显然是不同的(因为囚徒困境存在严格占优策略)。然而,这两个例子有一个共性,即若参与人彼此合作,则都将从中受益。但是,如果一方采取合作行为而另一方却不合作,则会遭受损失。当然,在这两种博弈类型中,还存在另一种途径来透视其相似性。假设我们回到最初的“考试—报告”博弈并对其稍加改变,假设除参与人双方为了有机会获得更好的成绩且都需要准备报告有变动外,其他收益结果保持与第 6.1 节保持一致。也就是,假设参与人双方都准备报告,彼此都在报告中的收益得分是 100,但是假设参与人中至多有一人准备报告,则彼此的收益得分是 84 分。此时,我们得到一个十分类似于猎鹿博弈的结构,即在策略组(报告,报告)或者(考试,考试)的协调都会达到均衡。但是,假设一方试图依据较高收益的均衡行为时,则这方可能事与愿违地得到较低成绩,因为另一方可能选择复习考试的策略。

多重均衡:鹰鸽博弈

  假设两只动物要决定一块食物在彼此之间如何分配。每种动物都可以选择争夺行为(鹰派策略)或分享性行为(鸽派策略)。若两种动物都选择分享性行为,他们将会均匀的分配食物,各自的收益是 3。若一方行为表现为争夺性,另一方行为表现是分享性,则争夺方会得到大多数食物,获得收益是 5,分享方只能得到收益为 1。但是,当两只动物都表现为争夺性行为,由于在争夺中践踏了食物(甚至会彼此伤害),则它们得到的收益将为 0。
  鹰鸽博弈在很多背景中被研究。比如,用两个国家替代两种动物,进一步假设这两个国家将在外交上同时选择是争夺型或是分享型。每个国家都希望通过争夺型外交提高国际声望。但是,假设两国都采取争夺型外交,最终可能导致彼此间发生战争危险。而战争对两国来说都是灾难性的。所以,在均衡状态,我们预期一方将会表现出争夺性行为,另一方则表现出分享型行为。但是,我们无法预测哪一方将会采取何种策略。为了了解均衡状态如何在两国间达到,我们再次需要了解更多有关两国的信息。
  在该类型的博弈中,存在两个均衡。事实上,参与人中的一方必须表现为分享型行为。同时,另一方则取得更高收益。假设参与人都尝试避免成为分享型一方,则彼此的最终收益是非常低的。但是,还是无法从这种博弈的结构中预测,哪方将会单独扮演该分享型角色。

混合策略

  硬币配对是一类简单的攻防博弈。它可如下描述。两个参与人各持一枚硬币,同时选择显示彼此手中硬币的正反面。正面记为(H),反面记为(T)。假如他们硬币的朝向相同,参与人 2 将赢得参与人 1 的硬币。反之,则参与人将赢得参与人 2 的硬币。
  硬币配对是大量有趣博弈类型中的简单一例。在每个结果中,参与人的总收益是 0。此类博弈被称为“零和博弈”。大量攻防博弈,或其他一般性存在参与人的利益是直接对立的博弈,都拥有这个结构。实际上类似硬币配对的博弈,常被比喻为战争中的决策。例如,欧洲 1944 年 6 月 6 日的盟军登陆——二战关键性的时刻之一,它涉及盟军的一项决策,即跨过英吉利海峡后在诺曼底或是在加莱登陆。决策还受到德国军方相关策略的影响,即德军在诺曼底或是在加莱大规模设防也会影响到盟军决策。这个拥有攻防博弈结构的例子,也非常类似于硬币配对博弈。
  在硬币配对博弈中,首先应注意到:不存在一组策略彼此是最佳应对。
  这意味着,假设我们仅认为参与人彼此仅有两个策略 H 和 T,则该博弃不存在纳什均衡。如果我们考虑硬币配对是怎样运行,这也毫无奇怪。纳什均衡要求,即使给定有关彼此策略的充分信息,参与人也没有动机改变一个可替代性的策略,即在纳什均衡中,参与人具有相互一致性,这体现在信念和行动上。但在硬币配对中,假如参与人 1 知道参与人 2 将选择特定的 H 或 T,则参与人 1 可以通过选择对方策略的对立策略来获得收益 +1。类似的推理也可把握参与人 2 的行为。
  当我们在直观上思考该类型的博奔是如何在真实生活中演绎时,所看到的将是,参与人通常会试图迷惑对手,让对手难以预测他们将有什么策略行为。它暗示着,在类似硬币配对的博弃模型中,我们不应只把策略当成是简单的 H 或 T,还应注意到参与人在 H 和 T 选择中行为的随机性。
  实际上每个参与人都不是直接选择 H 或 T,参与人选择依据的是概率,即概率表示她选择策略的机会大小。
  有两人在一起玩硬币配对游戏,他们都决定依据概率 p 和 g 随机地选择自己的行为。如果参与人 1 认定参与人 2 会在多于一半的时间里选择 H,则她一定会选择策略 T。可在这种情况下,参与人 2 选择策略 H 的次数不应该多于一半。对称的推理过程适用于当参与人 1 认为参与人 2 会在多于一半的时间里选择策略 T 的情形。无论是何种情况,我们均不能得到一个纳什均衡。所以关键的问题是,当参与人 2 的选择策略概率 q=1/2 时,参与人 1 的策略 H 及 T 是无所谓的:参与人 1 的策略 q=1/2 在效果上是“无利可图”策略。实际上,这便是在引入随机化时的最初直觉:每个参与人都想要对对方隐藏自己的行为,所以,他们各自的行为很难被对方得知。当然,应注意到概率都为 1/2 的策略,事实上是硬币配对的高度对称结构的结果。正如我们将在下一节的例子中看到:当收益是非对称时,纳什均衡也可以由非等同的概率策略组成。

帕累托最优与社会最优

  在一个纳什均衡中,每个参与人的策略都是彼此策略间互为最佳应对。换句话说,参与人都实现个体最优。但是,这并不意味着群体最优。
  帕累托最优:“一组策略选择”指的是每个参与者从一个策略集中选择了一个策略。那么,若不存在其他策略选择使所有参与者得到至少和目前一样高的回报,且至少有一个参与者会得到严格较高的回报,一组策略选择被称为帕累托最优。
  社会最优:一组策略选择是社会福利最大化(或社会最优),若它使参与者的回报之和最大。

第 7 章 进化博弈论

  博弈论的一个关键问题在于推理参与者在博弈中的行为。
  演化生物学是基于这样的理念:生物体的遗传基因在很大程度上决定了它的外部特征,因而决定了它是否能够适应给定的环境。适应性强的生物体往往会繁衍更多的后代,于是使得适应性强的基因在总体中的代表增加。依这种方式,适应性较强的基因倾向于长久生存,因为它们提供了较高的繁衍率。
  进化博弈论的关键思想是:许多行为涉及总体中多种生物体的互动,因而任何生物体的成功取决于它和其他生物体间是如何互动的。所以,生物体的适应力无法在孤立状态下得到测量。相反,它必须在其赖以生存的整体环境中被评估。这种思路引出了理论性博弈的一种自然类比:由基因决定的生物特征和行为可类比作博弈中的策略,生物的适应力类比为它的收益,并且它的收益取决于它与之互动的生物的策略(特征)。这种关联是相当深刻的:诸如均衡这样的理论性博弈观念,可以很好地用于预测总体演化的结果。

  纳什均衡概念的核心在于推理博弈的结果。在双人博弈的纳什均衡中,两个参与人都没有改变他们策略的动机。均衡是参与人的一种策略选择,一旦选择后,便不会轻易改变。在进化情境中,与之类似的概念便是进化稳定策略(evolutionarily stable strategy)——一种由基因决定的策略,一旦在一个种群中盛行,则倾向于保持下去。

  树木间的高度也被认为是遵循囚徒困境收益原则。若两棵相邻的树都长得矮,则它们均等地分享阳光。如果这两棵树都长得很高,它们也会均等分享阳光,但在这种情况下,由于在高度的增长中会消耗一定的资源,两棵树的收益都会较低。问题在于,当这两棵树是一高一低时,较高的树会获得绝大多数的阳光。毫无疑问,真实的情境比这要复杂。因为,树的基因会导致树的各种不同高度,所以,也就会有各种不同的策略(而不是仅仅归纳为矮小和高大)。在这种连续变化中,囚徒困境的收益情况有明显的局限性。它只能应用于有关树高度的某个范围。当树的高度超过这一范围时,进一步的高度增加则不再对应原收益结构,因为额外的阳光收益更多地被支撑巨大的高度所引起的适应性下滑所抵消。
  类似的竞争还发生在植物的根系部分。如果你在一个装满土壤的大罐中种植两棵大豆,这两棵大豆种植在大罐的相对两侧,则大豆的根系统在肥沃的土壤中将会飞快生长。当各自的根系统试图索取更多的养分时,最终这两个根系统会发生纠缠。这样做,使得它们能够均分土壤中的养分资源。现在,假设你人为地在大罐中间插入隔绝体,使得两边土壤的数量相等,结果是这两棵大豆的根系严格分布在隔绝体的两侧。它们各自仍从土壤中获得一半的养分资源,但在根系生长过程中它们各自投入的能量减少了,结果便是各自通过种子的生产获得了更大的繁殖成功。

  这个观察对以下这个有关根系统的简单进化博弈有所影响。假设大罐中间不设一个隔绝体,供大豆选择的根系统发展的可行策略有两种。一是保守,代表植物的根部增长仅在自己的土壤份额内进行。二是开拓,代表植物根部生长到它们所能达到的任何位置。这样,我们再次看到“体态大小”博弈的类似情境与收益,以及相同的结论:植物最好都选择保守策略,这样会得到较好的收益,但只有开拓策略是进化稳定的。

  人们发现病毒族群也表现出一种进化博弈的现象。噬菌体 Φ6 病毒感染细胞,而且通过自我复制进行繁殖。这类病毒的一种基因变异体称为噬菌体 ΦH2。噬菌体 ΦH2 具有这样的特征属性:它自身繁殖的该类病毒较少,但是它可以寄生于其他细胞来进行繁殖。这个过程不需要消耗病毒自身的能量。而且,ΦH2 能够利用 Φ6 的化学产物,于是当病毒噬菌体 Φ6 存在时,噬菌体 ΦH2 在适应性方面便有一个明显优势。结果便是产生了囚徒困境博弈的结构:病毒有两个进化性策略 Φ6 和 ΦH2;在一个纯 Φ6 族群中,所有的病毒行为收益会优于纯 ΦH2 族群的病毒;但是,无论其他病毒如何行为,当你(作为一个病毒)选择 ΦH2 策略时,则你的收益会更好。这样,只有 ΦH2 是进化稳定的。

第 8 章 网络流量的博弈论模型

  不论是在一个交通运输网络中行驶还是通过互联网传送数据包,都会涉及博弈论推理:每个人都需要根据自己或他人的选路决策评估多条路线作出最终选择,而不是随便挑选一条路线。在本章中,我们将利用博弈论的思想构建网络流量模型。这个过程中,我们会发现一个非常意外的结果一布雷斯悖论的观点表明,增加网络容量有时反而会减慢网络流通的速度。

  交通流量模型中参与者相当于司机(以上例子中大概有 4000 人),每个参与者可能的策略是由 A 到 B 的可能路线。这个例子中,每个参与者只有两个策略;而在更大的网络中,每个参与者可选择的策略有很多,每个参与者得到的回报就是他/她行程时间的负数(之所以使用负数是因为较多的行程时间意味着比较糟糕)。
  在这个流量博弈中,通常是没有占优策略。举例来讲,在图 8.1 中,每条路线都有可能成为参与者最好的选择,前提是其他参与者会选择另一条路线。这个博弈存在纳什均衡,正如我们将要讨论的,任何一组策略一如果司机能均等地选择两条路线(每条路 2000 辆车),都能够形成纳什均衡,并且这是形成纳什均衡的唯一条件。
  为什么车辆在两条路线上等分会产生一个纳什均衡,并且为什么所有的纳什均衡都有这种等分的特性?要回答第一个问题,我们观察到当两条路线等分车辆时,没有司机会有动机想要换到另外一条路线。而第二个问题,考虑一组策略,其中 x 辆车使用上面的路线,剩余的 4000-x 辆车使用下面的路线。如果 x 不等于 2000,两条路线就会有不同的行驶时间,那么在较慢路线上行驶的司机都会有动机想要换到更快的路线上去。因此,任何 x≠2000 的策略组合都不能形成纳什均衡,而任何 x=2000 的策略组合都形成一个纳什均衡。

  一切都运作得很好:每个司机自我利益占优的行为造成他们在均衡状态下能在可选的路线中完美地平衡。但是,仅仅对网络做一个小改变,就会形成一个有悖常理的状态。
  我们做如下改变:假设市政府计划从 C 到 D 新建一条高速公路,如图 8.2 所示。为了使事情简单化,设它的行程时间为 0,不管有多少辆车在此路线上都一样,尽管由此产生的效果有别于实际情况(但影响应该很少)。按常理推断 C 到 D 的路建成后,A 到 B 的运行时间会减少很多。
  实际结果令人吃惊:在这个新的高速网络中存在一个唯的纳什均衡,但是它导致大家花费更多的行驶时间。均衡状态下,每个司机都使用从 C 到 D 的路线,结果每个司机需要的行驶时间为 80(4000/100+0+4000/100=80)。进一步分析为什么这是一个均衡,注意到此时没有司机能从改变路线中受益:有了从 C 到 D 的路线后,其他任何一条路线都需花费 85 分钟。那么为什么说这是唯一的均衡?可以看到,从 C 到 D 路线的建立事实上使此路线成为所有司机的占优策略:不管当前的流量模式是什么,换到从 C 到 D 的路线都会受益。
  换句话说,一旦由 C 到 D 的高速路建成,此路线就像一个漩祸,将所有司机都吸引至此,这对所有人都有害。在新的网络中,如果所有司机的行为都是自我利益占优,就没有办法使网络恢复到一个对大家都更好的等分情况。
  这种现象,即一个运输网络增加新的资源有时反而使均衡状态中的性能受损,最早布雷斯在 1968 年就已提出,随后被称为布雷斯悖论。就像很多有悖常理的异常现象,它们的出现是基于实际生活中各种条件的恰当结合。在实际的运输网络中也曾经被观察到,韩国首尔市曾拆毁一条有 6 条行车道的高速路而改建成一个公园,实际上反而减少了出入该城市的交通时间(尽管交通量跟改建之前大致相似)。

  了解到布雷斯悖论的影响方式,值得注意的是它本身并没有自相矛盾。在很多设置环境中,给一个博弈增加一个新策略会使情况变得更糟。比如,第 6 章提到的囚犯困境可用来解释这个观点:假如对每个囚徒来说,他们唯一的策略是“不认罪”(一个非常简单的博弈),那么对双方来说其结果要好于加入“认罪”这项选择(这就是为什么警方会首先提供“认罪”这个选择)。

第 9 章 拍卖

拍卖的类型

  (1)增价拍卖:增价拍卖又称英式拍卖。这种拍卖是实时互动的,竞拍者或身在现场或通过电子设备实时参加。卖方逐渐提高售价,竞拍者不断退出,直到只剩下一位买家,这个买家以最终价赢得商品。由竞拍者口头叫价,或电子设备提交价格都属于增价拍卖的方式。
  (2)降价拍卖:降价拍卖又称荷兰式拍卖。这也是一种实时互动拍卖形式,卖方从最高价起逐步降价直到第一个竞拍者接受并支付当前价格。这种拍卖被称为荷兰式拍卖是因为在荷兰鲜花一直是以这种方式拍卖。
  (3)首价密封投标拍卖:这种拍卖中,竞拍者同时向卖方提交密封报价。这个术语源于这种拍卖的原始形式,报价密封在信封里提交给卖方,卖方同时打开这些报价。出价最高者以其出价赢得商品。
  (4)次价密封投标拍卖:竞拍者同时向卖方提交密封报价;出价最高者赢得商品但以第二高出价购买该商品。
  首价和次价密封投标拍卖相比,似乎是卖方采用首价密封投标拍卖形式会获得更高的收入:毕竟他将获得最高的而不是次高的竞标价。在次价拍卖中,卖方似乎是有意少收竞拍者的钱,这看起来很奇怪。这种推理实际上忽视了我们从博弈论中得到的一个主要信息——当你设定支配人们行为的规则时,必须承认人们会在这些规则中调整他们的行为。这里的关键是首价拍卖中的竞拍者出价往往要低于次价拍卖的出价,事实上这个降低的部分可以理解成是两种拍卖中获胜竞标价之间差异的补偿。这种思想也是本章后面一些观点的基础。

次价拍卖

  密封投标次价拍卖被广泛应用在不同的领域中。eBay 使用的拍卖形式本质上就是次价拍卖。搜索引擎出售关键字广告使用的价格机制是次价拍卖的一种扩展形式,第 15 章将讨论相关内容。拍卖理论中最重要的成果之一是:在次价密封投标拍卖中,竞标者提交独立的私密的竞标价,此时提交真实估值是一个占优的策略,即对于竞标者来说,最好的选择是竞标价恰好是他认为商品所值的价值。
  次价拍卖中,竞拍价只能决定能否获胜,而不能决定获胜后所支付的价格。因此,在改变出价时需要考虑到这个事实。

首价拍卖和其他拍卖形式

  现在回到首价拍卖,我们会发现情况要复杂得多,每个竞拍者必须推测其他竞争者的行为以便做出最佳出价。
  在密封投标首价拍卖中,出价不仅关系到竞拍者是否会获胜,还会影响获胜者所支付的价格。
  将首价拍卖设置成一场博弈。同样,竞拍者是博弈的参与者,每个竞拍者的策略就是其真实估值的一个函数。设竞拍者 i 的真实估值为 vi,出价为 bi,相应的回报定义如下:

  如果 bi 不是中标价,那么 i 的回报为 0。如果 bi 是中标价,那么 i 的回报为 vi-bi。

  以真实估值出价不再是一个占优策略。如果以真实估值出价没有获胜,那么得到的回报为 0(和前面一样),而如果获胜,回报仍然为 0,因为获胜者所支付的恰好是他认为商品所值的价值。
  因此,首价拍卖中最好的出价方式是稍微降低出价,这样如果获胜就会得到一个正值回报。具体降低多少取决于两种对立力量之间的权衡。如果出价离真实估值太过接近,则获胜后的回报也不会太大。但如是出价低于真实估值较多,以便获胜时能得到较高的回报,同时又减少了成为最高出价的机会,也就是在拍卖中获胜的机会。

  全支付拍卖:每个竞拍者提交出价;出价最高者获得商品;无论输赢,所有的竞拍者都得支付他们的出价。回报如下所述:

  如果 bi 不是中标价,则 i 的回报为 -bi。假如 bi 是中标价,则 i 的回报为 vi-bi。

  产生上述回报的博弈在很多情景中都会有,此时“投标”的概念比较模糊。政治游说是一个例子:每个党派都必须在游说上花费金钱,但是只有赢的一方才能获得此项花费的价值收益。虽然不是在游说花费多的一方总赢,在游说上花费的钱数和拍卖的出价之间有一个清晰的类比,即无论参与者输赢与否,必须全部支付他们的出价。类似的情况还有建筑设计竞赛,所有竞争的公司在起初设计上都花费金钱以试图赢得客户的合同。在客户做决定之前,这笔钱必须花费。
  在一个全支付拍卖中确定一个最优出价与首价拍卖的推理有很多相似之处:一般会以低于真实估值的价格出价,但必须在出价过高(提升你赢的可能)和过低(输的话可以减少花费,赢的话提高回报)间平衡好。通常来说,每个人都必须支付的拍卖意味着出价会大大低于首价拍卖的出价。首价拍卖中的最优出价原则也同样适用于全支付拍卖,在 9.7 节我们将证明这一点。

共同价值和赢家的诅咒

  到目前为止,我们都是假定竞拍者对拍卖商品的估值是独立的:每个竞拍者都知道本人对商品的估值,这与其他人对商品的估值无关。这在很多情景下都讲得通,但很明显这不适用于竞拍者有意再次卖出商品的情况。在这种情况下,商品有一个共同的最终价值再次销售的出售价——但它未必是已知的。每个竞拍者 i 对共同价值可能有些个人的信息,导致一个估计 vi。每个竞拍者的估值会有些偏差,通常这些估值不是相互独立的。一个模型就是设真实价值为 v,而每个竞拍者 i 的估值为 vi 可定义为 vi=v+xi,xi 只是一个随机的数字,均值为 0,代表 i 估算的偏差。
  有共同价值的拍卖介绍了一种新的复杂情况。让我们来假定一个有共同价值的商品通过次价拍卖卖出。竞拍者 i 以 vi 出价还是一个优势策略吗?事实上不是。为了了解为什么,我们可以利用模型 v+xi:。假设有很多竞拍者,每一个都以他的真实估值来出价。那么这个拍卖的结果就是,赢家不仅能获得商品,还能了解关于真实估值的信息一即其估值为最高。因此,很可能是一个过高的估值。不仅如此,第二高出价——即他所支付的价格——也可能是一个过高估值。结果是在再次销售中,相对于所支付的金额他可能会有损失。
  这就是赢家的诅咒。公司对有着共同价值的大片土地开采权进行竞拍,这个共同价值等同于在土地上获得的石油的价值。棒球运动中自由球员签署职业合同也涉及赢家的诅咒——未知的共同价值对应于所募招的棒球队员未来的表现。
  理性的竞拍者都会把赢家的诅咒考虑在内决定其出价:竞拍者应该基于个人估算 vi 和出价能否获胜来确定自己的最佳出价,在最佳出价上,赢要比输好。这就意味着在一个共同价值拍卖中,尽管次价形式被使用,竞拍者还是会把他们的出价减少些;而当使用首价拍卖时,出价会降低得更多。由于决定最优出价的过程是很复杂的,此处我们就不赘述。值得注意的是实际中赢家的诅咒也会直接对赢者造成损失,因为在许多竞拍者的竞拍中,犯错并出价过高者往往是竞拍的赢家。

第三部分 网络中的市场与策略性互动

第 10 章 匹配市场

二部图与完美匹配

  假设大学宿舍管理员要为每个新学年返校的学生分配房间;每个房间一个学生,而学校要求每个学生都列出自己能够接受的房间选项清单。学生们对房间可以有不同的喜好,如更大、更安静或阳光更好等,这样,如果有许多学生,他们的清单就会以复杂的方式重合。

二部图

  可以用二部图来表示学生们的清单。每个学生以一个节点代表,每个房间也以节点代表,如果某学生把某个房间列在他的清单上,就有一条线把该学生和房间连起来。图 10.1 代表了 5 个学生和 5 个房间的例子(其中指出,名叫维克兰的学生列出了 1、2、3 号房间,而名叫温蒂的学生只列出了 1 号房间)。

完美匹配

  回到大学宿舍管理员的任务上来:给每个学生分配一间他们愿意接受的房间。这个任务可以很自然地通过以上所画的图来解释:由于边代表学生愿意接受的房间,我们想要给每个学生分配一个房间,所以每个学生要安排到一个与他有边相连的房间。图 10.1(b) 用粗线边显示出每个学生分配到的房间。
  称下面的安排为一个完美匹配(perfect matching)。
  当二部图的两边有数目相同的节点,一个完美匹配就是左右节点的配对:
  (1)每个节点都有边连接到另外一列的节点。
  (2)不会出现左边两个节,点同时连到右边同一个节点上。
  如图 10.1(b) 所示,也可以从边的角度来考量完美匹配,即一个完美匹配就是二部图中的一组边,图中的每个节点恰好是一条边的端点。

受限组

  为说明二部图中有一个完美匹配,指出有关边的集合就足够了。但如果一个二部图没有完美匹配呢?如何断言一个二部图中不存在任何完美匹配?
  乍看上去这并不明显,人们很自然想到一种方法是把所有可能性都试一遍,最后表明不可能配对成功。但事实上基于图 10.2 的逻辑有一种简便的方式证明不存在完美匹配。在图 10.2 里,维克兰、温蒂和鑫三个人一共只提供了两个可被接受的选项,即三个人只有两个喜爱的房间,因此不能形成一个完美匹配——他们之一必然要被分到一个不喜欢的房间了。
  将这三个学生形成的节点组称为“受限组”,原因是连接他们和二部图另一组节点的边限制了完美匹配的形成。这个例子指出了一个普遍的现象,可以通过对受限组的定义来加以明确。首先,取二部图右边任何一组节点 S,将左边通过边与其相连的节点称为 S 的邻居,用 N(S) 表示所有 S 邻居的集合。最后,如果 S 比 N(S) 的数量大一也就是说,S 比 N(S) 包含更多的节点,那么右边的 S 就受限制。
  不论任何时候,一幅二部图中出现一组受限集合 S,即表示不可能有完美匹配:S 中的每个节点都要匹配到 N(S) 中的一个节点,但 S 中所含节点比 N(S) 中多,所以不可行。
  很容易看到受限组阻碍了完美匹配的形成。同时,尽管不那么明显,但事实上受限组也是完美匹配的唯一阻碍。这就是被称为匹配定理(Matching Theorem)的要点。
  匹配定理:如果一个两边节,点相等的二部图无法形成完美匹配,那么它一定包含一个受限组。
  如果没有这一定理,人们可能认为一幅无法形成完美匹配的二部图会有多种原因,有些甚至复杂得难以解释;但这一理论以简洁的方式说明了受限组事实上是完美匹配的唯一阻碍。
  现在运用学生和宿舍的例子来思考匹配定理。当学生提交了他们可接受的房间清单后,宿舍管理员很容易向学生解释安排的结果。他或者可以宣布一个完美匹配,每个学生得到自己喜爱的房间,或者他可以指出一组学生提供的选择范围太小,从而无法进行分配。这样一组学生就是受限组。

估值与最优分配

  前面所讲的二部图匹配问题说明了简单市场形式中的一个方面:个体以可接受的选项方式表达他们对某些对象的偏好;一个完美匹配体现了满足他们偏好的对象的分配方案;而如果不存在完美匹配,侧是因为系统中包含“限制”的阻碍。
  下面来更加深入地讨论二部图匹配市场的问题。首先,允许每个人表达偏好时不是用二元方式表达“接受”或“不接受”,而是以数值来表示他们对每个对象的喜爱程度。对前面 10.1 节中学生和宿舍的例子而言,就是让每个学生对每个房间给一个数值评价来表明他们对房间的满意程度,而不是仅给出一张可接受的房间清单。图 10.3(a) 是三个学生和三个房间的例子,例如鑫对于 1、2、3 号房间的估值分别为 12、2 和 4(而尤兰对 1、2、3 号房间的估值分别为 8、7 和 6)。注意学生们对于每个房间的评价可能存在异议。

  在一组个体对一组对象进行估值的场合,可以定义一种量,来评估将那些对象分配给不同个体的方案的质量,比如:可以定义分配方案的质量等于每个人所得到的对象估值的总和。这样,图 10.3 中展示出分配结果的质量为 12+6+5=23。
  如果宿舍管理员知道每个学生对每个房间的评价数值,那么一个合理分配房间的办法就是寻求达到尽可能高的分配方案质量。我们将之称为最优分配,因为这种方法使得每个人的开心程度之和最高。在图 10.3 中可以看到那是一个最优分配方案。当然,虽然最优分配提高了总的满意程度,它并不能保证给每个人最想要的房间。比如在图 10.3(b) 中,所有学生都认为 1 号房间最好,但只有一个学生能得到它。
  具体来说,寻求最优分配的问题有时也对应 10.1 节中二部图匹配的问题。特别是,可以看到二部图匹配问题是最优分配问题的一个特例。下面阐述原因。在 10.1 节中谈到的学生和房间数目相等,每个学生提交一份可接受的房间清单,而不提供数字估值,这样便形成一个如图 10.4(a) 所示的二部图,我们想要知道其中是否包含完美分配。这个问题也可以用估值和最优分配的观点来表达。对于学生接受的每个房间,我们将其估值定为 1,而对于他们没看上的房间,我们将其估值定为 0,将这个原则应用于图 10.4(a),就得到图 10.4(b)。现在,当我们能给每个学生提供他认为是 1 而不是 0 的房间时就产生了完美匹配,即最优分配的质量(价值)和学生数一致。这个简单例子说明了二部图匹配问题如何隐含在寻找最优分配问题之中。

价格与市场清仓性质

  至此,我们一直在用一种比喻,即“一个管理员”通过对每个人送来的数据进行中央计算,来得到完美匹配,或最优分配。虽然有很多类似市场的行为是以这种方式来进行的(如学生和宿舍的问题),但更标准的市场情景是没有如此强的中央协调,每个个人只是在商品的价格和他对其估值的基础上来做出决定。
  对此情况的把握是我们对市场匹配问题形式化的重要一步,即理解价格如何在非集中式的市场活动中发挥作用。我们会看到如果以某产品的定价策略来代替一个中央管理员,让个体根据他们对产品的评估寻求最佳个人利益,这样也能产生最优分配。

第 11 章 具有中介的市场网络模型

市场中的定价

  我们的网络模型以在讨论股市中见到的三个认识为基础,即买方和卖方通常经中介进行交易,买方和卖方不是都能用到相同的中介,不是所有买方和卖方都在相同的价格上交易。相反,每个买方和卖方对价格的掌控,部分是由他们在网络中的位置体现的可能性所决定的。

交易网络中的均衡

  在我们的模型中,如果买方和卖方只能接触一个经纪人,则称他们被垄断。最简单的例子如图 11.6 所示,有一个卖方、一个经纪人和一个买方,其中的卖方对商品的估值为 0,买方对商品的估值为 1。
  在这个商业网络中,经纪人处于垄断地位,买方和卖方只有通过他才能交易。唯一的均衡就是经纪人给卖方报出价 0,给买方报要价 1;他们俩接受报价,从而商品从卖方流动到买方。注意,这里也利用了买方和卖方的无所谓态度:由于他们无所谓是否参与交易,我们作为建模者此时选择了他们进行交易的结果。
  为什么这是唯一的均衡?因为对任何其他的 0 和 1 之间的出价和报价,经纪人都可以稍微降低出价,提高报价,从而实现更高利润的交易。

  当我们看到一个买方或卖方连接到唯一的经纪人,他们在任何均衡中得到的都是 0 回报,因为经纪人会将报价尽量推向极端。另一方面,当两个经纪人连接到同样的买方和卖方,他们谁也不可能在将商品从卖方转手到买方的过程中得到正的利润:如果一个经纪人在生意中要得到正利润,另一个就有机会切入进来,抢得那生意。

第 12 章 网络中的议价与权力

  在某些情况下,关系中的这种不平衡可能完全是由于两人个性的结果。但在另一些情形,则可能是两人所在其中的大型社会网络的作用,即一个人在关系中更有权力,是因为他在社会网络中占据了支配性的位置,使得他除这个关系之外有更多的社会性机会。在后面这种情形,关系中的不平衡可以归结到网络结构,超出了所涉及双方的个人特质。

  终极博弈也是涉及两个人要分配一美元的问题,但遵循的过程非常不同。
  (1)首先让 A 提出一个分配一美元的方案,多少给 B,多少自己留下。
  (2)B 有两个选择,要么接受,要么拒绝。
  (3)如果 B 接受了 A 的方案,各得其所;若 B 拒绝了,两人都得不到任何东西。
  此外,假设 A 和 B 通过即时消息联系,实验人员告知他们,他们以前从来没见过,并且今后很可能也不会再见面。就是说,这是一个一次性互动。
  首先,假设两人都希望最大化自己所得,他们该如何表现?这个并不难。先看 B 该如何。如果 A 提出的方案多少给了 B 一些,那么 B 的选择就是在得到那些(接受 A 的建议)和什么都得不到(拒绝建议)之间。因而,B 应该接受任何非零的安排。
  给定这就是 B 的行为准则了,A 该怎么办?由于 B 会接受任何不为零的安排,A 应该给 B 一点点,而自己尽量多得些。这样,A 应该建议他自己留 $0.99,让 B 得 $0.01,知道 B 会接受这个分配。或者,A 可能建议他自己留 $1.00,让 B 得 $0.00,因为此时 B 无所谓,A 就算冒一下风险。但在我们的讨论中,假设给 B 留一美分的方案。
  这就是对人们纯粹只考虑金钱多少,在权力极端不平衡情形下的行为的预测:具有绝对权力的那一位(A)将尽量克扣,几乎没权力的则会接受哪怕是一点点份额。直觉上,以及实验结果,都显示这不是人类的典型行为方式。
  1982 年,古斯、斯米特博格和施瓦茨做了一系列颇有影响的实验,研究人们实际上会怎么玩这个游戏。他们发现,扮演 A 的人倾向于给出相当平衡的分配,平均约三分之一给 B,而且相当一部分人事实上给出一半。此外,他们还发现扮演角色 B 的人常常会拒绝非常不平衡的分配提议。
  跟着有大量的工作都发现这种现象相当普遍,即使所涉及的钱数很大。这类实验也在不同的国家做过,倾向于相对平衡分配的情形是一致的,但我们也看到不同的文化背景带来的有趣差异。
  能用前面学过的博弈论框架来解释在终极博弈情形这种倾向于相对平衡的结果吗?事实上,可有多种方式。最自然地,可能是要记住我们在博弈论中定义回报时讨论的基本原理:一个参与者的回报应该反映他对给定结果的完整评估。因此,对于参与者 B 评估她只得到总数的 10% 从而决定放弃这个结果的情形,一个解释是因为感到不公平而产生的明显负面情绪回报,于是当我们考虑 B 对于各种可能的完整评估时,就能想到 B 会觉得拒绝很低的分配而感觉好,要比接受那种分配而感觉受欺侮的总体价值更高。此外,由于扮演角色 A 的人们理解这可能是 B 在这种情况下的态度,他们也就倾向于给出相对平衡的分配以避免拒绝,因为拒绝意味着 A 也是什么都得不到。
  当然,如果你在终极博弈中的角色是 A,对手 B 是一个以金钱最大化为目标的机器人,你应该给它越少越好。这一系列实验所表明的是,严格的金钱最大化原则不适合用来建立真人感受的回报模型。而且,即使是机器人,如果你给它在感觉受到欺侮后反抗的指令,它也会拒绝很低的分配份额。

第四部分 信息网络与万维网

第 13 章 万维网结构

  维基百科中一些与博弈论相关的文章通过交叉参考指针联系起来。例如,可以看到最初从一篇关于纳什均衡(NashEquilibrium)的文章,通过交叉参考导向,最终连接到关于美国国家航空航天局(NASA)的文章,中间经过介绍约翰·纳什(JohnNash,纳什均衡的创造者)的文章、影片《美丽的心灵》(影片记录了约翰·纳什的生平)、罗恩·霍华德(RonHoward,影片《美丽的心灵》的导演)、影片《阿波罗13》(由罗恩·霍华德执导的另一部影片),最后是关于美国宇航局的文章(NASA 负责实施阿波罗 13 号航天任务)。简言之,纳什均衡理论由某人发明,一个导演以该发明者的生平为主题拍了一部电影,这个导演还拍了另外一部关于 NASA 的电影。除了这条从纳什均衡理论到 NASA 的文章链,图 13.4 的交叉参考结构还提供了另一条短链,从约翰·纳什到他曾经工作过的美国兰德公司(RAND),像 NASA 一样,兰德公司常成为一些阴谋论讨论的对象。看似彼此不相关的概念通过短路径联系起来,这种现象类似于在第 2 章讨论社会网络时提到的“六度分隔”现象,短路径将相隔遥远的人联系起来。
  事实上,通过交叉参考链浏览不同的专题能很好地迎合人们自由联想的意识流方式。例如,你刚刚在读一本关于纳什均衡的书,在回家的路上很自然地联想起书中的内容,可能你的思想会不经意地突然转到 NASA。反思一下为什么会这样?在你的大脑中也有一幅自由联想链,将一些彼此相关的概念联系起来。这启发人们开始研究另一种信息网络:语义网络,其中节点代表概念,边表示概念之间存在的某种逻辑或感知关系。研究人员利用词汇关联研究方面的技术(如“当提到词‘冷’时,你会想到什么?”)探索人类大脑中隐含的语义网络结构。
  传统的信息存储方式如书籍、图书馆或计算机内存都是高度线性的,即这些存储方式依赖于某种排列顺序来组织信息。而人类的思维意识是以一种关联记忆的方式展开,正如我们提到的语义网络——人们在思考一件事时,会联想到其他的事;读一部小说时,会产生一些新的思想。

第 14 章 链接分析和网络搜索

  这类问题在传统的信息检索系统中同样存在,只是对于网络搜索显得更为严重,而网络搜索还引发了一些新的问题。首先,万维网中的内容具有动态变化的特性 。2001 年 9 月 11 日,“911”事发当天,许多人用谷歌搜索“世贸中心”,试图查询与 “911”事件相关的信息,结果没能查到相匹配的内容,因为当时谷歌搜索模型是基于定期收集的网页而建立索引结构,因此搜索结果都是几天或几周前收集到的网页,排在最前的几个结果大都是描述世贸中心本身建筑的网页,而不是关于 “911”事件的。为了提供这种搜索服务,谷歌及其他主要的搜索引擎开始提供专门的“新闻搜索”功能,实时地从相对稳定的新闻发源地收集新闻稿件,以便更及时地响应有关新闻报道的查询。目前,搜索引擎并没有完全将这种新闻搜索功能集成到其核心部分,因此便新兴起了像 Twitter 这样的网站,集静态内容和实时新闻内容于一身,来填补这个空间。

第五部分 网络动力学:总体模型

第 16 章 信息级联

  假如你要在一个不太熟悉的城市选择一家餐馆,根据你对当地餐馆的了解,决定去餐馆 A。当你到了这家餐馆,却发现没什么人在这里就餐,而隔壁的餐馆 B 却几乎爆满。此时,你可能会觉得那些在餐馆 B 就餐的人和你口味差不多,而且他们同样也是做了一番了解才选择餐馆 B,因此你可能会很合理地加入 B 的人群,而放弃原来的计划。我们来看为什么会这样,假如每个就餐者都独自拥有一些不太完全的餐馆信息,如果此时已经有许多人在餐馆 B 就餐,这些人的选择提供给你的信息可能要比你自己通过其他途径了解到的信息更有说服力,因此,忽略自己的信息而加入这些人群也是很合情理的事。这种情况下,我们称发生了群集(herding)或信息级联(informationcascade)效应。
  简单地说,产生信息级联的先决条件是,人们可以在不同时刻依次做出决定,而后面的人可以观察到前面人的决策行为,并通过这些行为推断出他们所了解一些信息。就像餐馆的例子,当第一批就餐者选择餐馆 B,就对后来者传递了他们所了解的信息。当人们放弃自己拥有的信息,转而以之前人们的行为为基础做出推断,便产生了级联效应。
  有趣的是,在级联效应中,个体模仿他人的行为并不是盲目的。相反,它是根据有限的信息进行合理推论的结果。当然,模仿也有可能是出于社会压力导致的顺从,与所谓的的信息没什么关系,有时并不容易分辨这两种现象。我们来思考由 Milgram、Bickman 和 Berkowitz 在 20 世纪 60 年代进行的一个实验。他们将参加者分成不同规模的小组,从每组 1 个人到 15 个人不等,分别让这些组的人站在街头凝视着天空,然后观察有多少路人停下来,也跟着凝视天空。研究人员发现,当只有一个人抬拾头看天空时,极少数路人停下来。如果 5 个人盯着天空看,会有多一些路人停下来,但大多数人仍然忽视他们。最后,当 15 人的组一起盯着天空时,他们发现,45% 的路人会停下来,也盯着天空看。
  这个实验结果表明,从众的社会力量随着一致性群体活动规模的壮大而增强。而另一种解释是,这种从众现象的形成从本质上是植根于信息级联的思想。这就是为什么最初的路人认为没什么理由要抬头看天空(既没有个人信息,也没有公共信息促使他们这样做),随着越来越多的人拾起头来看,后来的路人可能很合理地认为有充分的理由这样做(他们可能会觉得那些向上看的人知道些什么自己不知道的事)。
  从本质上说,信息级联可以在一定程度上解释一些社会环境中的模仿现象。如,时尚和潮流、对候选人的表决、高度畅销的书籍、新技术的推广和使用,甚至具有本地化特性的犯罪行为和政治运动等等,都可以看成是群集的例子,人们基于对别人行为的推断而做出决定。

  现在考虑当个体依次作出决定时会发生什么情况。像以前一样,这里关注的情况是,每个人都可以观察到前面人的决策行为,但并不清楚他们都知道些什么。在模型中,这意味着,当某个人决定接受或者拒绝一个选项时,会使用自己的私有信号,以及观察到所有先前人做出的决定。重要的是,每个个体没有机会得到其他人的私有信号。
  这个推理与 16.2 节中一组学生的群集实验非常类似,现在考察这些相似点。
  - 第 1 个人将遵循自已的私有信号,正如 16.5 节所描述的那样。
  - 第 2 个人看到 1 号个体的决定,揣摩出 1 号的私有信号,因此,2 号个体得到两种信号。如果这两种信号相同,2 号的决定就很容易做出。如果它们不同,那么就像我们在 16.5 节后面看到的,2 号选择接受或者拒绝没什么区别。这里我们假设 2 号按自己私有信号做选择。因此,无论是哪种情况,2 号会根据自己的私有信号做决定。
  - 其结果是,第 3 个人知道 1 号和 2 号都是依据自己的私有信号决策,这相当于 3 号个体得到了三个独立的信号(两个是推断的,一个是自己观察到的)。从 16.5 节的论证中我们知道,3 号将按照多数信号(高或低)选择接受或者拒绝。
  这意味着,如果 1 号和 2 号个体做出了相反的决定(即他们得到相反的信号),那么 3 号就会利用自已的私有信号来打破这个僵局。接下来的人们知道 3 号的决定是基于他自己的信号,并且在做自己的决定时会参考这个信息。
  另一方面,如果 1 和 2 作出同样的决定(即他们得到相同的信号),那么 3 号将遵循这一决定,而忽略自已的个人信号。后面的个体都知道,3 号的决定没有传递任何关于私有信号的信息,这些人将全部与 3 号处在同一个起点上。这种情况下,级联效应便开始了。也就是说,现在的情况是,没有哪个个体的决定是受其私有信号影响的。不管他们观察到什么,从 3 号以后的每个人将作出与 1 号和 2 号同样的决定。
  现在分析这个过程如何延伸到第 3 个以后的人。考虑第 N 个人,假设 N 号个体知道前面每个人都遵循自已的信号做决定,也就是说,这些早先的人接受/拒绝的决定完全取决于他们收到的是高信号或低信号,N 号个体很清楚这一点。我们需要考虑以下几种可能的情况。
  - 在 N 号个体之前做决定的人中,如果接受的数量与拒绝的数量相同,N 的私有信号就成为决胜因素,N 会按照自已的信号做决定。
  - 在 N 之前做决定的人中,如果接受的数量与拒绝的数量相差 1 个,那么或者 N 的私有信号对决定没什么作用,或者它会加强多数信号。无论是哪种情况,N 都会遵循自己的私有信号行事(我们假设一个人在无关紧要时遵循其私有信号做决定。)
  - 如果在 N 之前做决定的人中,接受的数量与拒绝的数量相差达到 2 或者大于 2 时,那么无论 N 的私有信号是什么,都不会改变早期形成的信号分布状态。因此,N 将按照先前的大多数信号,而忽略自己的信号。
  这种情况下,N+1,N 十 2,以及后面的人都清楚 N 忽略了自己的私有信号(后面的人同样清楚在 N 之前的人都是依赖自己的私有信号做决定)。因此,这些后面的人将处于同 N完全相同的状态。这意味着,他们每个人也将忽略自己的信号,按照多数信号行事,因此级联效应便开始。
  现在可以对决策行为的过程概述如下。只要接受数和拒绝数相差不超过一个,序列中的每个人就会简单地依据自己的私有信号做决定。一旦接受数和拒绝数相差达到两个以上,便形成级联效应,每个人就会一直简单地遵循多数人的决定。图 16.3 以图示的方法说明了这个过程,描绘了一个实例中人们依次做出决定后,接受数和拒绝数之差随着时间的变化情况。当一个人做出一个新的决定时,接受数或拒绝数正好增加一个,因此图形向上或向下移动一个单位。一旦接受数和拒绝数的差值离开零点附近的水平带,也就是说,当图形远离 x 轴至少两个单位时,级联效应便开始,并且会一致持续下去。
  最后需要说明,接受数和拒绝数的差值很难一直保持在一个狭窄的区间内(-1 和 +1 之间)。例如,在人们遵循自己的信号做决定的一段时间内,如果有三个人碰巧连续得到相同的信号,级联就会马上开始。(注意可能还没有发生这种情况时,级联就已经开始了,不过可以验证连续三个相同的信号足以使级联开始。)现在,我们论证当 N 趋近于无穷大时,连续出现三个相同信号的概率收敛于 1。
  这个论证说明,当个体数量趋于无穷大时,发生级联的概率为 1。因此,在极限情况下,可以确定这个模型中级联一定会发生。
  我们已经完成了相关的分析,最后还有一些问题值得一提。首先,从根本上说这是一个关于个人决策行为简化的模型。对于更一般的情况,例如,很可能有人没能看到先前做出的所有决定,而只看到其中一部分;因此并不是所有的私有信号都传递着平等的信息;或者也有可能人们所得到的回报有所不同。许多更宽泛的变异情况使得分析变得更加复杂,导致一些细节上的不同(例如,级联开始的条件显然不会总是像接受数和拒绝数相差至少为 2 那么简单)。然而,从这些模型推导出的总体结构本质上是相似的。当人们可以看到别人怎么做,而不清楚别人的信息时,在初始阶段,人们依靠自己的私有信息;但随着时间的推移,群体便形成一种状态,这个状态中的人仍然在做理性的行为,但开始忽略他们自己的信息,而去迎合人群的做法。
  我们现在从这些级联模型转向更一般性的结论,将这些模型发展成为一些不同环境中的信息级联都遵循的定性原则。

  从级联获得的认识:
  (1)级联可能是错误的。例如,接受一个选项实际上并非是好主意,但前两个人碰巧都得到高信号,这样接受的级联效应便马上开始,即使它是个错误的选择。
  (2)级联可能基于很少的信息。一旦级联开始,人们便忽略自己的私有信息,只有在前级联阶段,信息会影响人群的行为。这意味着,如果一个级联开始得相对比较快,大多数人群中拥有的私有信息(即个体的私有信号)都没有被利用。
  (3)级联是脆弱的。前面提到级联可以基于相对较少的信息,使得它们很容易启动;但也可以让它们很容易停止。一种表现是,当人们接收到略具优势的信息就可以颠覆已经存在一段时间的级联。

  这些发现启发我们进一步思考,在不同情况下个体或团体行为是否会发生级联效应?它将如何影响决策行为?一种非常容易产生级联效应的情况是委员会式的团体决策方式,人们围坐在一起,讨论一个问题可能的解决方案。例如,一个招聘委员会要决定是将工作机会提供给候选人 A 还是 B。这种情况下,一个常用的策略是大家围坐在桌前,依次发表他们对所支持候选人 A 或 B 的看法。如果参会者对两个候选人的看法大致相当,就会很快地产生级联效应:如果几个人最初赞成 A,可能导致其他人觉得也应该赞成 A,即使他们最初的首选可能是 B。在本章研究的级联有一个基本原则,人们并不是简单地迫于社会压力来迎合大多数,而是根据理性的判断作出决定,人们可能会认为先前发表意见的人有更有价值的信息。
  这种情况表明存在两种力量的作用,一方面,一组专家携手合作彼此依赖其他人的想法,另一方面,他们各自又都持有自己的意见。要平衡这两种力量,就要求每个专家在彼此合作形成一致之前能够形成部分独立的意见。这样,如果某些人对一个问题有很有价值的信息,无论他是否有机会发表意见,这些信息都会起到一定作用。
  市场营销人员同样利用级联效应,试图形成一个新产品的购买级联。如果他们能诱发最初一批人采用新的产品,那么后来的人也可能会决定采用这个产品,即便是它没有比竞争产品好在哪,甚至更糟糕。这些后来的购买者观察到前人采用新产品的选择,但不了解这些选择实际上是否能满足客户的需求,这样的购买是最有效果的;这种购买方式很像级联出现时人们的行为方式,此时,人们可以看到别人的做法,但不了解他们所掌握的信息。如果能够了解早期消费者的回报(或者一些相关的统计数字)信息,可以有效地避免产生一个错误选择的级联,这再次说明,改变一群人已有的信息会对他们的整体行为产生影响。

第 17 章 网络效应

  在 16 章开始,我们讨论了个体模仿他人行为有两种不同的基本原因。一种是基于信息效应:其他人的行为传递了他们所知道的信息,观察别人的行为并模仿着去做(即便有时会违背自己的个人信息)有时也是一个合理的决定。这是第 16 章的主要研究内容。另一种模仿他人的原因是基于直接受益效应(direct-benefit effects),也称为网络效应(networkeffects):对于某些决定,如果能与他人的决策行为保持一致可以带来直接的利益。这一章将研究这种网络效应。
  网络效应产生的一个自然环境是采用的技术需要与其他人交互或相容。例如,当传真机作为新产品推出时,它潜在的价值取决于有多少其他人也使用相同的技术。社交网络或媒体共享网站也表现出同样的特性,它们的价值在一定程度上体现在有多少其他人也在使用。同样,计算机操作系统也因为更多人使用而发展得越来越实用,即便它本身并不是以交互为主要目的,有更多用户的操作系统往往也涉及大量丰富多样的软件,形成的系统能够兼容各种文件格式(如文档、图片、电影等),便于更多的人使用。

  我们这里所描述的效应称为积极外部效应(positive externalities)。一个外部效应是这样一种情形,任何个人的福利会受到其他人行为活动的影响,而没有什么相互补偿的问题。例如,从一个社交网站能受益多少与有多少人使用这个网站有直接关系。当有更多的人加入该网站时,便无形中增加了你的福利,尽管没有什么明确的报酬合约。从增加福利这个意义上说,这种外部效应是一种积极因素。这一章,我们将探讨网络效应对外部效应产生的积极影响因素。在我们的分析环境中,回报取决于使用一种商品的人数,而与这些人如何发生联系的细节无关。第 19 章,我们将主要关注网络连接的细节,以及它们如何影响积极外部效应。
  我们曾在前面章节看到消极外部效应(negative externalities)的例子,即一个外部效应造成福利减少的情况。第 8 章讨论的交通堵塞就是一个例子,一个人使用一种运输或通信网络,会降低其他使用者的回报,同样遭受影响的用户并没有任何补偿协定。在本章的最后一节,我们将对积极外部效应和消极外部效应进行更详细对比和研究。
  有一点很重要,并非所有的事情都是外部效应;最关键的是要看这种影响有没有报酬或补偿。打个比方,你喝了一听健怡可乐,世界上就减少一听可供消费的健怡可乐,因此你的行为减少了其他人的福利。但是,在这种情况下,你必须花钱买健怡可乐,如果你付的钱可以再生产出另一听可乐,那么你就为你的行为作出了补偿。也就是说,不存在无偿的效应,也就没有外部效应。我们在第 24 章讨论产权时将进一步讨论外部效应和补偿的相互作用。

  假设每个消费者至多想要一个单位量的商品;每个消费者购买商品会获得一定的各自不同的利益。如果没有网络效应的影响,我们认为消费者的购买意愿完全取决于这个固有的利益。当存在网络效应时,消费者的购买意愿取决于两方面的因素:
  - 本身固有的利益。
  - 其他购买该商品的人数,购买的人数越多,消费者越想买。对网络效应的研究是分析上述第二个因素所起的作用。

  1.利用网络效应的市场营销
  一个公司应该如何利用网络效应的作用制定其产品市场营销策略?假设你运行一家公司,生产出的新产品,其营销将受到网络效应的影响,新产品可能是一个新的软件技术、通信技术、社交媒体等。产品市场营销的成功只有在你超越转折点(2)时才可能实现,如果开始销量很小,寄希望于慢慢地增长是不太可能成功的,除非你的产品被广泛使用,因为公司能够从每个潜在的购买者身上获取的利润很低。
  因此,在其他人还没有购买你的产品之前,你应该想办法先说动一大批初始用户接受你的产品。具体应该怎样操作?一种可能的方式是为商品设置较低的初始价格,甚至提供免费使用。这个价格可能因为低于成本价而造成公司早期的亏损,但如果产品能够不断扩大销售量,超过转折点,你再提高价格,用获得的利润来补偿早期的亏损。
  另一种方式可以利用时尚领衔人物的影响,他/她们购买或使用某种产品,会带动和吸引其他的人。这一策略同样涉及网络效应的影响,但它不是我们基于总体层面研究的问题。因此,当存在受网络效应影响的购买行为时,要区分这两种不同的网络效应。我们将在 19 章探讨这个问题。

  3.网络效应和竞争
  最后,我们来讨论如果多个厂家都生产某种新入市的竞争产品,并且它们都有各自的网络效应,结果会怎样?例如,考虑两个互为竞争对手的社交网站提供类似的服务,或者说两种技术本质上实现同样的功能,但每种技术的价值体现在有多少人使用它。过去几十年来,科技产业中有很多这种经典的竞争案例。例如,微软公司的崛起主宰了个人电脑操作系统市场,20 世纪 80 年代,VHS 成功地超越 Betamax,为录像带行业的标准格式。
  这种具有网络效应的产品竞争,结果很可能是一种产品主宰市场,而不是两种(或更多)竞争产品共同发展。率先超越其临界点的产品将吸引许多消费者,并且使得其他竞争产品对用户的吸引力下降。第一个超越这个临界点非常重要,甚至要比产品“最佳”这个抽象意义更重要。假设两种产品生产成本相同,产品 B 更好些。但如果产品 A 先进入市场,并且超过了它的临界点,那么产品 B 很可能就无法生存下去。
  以上的讨论引发我们一些思考,市场的发展趋势在较强的网络效应作用下会怎样?l996 年,Brian Arthur 在哈佛商业评论(Harvard Business Review)中总结了这种市场的“标志”特征:“市场的不稳定性(市场倾向于先进入的产品),多种潜在的结局(如,根据历史经验,其他的操作系统也曾有赢的机会),不可预测性,锁定市场的能力,劣质产品主导市场的可能性,优胜者优厚的利润”。并不是说一种市场在网络效应的作用下,会体现出所有上述特征,但它们是这种市场环境中应该注意到的一些现象。
  当然,在我们的讨论中,产品 A 战胜 B 而主导市场,这个假设还有一个条件是并没有其他变化来改变这种平衡。如果生产 B 的公司充分改进它的产品,并且市场营销也做得很好,而生产 A 的公司没有作出有效的反应,那么 B 也会超越 A 成为主导产品。

  有网络效应的模型中,市场条件细小的改变能够对结果造成强大的不连续的影响。产品有一小群热心支持的消费者(这个消费群体对产品有最高的估值),但是未能使这个小群体飞跃扩展到更大的人群——不那么热衷的主流消费群体,进而将用户量推动到较高的平衡 z**。然而,如果略微降低价格,使产品能够有稍多一些的吸引力,就有可能使最热衷的消费者发展成更大的主流群体,驱动平衡用户量上升到更高的水平,为产品的成功打开一个通道。

第 18 章 幂律与富者更富现象

18.1 流行度成为一种网络现象

  为什么称之为“富者更富”规则?原因是网页!的流行度增加的概率直接与当前的流行度成正比。这个现象也被称为择优连接(preferential attachment),就意义而言,链接的行为是“优先”选择已经有高流行度的网页。流行度的“富者更富”原则:本质上,越有名的人,越有可能被大家谈论,也越有可能使更多的人知道他/她们。网页也是这样,这一观点正是我们模型的关注点。
  还有一个直观的现象,利用富者更富模型预测流行度,其增长规律与细菌复制和复利息的增长规律相同:一个网页流行度的增长速度与其当前的流行度成正比,也就是随着时间呈指数增长。一个网页如果从其他网页链入的链接数较少,那么这种趋势将继续保持,基于中心极限定理,独立的小的随机值往往会相互抵消,富者更富的复制原则实际上是放大了较大量值的影响效应,使它们变得更大。在本章的 18.7 节,我们将这一推理进行量化,并计算幂律分布对应的指数。
  同处理其他的简单模型一样,我们的目标不是捕获人们在万维网或其他网络中创建链接的原因,而是要揭示这种链接最终形成幂律分布的根源,这个根源简单而自然,并不像最初显现的那样神奇。
  事实上,富者更富模型在许多场合中被视为是幂律分布的基础,包括一些与人们决策完全无关的情形。例如,人们发现城市的人口遵循幂律分布:人口数为 k 的城市大约占比例 1/k,其中 c 为常数。如果假设这些城市是在不同时期形成,而且,一旦形成,一个城市的人口增长就与其当前的规模成正比,这个模型正像人类产生下一代那样简单而自然,这恰恰是我们提出的富者更富的模型,因此,现实中存在的幂律分布对我们来说也不足为奇。再考察一个非常不同的例子,生物研究人员认为(尽管论据不够充足),一个基因组中的基因拷贝数量近似地遵循幂律分布。如果我们相信基因拷贝在很大程度上是通过突变事件中 DNA 随机片段被意外复制而产生,那么多拷贝基因存在于一个随机选择的 DNA 片段中的可能性更高,因此“富”基因(多拷贝基因)变得“更富”,我们又一次看到幂律分布。
  事实上,网页流行度、城市人口、基因复制所共同遵循的规律是非常神奇的,然而如果用富者更富的效应解释这些过程和结果,画面便开始变得明朗。同时,必须强调这些简单的模型只是对事物的近似描述;此外,还有一些其他类型的模型,以捕获幂律行为为目的,这里并没有讨论。例如,另一种相关的研究探讨了幂律如何产生于存在制约因素的优化系统。所有这些简单模型给我们的启发是,当看到数据服从幂律分布时,理解它存在的原因要比知道它的存在这一简单事实更有意义。

18.4 富者更富效应的不可预测性

  鉴于反馈效应具有幂律分布这一特性,很自然想到一个网页、一本书、一首歌曲或其他任何具有关注度的对象,其流行度的上升在初始阶段是相对比较脆弱的。一旦这些方面的某一对象被充分肯定,在富者更富模型的推动下,其流行度就可能变得更高,但最初启动这个富者更富的过程似乎是一个不确定的过程,充满了潜在的意外和失误。
  这种不可预知的敏感性和初始波动性在前两章讨论的内容中同样存在:信息级联效应中,依赖于一小部分人的初始决定,一项较差的技术却能够胜出,因为它在竞争对手之前达到一个特定的临界用户量。流行度规则表明,过程早期的随机效应同样也发挥了作用。例如,如果可以让时光倒流 15 年,然后重演历史,《哈利波特》还会售出上亿本或只是默默无闻?或者一些其他的儿童作品获得巨大成功?直觉告诉我们应该是后一种情况。总之,如果历史重演多次,似乎是每次的流行度都应该服从幂律分布,但我们并不清楚最流行的项目是否在每次重演都保持一致。
  尽管这种类型的实验对分析我们的模型很有帮助,但显然这是很难真正实施的实验。最近,研究人员 Salgankik、Dodds、Watts 完成了一项实验工作,对我们提出的观点提供相应的实验支持。他们创造了一个音乐下载网站,提供 48 首不太为公众所知的歌曲,这些歌曲的创作质量不同,全部由真实的表演团体演唱。网站向用户提供一个歌曲列表,每个用户有机会试听这些歌。网站还同时向每个用户显示一个表格,列出了当前每首歌曲的“下载次数”,即到目前为止一首歌从网站被下载的次数。最后,网站提供用户下载所喜爱歌曲的机会。
  用户并不知道实际上他们在访问网站时已经被随机分配到 8 个“类似”的复制网站之一。这 8 个复制网站的初始状态完全一致,都提供同样的歌曲,并且每首歌曲的初始下载次数均为零。但是,随着用户不断地访问,每个复制网站的发展出现不同。在小规模受控环境设置条件下,这个实验提供了一种途径能够观察在历史向前运行的 8 个不同过程,这 48 首歌曲流行度的变化情况。而事实上,研究人员发现不同歌曲的“市场占有率”在不同的复制网站上差别非常大,尽管最好的歌曲永远不会在最低点,最差的歌曲也永远不会在最高点。
  Salganik 等人通过这项实验观察到,总体上,反馈结果表现出的差别很大。具体来说,他们指派了一些用户到某个复制网站,其中没有提供歌曲下载的统计数字。这种类型的网站,用户没有直接的机会发扬富者更富机制,因此,不同歌曲的市场份额变化明显很小。
  而对于较少受控的环境,流行度的变化要更复杂,这一特点符合我们曾经提出的一些观点,具体而言,一本书、一部电影、一个名人、一个网站的成功强烈地受到反馈效应的影响,因此在某种程度上表现出固有的不可预知性。
  流行度产生于相互作用的信息级联,其强度变化符合幂律规则,正如我们在真实系统中观察到的那样。

18.5 “长尾”现象

  流行度的分布可以产生很重要的商业效应,特别是在传媒业。想象一个拥有大量库存的传媒公司,例如,一家图书或音乐零售巨头,需要做出一个决定:大规模的降价销售是选择那些种类较少但非常流行的项目,还是那些种类很多但每种都不太流行的项目?前一种情况,该公司的销售成功立足于“畅销”产品一少数种类产生较高收益的畅销产品。后一种情况,公司的销售成功立足于大量的“利基产品”,其中每一种产品吸引一小部分用户。
  尽管销售数据表明这个过程的发展趋势比较复杂,畅销产品和利基产品之间的张力促使一个特定的组织机构的形成。这正是像亚马逊(Amazon)或网飞(Netflix)这种公司的基本生存模式,因为没有实体店铺所受到的限制,它们具有保存大量库存的能力,并能够实现产品极大程度的多样化,虽然可能只有很少量种类的产品有很大的销售量。从根本上,量化长尾现象的重要性归结为对幂律分布进行分析。

第六部分 网络动力学:结构模型

第 19 章 网络中的级联行为

  人与人之间的交往和互动往往是发生在有限的局部而不是全局范围,也就是说,我们通常比较在意朋友或同事对某事所做的决定,而不太关心群体中所有其他人的决定。例如,在工作环境中,我们可能会选择某种与直接合作者兼容的技术,而不是一些最流行的技术。类似地,我们可能会与朋友保持一致的政治观点,即便是持这种观点的人只占少数。

  随着这种类型的研究不断增多,研究人员开始探索这种创新传播在不同领域都共存的些原则。Everett Rogers 在其很有影响的探讨创新传播行为的书中明确阐述了这些原则,包括为什么有些创新相比现有的方法有明显的相对优势,但却没能在人群中传播的一些因素。具体地,一项创新的成功与否取决于它的复杂性,即人们理解和应用它的方式;可观察性,人们是否可以观察到其他人在使用;可试用性,人们逐渐地越来越多地接受它,因而降低了它的风险;最重要的是它对整体社会系统的兼容性。同质性原则有时可能成为扩散的屏障:因为人们倾向于与他们相近的人互动,而新的创新事物往往来自于“外面”的世界,要使这些创新在一个紧密的社会团体中打开一条通路可能很难。
  我们以基本的个体决策模型为基础构建一个新行为的传播模型:当个体根据邻居的选择而作出决定时,一个特定的行为模式就开始穿过网络连接进行传播。构建这样的个体层次模型,既可以选择信息效应模式,也可以选择直接受益效应模式。本章中,我们将着重于后者,从一个直接受益效应的网络模型开始,该模型由 Stephen Morris 提出。
  基于直接受益效应的网络模型有这样的特点:每个人有一些特定的社会网络邻居,朋友、熟人或同事,并且因接受一项新事物所获的收益随着周围采纳的邻居越多而增多。因此,从利己主义的角度出发,当你周围足够多的邻居采纳了某项剑新时,你也应该采纳。例如,你会发现使用兼容技术很容易与同事合作;类似地,你会发现在交往中与那些和你的信仰和观点相近的人更容易沟通,或至少是不会更难相处。

  这种分析也启发人们思考一些营销策略,试想如果图 19.5 中 A 和 B 是竞争技术,而且生产 A 的公司希望推动它的技术超越图 19.5(b)中的停止状态。当然如果可能的话,最直接的方式是 A 的产品质量略微提高一些。例如,将协调博弈中的回报由 a=3 改为 a=4,那么由此产生的门槛值由 q=2/5 下降到 q=1/3。这样,可以检验从图 19.5(b)的状态开始所有的节点最终都将转换到 A。也就是说,这个较低的门槛值能够使得 A 闯入当前网络中那些拒绝它的区域。这个结论很有意义,现有的创新只要稍微提高其吸引力,就可以大大增加它的覆盖面。它还表明,A 和 B 在网络中共存的自然边界并不仅仅依赖于网络的结构,还与 A 相对于 B 的相对回报差异有关。
  如果无法再提高 A 的质量,也就是说。A 的生产者不可能改变其门槛值,就要采用不同的策略增强 A 的传播,让一些正在使用 B 的少部分关键人物转而使用 A,这些人要仔细挑选以达到级联效应。例如,可以检验,如果努力让图 19.5(b)中的节点 12 或 13 转向 A,那么采用 A 的级联过程将再次启动,最终使得所有节点 11~17 全部转向 A。另一种情况,如果营销人员努力使节点 11 或 14 转到 A,那么对网络其余部分并没有什么效果;所有其他采用 B 的节点仍然处于低于门槛值 q=2/5 的状态,因此不会转到 A。这说明如何选择节点对转换到一个新产品非常关键,本质上说是基于它们在网络中的位置。这些问题都是“病毒式营销”研究的重点内容。
  最后有必要做一个对比,针对一种新技术的采用,第 17 章我们基于人口层面构建的网络效应模型,这里基于网络层面讨论级联效应。在人口层面模型中,每个人根据整个群体中使用这种特定技术的人口比例决定是否采纳这项技术,因此一项新技术开始占据市场非常难,即便它比现有的技术更具优势。而在网络结构中,节点只关心它直接邻居的行为,一小部分初用者像一个长长的导火线,最终可能使相应的创新遍及全球。一个新的思想最初在一个局部范围的社会网络中传播,最终被广泛接受,这事实上正是许多创新事物的发展轨迹。

  许多社会运动倾向于在局部建立支持,并且传播比较慢的原因。在全球交友网络中跨越全球的弱连接系统能够以惊人的速度传播一个笑料或一个在线视频,而政治活动却传播得很慢,往往需要在居民区和小社区增加传播动力。用门槛值的概念可以解释这个问题:社会运动本身具有一定的风险,因此个体倾向于拥有较高的门槛值支持其行为;这种条件下,连接不同部分的捷径所起的作用很小。这种分析从扩散理论的角度提出了一个关于社会运动众所周知的观点,正如 Hedstrom 的研究指出,这种运动经常是按地区传播,McAdam 的研究表明,在 20 世纪 60 年代的自由之夏学生激进运动中,强连接比弱连接扮演了更重要的角色。

  1. 集体行动和多元无知
  一个启发性例子是组织一个抗议、暴动、反抗专制政权这样的活动。试想你在这样的社会生活,知道明天有一个反对政府的公共示威计划。如果有大量的人参与这个活动,政府将会畏缩并让步,社会中每个人包括示威者在内都将受益。但是,如果只有几百个人参与,则所有示威者将被逮捕(或者更糟),这样的话大家最好都不要参与。这种情祝下,你该怎么办?
  这是一个集体行动(collective action)的问题,一项活动只有足够多的人参与才会产生利益。这种情况让我们回想起第 17 章分析人口层次的网络效应:正如参加一个大规模游行活动,只有足够多的其他人购买传真机时,你才会考虑买。然而,这里的例子与第 17 章的设置有着明显不同。传真机的案例中,你可以观察到早期采用者的经验;可以查看评价和广告;还可以和许多同事讨论并了解他们的计划。由于反对专制政府涉及更严重的负面回报,许多这种类型的选项都是对他人封闭的,这种事情只能在少数可信任的朋友之间谈论,因为缺乏别人是否愿意参加示威活动的信息,或者不了解别人参加的标准是什么,你也很难决定是否参加。
  这也说明为什么一些专制政府不惜代价地限定公民之间的沟通。的确可能发生这种情况,有足够强大的人口比例反对当前政府,并希望采取极端的措施,但这些人大多觉得自己是一个小群体,认为这种反抗有很大风险。这样,尽管原则上说有足够强大的反抗活动可以摆脱当前政府,但往往它仍然可以维持很长一段时间。
  这种现象被称为多元无知(pluralistic ignorance)现象,人们普遍地错误估计整个民众对某些意见的反映。这是一个适用广泛的原则,不仅仅是在一个中央集权制度限制信息流通的环境。例如,1970 年在美国进行的一项调查表明(同一时期实施的几个调查也得到了类似的结果),虽然那个时期只有少数美国白人主张种族隔离,大大超过 50% 的人认为他们所在地区大多数美国白人支持这个主张。

  2. 集体行动的知识效应模型
  我们进一步分析社会网络结构如何影响人们对这种集体行动做出决定,假设社会网络中每个人都知道一个即将发生的反政府抗议活动,每个人有一个自己的门槛值能够确定其参与意愿。门槛值 k 意味着,“如果能确定至少有 k 个人参加(包括我本人),我将参加抗议活动”。
  社会网络中的连接可以看成是强关系,每个连接的两个端点彼此信任。因此,我们假设网络中每个人都知道其所有邻居的门槛值,但由于异议交流的风险特性,并不知道其他所有人的门槛值。现在,给定一个网络,对应一组门槛值,应该如何推测会发生什么情况?
  考虑如图 19.14 所示的例子,它显示出了一些微妙的特点。我们将“暴动”这个运动缩减到 3~4 个人的规模,假设每个节点代表一家公司的高级副总裁之一,每个人必须决定在第二天的董事会上是否要参与对抗不受欢迎的总裁。如果没有其他人的适当支持,这将是一个灾难,因此,每个人如果能确定至少有特定数目的其他人这样做才会有所行动。假设每个节点知道这个社会网络的结构。

  首先,图 19.14(a)说明了节点必须由其他节点决定其行为的推理。在这里,节点 w 参与对抗的前提是至少有 4 个节点这样做;因为总共只有 3 个人,也就是说 w 永远不会参与这个活动。节点 v 知道 w 的门槛值为 4,所以确定 w 不会参加。因为 v 需要确定有 3 个人参与才愿意加入,所以 v 也不会参与。最后,u 只需要确定有两个人参与就可以加入,但 u 知道其他两个节点的门槛值,因此可以确定他们都不会参与,所以山也不会参与。最终,这个对抗将不可能发生。
  图 19.14(b)的情况更微妙,此时节点必须先推测其他节点都知道什么信息,再决定自身的选择。具体地,从 u 的角度考虑这个情况(因为所有节点是对称的)。u 知道 v 和 w 的门槛值均为 3,因此,u、v、w 会对由他们三个都参加的对抗感到安全。但同时 u 也知道,v 和 w 彼此不知道对方的门槛值,所以就不能像 u 一样得出同样的推测。
  u 加入对抗是否安全呢?答案是否定的,原因如下。由于 u 不知道 x 的门槛值,有可能是非常高的值,比如 5。这样,节点 v 看到两个邻居的门槛值为 3 和 5,将不会加入。同样 w 也不会参与。因此这种情况下,如果 u 参与,u 就是唯一的参与者,这对 u 来说将是一个灾难。因此,u 将不会采取这个机会参与对抗行动。这种情况对于图 19.14(b)中 4 个节点是类似的,我们可以得出结论,所有节点将不会加入对抗行动,所以对抗不会发生。
  这种情况有个突出的特点:网络中的每个节点知道有 3 个节点的门槛值为 3 这个事实,这对于形成一个成功的反抗是充足的,但每个节点都因为不能确定其他节点知道这个事实而没有采取行动。
  如果将 v 到 w 的连接改变到 v 到 x 的连接,事情会变得非常不同,图 19.14(c)显示了这个网络。现在,每个节点 u、V、w 不仅知道有 3 个节点的门槛值为 3 这个事实,这个事实还成为一个共同知识:在由 u、v、w 组成的节点集中,每个节点知道这个事实,每个节点知道每个其他节点也知道这个事实,以此类推。我们在第 6 章博弈理论中简要谈到了共同知识这个概念,正如我们在这里看到的,它在以实现协调为目的相互作用中也起着很重要的作用。
  图 19.14(b)和图 19.14(c)的例子的差异非常微妙,归结为节点对于其他节点的情况拥有不同知识的结果。这种差别为我们研究强关系的强度和密集区域对激励高风险活动所起的作用提供了另一种思考方式,这也是 19.4 节讨论的一个主题。强关系是针对那些知道的事情和你有严重重叠的人,因此弱关系更具有信息优势。但对于集体行动,这种知识的重叠恰恰是需要的。
  共同知识和协调模型随后得到进一步的研究和发展,理解集体行动中知识相互作用的精确模式仍然是一个有趣的进一步的研究方向。

  3. 共同知识和杜会体制
  基于这些模型,Chwe 等研究人员认为,一个广泛的社会体系实际上起着帮助人们实现共同知识的作用。一个被广泛宣传的演讲或流行报纸上的一篇文章不仅只是传递消息的效果,还可以使听众或读者认识到许多其他人也得到了相关信息。
  这一点对研究新闻自由和集会自由,以及它们与开放社会的关系很有帮助。尽管体制相对来说远非政治,但仍起着产生共同知识的重要作用。例如,Chwe 认为美国橄榄球超级赛的广告经常被用来宣传产品,会产生强大的网络效应,像手机计划或其他有大量用户的某种商品。举例来说,苹果公司的 Macintosh 操作系统的广告在 1984 年美国橄榄球超级赛期间,由 Ridley-Scott 执导制作并向电视观众播放(几年后它被电视指南和广告时代宣称是“有史以来最伟大的电视广告”)。正如 Chew 对此评论:苹果操作系统与现有的个人电脑系统完全不兼容:苹果用户只能较方便地与其他苹果用户进行数据交换,如果只有为数不多的人购买苹果电脑,也就只有很少的可用软件。因此,有意购买的客户更倾向于确认其他人的购买后再决定购买;也就是说苹果的潜在购买群体面临一个协调问题。通过橄榄球超级赛期间无线传播这个广告,苹果公司并不只是简单地告知观众它的产品,它还向每个观众传递了一个信息,就是许多其他观众也因此知道了苹果电脑这一商品。
  David Patel 最近的研究表明,利用共同知识的原则分析伊斯兰教逊尼派(Sunni)和什叶派(Shiite)宗教体制之间的差异,有助于解释 2003 年美国侵袭伊拉克后一些政权发展情况。具体地,什叶派的组织结构强壮,致使星期五在清真寺的布道活动得到很好的协调,而逊尼派的组织结构缺乏可比性:“什叶派管理不同层级教土代表的阿亚图拉,能够坚持一贯地在不同的清真寺传播类似的消息,因此在分散的什叶派教友集会上产生共同知识和协调,与国家联邦制和选举策略类似。通过清真寺这种网络,什叶派教徒能够确定不同地区什叶派教徒知道的事情。Patel 因此认为,这种促进共享知识的机制使什叶派能够在全国范围内实现对某个目标的协调,在美国入侵伊拉克后的时代,其他团体缺乏相应的体制权力实现这种方式。
  通过这一切,我们看到,社会网络不只是简单的提供互动和信息交流,这些过程反过来又为个体抉择提供了参考依据,个体通过了解其他人知道些什么以及期望其他人怎么做来决定自己的选择。研究人员正在积极地探索这个框架对社会进程和社会机构提供的潜能。

第 20 章 小世界现象

  真实世界的全球朋友网络包含人们彼此联系的充足信息,构成一个庞大的地域和社交结构,能够在搜索过程中逐步聚焦远处的目标。Killworth 和 Bernard 进一步研究人们向某个目标转发信件所采用的策略,发现人们在转发过程中主要结合了地理关系和职业关系,具体利用哪些关系取决于收信人与发信人的关系特征。

  首先讨论一个存在短路径的模型,可能人们会惊讶地发现看似是任意的两个人之间的路径竟如此之短。假如每个人认识超过 100 个能直呼其名的朋友(事实上对大多数人来说,这个数字要更高)。同样,你的每个朋友除你之外也有至少 100 个朋友,原则上只有两步之遥,你就可以接近超过 100×100=10000 个人。进一步推断,原则上经过三步你就可以接近超过 100×100×100=1000000 个人。换言之,这个数字经过每一步以 100 的指数形式增长,经过 4 步,可以接近 1 亿人,5 步后达到 100 亿人。
  数学上看这个推理并没有错,但它所提供的关于真实社会网络的信息并不清晰。当我们得出结论第二步后可能会接近超过 1 万人,问题就已经产生了。我们知道,社会网络呈三角形态,即三个人互相认识,也就是说,你的 100 个朋友中,许多人也都相互认识。因此,当考虑沿着朋友关系构成的边到达的节点时,很多情况是从一个朋友到另一个朋友,而不是到其他的节点,图 20.1(b)展示了这种情况。数字 10000 这个结果是假设你的 100 个朋友连接到 100 个新朋友;如果不是这样,经过两步你能达到的朋友数将大大减小。
  因此,社会网络中的三元闭包效应限制了人们可以通过短路径达到的人数,图 20.1(a)和图 20.1(b)提供了这两种情况的对比。事实上,从某种程度上说这正是很多人首次听说到小世界现象后感到吃惊的主要原因:局部角度看社会网络的个体被高度聚集,没有大量的分支结构沿着很短的路径达到许多节点。

  简单地说,这个模型与之前的模型相比有较少的随机朋友,大多数人只认识他们的近邻,只有少数人认识较远的人。即使这样的网络,所有节点对之间仍然存在短路径。现在来解释其中的原因,把图中 k×k 个网格形成的方块想象成不同的城镇,我们从城镇的角度考虑小世界现象,每个城镇约有 k 个人分别有一个随机朋友,因此每个城镇共有 k 个随机均匀选择的到其他城镇的连接。这样就回到了之前的模型,只是这里以城镇替代了前面的节点,因此,我们能够找到任何两个城镇之间的短路径。现在要发现任何两个人之间的短路径,首先要找到两个人居住的城镇之间的短路径,然后利用邻近边形成路径,进而连接网络中不同的个体。

  对于不同目标成功搜索速度的大幅变化并不是简单地因为不同个体的属性差异,这主要是由于社会网络的结构特性使得地位较高的个体比地位较低的个体更容易被找到。同质性原则表明,地位较高的人也主要熟知其他地位较高的人,而地位较低的人认识的也大多是地位较低的人,但是这并不意味着这两个群体是对称的,或在社会网络可以互换位置。相反,大型社会网络往往是以一种所谓的核心-外围结构组成,其中地位较高的人被连接在一个密集连接的核心,而地位较低的人都分散在网络的外围。地位较高的人有丰富的关系资源;他/她们通过各种俱乐部、共同兴趣、共同的教育或职业背景相聚在一起,形成共同焦点;很容易建立跨越地域和社会界限的网络连接。地位较低的人往往更容易形成比较集中的本地连接。因此,要连接两个地域或社会距离较远地位较低的两个人,最短路径往往是先进入到核心后再返回来。

第 21 章 流行病学

  这种条件表述的二分法当 R0 接近于 1 时有一个有趣的“刀刃”特性。具体地,假设有一个分支过程,其中 R0 略低于 1,略微增加传染概率 p;结果可能会使 R0 最终高于 1,造成一个疾病突然的巨大爆发。同样的效果可以相反的过程发生,略微减少疾病的传染性将导致 R0 减小到 1 以下,可以消除疾病大范围流行的风险。因为 R0 是 p 和 k 的乘积,当 R0 接近于 1 时,稍微改变人们联系的人数 k 也会对结果产生很大影响。
  上述分析表明,在门槛值 R0=1 附近,社会应该付出加倍的努力来降低基本再生数,哪怕时一个较小的变化。由于 R0 是 p 和 k 的乘积,要减小 R0 的值,实际上涉及两种基本的公共健康措施:隔离人群能降低 k 的量值,提倡良好的卫生行为和习惯能减少细菌传播,从而减小量值 p。

  因此这个例子中,R0>1。但尽管如此,还是很容易看出这种疾病肯定会在有限的步骤内消失。每一层有 4 条连接到下一层的边,每条边不会传播疾病的独立概率为 1/3。因此,所有 4 条边都不会传播疾病的概率为(1/3)4=1/81,这样 4 条边形成一个“路障”,确保疾病无法超越它们达到网络的其他部分。由于疾病是由一层向另一层传播,而每一层将成为最后一层的概率至少是 1/81。因此,这种疾病传播一定会在有限数量的步骤后结束传播过程,这种情况发生的概率为 1。

  前面章节讨论的模型中,每个人最多只会感染一次疾病。对这类模型做简单的改变,便可以推论节点可能多次受感染的疾病传播行为。
  为了描述这种流行病,可以简单地允许节点在敏感(S)和感染(I)两个状态之间交替变化。因此不再有隔离这个状态,当节点结束感染状态后便循环回到敏感状态,并具备再次感染的条件。因为是在 S 和 I 两种状态中交替,称这种模式为 SIS 模型。
  除了缺少一个状态 R,该模型的结构非常接近 SIR 模型。
  · 最初,一些节点处于状态,其余节点处于状态 S。
  · 每个进入状态 I 的节点 v 在固定数量的步骤 tI 期间内具有传染性。
  · 在 tI 期间的每一步,v 以概率 p 将疾病传染给它所有处在状态 S 的邻居。
  · 经过 tI 步骤后,节点 v 不再具有传染性,返回到状态 S。
  图 21.5 展示了一个基于 SIS 模型的例子,接触网络由三个节点组成,其中 tI=1。注意节点 v 开始感染、恢复、再次感染的过程,可以想象这个接触网络是三个人居住的公寓,或三口之家,因为生活在一起,一个人可能把疾病传给别人,可能之后又受别人的传染。

  正如 SIR 模型,SIS 模型也可以进一步扩展以处理更一般的情况:不同的两个人可以有不同的传染概率;以及不同的康复概率,即每个受感染节点在每一步以概率 q 获得康复并转回到敏感状态;同样可以将感染状态分离成多个子状态,每个子状态的病情特征不同。

  SIR 和 SIS 流行病的生命周期
  通过本节和前面章节的例子可以看到,SIR 和 SIS 流行病在的图中(有限大小)的整个“轨迹”本质上是完全不同的。有限图中 SIR 流行病因为节点不会再次被感染,可能受感染的节点范围越来越小,因此它必然在数量相对较少的步骤后结束。而对于 SIS 流行病,却可以持续一个相当长的时期,它实际上是在更多倍数的节点范围内循环。但正如图 21.5(e)所示,如果 SS 流行病能够达到某种状态,所有节点同时都没再受到感染,那么疫情就会永远消失:不会再有任何受感染的个体将疾病传染给其他人。在有限图中,最终将(以概率 1)达到一种状态,所有的传染同时在连续的 t,步骤未能出现,意味着该流行病的传播结束。因此,对于给定的联系网络,SIS 流行病传播的关键是要了解疫情能持续多久,在不同的时间点有多少人受感染。

  如果要分析公共健康数据,很自然应该观察病例数量的周期振荡,并揭示外部因素对这种振荡的影响。例如,过去 50 年美国各地的梅毒病的流行周期传统上被归因于大规模的社会变化,包括性观念和其他一些因素变化。虽然这些因素发挥了明显的作用,最近的研究表明,疾病随时间的振荡和同步结果在很大程度上归因于疾病本身的传染特性,利用我们讨论的模型对疾病进行直接模拟,也可以得到类似的结论。
  大量的疾病记录资料可以为研究这些影响提供实证,以评价我们所提出的模型。
  Grassly、Fraser、Garnett 对梅毒和淋病进行了启发式的对比研究,发现了一些同步原则。梅毒的流行表现出突出的振荡特性,周期为 8~11 年,而淋病的周期性表现非常弱。然而,这两种疾病影响的人群却非常相似,并且也受制于非常相似的社会动因。
  这些差异是一直存在的,而事实上梅毒感染后能维持有限的暂时免疫力,而淋病却没有。并且,梅毒发病周期也正好符合这种疾病本身的免疫期。从发病周期的循环模式分析,可以发现美国不同地区该疾病的同步程度随着时间的椎移有增长趋势,说明 20 世纪后几十年中,疾病传播的接触网络跨越全国的连接越来越多。
  还有很多关于流行病同步方面的研究工作正在进行,包括对更复杂的时态现象建模。例如,像麻疹一类的疾病数据显示,在不同城市发生的流行病可能同步,但时期却不同,一个城市发生疾病爆发时,另一个城市可能正值低谷。这种特性不仅仅是简单地用远程联系能够解释的。同样,还有一些预防方案,如免疫接种以及其他医疗干预措施都可以充分利用这些时机特性,这为我们提供了一种思考方式,从简单模型产生的洞察力可以帮助人们作出更合理有效的决策。

  1. 线粒体夏娃(itochondrial Eve)
  1987 年,Rebecca Cann、Mark Stoneking、Allan Wilson 在自然刊物上发表了一篇论文,提出了一个相当惊人的命题证据。以时间倒转的顺序分析人类史的母系祖先,产生这样一条线索,从你到你的母亲,到你母亲的母亲(即你的外祖母),再到外祖母的母亲,无限地推下去。我们每个人原则上都可以产生这样一条母系祖先的线索,我们称之母系的世系(lineage)。现在,Cann、Stoneking、Wilson 的结论是,所有这些世系实际上源自 l0 万至 20 万年前的一个单一女子,可能是在非洲。她是我们所有母系祖先的根。
  我们首先要问他们是何以得此结论,然后再思考它意味着什么。一种椎论母系祖先的方法是研究一种并不在我们的细胞核里,而是在更小的分离基因组里的 DNA,每个人的细胞线粒体里都有独立的基因组。不同于核 DNA,它同时包含父亲和母亲的基因组,这种线粒体 DNA(近似地)完全由母亲传给孩子。所以大致来说,除了随机突变的情况,你会有你母亲的 DNA,她有她母亲的 DNA,等等。考虑到这一点,Cann、Stoneking、Wilson 根据广泛的地理和种族背景样本分析了人类线粒体,采用标准技术来估算基因序列通过许多代的随机突变发生偏离的速度,他们得出结论,人类所有的线粒体 DNA 很可能在大约 10 万至 20 万年前有一个共同的起源。所谓“共同起源”是指属于一个人的单一的线粒体基因组,因为她是地球上每个人线粒体 DNA 的源,研究人员规范地称这个女子为线粒体夏娃。
  这一发现在首次宣布就引起了公众的想象力;并在当时受到媒体相当的关注,其影响已经扩展到探讨人类历史的一般书籍中。最初的发现所涉及的分析方法后来被其他一些研究小组进一步提炼;相关人员指出线粒体 DNA 的遗传可能比原来的理解更为复杂这样的事实,但基本结论已经被普遍接受。

第七部分 机构及其聚合行为

第 22 章 市场与信息

  信息的非对称性实际上是一种基本的成分,表现为对内生事件的信念能在市场中张显它们自己。这有一个基本的原因,即在许多买卖双方有互动的情形,市场的一方对交易的货物或服务要比另一方有更好的信息。在二手车市场,卖方要比买方对出售的车有更多了解。在诸如 eBay 那样的电子市场,卖家经常也是比买家更多地了解他们要出售的东西。而在另外一些情形,例如医疗保险市场,保险的买方要比卖方更知道所要购买的商品(医疗保险)的价值,因为买家要比提供保险的公司更了解他或她存在的健康风险。在股票市场,交易的每一方都可能掌握一些对方不了解的关于股票未来价值的信息(我们在前面股票市场的讨论中忽略了这个特征)。在所有这些情况下,信息不充分的一方需要形成对交易商品价值的期望,而这种期望的形成应该考虑到有充分信息一方的行为。

  我们采用经济学家乔治·阿克罗夫的做法,他发表的关于信息非对称性的奠基性文章使他分享了 2001 年的诺贝尔经济学奖。他在论文中的例子就是二手车市场,或者像他说的,“柠檬市场”(特别差的二手车称为柠檬)。这些说法背后的思想并不新,也许就像贸易本身那样古老,但阿克罗夫是第一个清楚地阐述了背后的原理,以及它们对市场运行的含义,包括在某些情形市场是怎么失效的。

  1. 劳务市场
  劳务市场,其中找工作的人相当于卖方,找雇员的公司相当于买方,即,我们把形成雇佣的过程看成是一个市场,其中人们将他们的技能卖给雇主,以换得工资作为回报。下面针对劳务市场,我们重新考虑上一节柠檬市场的基本假设(1)~(4)。
  (1)工人有不同的质量;有些人生产率很高,有些人很低,这影响他们能为雇主公司产生的价值。
  (2)很自然地,我们可以考虑多种不同的工作,对应着不同级别的工资;公司愿意雇佣一个人的前提是它能确定哪种工作和工资级别对他是合适的。
  (3)存在着信息的不对称性:与可能的雇主相比,一个人通常更了解自已的工作能力。
  (4)如果我们采用假设(3)的一个加强(但可能)的版本,雇主不能可靠地确定他们拟雇佣的人的质量,那么他们不可能只雇到了高生产率的工人,从而工资也就不能和雇员的质量挂钩。这样,开出来的会是一个统一的工资,于是只有那些相信这工资不低于其技能价值的人会接受提供的工作。
  在这个分析中我们假设,尽管工人们具有不同的生产力,每个人的生产力是一个固定的量,不受他选择所做的工作的影响。有可能,工人的生产力受他们实际投入的努力的影响,但我们现在忽略这个问题。这样,关键点是(4),与二手车市场一样,可以看成是一个不利选择(adverse selection)问题。公司不可能从一个只有高生产率的工人人群中进行挑选;如果它要雇佣工人,唯一能肯定的事情是它会雇佣一些低生产率的人。
  用一个例子将劳务市场信息不对称的后果演绎一遍是有用的,这个例子和二手车例子十分相似。假设一个公司要从一个很大的潜在雇员池中雇佣工人。还假设工人有两种类型,高生产率和低生产率,并且他们的人数是一半对一半。雇佣一个高生产率的工人,每年能为公司产生 $80000 收入,低生产率的则可以产生 $40000。
  每个工人知道他自已的类型。而且我们还假设,每个工人可能选择不去为公司工作,而是自己单干。高生产率的工人单干也会得到较高的收入:假设高生产率的工人单干每年可挣 $55000,低生产率的单干每年可挣 $25000。因此,如果公司能准确了解每个申请工作的人的类型,情况是很清楚的:它对高生产率的人提供的年薪要在 $55000 和 $80000 之间,它对低生产率的人提供的年薪要在 $25000 和 $40000 之间,工作都会被接受,工人和公司都会从这个结果中获益。
  对公司不幸的是,它不能可靠地确定每个工人的类型。于是公司只能提供一个统一的工资 w,聘用那些愿意接受 w 作为工资的工人。公司愿意给出工资 w 的前提是所聘用的工人为公司带来的平均收入不低于 w。

  2. 劳务市场中的均衡
  在我们的例子中,应该提供什么样的工资,什么样的工人会愿意为公司工作?这里的分析与二手车的情形十分相似。我们首先来寻找一个自我实现预期的均衡。如果公司预期所有的工人都会出现在就业市场上,那么由于两类工人的数量是一样的,平均每人产生的收入就是:
  $$\frac{80000+40000}{2}=60000$$
  于是就可以按照每年 $60000 提供一个统一的工资。在这个工资上,两类工人都会愿意为公司工作,因此公司的预期就被现实确认了,就达到了一个均衡,每个工人都被雇用。与二手车例子类比,这里还有一个不是社会所期望的均衡,即如果公司预期只有低效率的工人出现在就业市场上,它就会按照每年 $40000 开出工资。这样,只有低效率的工人愿意接受工作,于是公司的预期再次被证实。因此,这里存在两个可能的均衡,一高一低,对应申请人中不同的工人配比。从本质上讲,公司对于它的职位申请者的质量的先验置信度得到了自我实现。
  如果我们改变高效和低效工人的比例,情况会不同。设只有 1/4 高效工人,3/4 低效。也存在只有低效工人被雇佣了的均衡,但是否也存在所有工人都被雇佣的均衡呢?如果公司期望所有工人都在市场上,那么它对平均每人带来的收人估计为:
  $$\frac14×80000+\frac34×40000=50000$$
  这就是它提供的最高工资。但在这个工资上,高效率工人不会接受工作,从而事实上不是所有工人都会在市场上。换言之,高效率工人申请公司工作的均衡不存在,这就像好的二手车被破车逐出了市场一样,高效率的工人被太多的低效率工人“赶出了”市场。

  3. 保险市场
  我们可以用类似的方式分析许多市场。例如,非对称信息在健康保险市场有重要的作用。保险公司通常没有投保人了解他们自己的健康状况。对于一个人群来说,保险公司通常能很好地预测为他们提供健康保险的平均代价,但难以预测对任何特定人土提供保险的代价。它们一般是基于医疗史将人们分成不同的风险类别,但在任何一类中,每个人还是比保险公司更清楚自己过去以及将来可能发生的情况。
  因此,我们有了柠檬市场的所有成分:对一种给定风险类别中的不同人提供保险的代价会不同,但保险公司不可能可靠地做这种细粒度的区分。我们还应该看到在健康保险情形的一个有趣的转变:是健康保险的购买者,而不是卖方,拥有更多的信息。但结果是一样的。对于任何风险类别,保险公司基本上需要收取一个统一的价格,要足以支付提供该群体的平均医疗费用。这意味着,在该群体中很健康的人所付的保费要高于他们医疗费的期望值,于是他们可能不愿意购买保险。然后,因为这些相对健康的人不参加保险,剩下的人的总体平均健康状态就变得较低,保险公司将需要向这个不太健康的人群收取较高的保费。现在,在那些剩下的人中相对健康的人也可能会认为保费太贵,因而他们也可能选择不买保险,于是人群的平均健康水平进一步下降。类似于在二手车市场的情形,健康保险市场能够如此拆分下去,直到没有人愿意买保险。当然,这是否确实发生取决于实际的数字:提供保险的成本是多少,有多少人更看重保险的价值(而不是其他什么措施)。但正如前面的例子,这里我们看到,当信息失衡时,社会不希望发生的结果有可能在市场上出现。
  如同在二手车或就业的情况,我们讨论的健康保险市场上的信息不对称导致一种有害的选择。保险公司不能只选择一个由健康人组成的人群;相反,如果有人买保险的话,唯一可以肯定的是其中肯定有些不太健康。在医疗保险市场,还有另一种类型(我们一直忽略)的信息不对称。如前面的例子中,我们认为每个人的健康状况是固定不变的,因此他或她需要为保险支付的代价也不变。但人们可以采取行动来影响他们的健康。如果保险公司不可观察到这些行动,于是就有一个信息不对称的新来源,因为每个人都比保险公司更知道他未来的行为。一旦个人购买了医疗保险,他采取(昂贵的)行动来保持他健康的动机就减少了,因为他已不再承担健康状况不佳的全部费用。这引入了一个称为道德风险(moral hazard)的效果:当你不需要承担你不良行为的全部潜在代价时,你回避那些行为的动力就会减少。

  4.交易和股票市场中的信息不对称
  从本章学到的基本观念的角度进一步想想这几个例子是有用的:在任何交易中,每个交易者应该问为什么对方想做这笔买卖。正如我们在本章开始时提到的,如果一个交易者在买,那么另外的交易者就是在卖,反之亦然。因此,这两个交易者的行动,正好彼此相反。理解另一个交易者行为背后的动机,对理解这笔买卖是否该做可能是至关重要的。例如,在二手车市场,买方应该问为什么那个卖家想卖。卖方也是一样,当他们处在潜在不利的信息地位时(例如,销售健康保险的公司不能确定到底为什么一个人正寻求购买它们的保险),也可问类似的问题。
  所有这些问题在本章前面讨论的另一个市场都扮演了重要角色,那就是金融资本市场,如股票或债券。这里,同样是每一个买方对应有个卖家,每个人都应该对对方的动机感到好奇。一个人要卖股票,可能是希望调整他的投资组合,或者是因为缺现金;还可能是因为他对该股票的认识不同于市场价格(市场信念)反映出来的认识,即使他没有什么私有信息。还可能,一个人卖股票是因为他掌握了某些私有信息(内部消息),预示未来这支股会掉价,等等。类似地,一个买家可能是因为他有多余的现金要投资,因为他与市场的信念不相同,或者因为他有这支股票将来要涨的私有消息。
  在这样的股票交易中,双方信息的差异会导致对股票价值认识的差异。确定交易的另一方知道些什么常常是不可能的,但理解有时候另一方会知道一些事情则不是不可能的。一旦交易的每一方将这种情形考虑进来,就可能没有交易发生,如同在二手车例子中那样。

  讲了这么些信息的不对称对市场运行的影响,人们很自然会去想减小它的方法。一种在许多场合都使用的基本途径就是创建一种认证机制:让卖方提供拟出售物品质量的信号的一种方式。
  回到二手车的例子,我们可以看到有若干种可能的信号。其一,中间商有时提供一种保证,称一辆车为“经过认证的车”。中间商确认这些车在一些可能有问题的方面都被检查过,而且若有问题的话都已被修好。另一个信号机制是提供一个担保,承诺如果车在某个时间内需要修理的话,费用将由卖方负责,或者是卖方负责免费修理。这两种质量保证都是对买方有直接价值的,而且它们的价值可能超过了你的想象。对于好车,提供这种保证的代价要比对破车小,可以预期出售前后所需的修理会比较少些。如果对于破车卖主来说提供这种信号的代价太高,那么只有好车会有这种信号,或者至少可以说,在有这种信号的所有车中,好车的比例会高一些。这样,买家可以通过这种信号的存在来推测一辆车的质量。对买家来说,这种推测对该车预期价值的提升甚至高于保证中承诺修车的直接价值。
  因此,这种保修系统对于化解可能造成市场实效的信息不对称性是很关键的。

  劳务市场的信号
  这种给信号的想法不仅适用于二手车市场,也许它对劳务市场更加重要。
  通过我们前面关于劳务市场的例子不难理解。在那个例子中,有一些高效率和低效率的工人,公司最初区别不了。假设,高效率的工人要比低效率的工人受教育的情况好些(也许是因为高效率工人在学校的成绩好些,能通过较少的努力就得到学位)。在这种情况下,教育就提供了一个生产率的认证信号,雇主会愿意对受过较多教育的工人支付较高的工资。
  注意:即便在教育对工人的生产率没有直接影响的场合,这种信号机制也是起作用的。当然,教育本身就有价值,但当我们考虑信息不对称性的时候,就看到教育在市场中有双重作用。它为人们将来工作提供训练;在这之外,它也降低了关于工人质量的信息不对称性,起到了劳务市场有效运行不可或缺的一种作用。

  一旦认识到掌握信息在许多市场中是至关重要的,我们就可以理解电子商务网站采用的一些标准的机制,它们事实上是受到非对称信息和信号的启发所产生的。在这一节,我们考虑两种机制:信誉系统,以及在带有广告的搜索中广告质量测度的作用。
  1. 信誉系统
  在网络环境下,这种想法起作用最清楚的例子之一是在诸如 eBay 那种网站上信誉系统(reputation systems)的发展。由于 eBay 是用来支持以前从没见过,并且以后也可能不再来往的人们之间进行交易的平台,因此买家面对着与很差的卖家(就像那些卖柠檬的)打交道的风险,即卖家所提供的物品的质量低于所宣称的,甚至根本就不提供所承诺的物品。这样我们就有了一个与柠檬市场很相似的情形:如果买家相信得到很差的产品(或者就是被欺骗)的几率太高,那么他们愿意在 eBay 上为一件物品支付的价格就会很低,以至于持有好物品的卖家都不愿意加入。这样,eBay 市场就彻底失效了。
  信誉系统是像 eBay 这种网站的一种特征,旨在提供一种缓解这个问题的认证机制。在每次购买行为之后,买家对卖家给一个评估,报告所作的交易和收到的物品是否满足预期。
  一个卖家收到的(来自多方的)评估由一个算法来综合,给出该卖家的总体信誉分数(reputation score),该算法就是信誉系统的核心。卖家的信誉分数随时间变化:好评使分数提高,批评使它降低。这样,一个好的信誉分起着一种信号的作用一原则上,得到好分是有代价的,因为它要求这个卖家做了一系列得到买家满意的生意。如果较好的卖家能得到较高的信誉分,那么信誉就可以看成是卖家质量的信号,就好像卖家认证他的二手车,或者工人付费受教育所起的信号作用那样。以这种方式,如果像 eBay 这样的网站能使买家对信誉系统的可靠性有信心,则信誉分数就能减少这种网站固有的信息不对称性的影响。
  创建一个有效的信誉系统充满挑战,其中一些直接来自这种应用本身的在线性质。特别是像 eBay 那种网站的参与者通常可以通过注册多个账户来创建多个身份,这就导致了若干破坏信誉系统目的的方式。首先,刻意使坏的卖家可以故意拾高它所掌握的一个特定身份的信誉,从而得到买家的信任,然后以那个身份从事信誉不好的活动,直到其信誉彻底毁坏(即信誉分降到很低),抛弃这个身份,创建另一个新的,重新开始这个过程。换句话说,如果很容易通过注册一个新的账号“重新开始”,不良行为的信誉后果就会减轻。这种可以重新开始的能力对在线交易问题增加了一个严重的道德风险特征,就好像一个人影响他健康状态的能力对医疗保险增加了一个道德风险成分一样,这就使创建可靠信誉系统的问题更加困难了。此外,由于另一种潜在的卖家误导行为,信誉系统的设计进一步复杂化。特别地,一个卖家可以同时操纵多个身份,让不同的身份参与相互的交易,只是为了相互哄拾正面的反馈。这个卖家因而就可能在没有真正良好行为历史的情况下也得到信誉高分。从基本精神看,这些策略使我们想起在 Wb 搜索中关于链接分析的讨论,它们是这种
  一般性原理的极端版本。这个原理就是,当人的行为由计算机算法来评价时,我们应该预计,许多人会想办法适应算法的标准而从中获得利益。设计能有效地抵御这种困难的信誉系统是一个热点研究问题。

  2. 在基于关键词的广告中的广告质量
  柠檬市场背后的思想,在搜索引擎用来支持关键词广告的系统中也有清楚的体现,事实上,这形成了一个有趣的案例研究,说明这些概念对一个巨大在线市场的影响。特别地,在第 15 章我们谈到了广告质量问题:如何让广告出现在网页上的排序不只是基于投放广告的厂家的竞价,也要考虑这广告在给定位置,相对于其他广告,得到的真实点击率。否则,一个高竞价但没什么吸引力的广告可能会挤占网页前面的空间,但几乎没人点击它,从而不能为搜索引擎带来什么收入。
  但是,当你看看搜索产业实际上是怎么运行广告市场的时候,就很快会认识到“广告质量”的概念不仅仅是反映在该广告得到的点击率,它实际上更加微妙,取决于用户对广告满意度的一种综合估计。一个通常的场景如下。可能有一个广告者,在某个查询词上给出很高的竞价,并且,这个广告有一种迷人的广告词,使得人们从搜索结果页面上给予了很高的点击率。在每个点击上的高竞价,乘以高点击率,能为搜索引擎产生显著的收人。然而,这广告词链接所到的实际网页(landing page,当用户点击广告后到达的网页)是低质量的——不是欺诈的,只是与广告所关联的查询不很相关。例如,一个广告商在查询词“加勒比度假”上出了一个很高的竞价,并且在 Go0gle 结果网页上包含一段广告文字“梦中的度假地”,但当你点击这广告词时,却得到在世界上一个完全不同的地方出租度假住处的网页。很自然,大多数点击这个广告的用户都会是很失望的。
  在这种情况下,搜索引擎当前的策略是大大降低那种广告在网页上的地位,或者根本就不显示它,即使这显然会使搜索引擎公司失去将这广告放在高位带来的高点击率收人。他们这么做的理由是:如果用户得到了被这广告引导到低质量网页的经历,他们通常就不会点击很多广告了,长此以往,这种用户行为的整体效果会对收人产生巨大的负效应。从本质上讲,这种从高点击/低质广告中获得的短期收入,会被用户形成的低质量感受所带来的长期损失抵消。
  信息的不对称,是这权衡背后的基本问题,事实上,搜索广告市场表现出了柠檬市场的基本成分。虽然在一个搜索广告上点击一次是很小一个动作,与购买汽车或雇用新员工不可比(如在前面二手车市场和劳动力市场的例子),它仍然是用户(买家)信念的一个反映,即只有当她相信链接的另一端是值得的,她才会去点击。而且,正如买方只有在购买后才会知道一个二手车的质量,用户也只有在点击广告到达目标网页后才能知道网页的质量。在这方面,做广告的比搜索引擎用户有更多关于他们的目标网页质量的信息,而用户对广告文字在多大程度反映目标网页质量,隐含地形成了一种心理估计。
  因此,我们注意到,虽然这里和柠檬市场的类比是相当自然的,但也是有点微妙。特别是,它不是关于广告商和搜索引擎之间的关系(虽然人们也可以在那里寻找信息不对称),而是用户和广告商的关系,其中有价值的是用户点击广告所付出的努力。总体来看,用户决定在一个链接上点击是至关重要的,因为它们造成了搜索行业收入的很大一部分。
  在前面的分析中,我们看到在这类市场可以有多种自我实现的期望的均衡:一些是买方预测平均高品质,同时实际上也是高品质的货物出售;一些是买家预测低平均质量,同时在市场上也只有低质量的货物。这种平衡是基于消费者作出正确预测的假设。如果用户有时间来了解广告质量的分布,这在搜索广告的情况下也有一定道理。由于搜索引擎对它们显示的广告是可控制的,它们试图维持一个合理品质的广告混合,从而选择一个整体市场的均衡,其中用户期望高品质的广告,持有高品质内容广告的客户也愿意通过搜索引擎来做广告。

第 23 章 表决

23.1 作为集体决策的表决

  表决的概念包括很宽一类用以达成群体决定的方法。例如,形成陪审团裁决的方法,产生美国总统大选结果的方法,或者是产生大学橄榄球赛的海斯曼杯冠军的方法,都是不同的,而这些差别既影响进程,也影响结果。此外,表决可用于选择一个单一的“赢家”,也可以用于产生一个排名名单。后者的例子包括聚合多个民意调查的结果,得到高校运动队的排名,以及综合多种评论意见,发布有史以来最好的电影、歌曲或专辑的排行榜,等等。
  表决理论最近也用于一些网络应用。不同的搜索引擎产生不同的排序结果;一系列关于元搜索的工作提出了一些工具,来将这些排名聚合成一个单一排序。书籍、音乐和其他物品的推荐系统,如亚马逊的产品推荐系统,也已用到了相关的想法来聚合不同的偏好。在这种应用中,推荐系统根据历史信息,确定出若干与你有类似口味的用户,然后再使用表决的方法,将那些用户的偏好进行综合,为你产生一个建议排名单(或一个最好的建议)。注意,在这种情况下,目标不是要为所有人产生一个单一的排名,而是为每个用户,根据类似用户的偏好,形成一个聚合的排名。

23.2 个体的偏好

  表决系统的作用,就我们的目的而言,可如下描述。一群人要对一组有限可能的备选项(候选项)进行评估:这些备选项可能对应政治候选人、审判中可能的判决、国防开支的数量、奖项的提名人,或者在一个决定中的一组观点。表决涉及的人希望在多个备选项中产生一个单一的排名,确定那些备选项从好到差的顺序,在某种意义下反映这群人集体的意见。当然,这里的挑战是定义如何就叫“反映”了群体中成员们的各种意见。

23.3 表决系统:少数服从多数规则

  l. 少数服从多数规则与孔多塞(Condorcet)饽论
  当只有两个候选项时,最广泛使用的表决制度也是最自然的,即少数服从多数规则(majority rule)。在这种规则下,我们采取的是将多数选民偏爱的选择排在第一位,将另一个选择放在第二位。在这种讨论中,总假定选民人数为奇数,这样就不必担心产生平局的可能性。
  由于多数规则对两种选择的情况是太自然了,因此在多于两个候选项的情况下,人们也很自然地会尝试基于少数服从多数规则来设计一个表决系统。然而,这实际上是非常棘手的。也许最直接的方法是首先建立群体偏好(group preferences.),做法是将少数服从少数服从多数规则应用到每个候选项对,然后试图把这种群体偏好转变成群体排名。也就是说,
  我们建立一个群体偏好关系 >,其基础是每个人的偏好 >i 。对于每对候选项 X 和 Y,我们统计给出 X>i Y 的投票人的个数,以及给出 Y>i X 的投票人个数。如果第一个数字比第二个大,那么就可以说群体 > 满足 X>Y,因为多数选民在单独考虑 X 和 Y 的时候都偏向 X。同样,我们说群体偏好是 Y>X,如果给出 Y>i X 的人数要多。由于选民人数是奇数,我们不会在 X 和 Y 之间看到相等的偏好数。因此,对于每个不同的候选项对,我们一定有 X>Y 或 Y>X。也就是说,群体偏好关系是完备的。
  到目前为止,我们还没有任何问题。但令人吃惊的困难是,即使每个人的偏好都是传递的,该群体的偏好也可能是不传递的。考察这怎么可能发生。假设我们有三个人 1、2 和 3,三个候选项 X、Y 和 Z。进一步假设

  然后,应用少数服从多数规则来定义群体偏好,我们得到 X>Y(因为相对于 Y,1 和 3 都偏向 X),Y>Z(因为相对于 Z,1 和 2 都偏向 Y),以及 Z>X(因为相对于 X,2 和 3 都偏向 Z)。这就违反了传递性,它要求一旦有了 X>Y 和 Y>Z,则应该有 X>Z。
  从传递性个人偏好得出非传递性群体偏好的可能性称为孔多塞悖论(Condorcet Paradox),是法国政治哲学家马奎斯·德·孔多塞(Marquis de Condorcet)在 1700 年代讨论过的一种现象。关于它,有一些本质的东西与直觉相悖。如果我们记得前面关于非传递性偏好的讨论是多么“无辜”,这里的孔多塞悖论则描述了一种简单的情形,即一群人,当要通过少数服从多数规则表达他们的集体偏好时,他们可以在保持每个人都有完全合理的偏好的情况下,整体表现得自相矛盾。让我们回到一个人对巧克力,他更喜欢草莓;对草莓,他喜欢香草;对香草,他偏好巧克力的例子。即使我们假设没有哪个人会有这样的行为,孔多塞悖论说明,当一群朋友要分享一品脱冰激凌,通过少数服从多数表决来决定买哪一种口味时,这样的情况能很自然的产生。
  事实上,孔多塞悖论也用来说明如何自然地引导一个人形成非传递的个人偏好。例如,考虑一个学生要选择上哪所大学,她理想中的大学是排名高,课堂的平均人数少,而且还能给她相当数量的奖学金。假设她被三所大学录取了,各自的特点如图 23.2 所示。在比较这些大学的时候,该生打算针对三个方面的考虑,两两进行比较,采用“少数服从多数”的规则来做决定。不幸的是,这导致了 X>i (因为在排名和奖学金上,X 比 Y 好)、Y>i Z(因为在排名和课堂规模上,X 比 Y 好),以及 Z>i X(因为在课堂规模和奖学金上,Z 比 X 好)。不难看到这其中的相似性,每个方面相当于一个投票人,这个学生的“个人偏好关系”实际上就是从这三个方面综合出来的群体偏好关系。但它确实表明即便是一个人在以多重标准做决定的时候也会出现的复杂性。

  2. 基于少数服从多数规则的表决系统
  孔多塞悖论预示着在表决系统的设计中会有一些麻烦,但如果我们就是需要某种方法来从一个群体中产生实际的排名(包括一个排在最前面的候选项),还是值得探索用少数服从多数原则能做些什么。我们将着重于将排名第一选择出来的方法,认为它是“群体的首选”。为产生一个完整的排序表,人们可以首先选择出群体首选项,将它从候选项集合中删去,然后对剩下的候选项重复应用这个过程。
  一种找到群体首选项的自然方式如下。我们将所有候选项排成某种序,然后利用少数服从多数原则从这个序中一个个删除候选项。具体做法是,首先用少数服从多数表决法比较头两个候选项,将胜者与第 3 个候选项进行比较,然后再将胜者与第 4 个候选项进行比较,如此下去。最后比较出来的胜者一定就是群体首选项了。我们可以将这个过程图示在图 23.3(a)中,表示在一个 4 候选项上的删除序列,A 和 B 首先进行比较,胜者与 C 比,再胜者与 D 比。我们可以将此看作是一个会议的议程,其中候选项两两提交到群体,采用多数表决法,群体首选项从这个过程中浮现出来。
  这是在候选项对上运用多数规则发现群体首选项的一种更一般策略的一个例子:我们可以将它们排成任何样子的“淘汰赛”,其中候选项以某种形式成对安排,胜者进人下一轮,输者则被淘汰。在这个比赛中最终浮现出来的那个候选项就被称为群体首选项。图 23.3(a)就是一种淘汰赛的结构;图 23.3(b)画出了另一种结构。

  3. 基于少数服从多数表决法则的表决系统的弊病
  这些系统的确产生一个群体最喜欢的(并且,通过在剩下的候选项上反复调用系统,也产生一个群体排名)。但是,孔多塞悖论可以用来揭示这种系统的一个重要毛病:其结果有赖于一种策略议程设置(strategic agenda setting)。让我们回到原来的孔多塞悖论的例子,其中三个投票人对于候选项 X、Y 和 Z 有各自个人的排序。他们决定利用图 23.3(a)所示的系统(针对三个候选项)来选出群体首选项:他们将首先在两个候选项上做一个少数服从多数表决,然后再在胜者和第三个候选项之间进行多数表决。
  这就变成了如何为这个过程设置议程的问题,即先对 X、Y 和 Z 之间的哪两个来表决,哪一个要放到最后?由于个人偏好的结构,在这种情况下议程的选择对结果具有决定性的作用。如果像图 23.4(a)那样,先比 X 和 Y,那么 X 取胜,但然后输给了 Z,X 当不了群体首选项了。另一方面,如果先比 Y 和 Z(如图 23.4(b),那么 Y 取胜,但然后输给了 X,X 就成了群体首选项。(我们可以类似地让 Y 当上群体首选项)。这样,对于符合孔多塞悖论情况下的个人偏好,整体的胜者完全由在候选项对的表决序列确定。换种方式说,如果最喜欢 Z 的人来设置议程,她可以做出让 Z 取胜的序列;但如果最喜欢 X 或 Y 的人来设置议程,他可以做出让他首选的对象取胜的序列。群体首选项于是就由控制议程的人来决定了。这个问题也不可能靠重新引入已被删除的候选项的方式解决。在孔多塞悖论下的偏好,总会有一个已被删去的候选项,胜过当前群体首选项的候选人,因此,重新引入候选项来考虑的过程没法结束。
  前面,我们通过一个学生要考虑多种因素来选择大学的例子(如图 23.2 所示),观察到孔多塞悖论也可能反映出个人(而不是群体)决策中的病态。议程设置的问题在个人决策的场合也有类似的情况。例如,假设在那个学生是根据录取通知书到达时间做出放弃某所大学的决定的。那么,如果录取信到达的次序是 X、Y、Z,她就会当 Y 到达时放弃 Y 而保留 X(因为 X 有较高排名和较高奖学金),然后当 Z 到达时决定放弃 X 而保留 Z(因为 Z 有较小的班级和较高奖学金)。这种在两两之间的决定都是有道理的,但它导致最后留下的 Z,还不如她放弃了但其实更喜欢的 Y。这就是最终决定取决于议程设置所产生的问题。

23.4 表决系统:与位置相关的表决

  有另一种表决系统,其产生组排序的方式不是从候选项的两两比较中建立起来,而是试图直接从个人排序中产生。这种系统中,每个候选项根据其在人们排序中的位置,得到一个权重,在组排序中按照总体权重安排。这种系统的一个简单例子是波达计数法(Borda Count),由戴高乐·波达(Jean-Charles de Borda)在 l770 年提出。波达计数法常用来选择体育运动奖项的胜者,如高校橄榄球的海斯曼奖杯;一个变种是用来选择职业棒球的最有价值球员;也被美联社和合众国际社用来确定运动队的排名。
  在波达计数法中,如果总共有个候选项,那么个人 i 对她排在第一位的候选项赋予权重 k—1,对第二个赋予 k—2,直到倒数第二个 1,最后一个 0。换句话说,每个候选项从个人 i 得到的权重等与比它低的候选项的个数。每个候选项的总权重就是每个人给它的权重之和。然后,候选项就按照总权重排序。(我们假设,如果两个候选项得到相同的总权重,就采用某种预先安排好的打破平局的方法来决定谁放在前面。)
  例如,假设有 4 个候选项,A、B、C 和 D,有两个投票人,分别给出排序:
  A>i >Bi>Ci>Di
  和
  B>i >Ci>Ai>Di
  那么,根据波达计数法,赋予给候选项 A 的权重是 3+1=4,给 B 的是 5,C 的是 3,D 的是 0。因而,按照降序排列,组排序就是:
  B>A>C>D
  不难看到,保持其基本风格,我们可以建立波达计数法的各种变种:可以给每个位置赋予任意的“点数”,然后按照总点数来排列候选项。波达计数法将 k—1 赋予第一个位置,k—2 给第二个位置,等等。但我们可以想象不同的赋值,例如,若只想说前三名重要,我们就可以给第一名 3 分,第二名 2 分,第三名 1 分,其余的都是 0 分,组排序还是由总分决定。我们称这类系统为位置表决系统(positional voting system),因为候选项得到的数值权重取决于它们在个人排序中的位置。
  波达计数法的一个要点是(忽略平手),对一组候选项来说,它总是产生一个完备的、传递的排序。这是它的定义使然,因为它建立了一个单一的数值标准来将候选项排序(包括一个平手消解的规则)。但是,波达计数法也有一些根本的弊病,如下所论。
  1. 位置表决系统的弊病
  波达计数法,以及一般的位置表决系统最大的问题,在于组排序的前列位置可能会严重依赖个人排序中的很低的部分。可通过一个场景解释这一情况。假设一个杂志要写一个专栏,请 5 名电影评论家来选出有史以来最好的电影,《公民凯恩》和《教父》是两个候选对象。专栏最后让他们采用少数服从多数表决法,评论家 1、2 和 3 喜欢《公民凯恩》,但评论家 4 和 5 更喜欢《教父》。
  然而,在最后一分钟,栏目的编辑们认为该专栏需要更加“现代的”感觉,于是增加了《低俗小说》作为第三个可选项,让他们讨论和评价。由于现在有三个候选项了,杂志让每个评论家提供一个排序,然后利用波达计数法来做总体决定,作为该栏目抢眼的话题。前面三个评论家(他们都喜欢老电影)给出的是:
  公民凯恩>i 教父>i 低俗小说
  评论家 4 和 5(只喜欢在最近 40 年出的电影)给出的则是:
  教父>i 低俗小说>i 公民凯恩
  应用波达计数法,我们看到前 3 位评论家每一位给《公民凯恩》的权重是 2,后两名是 0,总权重是 6。《教父》从前三位分别得到权重 1,从后两位分别得到 2,总数是 7。《低俗小说》则从前三位得到 0,从后两位分别得 1,总数为 2。结果,波达计数法给出《教父》为群体首选项。
  注意这里发生了什么。在《公民凯恩》和《教父》之间的两两比较保持不变—《公民凯恩》以 3:2 取胜。但由于加了第三个可能,群体首选项的识别改变了。除此以外,这并不是由于这群人特别喜欢这个新的第三种可能,它实际上在与其他电影的两两比较中都输掉了。换个角度讲,《公民凯恩》在波达计数法中没能排在第一位,尽管它在按照少数服从多数规则的两两比较中要比其他两个都好。因此,我们发现,波达计数法的结果会依赖那些直觉上看起来“不相干的”候选项的出现一那样的候选项看起来很弱,但实际上起了一个“破坏者”的作用,引起了结果中高排名者的变化。
  这种结果的可能性引出了波达计数法的进一步困难。特别是,策略性偏好误报(strategic misreporting of preferences)问题。我们考虑一个稍微不同的场景来看看这是怎么回事。假设在前面的故事中,评论家 4 和 5 实际上有真实的排序:
  教父>i 公民凯恩>i 低俗小说
  换句话说,在故事的这个版本中,所有 5 位评论家都同意《低俗小说》应该在这三个电影中排在最后。如果我们在这样 5 个个人排序上做波达计数法,组排序会将《公明凯恩》放在第一(它得到总权重 3×2+2×1=8,而《教父》得 3×1+2×2=7)。然而,假设评论家 4 和 5 理解波达计数法的性质,事先决定将他们的排序误报为:
  教父>i 低俗小说>i 公民凯恩
  于是我们就有前面情形的个人排序,并且《教父》最终排在第一。
  这里的要点是,在波达计数法下的投票者有时可以通过撒谎,不告知他们的真实偏好而得利,特别是,可以压低其他许多投票者放在他们排序顶端候选项的排名。

  2. 美国总统大选中的例子
  这样一种病态现象在美国总统大选中也有过不同的版本。美国总统大选的全过程有一个复杂的规定,其中包括各州在换届选举中选出他们的选举人,即选择将获得州选举人票的候选人,通常是通过多数决(plurality vote)来完成的:被相对最多(不一定是大多数)的选民排在前面的获胜。(美国宪法不要求这样,有些州已经考虑和采用了其他的方法,但这是典型的做法。)
  我们想想,多数决事实上就是一种位置表决系统,从下面这种等价的方式能看出来。让每个投票人报告他们各自对所有候选人的排序,每个个人排序于是将权重 1 赋给了排在第一名的候选人,后面的权重都为 0。从这些排序中得到最大权重的候选人胜出。注意,这不过是用不同的方式在说“被最多的选民排在前面的获胜”,但它说明这个系统符合位置方法的结构。多数决显示出来的困难类似于我们在波达计数法中观察到的。在只有两个候选人的情形,多数决规则与少数服从多数原则相同;但若候选人多于两个,我们就会看到“第三方”效应又出现了,一个只有很少人青睐的候选项有可能起到在两个强有力的竞争者中改变结果的作用。于是,这就会使某些选民刻意策划他们的选择,故意误报他们对第一名的选择,从而让一个候选人有更多的胜出机会。这样的问题在最近美国总统选举中出现过,并且它们在一些重要的早期选举(例如亚伯拉罕·林肯在 1860 年的选举)中的效果也被研究过。

23.5 阿罗不可能定理

  我们已经看到了一些不同的表决系统,当需要考虑多于两个候选项的时候,它们都显示出病态的行为。如果进一步考虑在实践中采用的表决系统,我们会发现它们也是受困于在产生组排序方式中的问题。然而,在一定时候,我们也许应该离开具体的表决系统,问一个更一般的问题:是否存在什么表决系统,能在三个或更多的候选项中产生组排序,并且避免我们到目前为止谈到的所有弊病?
  要使这个问题具体化,要求我们精确说明所有相关的定义。我们已经讨论了表决系统的精确定义:对于一个固定数量(k)的选民,表决系统是一个函数,它以 k 个个人排序为输入,产生一个组排序。我们需要做的另一件事是说明一个表决系统没有弊病是什么意思。为此,提出合理的表决系统应该满足的两个性质:

  • 首先,如果有一对候选项 X 和 Y,所有选民都给出 X>i Y,那么组排序中也就应该有 X>Y。这是一个十分自然的要求,称为帕累托原则(Pareto principle)或者趋同原则(Unanimity principle);它只是要求如果大家相对于 Y 都更喜欢 X,则该组排名应该反映出这一点。可以认为趋同原则旨在确保群体排名至少要在最低的要求上反映个人的排名。
  • 其二,我们要求,对于任意两个候选项 X 和 Y,它们在组排序中的顺序仅取决于它们在个人排序中的相对顺序。换句话说,设从一组个人排序产生的组排序中有 X>Y,如果在某些个人排序中我们移动某个候选项 Z 的位置,但保持 X 和 Y 的相对位置不变,则结果组排序依然应该有 X>Y。
    这个条件称为无关候选项的独立性(Independence of Irrelevant Alternatives,IIA),因为它要求在组排序中 X 和 Y 的关系仅取决于选举人关于它们俩的偏好,而与他们怎么看其他候选项无关。IIA 要比趋同性更加微妙,而且在我们前面讨论的表决系统的病态行为很多就是由于没有满足 IIA。在依照波达计数法的策略性误报偏好情况中,这种 IA 问题是很清楚的,在那里第三个候选项 Z 在排序中的换位就足以改变了另外两个候选项 X 和 Y 在结果中的地位。IIA 因素也在基于少数服从多数的策略议程设置问题中有作用:那里的关键想法是,选择一种议程设置,早早就把候选项 X 删除,不让它有机会和候选项 Y 比较从而胜过它。
  1. 满足趋同性和 IIA 的表决系统
      由于趋同性和 IIA 都是合理的性质,很自然我们就会问什么样的表决系统满足这两条性质。当只有两个候选项的时候,少数服从多数规则显然是满足它们的:如果大家都喜欢 X,结果就认定了 X;并且由于只有两个候选项,X 和 Y 在组排序中的位置显然不会受什么其他候选项的影响。当有三个或者更多候选项时,要找一个满足这两个性质的表决系统就不简单了:前面说的位置表决系统和少数服从多数系统都不成。但是,有一种表决系统,即独裁系统是满足这两条的。所谓独裁系统,就是挑一个人(i),让组排序就等于这个人的排序。注意,基于这种独裁的概念,实际上有 k 种不同的表决,个选民的每个人都可能被选成独裁者。
      我们很容易能看到这种独裁系统满足趋同性和 IIA。首先,如果相对于 Y 每个人都更喜欢 X,那么独裁者也是,因此组排序就反映这种认识。其次,X 和 Y 在组排序中的位置只取决于独裁者对它们的排序,与任何其他候选项 Z 的位序无关。
      2.阿罗定理
      1950 年代,肯尼·阿罗证明了一个惊人的结果,讲清楚了为什么表决系统难以摆脱那些病态行为。
      阿罗定理:如果针对至少三个候选项,则任何满足趋同性和 IA 的表决系统必定是对应某个个人的独裁。
      换句话说,独裁是满足趋同性和无关项独立性(IIA)的唯一的系统。
      由于人们通常认为独裁是一个不好的性质,即“非独裁”是一个所期望的性质,阿罗定理常常被表达成一个不可能性结果。即如果一个表决系统的组排序不总是和某人(i)的排序一致,则我们说一个表决系统具有非独裁性,此时可以重新表述阿罗定理如下。
      阿罗定理(等价版本):如果针对至少三个候选项,则没有任何表决系统同时满足趋同性、IIA 和非独裁性。
      最终,阿罗定理告诉我们的不是表决是一定“不可能的”,而是其中有不可避免的权衡需要处理一我们选择的任何系统都会有某种形式的不理想行为。因此,它有助于人们将注意力放在讨论如何管理表决中的这些权衡上,并且在这种认识上评价不同的表决系统。

23.6 单峰偏好和中值选举人定理

  孔多塞悖论和阿罗定理是天然的事实,我们没法回避。然面,当面对一种不可能结果的时候,一种通常的做法是考虑有关问题的一些合理的特殊情况,看看其中是否不会出现那些基本的困难。关于表决,沿着这方向有着一个长线的研究。
  这些研究的起始点,是观察到在孔多塞悖论情势下所采用的个人排序有些不寻常。回顾那里有三个候选项 X、Y 和 Z,三个选举人 1、2 和 3,我们有:
  X>1 Y>1 Z
  Y>2 Z>2 X
  Z>3 X>3 Y
  假设 X、Y 和 Z 分别对应要花在教育或者国防上的费用,X 对应一个比较小的数,Y 中等,Z
  是一个大数。那么选举人 1 的偏好符合逻辑(不一定就对):上述表达式相当于说“钱花得越少越好”。选举人 2 的偏好也可有逻辑的理解:他认为最好是花中等量的钱,但如果不行的话,那就只有多花一些了。选举人 3 的偏好则难以简单说清楚道理来:他认为应该花大钱,但第二选择却最少,中间的则放在最后。换句话说,前两个选举人的偏好可以通过与一个固定数字的相近程度来解释:他们都有一个“理想的”数量,并且按照与这个理想的相近程度来评估候选项。第三个人的偏好没法得到这样的解释:不存在一个“理想的”数,以至于问题中的“大数”和“小数”都离它很近,但“中等数”反而离它远。这不是说一个人不可以有这种偏好(例如,有人可能认为,如果我们不舍得在教育上给予足够投资(从而才可以将它做好),就还不如一分钱也不花在教育上),只是说那样的偏好比较不寻常。
  相似的推理也可以用于 X、Y 和 Z 是政治候选人的情形。例如,按照他们的政治倾向,
  X 是自由派,Y 是中间派,Z 是保守派。在这种情况下,选举人 1 喜欢自由派,选举人 2 喜欢中间派,但如果他必须在两个极端之间选择的话则倾向于保守,但选举人 3 喜欢保守派候选人,然后是自由派,最后是中间派。同样,选举人 1 和 2 的偏好是好解释的,因为我们可以假设他们对候选人的评判是参照政治倾向“谱”(译者注:即想象每种态度都可以放到保守和自由这两个极端之间的某一点上)中个人认定的某个“理想的”点,但选举人 3 的偏好没法这么解释,因此不那么自然。
  我们现在来描述一种将选举人 3 的排序的“非常理性”形式化的方式,然后说明如果排序中不包含这样的结构,则孔多塞悖论就不会出现。
  1.单峰偏好
  如果参与表决的候选项的特征可以对应于数值,或者可以按照政治倾向的程度做线性排序,我们有理由假设个人的偏好倾向于看起来像上述例子中的选举人 1 和 2 的偏好,即在候选项涉及的范围,每人有一个特别喜好的点,他们参照这一点来对候选项做出评估。事实上,对我们这里的讨论而言,假设还可以弱一些,即一个人的偏好在他最喜欢的候选项两边一致地“下降”。
  精确地讲,假设 k 个候选项是 X1,X2,…,Xk。,每个人都按照这个次序看它们(同样,我们可想象它们是数值,或者政治倾向谱上的候选人)。我们说,一个投票人有着单峰偏好(single-peaked preferences),如果不存在候选项 Xs,它的两个邻居 Xs-1 和 Xs+1 的排位都比它高。换句话说,一个选举人绝不会偏好两种选择,位于一个中间选择的对立的两边。由于我们假设选举人具有完备和传递的偏好,我们也称这种单峰偏好为单峰排序。
  这样的偏好称为单峰的,因为我们要求的条件等价于是说每个选举人 i 有一个最高排名的选项 Xt,且她的偏好在 Xt 的两边都降低:
  Xti Xt+1i Xt+2i
  且
  Xti Xt-1i Xt-2i
  画出图来,如图 23.5 所示。其中的例子中有三个选举人,分别有偏好:
  X11 X21 X31 X41 X5
  X22 X32 X42 X12 X5
  X33 X23 X13 X43 X5
  图中的三条曲线分别表示这三个人的偏好。曲线上,椭圆代表一个候选项,它的高度对应其在偏好排序表中的位置。如图 23.5 所示,个人偏好排序中的单峰表现在曲线上就是一个可见的顶点。

  2. 单峰偏好下的少数服从多数规则
  单峰偏好很自然地用在多种排序模型中,但它们在表决理论上的意义被邓肯·布莱克(Duncan Black)在 1948 年发现。
  回顾在 23.3 节的第一个最基本的例子,我们要从一组个人排序中综合出组排序。我们比较每一对候选项 X 和 Y,用少数服从多数规则来产生组的偏好 X>Y 或 Y>X(取决于哪个候选项得到更多选举人的青睐)。如前,我们也假设选举人是奇数,因此不用担心出现平手的可能性。我们的希望是结果组偏好关系>是完备且传递的,从而就能从中产生一个组排序。不幸的是,孔多塞悖论表明这种希望是枉然的:传递的个人偏好也可能导致非传递的组偏好。
  但这就是我们在本节发展的框架的要点,即对于单峰偏好来说,上述方案是完美的。我们有如下结论。
  断言:如果所有个体排名都是单峰的,那么将少数服从多数规则应用到所有候选项对上,所产生的组偏好关系>是完备且传递的。
  初看起来,并不清楚这个惊人的事实会是真的,但它来自如下一个直觉上很自然的理由。
  3. 个人首选项表中的中间项
  如同其他构建组排序的方式一样,我们从找到组首选项(即可以放到排序顶端的候选项)开始,进而填充排序中后面的位置。找到一个组首选项是这个问题的关键,因为它要求我们识别出一个候选项来,其在两两多数表决中胜过所有其他候选项。
  我们考虑每个选举人排在最高的候选项,把这些首选项从左到右,按照本节前面确定的顺序排列。注意,如果一些选举人的首选项是相同的,那么该候选项在排列表中就会出现多次,但这没什么关系。现在考虑排列表的“中位”候选项,即恰好在表中间的那个。例如,按照图 23.5 的三个个人偏好,个人首选项的排序表会是 X1、X2、X3,因此中间项是 X2。对于更多选举人的情形,如果个人首选项排列是 X1、X1、X2、X2、X3、X4、X5,则中间项也是 X2,我们考虑的是所有项,包括重复。
  考虑个人首选项表的中间项作为组的首选项是一个自然的想法,因为它自然地在两个极端之间取得了“妥协”。而且,事实上它对我们的目的而言的确不错:
  中位项定理:在个人排序具有单峰性质条件下,个人首选项列表的中间项在少数服从多数的两两比较中胜过所有其他候选项。
  下面考察这为什么是对的。令 Xm 为个人首选项列表的中间项,Xt 是任意其他候选项。假设 Xt 在 Xm 的右边,即 t>m(它在左边的情形可完全对称论述)。也设想将选举人按照各自首选项在列表中的顺序做排序。
  我们的论证思路如图 23.6 所示。选举人的个数 k 是奇数,在有序表的第(k+1)/2 位置上的 Xm 就是中间项。这意味着对于前面(k+1)/2 个位置上的选举人,Xm 要么是他们的首选项,或者他们的首选项在 Xm 的左边。对这些选举人的每一个而言,Xm 和 Xt 都在该选举人偏好右手边的“下坡”上,但 Xm 要比 Xt 离峰更近,因此相对于 Xt,他们要更偏好 Xm。也就是说,在前(k+1)/2 位置上的每个人都更偏好 Xm。注意到这已经是选举人严格的多数了,因此在少数服从多数的两两比较中 Xm 胜过 Xt

  简单地讲,个人首选项表的中间项 Xm,相对于任何其他候选项 Xt,而言,总是可以获得多数支持,这是因为对多于一半的选举人而言,Xm 介于 Xt 和他们各自的首选项之间。
  从这个关于个人首选项表的中间项的事实,不难看出为什么在所有候选项对上施行少数服从多数规则,可以产生完备且传递的组排序:通过一次次将组首选项识别出来,我们就建立起了组排序。也就是说,我们从找到个人首选项的中位项开始,并将它放到组排序的顶端。这样做是保险的,因为中位项定理保证了它胜过所有其他将被放到这个组排序表上的候选项。
  现在,我们从每个个人排序中删除此候选项。注意,当这样做之后,所有个人的排序依然保持单峰性质,从本质上讲,我们只是从每个排序中“削掉了”峰顶,因而在原来排序中的第二项成了新的峰顶。我们现在有了一个同样问题的不同版本,即关于若干(比先前少一个)候选项的一组单峰排序。因此,我们可以从这些排序的第一名之间找到新的中位项,将它排到组排序的第二个位置,继续这种方式,直到所有候选项都被处理完毕。
  例如,将这个过程应用于图 23.5 的三个选民情形,我们会首先将 X2 选出来,将它放到组排序的第一个位置。一旦我们从候选项集合中删除了它,就得到三个关于 X1、X3、X4 和 X5 的单峰排序。在这个集合中,三个选民的个人首选分别是 X1、X3 和 X3,因此 X3 是新的个人首选中位项,我们将它放到组排序的第二位。如此进行,最后得到组排序:
  X2>X3>X1>X4>X5
  由于选民 2 的首选项被认定为第一个个人首选项表的中位项,他就是最初的“中位项选民”,组排序的第一项就和他的首选项一致,即都是 X2。然而,组排序并不完全与选民 2 的个人排序一致,例如选民 1 和选民 3 都偏爱 X1 和 X4,尽管选民 2 不那么想,但组排序反映了这个现实。

23.7 作为信息聚合形式的表决

  到目前为止,我们主要集中在表决用来聚合群体中有本质差别观点的情形。表决也可用于一群人有共同目标的场合。在那些场合,可以合理地假设存在一个真正的最好的排序,表决的目的是发现这个排序。对政治候选人,或者艺术品来说,这很可能是不适合的;但它可能是陪审团研究问题的方式,特别是当陪审团员纠缠在事实的不确定性上而难以形成决定的时候。还有一个场合它也可能是个好模型,那就是公司的咨询委员会,当委员们对公司提出的多个商业计划进行评价时,由于每个计划所产生的未来回报都是不确定的,需要以一定的方式形成一个优先排序。
  在这样一些情形,我们想象有一个真正最好的排序,可以认为个人排序的不同只是他们掌握的信息不同,或者对已有信息的不同评价。如果所涉及的每个人有同样的信息,并且对它有相同的评价方式,则会形成相同的排序。
  我们将看到,这些想法在人们考虑他们表决方式的时候能导致某些复杂的效果。作为一个基点,我们从一个简单的模型开始,其中人们纯粹基于他们的个人排序同时进行表决。
  然后我们讨论在这两个假设不成立时会发生什么情况,即表决顺序进行,或者对他人排序的了解会引起一个人改变她的排序。
  同时且诚实的表决:孔多塞陪审团定理
  我们从简单情况开始,假设有两个候选项 X、Y,其中一个本质上就是好些,每个选民会给她相信是较好的一个投票。选民们占有不同但非确定的信息,我们利用在第 16 章关于信息链的框架为这种情况建模。首先假设有一个“X 最好”的先验概率(a prior probability),每个选民都知道。为简单起见,我们取这个概率为 1/2 来做分析。这意味着在开始的时候,X 和 Y 同等可能是最好的选择。然后,每个选民收到一个独立的、私有的信号(关于 X 和 Y哪一个更好)。该信号给出的方式是以某个 q>1/2 的概率,指出 X 和 Y 中哪一个更好;以如同第 16 章中那种条件概率的形式写出来就是:
$$Pr\ [\ X᠆signal\ is\ observed\ |\ X\ is\ best]=q$$
  且
$$Pr\ [\ Y᠆signal\ is\ observed\ |\ Y\ is\ best]=q$$
  我们可以想象每个选民获得信号的方式是扔一个不平衡的硬币,对每个选民而言,它以概率 q 落在指示较好候选项那一面。
  不同于第 16 章的情形,在我们当前的分析中,所有投票都是同时进行的。也就是说,没人可以在她做出决定之前看到他人的决定。同时,我们假设每个人投票都是诚实的,即她一定投给她相信是更好的候选项,其信念来源于她掌握的信息(以她的私有信号的形式)。建立个人诚实投票的模型,可以采用如同第 16 章中的条件概率方式,即当一个选民观察到一个关于 X 的信号,她首先估计条件概率:
$$Pr\ [\ X\ is\ best\ |\ X᠆signal\ is\ observed\ ]$$
  然后,如果这个概率>1/2,她就决定选 X,否则就选 Y。如果她观察到的是关于 Y 的信号,也可有类似分析。我们这里只讨论 X 信号的情形就够了,因为两种情况是对称的。
  与在 16.3 节做的分析完全相似,我们可以用贝叶斯规则来估计这个选民决定背后的条件概率。即:
$$Pr\ [\ X\ is\ best\ |\ X᠆signal\ is\ observed\ ]=\frac{Pr\ [\ X\ is\ best\ ]×Pr\ [\ X᠆signal\ is\ observed\ |\ X\ is\ best\ ]}{Pr\ [\ X᠆signal\ is\ observed\ ]}$$
  由我们关于先验概率的假设,有 $Pr\ [\ X\ is\ best\ ]=1/2$。根据对信号的定义,我们知道 $Pr\ [\ X᠆signal\ is\ observed\ |\ X\ is\ best]=q$。最后,观察到 X 信号有两种情形:X 是最好,或者 Y 是最好。因此:
$$Pr\ [\ X᠆signal\ is\ observed\ ]=Pr\ [\ X\ is\ best\ ]×Pr\ [\ X᠆signal\ is\ observed\ |\ X\ is\ best\ ]+Pr\ [\ Y\ is\ best\ ]×Pr\ [\ X᠆signal\ is\ observed\ |\ Y\ is\ best\ ]=\frac12q+\frac12(1-q)=\frac12$$
  将这些整理到一起,我们得到:
$$Pr\ [\ X\ is\ best\ |\ X᠆signal\ is\ observed\ ]=\frac{(1/2)q}{1/2}=q$$
  一个完全自然的结论就是,选民将倾向于所收到信号支持的候选项。事实上,用贝叶斯规侧得到的计算结果给我们的不仅是这个结论,它还告诉我们,基于这个信号该选民应赋予这候选项的概率。
  马奎斯·德·孔多塞(侯爵)描述这个场景的时候是 1785 年。在他的版本中,他直接假设每个选民以某个概率 q>1/2 来选择其最喜欢的候选项,而不是从私有信号的假设中推导出来这个概率。但基于这两种假设的模型效果是一样的。孔多塞想说明,当许多选民以一个稍大于 0.5 的概率倾向于两个选择中的某一个时,少数服从多数规则是有效的。他从概率的角度对个人决定做形式化是一个新颖的做法,因为在那个年代概率还是一个比较新的东西。他的主要结论,现在称为孔多塞陪审团定理,如下所述。假设 X 是最好的候选项(Y 的情祝是对称的)。那么,随着选民数量的增加,选择 X 的选民(的份额)会几乎肯定地收敛到接收一个 X 信号的概率 q>1/2。特别地,这意味着多数人达到一个正确决定的概率,随着选民人数的增加,会收敛到 1。在这个意义上,孔多塞的陪审团定理也许是“群众智慧”概念最早的形式化结果,即聚合许多人的认识可以导致比任何专家个人都要更高质量的决定。

23.8 信息聚合中不诚实的表决

  上一节中孔多塞陪审团定理的假设之一是所有人都诚实表决,即每个人基于得到的信息都会选他或她相信是最好的。表面上看,这似乎是个比较温和的假设。如果选民能分享他们的信号,他们就会对最好的候选项形成全体一致的意见。但由于他们不能相互通信,并且只能看到他们自己的私有信号,一个选民除了根据她的信号做出最好的判断外,有什么理由还做别的什么呢?
  事实上,存在许多自然的情形,人们实际上会选择投出不诚实的票,偏向于她相信是最差的候选项,尽管她的目标还是最大化群体选出最好候选项的概率。这显然是一个违反直觉的断言,其背后的道理只是近期才有人阐明。为解释这种现象,我们来看一个基于 Austen-Smith 和 Banks 描述的场景的假想实验。
  1. 鼓励虚假投票的实验
  这里是实验的安排。实验者宜布,一个装有 10 颗弹子的坛子要放在一间屋子的前面;有 50% 的机会,坛子装有 10 颗白色的弹子,50% 机会是 9 颗绿色的和 1 颗白色的(我们称这第一种坛子为“纯粹的”,第二种为“混合的”)。
  实验者让 3 个人一起来猜一猜现在是哪一种情况。他们的集体决定将按照下面的协议形成。首先,每个人允许从坛子中取出一颗弹子,看看它(但不给另外两人看),然后将它放回去。然后,三个人要做一次同时的投票,不能通信交流信息,猜这坛子是哪种类型。如果多数人说对了,那么三个人都获得一笔奖金;否则,三人什么也得不到。(注意:如果多数人错了,每个人什么都得不到,尽管其中可能有人自已对了。)可以看到,实验的目的是为这些选民建立一组独立的私有信号:每个选民取出看的弹子的颜色是她的私人信号,不能传达给任何其他选民。但是,群体决定又必须通过少数服从多数表决来达成,而每个选民得到的概率信号是不同且可能是冲突的。
  我们现在来看一个人应该如何推理基于她抽取到的弹子情况的条件概率;这之后,我们考虑她应该如何进行实际的投票。
  2. 条件概率和关于投票的决定
  首先,假设你(作为三名实验人之一)抽得了一个白色弹子。不用精确计算,像我们在前面的小节中一样,利用贝叶斯规则,容易得出这种情形下的坛子很可能就是全部白色弹子那一种。(直觉上,如果你看到一颗白色弹子,它从全白坛子出来的可能性要比从只有一颗白弹子坛子出来的可能性大很多。)另一方面,如果你抽到了绿弹子,那肯定就是混合坛子了,因为只有它包含绿弹子。
  因此,如果你诚实地投票,当抽到白色,就会投“纯的”,绿色就会投“混合的”。但是,如果假设你知道其他两人也会诚实投票,你想选择你的投票来最大化三人中的多数产生正确答案的机会。于是,就可以问自已的一个问题,“在什么情况下,我的投票会影响整体结果”?稍加考虑,就会看到你的投票对结果的影响仅发生在另两个(诚实的)人投票意见不相同的时候(一个说纯的,一个说混合的)。此时,另两个人之一已经抽到了一个绿色弹子,因此坛子一定是混合的了。从这个推理得出的结论是:在你的一票起作用的时候,坛子一定是混合的!
  因此,如果你知道你的同伴会诚实投票,你为群体能帮的忙就总是投“混合的”,于是就给单次抽取绿色弹子支配多数结果的机会。换句话说,你这样做就是通过策略的投票操纵了群体的选择。的确,你这样做不是为了占别人的便宜,而只是为了让群体更可能做出最好的选择。但不管怎样,在这种情况下,如果你的两个同伴诚实投票,你也诚实投票的话就不是最优的。
  3. 投票实验的解释
  一旦我们意识到这个例子的妙处,自然就会想到针对一个共同目标的投票是不是与博奔论有什么关系。选民对应参与者,他们可能的策略就是基于私有信息选择投票的可能,得到的回报基于每个人的投票选择。我们刚才考虑的实验构造了一种场景,其中诚实的投票不是一个均衡。注意,虽然其中的分析排出了为达到均衡的最自然的候选项,但实际上它没有决定这个博弈中均衡是什么样子的。事实上,存在多个均衡,其中一些计算起来有点复杂,我们这里暂且不管它们。
  从这个讨论中,有一些进一步的要点值得多思考。首先,实验以一种非常清晰和漂亮的形式,展现出了非诚实投票的现象,清楚地揭示出其中的细节。但这种场景在现实世界情形也会出现,其特征是一个像少数服从多数投票这样的高度对称的决策过程,与具有非对称结构的一对候选项(像这里的单纯和混合坛子)相冲突。例如,假设一个公司的咨询委员会要为该公司在一个有风险和一个安全的举措上作决定,决定的方式是少数服从多数。进一步假设委员会成员有他们自己关于哪个方案更好的私有证据,并且如果任何一个人有真正的证据表明有风险的方案要好些,它就会是最好的选择。如果你是这种情况下的委员会成员,且你知道其他人会诚实投票,那么你知道你的一票只是在一半的委员会成员有倾向于风险方案是才有用,届时,风险方案是较好的。因此,如果你违心地将票投给风险方案,群体会较好一些,改进了当它真应该是那么回事的时候选择的机会。当然,将表决看成-·种博弈,你应该理解这里的情形事实上要更加复杂:若其他委员会成员也不诚实投票,你可能会假设他们也跟你有同样的推理。给定这种情况,确定如何行动,是一个复杂的问题。
  最后,值得特别提出的是这种分析中的一个关键方法,也就是当你的行动实际影响总体结果的情况下,你才评估它们的后果。它清楚地揭示了非诚实投票是正确决定的原因。研究人员观察到,将这个原理用于表决,也形成了一个在其他博弈场合下平行的推理方法,包括我们在第 9 章看到的“赢者的诅咒”。那里,当多人在一个有公共价值的项目(诸如石油开采权)上投标时,你投标的价值只是在你赢的时候才有意义,在那种情况,对项目真实价值的估计很可能是过高的(而不是过低)。因此,当你投标的时候,你需要考虑这个情况,让投下的标低于你对项目真实价值的估计。在投标活动中的这种虚假性类似于我们这里一直讨论的表决中的非诚实性;在这两种情况下,它们之所以出现是因为你评估你的决定针对其对结果的实际影响,而结果所提供的附加隐含的信息,是需要加以考虑的。

23.9 陪审团决定和一致通过规则

  刑事审判中的陪审团决定是最初引起这个讨论的重要例子:它们形成了一类自然的事例,其中投票人(陪审团成员)原则上认为是存在一个“最佳”群体决定,被告若有罪就应该定罪,若无辜就应该宣判无罪;他们就是要通过聚合个人的观点来达到这个最佳决定。有了前面那些讨论,这里很自然要问:在这种情况下会出现非诚实的投票吗?如果有,后果会如何?如同费德森(Feddersen)和帕森多夫(Pesendorfer)所论证的,在有些陪审员刻意要使他们的表决贡献于群体最佳决定的情况下,非诚实投票实际上会自然地作为一种策略出现 16]。我们这里给出其分析的基本结构。
  1. 裁决,一致意见和私有信号
  如果将刑事审判中的陪审团决定与 23.7 节中的孔多塞定理的情形相比较,我们能注意到两个基本区别,都是源于刑事司法系统中旨在避免给无辜的被告定罪的体制特点。第一个区别是,为了给被告定罪,它通常要求一致的表决。因此,如果我们有 k 个陪审员,有“无罪”和“有罪”这两个选项,每个陪审员投其中一个,只有当每人都投“有罪”,群体结论才是有罪。第二个区别是陪审员用于评估两个选项的标准。在第 23.7 节的模型中,如果
  每一个选民可以观察所有可用的信息,她会选择候选项 X,如果:
$$Pr\ [\ X\ is\ best\ |\ all\ available\ information\ ]>\frac12$$
然而在刑事审判中,给陪审员的指示不是“如果相比无辜而言被告更可能是有罪的,则他/她应该被定罪”,而是“只有在相当程度上怀疑被告是有罪的,他才该被定罪。”这意味着陪审员不该问是否:
$$Pr\ [\ defendant\ is\ guilty\ |\ all\ available\ information\ ]>\frac12$$
而是问,对于某个较大的数 z,是否有:
$$Pr\ [\ defendant\ is\ guilty\ |\ all\ available\ information\ ]>z$$
  我们现在给每个陪审员得到的信息建模。按照 23.7 节用在孔多塞陪审团定理上的框架,假设每个陪审员收到一个独立的私有信号,建议有罪(G 信号)或无辜(I 信号)。在实际中的被告当然是有罪或者无辜,但我们假设倾向于真实情况的信号要比倾向于错误的信号丰富,也就是对某个 q>1/2,我们有:
$$Pr\ [\ G᠆signal\ |\ defendant\ is\ guilty\ ]=q$$
以及
$$Pr\ [\ I᠆signal\ |\ defendant\ is\ innocent\ ]=q$$
  观察到 G 信号的陪审员会在意相应的条件概率,即$Pr\ [\ defendant\ is\ guilty\ |\ G᠆singal\ ]$。假设被告有罪的先验概率是 1/2,即没有任何信号出现。那么,23.7 节中利用贝叶斯规则的论证也可以在此使用(有罪和无罪对应于那里的候选项 X 和 Y),得到:
$$Pr\ [\ defendant\ is\ guilty\ |\ G᠆singal\ ]=q$$
  类似地有:
$$Pr\ [\ defendant\ is\ innocent\ |\ I᠆singal\ ]=q$$
  对于任意 0 和 1 之间的先验概率,下面接下来分析的结论本质上与 23.7 节是一样的,只是计算稍有不同。
  在分析之前,我们可以问这个模型的假设,即每个陪审员收到独立的私有信号,是不是合理的,毕竟他们在法庭中坐在一起,而且都看到了同样的证据。显然,私有信号假设是一个简化的近似。但我们也很清楚,在真实法庭的陪审员,就一个案子的事实,可以而且的确形成相当多样化的看法。这其实是自然的:尽管看到同样的证据,陪审员还是有不同的解释和推理,这在于他们每个人的直觉和决策风格,它们是难以作为事实从一个人传达到另一个人的。因此,在这种情形,我们可以将私有信号理解为对信息的不同解释(interpretations),而不是个人的附加信息来源。一个理性的陪审员会受她自己信号的引导,但也会被别人信号结果的影响,即其他人对案子的看法与她相同还是不同。
  2. 陪审员决定的模型
  如上所述,一致同意规则的设计使得难以给一个无辜被告定罪,因为那要求每一个陪审员都“无误地”选择有罪。从表面看,这种原则有道理,但如同我们在 23.8 节看到的,当我们假设人们选择自己的投票时会考虑群体决定结果的话,关于这种原理效果的理解是微妙的。
  特别地,因下列原因,事情可变得更加复杂。假设你是陪审员之一,收到一个 $I$ 信号。首先,似乎很清楚,你要投一个“无罪开释”,毕竟,你的 $I$ 信号给你一个指出被告无罪的条件概率 q>1/2。但然后你记得两件事,首先,群体认定有罪的标准是:
$$Pr\ [\ defendant\ is\ guilty\ |\ available\ information\ ]=z$$
  意味着,原则上讲,未观察到的其他人的信号(假若你知道的话)足以使这个有罪条件概率大于 $z$,尽管你的是 $I$ 信号。再者,像在 23.8 节那样,你问自己一个关键问题:在什么情况下,我的投票会影响结果?在全体一致规则下,你唯一能影响结果的情形是别人都投“有罪”,就你不一样。如果你相信其他人都会按照他们自已的信号投票,你就可以准确地知道你的投票影响大局时的信号情况:$k-1$ 个 $G$ 信号和你的一个 $I$ 信号。
  在这种情况下,什么是被告有罪的概率?利用贝叶斯规则,有:
$$Pr\ [\ defendant\ is\ guilty\ |\ you\ have\ the\ only\ I᠆signal\ ]=\frac{Pr\ [\ defendant\ is\ guilty\ ]×Pr\ [\ you\ have\ the\ only\ I᠆signal\ |\ defendant\ is\ guilty\ ]}{Pr\ [\ you\ have\ the\ only\ I᠆signal\ ]}$$
  我们的假设是 $Pr\ [\ defendant\ is\ guilty\ ]=1/2$,并且由于 $G$ 信号的独立性,我们有 $Pr\ [\ you\ have\ the\ only\ I᠆signal\ |\ defendant\ is\ guilty\ ]=q^{k-1}(1-q)$(后面这个等号是由于另外 $k-1$ 个陪审员收到 $G$ 信号的概率是 $q^{k-1}$,乘以你收到 $I$ 信号的概率 $1-q$)。最后,如同通常贝叶斯规则计算,我们确定除你之外所有陪审员收到 G 信号的两种方式,被告有罪或者他是无辜的:
$$Pr\ [\ you\ have\ the\ only\ I᠆signal\ ]
=Pr\ [\ defendant\ is\ guilty\ ]×Pr\ [\ you\ have\ the\ only\ I᠆signal\ |\ defendant\ is\ guilty\ ]+Pr[\ defendant\ is\ innocent\ ]×Pr\ [\ you\ have\ the\ only\ I᠆signal\ |\ defendant\ is\ innocent\ ]
=\frac12q^{k-1}(1-q)+\frac12(1-q)^{k-1}q$$
(最后表达式中的第二项与第一项的精神类似,即如果被告无辜,除你之外每人得到 $G$ 信号的概率是 $(1-q)^{k-1}$,乘以你得到 $I$ 信号的概率 $q$)。整理上述,我们得:
$$Pr\ [\ defendant\ is\ guilty\ |\ you\ have\ the\ only\ I᠆signal\ ]=\frac{\frac12q^{k-1}(1-q)}{\frac12q^{k-1}(1-q)+\frac12(1-q)^{k-1}q}=\frac{q^{k-2}}{q^{k-2}+(1-q)^{k-2}}$$
其中,最后一个等号是从前面式子的分子分母同时约去 $q(1-q)/2$ 而得。
  现在,由于 $q>1/2$,当陪审团规模 $k$ 趋向无穷时,$(1-q)^{k-2}$ 是分母的一个任意小量,这样
$$Pr\ [\ defendant\ is\ guilty\ |\ you\ have\ the\ only\ I᠆signal\ ]$$
  随 $k$ 趋向无穷而收敛到 $1$。因而,若 $k$ 足够大,就总会有 $Pr\ [\ defendant\ is\ guilty\ |\ you\ have\ the\ only\ I᠆signal\ ]>z$。
  从这个计算我们得到的结论是,如果你相信其他人都是按照他们的信号投票的,且如果有足够多的陪审员,那么在你投“无罪开释”可影响结果的唯一场合,被告事实上就是很可能有罪的。因此,如果你的投票是按照法庭给陪审团的指示精神,你就应该忽略信号而投“有罪”。当然,在收到一个 $G$ 信号的时候,你这么做会更有信心,因而我们能将这里的结论归纳得更加透彻:如果你相信其他人都会按照他们的信号投票,且陪审团足够大,你就应该总是忽略你的信号而投“有罪”。
  直觉上,这个情况就是,你只是在其他人都有相反观点时影响一致表决的结果;偎设其他人都像你一样获得信息,且按照他们的真实认识投票,结论是他们可能(集体)是对的,但你是错的。如同早先在 23.8 节的例子,这成为一个有趣的提醒,当你设计一个过程或者协议让一群人遵循的时候,你应该预期他们会根据你定的规则来调整他们的行为。这里,基于一致同意的表决系统设计来帮助避免错误的定罪,但它实际上也创造了一个人们忽略“被告无辜信号”的动机。
  3. 在一致同意和其他系统中表决的平衡态
  如同 23.8 节,我们说明了(对于足够大的陪审团),按照你的信号投票不是一个均衡,即如果每人都这么做,则你应该总是投“有罪”。在关于这个问题的分析中,费德森和佩森多夫进一步给出了在这种陪审团表决模型下均衡的实际特点。
  首先,有一个容易发现但有点病态的均衡:如果每人都决定忽略他们的信号而投“无罪”票,就是一个均衡。理解这一点,注意到没有陪审员能通过改变他们的行为来影响结果,因此任何陪审员都没有理由改变她的行动。
  更有意思的是,有一个独特的均衡,具有如下性质:(1)所有陪审员采用同样的策略;(2)每个陪审员的行为实际上决定于她所得到的信号。这是一个混合策略的均衡,其中每个陪审员总是在 $G$ 信号上投“有罪”票,在 $I$ 信号上以一个概率(0 和 1 之间)投“有罪”票。这里的想法是,有 $I$ 信号的陪审员可以随机选择忽略它,有效地纠正了她可能犯错的概率。我们可以说明,当陪审员们遵循这个均衡时,他们的集体决定,将一个无辜被告定罪的概率,是一个不会随陪审团规模变大趋向于 0 的正数。这里的问题是,一致通过规则鼓励投票人太“过分纠正”他们可能犯错的机会,它说明,在这种机制下,群体达成错误决定的概率是明显的。
  进一步地,一致同意规则在这个意义下特别的不好。具体来说,我们可以研究这样的表决系统,其中为被告定罪只要求陪审团的 $f$ 部分投有罪票,对 0 和 1 之间不同的 $f$ 分别考虑。对一个给定的 $f$,我们称这系统为 $f$ 一多数规则系统。这里依然有一个均衡,其中陪审员们利用随机性,不时忽略他们的信号来校正他们可能犯错的概率。但是,对 $f$一多数规则来说,一个陪审员的表决,当其他陪审员按照 $f$ 和 $(1-f)$ 分成“有罪”和“无罪”两个阵营的时候,就可以影响结果;远没有一致通过规则那么极端,那里,一个陪审员只是在她自己独行且与“有罪”相对的时候影响表决结果。这里,陪审员采用的随机校正相应就没那么极端,而且可以证明随陪审团规模趋向无穷,集体决定错误的概率趋向于 0。
  这个结果,让我们进一步质疑一致同意规则是否合适。这结果表明,要求一个大多数,而不是一致同意定罪的陪审团决策规则,实际上可能带来较低的错误定罪概率的行为。它再次表明,不同的社会机构,会引起参与其中的人们的行为改变,这种改变对我们评估和权衡社会机构的效果带来了十分微妙的问题。

23.10 依次表决及其与信息级联的关系

  让我们回到孔多塞陪审团定理的最初形式,人们同时并诚实地对两个候选项 X 和 Y 进行表决。前面两节,我们考察了当去掉诚实性假设后会发生的情况。现在我们来考察如果去掉同时性假设会发生什么,也会很有意思。我们将保留诚实性,因为一次只改变模型的一个方面可以简化讨论。因此,每个选民要按照她相信是最好的选择投票。
  当假设选民们诚实但顺序行动的时候,我们就有了一个与第 16 章讨论的信息级联很一致的模型。在信息级联的模型中,我们假定选民依次作出选择:他们能够观察到前面选民的选择(但不是私人信号),如果对前面选民的观察增加了他们自己选择更好候选项的机会,他们可以选择不顾自己的信号。注意,在这个级联模型中,选民们仍然表现得诚实,即他们总是基于所观察到的信息,试图选择最可能是正确的候选项。
  除了同时和顺序投票之间的这种区别外,第 23.7 节的孔多塞陪审团定理的情况与第 16 章信息级联模型是非常相似的。在这两种模型中,有一个“X 是正确的”先验概率,而且有偏向正确候选项、以概率大于 1/2 出现的私有信号。因此,我们可以利用在 16.5 节的分析来论证,如果选民依次行动,最初两个人投 X 的票,将导致随后的人也都投 X 的票,不论 X 是否正确的决定。更一般地说,一旦一个候选项得票数超过另一个候选项两个,就会形成一个连锁反应,所有后续选民都会选择不顾他们自己的信号而随大流了。
  当一个候选项的票数刚好领先另一个候选项两张,连锁反应即开始的事实,依赖于我们在第 16 章里简化模型的特殊结构。然而,其原理是相当一般的。在我们描述的顺序表决类型中,连锁反应最终是会建立起来的。此外,增加选民的数量从本质上阻止不了这种连锁反应。因此,孔多塞陪审团定理的原理在这里不适用:没有理由指望一大群顺序投票的选民会得到正确的答案。

第 24 章 产权

  我们考虑的最后一类社会机构关注的是通过产权(property rights)在一个社会中配置资源。产权赋予权利的持有人使用一种资源的能力,排除他人使用该资源的能力,通常还有权将该资源出售或转让给他人。这里的财产可以有多种形式,从物理财产,如一块土地或一罐健怡可乐,到一首歌曲或生产流程的知识财产。本章我们将研究产权的存在和形式,以及产权的缺乏会如何影响到这类财产的社会性后果。本章的中心思想是,一个社会选择建立的产权将影响到资源的配置,有的产权要比其他产权更有可能导致社会资源的优化配置。

24.1 外部性与科斯定理

  在第 17 章我们讨论过,商品的分配在市场均衡时(对于没有网络效应的经济)达到社会优化。在市场均衡时,生产的物品被分配给最看重它们的消费者,生产商品对社会的成本,要低于得到该商品的消费者认为的价值。这就会导致社会总盈余最大化。对这个事实的直觉来自于观察,在市场均衡配置情况下,消费了一个单位物品的人,支付了社会生产一单位物品所需的成本,没消费物品的人即是不愿支付生产所需该物品的成本。在这种讨论中,以及在第 17 章,我们假设(隐含):生产物品的成本正确地反映了社会生产该物品的真正成本;一个人愿意支付一个单位物品的价格正确地反映了社会允许人们消费该物品的价值,物品的生产者拥有它(有它的产权),并且可以以市场价格卖掉它;而且,为了消费该物品,一个人必须以市场价格买这个物品。
  为什么得到正确的价值是如此的重要,让我们以不同的术语来说说生产和贸易的故事。当一个人消费了一罐健怡可乐,她就创建了一种个人利益(否则她就不会自愿地消费它),并且她对社会的其余部分也带来了损害,因为此时社会少了一罐可乐,本可以被社会的另一位成员消费的。但是,如果消费者对这一罐健怡可乐支付的价格等于社会生产另一罐可乐的成本,那么该消费者购买和消费的健怡可乐,正好补偿了她带给社会的损害。明确定义的产权在这个故事的背后发挥着重要作用。它可以使每一个生产或消费的物品都有一个明晰产权。如果对这罐可乐的产权是清楚的,如果健怡可乐的生产者和消费者的行动不影响任何其他人,那么这笔交易就是一个完整的产权交易。否则,如果我们这罐可乐的生产者或消费者的行动会在某种没有产权覆盖的方式下影响他人,那么由此产生的均衡就不一定是社会最优。当某些个人或公司的福祉因其他个人或公司的行动,在没有双方同意补偿的产权要求下受到影响,我们就说一个外部性(externality)发生了。外部性可能是负面的,就像在第 8 章讨论交通堵塞时看到的,外部性也可能是正面的,就像在第 17 章讨论在网络效应下商品的情形时看到的。

  1. 外部性和非优化配置
  让我们探讨几个例子,考察外部性发生的可能,以及为什么它们可能形成非优化配置。首先,假设某人要在餐厅吸烟,该餐馆中还有另一个人。该吸烟者买了雪茄,可以认为其价格涵盖了生产这雪茄的成本,所以至少在吸烟者和生产者之间没有因这雪茄的买卖形成外部性。但在餐馆消费雪茄的行为中,吸烟者将一种伤害强加到了餐馆中另一个人身上,而且是没有补偿的。所造成的这种配置是否是社会最优,取决于所形成的伤害和利益的定量关系。
  假设那个用餐者受到伤害的价值是 10 美元,即如果他因吸二手烟得到了 10 美元的补偿,他的感觉就和没人抽烟一样好。另外,假设吸烟者因吸烟得到的好处值 5 美元,于是抽烟这件事就使社会盈余减少了 5 美元:10 美元的危害与 5 美元的好处之差。在这种情况下,社会最优要求无烟环境的餐厅。实现这个目标的机制之一是一个法律,即禁止在餐馆吸烟。
  另一种可以实现同一目标的机制,是建立一个餐馆无烟空气的产权,并使这个产权是可交易的。在这种情况下,其他用餐者可以选择是否放弃这个产权以得到合适的补偿,来允许吸烟者抽他的雪茄,也就是出售了产权。由于我们假设吸烟者对可以在餐馆吸烟这件事的估值只有 5 美元,在这种情况下,就不会有在餐厅吸烟的,因为吸烟者不会愿意对所造成的损害支付足够的补偿(10 美元)来使其他用餐者满意。当然,如果吸烟者在吸烟中得到的利益值是 15 美元,而不是 5 美元,然后会有交易了。吸烟者将支付 10 和 15 美元之间的一个数给那个用餐者(从而买到了清洁空气权),吸烟者抽他的雪茄,双方将都满意于这一结果,我们达到了一个社会最优配置。
  在吸烟的例子中,建立一个无烟空气的产权,导致了一种社会优化配置,与个人对吸烟和无烟空气价值的认识无关。另外,允许吸烟者吸烟的产权也会产生设想的作用,因为在吸烟者与另一个用餐人之间达成了协议后,吸烟也就在社会最优时发生。社会优化的缺失,会在产权不明晰,或者根本没有产权的情况下出现。在这种情况下,人们可能在允许吸烟与否上就产生冲突,导致社会优化配置的协商意见似乎不大可能形成。
  最后,如果优化配置的价值所在就是要求不吸烟的话,一项禁止在餐馆吸烟的法律会导致社会最优配置,但这样的法律不能提供吸烟被认为是有价值的优化配置。在实践中,美国有些地方的餐馆中是禁止吸烟的,将这种情况与优化配置问题关联起来会有些意思。禁烟令的出现有多种动机,前面的讨论中都有所论及。也许,优化配置的基本价值总是或几乎总是在于要求无烟空气;也许,制定政策的人们认为人们总是低估无烟空气的价值,因此若允许交易的话,他们会犯错;还也许,在餐厅执行和交易无烟空气产权的成本会很高,还不如禁止吸烟了事。
  让我们来稍微详细探讨最后这个动机,即建立产权的成本。在我们的例子中,只有一个其他食客。如果有多个食客和餐馆员工怎么办?那么无论谁拥有这个产权(吸烟者或在餐厅的其他人),将需要一个复杂的谈判,如果食客们来来去去,谈判将不得不反复进行。这其中的代价很容易就变得十分高,以至于完全是不可行的,于是建立一个禁止吸烟法律会成为下一个选择。这很可能是我们能做到最好的,如果社会的最优化通常就会导致一个无烟的环境。
  这个在餐馆吸烟的问题是一个简单的例子,它反映了一个广泛且产权在其中发挥作用的重要问题:工业生产活动对环境的影响。当产权不清晰和执行不力时,也可能会出现类似的问题。例如,考虑一个对空气和水有污染的发电厂。该电厂需要购买许多东西用于发电过程;如劳动力,大型设备和燃料,以市场价格买进,补偿了这些货物的卖方在失去它们时蒙受的损失。但这电厂在生产过程中也在隐含地使用清洁的空气和干净的水。如果该电厂要为产生脏空气和水支付一个价格,反映对他人造成的危害(包括个人和其他公司),那么电力、清洁的空气和水的配置就会是社会最优了。如在餐厅吸烟的情形,建立一个关于洁净的空气和水的产权,或电厂可以污染空气和水的权力的产权,将从原则上可导致社会在电力和空气和水的污染程度上的最优配置。这里值得指出的是,社会最优配置不可能意味着就没有污染。相反,它只是要求所确定出来的污染量,如所有其他货物的数量一样,得到优化的补偿。但也正如在餐厅的情况一样,在电厂和所有受其影响的方方面面之间谈判的交易成本,可能会使人们望而却步。

  2. 确定社会最优配置的机制
  在我们的电厂例子中,利用产权和共识的补偿来确定社会优化配置的一个困难是:如何定量确定由污染造成的损害的程度?如果我们只是问人们从污染中受到多大的伤害,并试图以此来决定是否允许污染,那么受伤害的每个人都有动机夸大危害的程度。同样,制造污染的公司会夸大降低污染的成本。然而,有一个方法,可以用来解决这个动机问题,我们前面分析过它的一个特例。
  一个类似的机制可以用于引导污染者和受污染者都讲真话。不过环境污染的情形要比较复杂些,因为两者的估值,买家(排污者)和卖方(受影响的人们),都是未知的。在这里,我们可以想象是政府在运行这个机制,从污染者那里收费,为因污染而遭受损失的提供补偿。这一机制的目标是确定社会最优的污染量,而不是要用从污染者那里所收取的款项来充分补偿那些受到污染的人。事实上,一旦这机制运行起来,支付开始发生,人们可能会感觉更好或更坏。此外,收取的金额可能不等于赔偿的金额,因此政府可能是盈余运行,也可能是赤字运行。实际运行 VCG 机制,以确定最佳的污染量会是困难和昂贵的。第一个问题是确定谁是潜在的污染受害者,因而应包括在该机制中。其次,每当受影响的对象群体发生改变,或者污染者改变它们的污染量,该机制就需要重新运行。对每个污染者都要这样做。一遍又一遍运行这些机制的代价将很高。相反,一些政府采用更基于市场的方法,即企业可以按市场价格购买污染的权利。这些被称为限制和交易(cap-and-trade)体系。美国在二氧化硫排放上就是采用的限制和交易系统。在限制和交易系统下,政府提供若于污染排放许可证,允许公司交易这些许可证,并要求排放污染的企业要持有相应数目的排放许可权。如果初始许可的数目设置正确,那么也就实现了污染的社会优化配置。
  利用产权或可交易的污染许可证,作为一种解决由外部性造成的问题的方法,其核心思想是科斯定理(Coase’s Theorem)。它的大致含义是,如果建立并执行可交易的产权,那么受外部性影响的各方之间的谈判将导致社会最优结果,无论是谁最初拥有这个产权。例如,在我们前面的餐厅吸烟者情景中,为达到社会最优所需的无非是要建立和执行允许吸烟的权利,或者有无烟空气的权利。然后,双方之间的交易将导致社会优化配置的实现。当然,谁拥有这个权利会影响各方在达到均衡时的地位,因此他们在谁应该最初拥有权利的问题上一定会有不同意见。但是,不管初始权给了谁,吸烟的发生当且仅当它是社会最优。同样的想法也适用于污染排放许可证问题。如果清晰地建立起产权,某方作为权利的初始拥有者,则交易将导致优化。同样,许可证的初始发放情况会使得某些方面占便宜,另一些则吃亏,因此它一定是在政治上有争议的。
  科斯论点(最初的所有权无关)的一个必要条件是它忽略交易成本,只是假定从任何产权安排开始的谈判将导致有效的结果。正如我们在吸烟例子中注意到的,如果许多人都参与谈判,这是做不到的。同样,在污染例子中,建立市场化的污染权更可能是要降低交易成本,以导致社会最优结果。

24.2 公物的悲剧

  在 1968 年《科学》上的一篇题为“公地悲剧”的文章中,加勒特·哈丁讲了一个引人关注的故事,在共享资源上不可避免的“悲剧”。在他的故事中,有一片村庄的公地,任何牧民都可以自由地放牧。哈丁说,这些公地将不可避免地被过度使用,最后损害所有的村民。然后,他认为,建立产权可以解决这个问题。这些产权可以是私人持有,公地可以出售给一些个人,或者它们也可以由集体持有。然而,如果村庄要继续拥有这公地,就必须仔细限制它的使用,如果我们要有一个社会最优配置的话。
  对这种失去社会最优的情形,村里其实可以很容易地解决这个问题。有两个明显的方法,每一个都有多个变形。
  一种方法是让村集体继续拥有这块公地,但要以某种方式将牲畜数限制到社会最优量。要做到这一点,可以是收放牧费,或者直接将在公地上可放牧奶牛的数量控制在最佳值 x*。要知道为什么这是最优的,只需注意到一个村民会在公地上放牧,当且仅当因此得到的收入多于他要付的价格。因此,在平衡点,在公地放牧的收入必须等于价格。另外,村里可以出售 x* N 头奶牛的放牧权。这个方法上的各种变化都导致社会公共资源优化利用,以及对村里的收入。
  除了共同拥有这种方式,村里也可以将公地出售给一个有许多奶牛的村民。这个村民也会是在公地上放 x* N 头牛,因为这能最大化他的收入。村里能够卖出的最高价格,也就是买方在最佳利用情况下能得到的收入。因此,用这两种方法——由村集体拥有放牧权,且以适当的价格收取放牧费;或直接将公地出售给个人,村里都得到一份收入,并且公地得到优化使用。
  在哈丁的公地例子中,为避免悲剧,只需要建立一种产权就行了。它可以是一种由某种形式的政府持有的权利,该政府优化限制资源的使用,也可以是私人持有的产权。正如科斯的观点,对于社会优化而言,谁拥有财产不重要;重要的是有人拥有它。哈丁用这个故事来论证为什么有太多污染产生,为什么国家公园被过度使用(如果没有入门费或对用户数量的限制),为什么有过度捕捞,以及人口过多,从而对世界资源的过度使用是不可避免的。在上述这些例子中,都有一种外部性,体现为一个企业或个人的行为影响他人,如果没有产权,也就没有补偿,因此也就没有理由优化地使用资源。

24.3 知识财产

  我们在科斯定理或哈丁的悲剧中讨论的财产独立于个人或公司的投资而存在。餐厅的空气,以及可能受发电厂污染的空气或水,都是与生俱来,不管社会针对它们创建了什么产权。同样,一旦村子的草场形成了,它的存在就独立于村民的任何行动。但是,在草场和空气或水之间有一个区别,而且,正如我们将看到的,这三个例子中的财产与另一种财产——知识财产——之间还有另一个区别。
  到目前为止,我们的分析只是关注资源的有效利用,而没有考虑这些资源是怎么来的。对于空气和水,这似乎是合理的。这些自然资源不是由人类的努力创造出来的,也不需要努力才能使它们有用。村里的草场也是一种自然资源,但人的努力可以改变它的价值。定期割草,清除杂草,施用化肥或天然肥料都可以使草场具有更强的生产力。建立什么样的产权对于那些活动是否能开展是有关系的。如果没有人拥有那片草地,那么就没有人能够充分受益于开展这些耗资巨大,而且提高生产率的投资行为,因此它们似乎也就不会发生。通过将产权安排给某人来解决产权问题,也就解决了资源利用效率低的问题,而且还解决了一个为提高生产率的投资激励不足的问题。如果一个人拥有了这片草地,那他就能收获在草地上投资的回报,这就是使他进行物有所值的投资的动机。他将愿意承担在草地上的任何投资,只要产生的收入超过投入成本。同样,如果村里集体拥有那草地,但出售使用它的权利,村里也就有适当的动机来维护这草地。因此,与前面讨论的相比,对村里草地安排一个产权对社会优化是更重要的。
  1. 竞争性和非竞争性商品
  到目前为止,我们讲了许多关于创建和执行产权的问题,也许令人惊讶的是,有些商品,如果赋予了产权,会导致低效率的使用,还不如根本就没有所有权。例如,考虑一个创作过程的结果。这可能是一本书、一首歌曲、一个新的计算机程序、一个作物新品种、一种治疗癌症的新药,或生产电池的一个新工艺。一个人或公司使用该创造过程的结果(不是指物理实体,而是在物理实体中蕴含的思想),不会影响他人使用它的能力①。例如,制造电池或制药的流程,无数人都可以使用。每个人都可以听从互联网下载的一首歌曲,或在线阅读一本书,不会影响别人听歌曲或读书的能力。与此相反,一个人喝的那罐健怡可乐,别人不能再喝了。村里草地上的草,一个村民的牛吃了后,另一头牛就吃不到了。一种商品,如果一个用户的使用或消费排除了其他潜在用户使用或消费的可能,被称为竞争性商品(rivalrous goods);而可以一遍又一遍使用或消费的商品称为非竞争性商品(nonrivalrous goods)。
  对于非竞争性商品,建立产权可以于预对该商品的有效利用。商品的拥有者可以收取使用费,任何非零价格的使用费都可能使一些潜在用户不去购买这个商品,因此就不会使用它(或至少不能合法使用)。这就导致了一种低效,因为对社会来说允许每个人都用它是没有任何成本的,所以禁止一个人使用它就是个浪费。这和村庄草地的情形是相反的,那里为了达到社会优化,需要限制物品(草地)的使用。在那种场合,物品是竞争性的。但对于非竞争性商品,哈丁的想法并不适用。
  当然,这不是有关非竞争性商品的产权故事的结局。我们还是要问它们是怎么来的,没有产权的话是否会存在。如果一个非竞争性物品的创造者并不拥有它,那么该创造者从他的创造中获得利润的能力是有限的。即使如此,创造者还是可能从他的创造中得到一定的利益。人类曾经发现了许多有用的东西(例如,用火来烧肉),那时没有任何法律来对这些想法的结果进行保护。这些早期的发明者从他们自己的使用中直接受益。柏拉图写作,莫扎特作曲,都没有或很少有对他们作品的保护。但他们也从直接使用和他人使用其作品中获益。因此,总会存在一些创造性的活动,创造者将从中获得一定的利益,而无须产权来保护他们的知识财产。但我们并不清楚在没有这种产权的情况下,创造性活动的社会最优是不是会出现,并且,也不清楚这些权利应是什么形式,才能产生最佳量的创造性活动。
  相关的问题是在对创造性活动提供激励和允许高效使用创造的结果之间进行权衡。没有其他人会掌握一个创造发明,如果创造者不披露它,因此创造者至少可以从首先使用一个有价值的物品上获益。如果没有保护,那么该物品最终将成为公开的,创造者要从中收费的能力将消失。这样,没有产权,创造性活动的经济回报可能很小,并且,在现代经济中,快速和廉价的复制和通信的出现,创造者收费的能力的确会非常小。对创造性活动实行产权,提高了创作者的积极性,但它的代价是创造出现后的低效利用。
  2. 版权
  我们不试图在这之间寻找一种抽象的平衡,下面看几个例子。首先,让我们考虑图书、歌曲、戏剧,电视节目和电影的情形。在美国,所有这些作品都受版权法(copyright law)(现为 1976 年版权法)保护,它给作品的创作者独家复制、分发、修改它的权利;在歌曲、戏剧、电视剧和电影的情形下,还有表演的权利。这项权利将一直持续到该作品的创作者去世后 70 年。版权拥有人具有将这个权利转让给他人的权利。
  对于版权作品,理解在没有得到权利持有者许可的情况下,哪些使用是允许的,哪些使用是非法的,是很重要的。首先,著作权人的复制专有权的实际上并没有禁止所有复制。合理使用(fair use)的原则已经随着时间的推移,允许对版权保护作品在非商业用途上的有限部分复制。例如,它允许在评述、学术文章,或者教室里对版权作品进行引用。合理使用原则在 1976 年版权法的第 17 段的第 107 节有概述(整个法案见 http://www.copyright.gov/title17/)。这一法律没有准确定义什么是或不是合理使用;而是,受版权保护的作品是否被合理使用要逐案确定,复印者的意图在裁定中是一个关键因素。其二,著作权法不禁止作品副本的拥有者倒卖该副本。(这不同于做一个新的副本,然后销售这个新副本,那是禁止的。)因此,虽然复制书籍或 D 并将复制品转给他人是非法的,出售一个依法取得的副本是允许的。
  著作权法赋予权利的持有者一种垄断(单卖方)。一般来说,垄断是有害的,人为的垄断,通过设置高于社会最优的价格,限制了物品的使用。对版权作品,如果价格对作品的创造没有作用的话,社会最优价格应该是零。人们仍然不清楚,在多大程度上,由版权提供的保护,对于产生足够的激励来产出那些当前得到保护的作品是必要的。例如,一些作者,如博尔德林和莱文认为,完全不应该存在版权,因为他们相信版权对于创新是没有必要的,而且阻碍了创新作品的使用效率。较普遍的看法是,版权是一种必要的魔鬼:它们的确阻碍了有效的使用,但如果没有它们,专门用于创作活动的资源量会小到不利于创新。
  3. 专利
  接下来,让我们考虑发明,例如,一种新药,一个新的制造工艺,或一种新的电脑硬件。发明人可以向美国专利商标局提出申请发明专利,并且,如果专利被授予,发明者有权不让其他人在一个固定的时间内使用这个发明,通常是 20 年。美国专利和商标局的网站(http://www.uspto.gov/main/patents.htm)给出了这个法律的描述。
  专利的经济作用很像版权。它们增加了对专利发明活动的回报,代价是专利发明后的低效利用。然而,专利在几个方面不同于版权。首先,对原创作品授予版权是自动的,创作者只需要指出作品是有版权的。专利则是要向美国专利和商标局申请,它要负责审查申请内容的创新性。第二,版权和专利执法一般是留给版权或专利持有人。主要的例外是互联网上对版权歌曲和电影的侵权问题,以及开发一些工具或办法来规避数字版权管理。根据 1998 年的数字千年版权法,这些活动已被部分认为是犯罪的。第三,相对于在大多数艺术作品上的投资而言,为创造许多可专利的商品在研究和开发上所需的投资是非常大的。例如,制药行业在研发上花费大量资金,而且如果没有给发明赋予专利的能力,这样的投入很可能是不会发生的。因此,限制性和强化实施的专利法比著作权法更引人注目。与产权的许多其他方面一样,这其中的权衡是很复杂的,它们依然是一个活跃讨论着的题目。