《链接:网络新科学》书摘


链接网络新科学/(美)巴拉巴西著;徐彬译.--长沙:湖南科学技术出版社,2007.4
ISBN 978-7-5357-4858-4

下载 链接:网络新科学.pdf (访问密码:320860)


第 1 章 导言

  整个 20 世纪的科学研究,大部分都是依照简化论进行的。简化论告诉我们,要想了解自然,就必须首先将其拆为分散的零件。这一想法的前提设想是一旦我们理解了各个部件,就容易抓住全局了。对自然要分而治之。魔鬼就隐藏在细节之中。因此,许多年来,我们都是被迫以微观的方式,观察自己身处的世界。我们所受的教育,就是通过观察研究超弦和原子来了解宇宙;通过研究分子来了解生命;通过研究基因来了解复杂的人类行为;通过研究预言来观察时尚和宗教的起源。
  现在我们似乎知道了关于事物片断的方方面面的知识,但是对于整个的自然界,仍旧是一无所知。实际上,重新组合自然的过程要比科学家预计的要难得多。原因很简单:大搞简化论的同时,我们一头撞在了复杂性这堵墙上。我们已经意识到,自然不是一个设计完美的、只有唯一答案的谜题。在复杂系统中,部件可以以许多种不同的方式组合起来,要想把每个可能性都尝试一下,需要数十亿年的时间。而自然界却能以短短百万年的时间,将这些部件优雅、精致地组合在一起。自然界组合这些零件的奥秘,是利用了包容一切的自组织法则。
  本书的主旨很简单:促使读者从网络的角度思考问题。本书探讨的是关于网络的出现、网络的模样及其演变规律的话题。本书将向读者展示基于网络的自然、社会和商业的图景,还将提供新的框架,帮助我们理解从民主政治到互联网,从互联网的薄弱所在到致命病毒肆虐等方面的问题。

第 2 章 随机宇宙

  每个节点只需一个链接,就能让所有的节点连为一体。也就是说,每个人只要认识其他一个人,大脑中的每个脑细胞只要有一个链接连到其他的脑细胞上,我们体内的化学成分只要能参与至少一次化学反应,商业世界中的公司只要能和其他公司做成一个买卖,就和其他成员建立起了链接。1 就是这里的阀值如果网络中的节点的平均链接少于 1,那么网络就会分割成无法相互沟通的节点串。而每个节点的平均链接如果超过 1,分裂的危险就比较微小。
  自然界对链接毫不吝惜,它往往会超过 1 个链接的阀值。社会学家估计平均每个人知道 200~5000 个人的名字。每个神经细胞一般会和其他数十个相连,有的则超过数千个。每个公司毫无例外都会和数百个供货商和顾客相连,有些大公司的链接甚至超过百万个。在我们体内,大多数分子参与的化学反应超过一个一有些分子,比如水分子,参与的反应超过数百个。因此,真正的网络不仅是相连的,而且远远超过了 1 的阀值。随机网络理论表明,随着节点平均链接数量的增加到一个临界值,被排除在巨型节点串外的节点数量就会急剧减少。也就是说,添加的链接越多,就越难找到孤立的节点。自然界不会冒险停留在阀值左右,它往往大大超过这个值。相应的,我们周围的网络就不仅仅是独立的网络。这个网络极其繁复,没有任何成员能够游离在外,其中的每个节点都能被访问到。因此,世界上不存在完全和外来世界隔绝的孤岛。同样,我们体内的每个分子能组合成一个完整的人体,构成单一的、复杂的细胞图谱。正因如此,通过链接,他们的行为轻而易举地就影响了上百万的人。

  艾尔德和莱利的随机网络模型,其柱状图遵循泊松分布规律(Poisson distribu-tion),泊松分布有一个显著的峰值,表明大多数节点的平均链接数都是一样的。在峰值的两边,分布迅速下降,与平均值相差较大的值极为少见。
  将此图比照有 60 亿人口的社会网络,泊松分布说明我们之中的大多数人都有数量差不多的朋友和熟人。通过该分布图我们可以预言,朋友和熟人数量明显高于或低于平均值的人很少。因此,随机图论预言,如果我们随机安排社会链接,那么所得到的社会就会是非常民主的,其中的所有人都处于中间状态,只有极少数人脱离常态,这些人可能特别善于交际,或极端封闭。这样我们得到的网络就有一个非常一致的结构,在其中平均值就是常态。
  艾尔德和莱利的随机宇宙里平均值就占主导地位。该理论预言大多数人认识的人数量相当;大多数神经细胞大体和同等数量的神经细胞相连;大多数公司和数量大体相同的其他公司进行贸易;大多数网站的访问者数量也大体相同。由于自然界是闭着眼睛向外“抛洒”链接,长远看来,不会有特别走运或特别不走运的节点。
  艾尔德和莱利的随机网络理论自从 1959 年问世以来,就主宰了有关网络的科学思考。他创立了几个范例,后来凡是搞网络的人,自觉不自觉地都受其影响。该理论还将复杂性和随机性看作是一回事。如果一个网络过于复杂,难于用简单的术语表述,那么我们可以说它是随机的。社会、细胞、通讯网络,以及经济等都足够复杂,算得上是随机网络。你可能觉得宇宙是随机的这一观点有点靠不住:所有的节点真是平等的吗?是否存在这样的国家、学校、教堂,或任何社会秩序的产物,在其中人们可以完全随机地相互作用?如果公司完全随机选择消费者,把销售人员编成百万个骰子,我们还能有现在这样的经济体系吗?大多数人都会认为,我们生活的世界远没有那么随机——在复杂系统背后,一定还存在某种秩序。
  既然如此,为何像艾尔德和莱利这样世间少有的智者选择将网络的出现描绘为完全随机的过程?答案非常简单:他们从来没打算提出放之四海而皆准的网络形成理论,他们更醉心于随机网络的数学之美,而不是这个网络是否能忠实地反映网络的特性。确实,在他们 1959 年发表的论文中,他们的确提到:“网络图的进化可以被视为某种交通网络(如铁路、公路或电网系统等)的简化了的模型。”但是,除了这一次他们偶尔涉足了真实世界外,其他的时候,他们的工作完全是受到有关数学问题的深度而非其应用的鼓舞而进行的。

第 3 章 六度分隔

  米尔格莱姆的目标是找到在美国任意两人之间的“距离”。试验的起始问题就是:在两个随机选择的个体之间,需要多少个熟人能将他们联系起来?实验之初,他首先选择了两个目标,一个是马萨诸塞州莎伦的神学学生的妻子,另一个是波士顿的股票经纪人。他选择堪萨斯州的卫奇塔(Wichita)和内布拉斯加州的奥马哈作为实验的起点。这是因为,从他所在的砍布里奇看来,这两个城市似乎比较遥远,好像是位于大平原上。对于这样遥远地方的人需要多少个链接联系起来,大家缺乏一致意见。1969 年,米尔格莱姆本人指出:“最近我询问过…个搞情报工作的人,问他这中间需要多少人,他说从内布拉斯加州到莎伦需要 100 个中间人,甚至更多。”
  米尔格莱姆的实验包括向随机选择的卫奇塔和奥马哈居民发送信件,请他们参与这一美国社会联系研究。信中简要说明  了研究的目的,附了一张照片,以及其中一个目标人物的地址和其他信息,然后还有如下要求:

如何参与此项研究

  1. 将您的姓名填写在本页下方的名单中,使接到信的人知道信是由谁发出的。
  2. 从信上撕下一张明信片,填写好明信片后,寄回到哈佛大学。无须付邮资。明信片非常重要,它使我们能够跟踪信件传递到目标人物的进程。
  3. 如果你直接就认识目标人物,请将此信直接寄给他(或她)。只有当你亲自见过目标人物,而且知道对方姓名时才可以这样做。
  4. 如果你本人不认识目标人物,不要试图直接和他联系,而是请将这宗文件(明信片以及其他内容)寄给自已的一个最有可能认识目标人物的熟人。你可以将其寄给朋友、亲戚或熟人,但前提是你必须知道对方姓甚名谁。
  米尔格莱姆最关心的是:这些信中能有多少能到达目标人物的手中?如果中间链接确实是像他朋友猜测的那样要 100 个左右,那么实验就很有可能会失败,因为在这么长的链条上,总会有人不那么配合。因此,几天后,当第一封信来到时,对他们来说真是个惊喜,而这封信只经过了两个直接的链接!后来这成了最短的路径。不过,最终在发出的 160 封信中,只有 42 封收回了,其中有的需要 12 个中间人。这些完成的邮件链使米尔格莱姆得以判断出到达目标人物所需的中间人数量。他发现中间人的平均数是 5.5,这的确是一个很低的数据一而且和凯伦斯估计的数惊人地巧合。经过四舍五入,我们得到的是 6,这样就有了“六度分隔”的著名说法。
  社会心理学家托马斯·布拉斯(Thomas Blass)过去 15 年来致力于研究斯坦利·米尔格莱姆的生平和作品,他指出米尔格莱姆本人从来没提过“六度分隔”的说法。这个说法是约翰·格尔(John Guare)在 1991 年的杰出戏剧题目中首先使用的。该剧在百老汇非常成功,随后又拍成了同名电影。在剧中,欧萨(Ousa,电影中由斯道科特·詹尼饰演)提起人们之间的相互关系,对他女儿开玩笑说:“这个星球上,每个人之间只隔着 6 个人,即六度分隔。在这个行星上,我们和其他每个人之间,就只有六度分隔。美国总统,威尼斯的贡多拉船船夫…不仅仅是大人物,所有的人都算在内。包括雨林里的土著,火地岛上的居民,爱斯基摩人。只需 6 个人,我就能和这个行星上的任何人扯上关系。这个想法真了不起……每个人都是开向另外世界的窗户。”
  米尔格莱姆的研究仅限于美国,是将卫奇塔和奥马哈“一边”的人和“另一边”波士顿的人进行联系得到的结果。不过,欧萨认为,六度分隔的理论适用于全世界。这里就诞生了一个神话。由于多数人会去看电影而不去阅读社会学论文,因此格尔的说法在常人心中更有市场。
  在任意两个人之间,只需握几次手就能联系得上。也就是说,我们生活的世界真的很小。我们的世界之所以小,是因为社会是一个密度极高的网络。我们拥有的朋友数量,比 1 这个保证我们联系成网络的阈值要高得多。社会关系网络并不是仅有的“小世界”。

  在万维网上,随机从一个网页到另一个随机网页之间,所需的点击是?为了回答此间题,我们需要绘制完整的网络地图。可问题是,谁也没有这样的完整地图。即便是最大的搜索引擎,使用上千台电脑不间断地搜索,也只能覆盖整个网络的 15%。没有整个网络的地图,我们能判断出网页间的间隔吗?答案是肯定的。但是我们要用到统计学中常用的一种方法一这是一般用来对付成分和结果都无法预计的随机系统的物理学分支。
  我们使用的办法有一个简单的前提:如果全部的网络过大,无法装入我们的电脑,那么就分解开来,研究其较小的部分。例如,我们节选了网络的一小部分,包含 1000 个节点,然后计算任意两个节点之间的间隔。接下来我们又在此基础上选取了更大的一部分,包含 10000 个节点,然后计算这部分中任意两个节点之间的间隔。我们反复选取,反复计算,直到我们的电脑系统所能处理的极限,然后分析节点间隔的变化趋势。结果表明,节点间隔的增加比节点数量的增加慢得多,而且遵循简单的循环的公式。这一结果使我们在知道了网络文档总数的情况下,就能预计整个网络的节点间隔。日本电气公司提供了网络文档总数的数据。他们估计,到 1998 年底,网络。上公开索引的节点总数为 8 亿个节点。这样以来,根据我们的公式,就可以计算出网络的“直径”为 18.59,近似值为 19。仿照格尔的说法,那就是十九度间隔。虽然实际浏览的时候,某些人得到的印象可能有所偏差,但网络的确是个小小的世界,任意两个文档之间的平均间隔为 19。
  科学家发现,在所有人类研究过的网络中,间隔都比较小。事实上,食物链中,物种之间的间隔只有两个链接;细胞中的分子之间的间隔是 3 次化学反应;科学界,不同领域的科学家之间共同发表作品的间隔是 4 到 6 个链接;线虫(C.elegans)大脑中的神经细胞之间由 14 个神经键连接。事实上,万维网的十九度间隔是最大的了,到目前为止,其他研究过的网络之间的间隔为 2 到 14。
  十九度间隔和六度分隔之间的差异的确不小。不过,这并不是问题所在。问题的关键在于,大型的网络,虽然往往有数百万或数十亿的节点,实际上却是小世界,节点之间的间隔比节点的总数要小得多。我们的社会拥有 60 亿个节点,其间隔为 6。万维网有接近 10 亿个节点,间隔为 19。而由成千上万的路由器构成的互联网,间隔为 10。从这个角度来考虑问题,间隔是 6 还是 19,这种差别就可以忽略不计了。
  人们自然而然会问到的问题是:为什么大型网络中节点的间隔如此少?拥有数十亿节点的网络,究竟如何连为一体,使得节点之间的间隔如此的少?答案在于这些网络都具有高度相互关联的特性。在前面的章节中,我们讲到随机网络只需每个节点一个链接即可组成节点串。问题在于,如果节点的链接数量超过 1,又会如何?在真正的网络中,每个节点拥有的连接一般都超过 1。当网络链接达到了平均数 1 的阈值,节点和节点之间的间隔非常之大。但是随着链接的增加,节点间的距离会骤然变小。我们来考虑一下节点的平均链接为 k 的网络。这意味着从某个典型的节点,走一步可以达到 k 个节点中的一个。不过,实际上网络中间隔为 2 个链接的节点数量为 k2 个,间隔为 d 个链接的节点数量为 kd 个。因此,如果 k 的值较大,那么即使 d 的值很小,所能连上的节点数也会很多。仅仅需要几步,就能达到所有能找到的节点。这就解释出大多数网络的间隔为何如此之小。
  这里的分析可以很容易使用数学函数公式来表达。该公式能够用来预测随机网络中节点的间隔。网络节点间隔之所以小,是因为公式中的对数值小。事实上,即使原始数值再大,其对数也很小。例如,以 10 为底的 10 亿的对数仅为 9。例如,如果有两个网络,它们的节点平均链接都是 10,但是其中一个网络的规模是另一个的 10 倍,那么,较大网络的节点间隔仅比较小网络的间隔大 2。对数关系使得巨大的网络变小了,造成了我们周围一个又一个网络的小小世界。

  所谓的六度间隔和十九度间隔说却有强大的误导作用,因为人们可能想当然认为在一个小世界里,很容易找到所需的东西。事实并非如此!这不仅是因为我们所要找的人或文档在 6 个或 19 个链接开外,而且因为所有的人或文档都在 6 个或 19 个链接开外。换句话说,6 或 19 既可能是个小数,也可能是个大数,这取决于你要找的是什么。由于每个网页平均有 7 个左右的链接,这就意味着从第一个文档出发,有 7 个链接,点击两次后,就有 49 个文档等待点击,然后有 343 个文档,以此类推。这样一来,要想到达 19 步开外的节点,原则上我们要检查 10 的 16 次方个文档,这比网络上文档的总数还要多一千万倍。这似乎是自相矛盾,实际上却不然:我们在搜索的过  程中碰到的某些链接会引导我们倒回去。因此,它们就不是“新”的链接。但是,即便是每点击一个文档只需一秒钟,要想尝试完 19 步开外的所有文档,也要 3 亿年!即便如此,虽然有如此之多的选择,即便是不使用搜索引擎,我们有时候仍然很快就能找到所需文档。
  当然,其中的奥妙在于我们并不亦步亦趋点击所有的链接。我们会借助提示信息进行判断。比如,在寻找毕加索的相关信息的时候,如果网页上有 3 个选项,我们会选择现代艺术的链接,而不是指向某个摔跤好手或是青蛙王子的爱情生活的链接。通过解读链接的含义,我们就无须检查十九度之内的所有的页面,只需几次点击就能找到所需的页面。虽然这个办法似乎是最高效的,但是事实上,使用该办法总是无法找到最短的路径。比如,我们半路上忽略过的摔跤手的网页上很可能恰恰有指向毕加索网站的链接,这种可能性总是存在。但是大多数人在搜寻毕加索的时候,都会忽略摔跤手的链接,导致最终走了不少弯路。相比之下,电脑没有个人的口味或喜好,它会逐一检查所有的链接。通过检查所有的可能路径,最终电脑肯定能找到最短的路径。
  通过在网络上寻找毕加索的信息,突出反映出六度分隔的一个根本性的问题:米尔格莱姆的办法过高估计了美国任意两人之间的最短距离。六度分隔其实只能是上限。在任意两人之间,存在有数不清的长短不一的路径。米尔格莱姆的实验对象根本就不知道联系到目标对象的最短路径。这就好比是在迷宫里,我们所能看见的只是眼前的走廊和大门。即便手头有指南针,而且知道出口大体上是在北方,想找到出口也会耗费大量的时间,而且我们的行动效率也会很低。相反,如果手头有迷宫地图,不出 5 分钟,我们就能走出来。与此类似,如果米尔格莱姆实验中的对象手头有全美国所有人的社交路线图,那么信件也就能经过奥马哈和波士顿之间的最短路径到达对方手里了。在手头没有路线图的情况下,参与者只能根据猜测,将信寄给最有可能将其送往正确对象的人。例如,如果你想结识美国总统,首先想到的可能是认识总统的那些人。你最有可能想到的是本州的参议员或众议员。由于大多数人实际上和参议员并无私交,我们首先会试图找到认识他的人,让那人当中间人,介绍我们认识参议员和总统。这样中间至少就需要 3 个人。此时,你可能想不到,就在前几天的一次晚宴上,坐在你身边的那个人可能上学的时候和总统阁下是同学。这样一来,你实际上和总统之间只有两度的间隔。与此类似,米尔格莱姆的实验所记录的路径几乎毫无例外都不是最短路径。因此,真正的社会间隔很显然被高估了。实际值肯定低于 6,有可能也低于凯伦斯估计的 5。由于不存在什么“社会搜索引擎”,我们也许永远无法弄清楚实际的数值。

  六度分隔是现代社会造成的结果——这是由于人类总有交际的渴望。同时人类新发明的远距离通讯手段也对此起到了推波助澜的作用。我们赖以生存的地球村,对于人类来说其实是个新产生的现象。大多数美国人的祖先都不可能和远隔重洋的欧洲大陆的亲人保持联系。当时既不通邮,也不通电话,当时的社会网络还比较脆弱,一旦因为人们移居他乡而断裂,就很难重新连上。到了 20 世纪,随着邮件系统、电话以及航空旅行消除和缩短了人与人之间的距离,这一切都发生了改变。如今,移居美国的人可以继续和母国的亲朋好友保持联系。我们能够也确实在保持联系。比如我个人,虽然有些亲朋好友住在韩国或是东欧,但我仍能和他们保持联系。在 20 世纪,世界不可逆转地塌缩为一个小小的世界。而且我们的世界此刻正在经历另一次的爆聚(implosion),互联网正把世界的每一个角落连为一体。虽然在网络上,和任意某个人之间的距离为 19 次点击,但是和亲朋好友之间,却只隔了 1 次点击。自从分手后,某些朋友可能已经换了 5 份工作,换了 3 个城市,但是不管他们走到哪里,只要我们愿意,我们都能在互联网上找到他们的足迹。世界一直在缩小,这是因为以前可能彻底断开的社会链接,现在却能很容易地保持下去。而且个人所能保持的社会链接的数量也大幅增加了,这进一步减少了社会间隔。米尔格莱姆估计为 6 度;凯伦斯估计为 5 度;现在,这个值很可能减少到了 3。
  “小世界”实在是所有网络都具备的一种遗传属性。较小的间隔并不是人类社会的神秘之处,或是特有的属性,事实上我们周围的大多数网络都具有此特点。这一特点植根于网络的结构之中一不论是查找网页还是朋友,所需的中间链接事实上就是不多。小世界的形成,和我们所熟悉的欧几里得几何所描述的世界似乎存在很大的不同。在欧几里得的世界里,距离是以里程来计算的。但人与人的交际,越来越和物理上的距离不相干。人们在全世界旅行的时候,不断能从完全陌生的人群中找到老相识,这样的事例一再表明,我们和地球另一边的某个人之间的关系,可能比和挨门邻居的关系还要亲近。在网络这种非欧几里得世界漫游,我们不断感到宁宙间存在一种新的儿何学等待我们研究掌握,好使我们能够明白身边的复杂世界。

第 4 章 小世界

  马克·格兰诺维特(Mark Granovetter)把自己的第一部论文手稿送交出版的时候,他还只是哈佛大学的研究生,不过他对自己的手稿期望很高。人们如何获取工作这一问题困扰了无数的研究生。格兰诺维特没有急于加工自己的履历表,去人才市场求职,而是渡过查尔斯河来到了对面的马萨诸塞州的牛顿镇。现在的牛顿镇是波士顿的一个富庶的郊区,可是在 20 世纪 60 年代,那里还是工人阶级的聚居区。格兰诺维特致力于探明人们如何“联网”,即如何通过社会关系找到新的作。他访间了多位具有管理职位或专业职位的工人,询问他们目前的工作是通过何人的帮助获得的。是朋友介绍的吗?他得到的答案总是相同的:不,不是朋友介绍的,介绍我的只是个普通的相识而已。格兰诺维特由此想起了在基础化学课上学到的较弱的氢键是如何将巨大的水分子结合在一起的。这样一幅分子结构图在他刚上大学的时候就深深印在了他脑海里,并激发了他的灵感,使他写出了第一篇论文,该论文篇幅很长,而且很有见地,探讨了较弱的社会关系对于我们生活的重要性。1969 年 8 月,他把论文寄给了《美国社会学评论》(American SociologiGal Review)。l2 月,他收到回音,被告知有两位匿名评委“毙”了他的论文。格兰诺维特极为丧气,在此后 3 年的时间里动都没动那篇论文。1972 年,他把该手稿进行了缩减,又投给了另一份期刊:《美国社会学杂志》(American journal of Sociology)。这次他的运气不错,论文终于在 1973 年 5 月发表,距第一次投稿已经有 4 年了。如今,格兰诺维特的“弱关系的力量”(The Strength of Weak Ties)这篇论文,已经被公认为最有影响力的社会学论文之一,该论文也是经常被引用的论文之一。
  在“弱关系的力量”这篇文章里,格兰诺维特提出了一个乍看起来十分荒谬的观点:若论起找工作、获取消息、开饭馆,或是传播最时兴的潮流,我们的较弱的社会关系比起自己所珍视的坚实的友谊能起到更重要的作用。他谈到,一个普通人[他称作“个体”(Eg)]周围的社会网络结构特别像基因结构。“个体会有一批相当亲密的朋友,其中大多数相互之间也都有联系——这是一种高度密集的社会结构。此外,个体还会有一批熟人,这些人相互之间并不相识。不过,每一个普通的熟人自己可能有自己的密友,因此也处在一个密集的社会结构中,不过该结构和个体所处的社会结构不同。”
  透过格兰诺维特的论述,我们看到了一幅和艾尔德和莱利描述的随机宇宙迥然不同的社会图景。在他的眼中,社会组织成一个个高度相关的集体,或称作紧密联系的朋友圈,在这个圈子里的人相互都认识。这个圈子通过少数的向外链接与外部世界联为一体,不至于处于隔绝状态。假如格兰诺维特的描述是正确的,那么我们的社会网络的结构就非常特别。它将是完整的网络图的集合。这些网络图都是微小的节点串,其中的每个节点都和内部的其他节点相连。这些完整的网络图通过几个较弱的联系,即熟人关系,和不同的朋友圈联系起来。
  这种关系对于我们和外部世界互通消息起到了至关重要的作用。在找工作的时候,我们最亲密的朋友往往帮不上忙。他们和我们处在同样的圈子里,因此他们接触的信息不可避免会和我们接触的一样。要想获取新的信息,就必须利用弱关系。事实也确实表明,从事管理方面工作的工人更有可能通过弱关系(27.8%)而不是强关系(16.7%)获得工作机会信息。与最亲密的朋友相比,弱关系(或是熟人)是我们联系外部世界的桥梁,因为他们和我们活动的范围不同,因此能够从不同的来源获取信息。
  在随机网络中不存在朋友,因为我们和其他节点的链接完全是随机的。在艾尔德一莱利社会宇宙中,我的两个密友相互认识的几率,相当于某个澳大利亚鞋匠和某个非洲部落酋长相互认识的几率,但是我们身处的社会并不是那样的。在大多数情况下,两个好朋友也各自认识对方的朋友。他们会经常参加同样的聚会,出人同一个酒吧,看同样的电影。两个人之间的关系越强,他们的朋友圈重合的区域就越大。虽然格兰诺维特关于弱关系重要性的观点乍看上去有些与我们的直觉不符,甚至有点荒谬,但它的确揭示了我们的社会组织的一个简单事实。格兰诺维特描述的社会是由完全相连的朋友圈组成的破碎的网络,朋友圈通过弱关系相互联系,这比艾尔德和莱利提出的随机社会图景要更接近真实的情况。要想更好地理解社会结构,随机网络理论有必要和格兰诺维特描述的朋友圈概念结合起来。将两者结合这一工作花了几乎 30 年的时间。有趣的是,解决这一问题的可能的线索并不是来自社会学或图论。

  我们经常听到这种大家按照同样的节奏共同鼓掌,这些都是自发产生的。这种自发而又神秘的同步鼓掌现象,是自组织的绝佳例子,这种现象遵循严格的定律,而这些规则已经被物理学家和数学家深入研究过。某些种类的萤火虫也遵循这些定律。在东南亚,常常有数百万只这种萤火虫聚集在红树林里间歇发光。然后忽然从某个时刻起,这些萤火虫开始同步发光变暗,把灯塔状的红树冠变成了巨大的间歇发光的灯泡,在好儿里地开外都能看见。这种微妙的趋向同步的现象在自然界十分普遍。心脏的起搏细胞,正是在同步趋势的驱使下一起启动;长期共同生活的女性,月经周期也会趋于同步。

  瓦特从一个简单的问题出发,开始了网络理论研究的旅程。这个问题是:我的两个朋友相互认识的可能性有多大?我们从前面了解到,根据随机网络理论,这个问题的答案很清楚。由于节点是随机链接在一起的,我的两个好友相互认识的可能性就和威尼斯的某个贡多拉船船夫和某个爱斯基摩渔人相识的可能性同样小。很显然,正如格拉诺维特在 25 年前所指出的,这并非社会组织的实情。我们都是某个节点串的一部分,在里面每个人都相互认识。因此,不可避免地,我的两个朋友会相互认识。要想搜集到节点串的特点方面的证据,而且是数学家或物理学家所能接受的证据,我们就必须能测量节点串的群集属性为此,瓦特和斯托加茨引入了一个新的量,称作群集系数。假设你有 4 个好朋友,如果他们相互之间也都是朋友,你就能通过一个链接和他们每个人联系,这样你就有了6 个友谊链。不过,你的朋友中可能有个别人相互之间并不是朋友。这样实际的数据就不到 6 个链接——我们假设有 4 个。这样,你的朋友圈的群集系数就是 0.66,这个系数是以你的朋友链接的实际数量(4),除以理想条件下当他们相互都是朋友的时候的链接总数(6)得来的。
  群集系数能说明你的朋友圈有多紧密。如果群集系数的值接近 1.0,这意味着你的所有朋友相互之间也是朋友。反之,如果群集系数为,那么你就是将自己的朋友连接成一个圈子的唯一的人。格拉诺维特眼中的社会包括许多高度联系的群集,群集和群集之间由较弱的关系联系起来。这样的高度联系的网络的群集系数应该较高。要想获得具体的数字来证明我们的社会确实充满了这样的群集,就需要测量地球上每个人的群集系数。由于根本不存在说明谁和谁有关系,以及谁是谁的朋友这样的地图,因此也就不可能真的测量出每个人的群集系数。不过,有个特殊的社会群体定期公布他们的社会联系。我们可以研究一下这个特殊群体的群集关系。

  有关科学家的协作网络。纽曼的论文证明了科学家的日常生活都是发生于密集联系的科学家群集中,这些集群又通过弱关系相互联系起来。社会系统中确实存在群集现象。
  社会群集是我们凭直觉所能感受到的。人类似乎具有先天的结党分派的渴望,因为党派能给我们带来熟识、安全、亲近的感觉。不过,社会网络的某个属性,只有当它能反映出自然界大多数网络的某种一致属性的时候,科学家才会对它感兴趣。因此,瓦特和斯托加茨的最重大的发现,就在于指出了群集现象不只是存在于社会关系网络中。
  通常人们都把人类的高度智能归因于我们大脑所拥有的复杂的神经网络系统。可是,仅仅拥有 302 个神经细胞的线虫(Caenorhabditis elegans,或称作 C.elegans),却向我们展示了这么一丁点神经细胞也能产生巨大的能量。这种身长 1 毫米的蠕虫的生命周期只有 2~3 星期。
  C.elegans 的基因组和人类基因组区别不大,但它却是最简单的多细胞生物之一。科学家甚至已经成功地搞清楚了它的神经系统的分布,绘制出了详细的路线图,标明其神经细胞是如何联系在一起的。通过研究这种虫子的神经网络图,瓦茨和斯托加茨发现这个小小的网络和社会总体上差别不大:这个网络的群集程度也很高——其任意神经细胞的相邻神经细胞相互链接的可能性,是随机网络中的 5 倍。研究者在研究美国西部电网的时候发现了类似的分布特点。在电网中,发电机和变压器等于是节点,而输电线路则是链接,这些电网呈现出高度的群集现象。好莱坞的演员协作网络也存在此现象,我将在下一章详细探讨这一网络。
  由于科学界对瓦茨和斯托加茨的意外的发现甚感兴趣,许多科学家继而详细研究了许多类型的网络。万维网存在群集现象;互联网存在群集现象;对于描述公司企业如何通过合资关系连接在一起的网络,经济学家发现它也存在群集现象;生态学家在描述生态系统中物种的捕食关系的食物链中也发现了群集现象;细胞生物学家也认识到,在细胞中,分子构成的脆弱的网络也存在群集现象。这些发现,证明群集现象无所不在。这使得它由以前认为的独一无二的社会网络特性,变成了复杂网络的共同特性,并且对真实的网络都是随机的这一观点提出了挑战。

  为了回答为何群集现象普遍存在于真实网络系统中,瓦茨和斯托加茨在 1998 年发表于《自然》杂志的论文中,提出了与艾尔德和莱利的随机网络模型不同的新模型。他们提出的模型,首次将群集现象和随机网络图的偶然性统一了起来。他们想象一个圈子里的人(图 4.2)都认识自己紧邻的人。在这个简单的模型中,每个节点都有 4 个邻居,他们之间通过 3 个链接相互连在一起。这样,整个网络就拥有较高的群集系数。事实是,如果所有的 4 个邻居都是相互链接的,那么他们之间应该有 6 个链接。由于此模型中他们之间的链接只有 3 个,因此群集系数是 3 除以 6,也就是 0.5,和我们在数学家网络中得到的 0.56 的值非常接近。要想证明这一结果确实反映了高度的群集现象,我们可以假设在一个随机网络中,某个典型的节点仍然有 4 个邻居,但却是和整个系统中的任意节点随机连接在一起。这样一来,其 4 个邻居之间的链接数,就取决于网络的规模。如果网络如图所示拥有 12 个节点,那么其群集系数为 0.33。如果有 10 亿个节点,这个数就会下降到 4×10-9!很显然,新的模型预计群集系数为 0.5,和这些数值相比要大得多。

  不过我们也要为模型的高度群集特性付出代价,这样该网络就不是小世界了。在社会网络模型中,只有我紧邻和次紧邻的人认识我。要想和圈子另一边的人取得联系,我就必须转遍整个圈子,和无数的人握手相识,才能做到。我们可以很容易地找到连接顶端节点和底部节点的最短路径,它至少包含 3 个链接。听起来似乎不多,但是如果我有耐心,而且纸张够大的话,在同一个圈子上画上 60 亿个节点,每个节点都和其紧邻和次紧邻的节点相连,那么连接圈子两端的任意两个节点的最短路径恐怕要包括 10 亿个链接!这样看来,围绕这样一个圈子建立的社会,不仅具有高度的群集特性,而且是个非常大的世界。
  实际生活中,我们都和地球上某个遥远地方的人有联系。每个人除了邻居之外,还有相距较远的朋友。假如我想找到和某个澳大利亚人的联系路径,我无须挨家挨户敲门,因为即使那样做,我早晚也会敲到太平洋的边上而无路可走。我可能会记得我高中时最好的朋友几年前移居悉尼了。这样一来,我就可以先联系这个朋友,然后由他再找到需要找的那个澳大利亚人,毕竟他在那里的交际圈也是不断扩大的。一个能反映当今社会实情的比较现实的模型,就应该允许远距离链接的存在。在上面谈到的模型中,只需添加几个随机链接,就得到了所需的模型。也就是说,只需在圆圈上选择任意两个节点,并用新的链接将其连起来即可。这样就把所选节点之间的距离降到了 1,而且他们各自紧邻的节点之间的距离也大大缩短了。如果添加多个这样的随机链接,就能把所有的节点的距离拉近。
  瓦茨和斯托加茨发现了一个惊人的特点:即使只是添加少数几个链接,就能把所有节点之间的平均间隔大大降低,这少数儿个链接却不会太大地改变网络的群集系数。然而由于它们构成了跨度颇大的桥梁,往往是将圆圈两端的节点链接起来,这使得所有节点之间的巨大间隔崩溃了。该模型能够大大降低间隔,同时却基本上并不改变群集系数,这一特性说明了人们在交友的时候范围虽然有可能比较有限,只要其中有少数人的交往比较广,拥有远距离的链接,社会就能构成小世界。基于此简单模型,我们意识到六度分隔是植根于人群中有少数人的亲朋好友是住在远处,而不是住在左邻右舍。这些距离较远的链接,使我们拥有了链接远处世界的捷径。巨大的网络无须充满随机链接,就能显示出小世界的特性,只需少数几个远程链接就够了。
  有一段短暂的时期,似乎瓦茨和斯托加茨的更一般性的、群集性更明显的模型似乎要取代艾尔德和莱利的随机宇宙。我们每个人都能想象到这样一幅图景:自己在本地的熟人形成一个圈子,这个圈子里的某些人又有较远的链接,这个情景能非常清楚地解释我们周围的小世界。该模型给出了一个绝佳的折中方案,把艾尔德和莱利的随机世界和规则的格构结合起来。在随机世界里,虽然是个小世界,但是对朋友构成的群集不够友好;而在规则的格构里,节点相互之间的距离太过遥远。
  现在我们明白了瓦特-斯托加茨模型和艾尔德-莱利的世界观并非是不可调和的。如果假设从规则的格构出发,它也的确允许群集的存在。但是从多个角度上讲,其最基本的原理,仍紧紧吻合艾尔德-莱利的观点。毕竟,虽然刚开始我们是把节点安排在一个圆圈上,但是链接它们的时候,却完全是随机的。这样一来,两个模型从深层上表现的都是平等主义的社会,其链接都是随机的。
  我们刚刚透彻理解了该成果,忽然碰上了一件紧急事件。我们的小机器人从万维网上获取的网络图像和艾尔德-莱利以及瓦茨-斯托加茨模型预言的网络结构极为不同。在接下来的章节中我会介绍,我们得到的网络图中有一批中心节点——即带有异乎寻常的多的链接的节点。问题在于,在艾尔德和莱利平等主义的模型中,这样的中心节点极其罕见;显然,该模型无法解释我们的机器人获取的实际网络图。瓦特一斯托加茨模型也好不到哪儿去:该模型也不允许有链接大大超过平均数的中心节点的存在。因此两个模型都存在重要的缺陷,这制约了我们对网络状宇宙的理解。这些数据促使我们寻找对真实网络的更好的解释,并最终迫使我们彻底抛弃了随机世界观。沿着这条路径,我们的研究出现了始料不及的转折。我们必须抛弃到目前为止所掌握的所有的对网络的理解。

第 5 章 中心节点和连接者

  连接者——即带有极大量链接的节点一存在于多种复杂系统中,从经济体系到细胞中都存在连接者。他们是大多数网络的基本组成部分。这一发现颠覆了我们对于网络的所有知识。群集现象是艾尔德-莱利的随机世界观的第一个裂隙。前一个章节中谈到的瓦茨和斯托加茨模型暂时解决了这一危机,使得六度分隔能够成立。而连接者现象则是对这两种模型的致命打击。为了解释这种具有大量链接的节点的存在,我们就必须完全抛弃随机世界观。

  电脑空间代表了最高度的言论自由。很难对网页内容进行新闻检查与控制,一旦某条信息发布在网上了,数以百万计的人都能看到它。这种前所未有的言论权力,辅以无比低廉的发表费用,使得网络成了民主思想的论坛;任何人的声音都拥有同样的机会传播给他人,至少政界人七和商业周刊都这样宣称。假如万维网是完全随机的网络,他们这样说就可能是正确的。然而万维网并不是完全随机的。我们的万维网路线图研究项目最引人注目的发现,就是万维网完全缺乏民主、公正与平等之类的价值观。我们知道,网络拓扑学决定了我们无法看到网络中的所有一切,只能看到数十亿文档中的一小部分。
  发表是肯定可以的,一旦发表,它们就立即向全世界所有人开放,所需的只是一个网络链接。然而,面对 10 亿多文档组成的丛林,我们的问题是,把消息发布在万维网上之后,会有人注意到它吗?
  为了让人阅读,你的信息必须是可见的,这和对小说作家或科学家写的东西的要求都是一样的。在万维网上,可见度的度量标准就是链接数量。指向链接越多,它的可见度就越高。如果万维网上每个页面都有指向你的文档的链接,那么在很短的时间内,每个人就都能知道你要说的内容了。但是网页上平均只有 57 个链接,每个链接都指向 10 亿个网页中的某一个。因此,一个典型网络文档拥有指向你的网页链接的可能性接近于零。
  我的网页 www.nd.edu/
alb 就和这一结论非常吻合。根据 AltaVista 的搜索结果,全世界有 40 个其他网页指向它。平心而论,考虑到我的网页涉及的面这么狭窄,这个数目也不算少了。但是考虑到整个万维网。上有 10 亿个网页供浏览者选择,那么诸位发现我的网页的可能性就大约是 4×10-9。也就是说,假如诸位随机在万维网上浏览,且在每个网页上只停留 10 秒钟,那么就必须连续 8 年夜以继日地不断浏览冲浪,才能撞上一个指向我的主页的链接。
  不过我们的发现却否认了这种预言。我们的机器人返回的结果表明,有证据显示,万维网的拓扑结构存在高度的不均衡现象。我们调查的圣母院大学的 325000 个页面中,有 270000 个,即 82% 的页面只有 3 个或更少的指向它们的链接。然而,有一小部分网页,大约有 42 个,被 1000 多个其他网页引用,而且指向它们的链接超过 1000 多个!接下来对 2.03 亿个网页的研究揭示出更大程度的不平衡:大多数的网页,大约占到所有网络文档的 90%,拥有的指向它们的链接为 10 个或更少,而少数网页,大约占网页总数的 3%,则被接近 100 万个其他的网页引用!
  这和社会网络类似。在社会中,有少数的连接者认识的人数之多超乎寻常。在万维网中,其结构也被一些高度链接的节点(或称作中心节点)所主导。这类中心节点,如雅虎或亚马逊网站,都具有极高的可见性——不论我们到哪儿,都能见到指向这些节点的链接。万维网背后的网络里面有许多未受注意或很少被注意到的节点,只有很少的链接把这类网站和中心节点链接起来。
  中心节点的存在,颠覆了某些人的认为电脑空间是平等主义乐园的乌托邦式幻象。没错,每个人都有权利在网络上发布东西,但是会不会有人注意到呢?如果万维网是随机网络,我们被看见、被听到的机会应该是相等的。我们以集权的方式创造中心节点,即每个人都会连接指向的网站。不论处在万维网的什么地方,这样的节点都非常容易找到。和此类中心节点相比,万维网的其余部分是不可见的。实际上,只有一两个链接指向的文档几乎就等于不存在。他人几乎不可能找到这样的网页,即便是搜索引擎对这样的网页也心存偏见。搜索引擎的网络机器人在万维网上游荡的时候根本就无视这类网站的存在,而是专注于搜寻最热门的网站。

  从一个角度讲,我们可以判断,演过的影片最多的演员,联系也最多,和好莱坞其他演员的距离也最短。一般而言,这个判断是正确的:某个演员饰演的剧目越多,他和同事的平均距离越短。不过,饰演剧目最多的演员名单却并不是联系最多的演员,这多少也有些让我们吃惊。我敢打保票说,诸位对饰演过的影片数量前 10 名中大多数名字可能都不熟悉,我们当时也是一样,对他经过一番研究,我们终于查明了他们的底细,原来他们都是三级片明星。
  这个演员表可能很好地说明了,一旦涉及网络,规模并不总是最重要的因素。虽然这些三级片明星饰演过的影片数量惊人,但是他们就是没能靠近好莱坞的中心。由于网络存在群集现象,只和自己所在的群集中的节点相连的节点,可能在自己的亚文化圈子里处于中心位置。假如缺少链接到外部世界的接口,他们距离其他节点串中各个节点的距离就比较远。因此,对于只演三级片的明星,如果他只和其他的三级片明星有联系,就很难把他和马丁·斯科西斯(Martin Scorsese)或安德烈·塔尔可夫斯基(Andrey Tarkovsky)的影片中的演员联系起来,他们处于完全不同的世界里。网络的真正中心保留给了那些在多个大型群集里都有自己的位置的节点。对于演员网络,这种节点就是那些饰演过多种类型影片的演员。对于万维网,这种节点就是那种不只提供现代艺术的链接,而是对于人们的所有疑间都提供链接的网站。对于社会,这种节点就是那种和各个领域的人都有交往的人。他们是数学界的艾尔德,这种人从不局限于任何框框,对于多学科相关的话题,他们都能驾驭自如。他们是网络中的达·芬奇,不论对艺术还是科学都驾轻就熟。

  在细胞中,通过化学反应构成的分子网络中存在中心节点。一小部分分子,比如水分子或三磷腺苷(ATP),就是细胞中的斯泰格尔,它们参与了大量的反应。在互联网上,将全世界的电脑连接在一起的线路网络中,也存在少数的中心节点。它们起的作用至关重要,保证了互联网的高可靠性。艾尔德是数学界的中心节点,有 507 名数学家的艾尔德数为 1。根据美国电话电报公司的一项研究,一小部分电话号码打出或接听了极大量的电话,这主要包括电话销售公司和客户服务电话等。在大多数科学家研究过的复杂网络中,都存在中心节点。它们普遍存在,成为我们周围的复杂的相互关联的世界的基因特性。

  中心节点的确很特殊,在任何存在中心节点的网络中,它们都对网络结构起到关键作用,使该网络呈现小世界的特点。中心节点和异乎寻常的多的节点之间存在链接,为系统中任意两个节点创造了联系捷径。其结果,就是全球随机选择的两个人之间的距离是 6,而任意一个人和连接者之间的距离则是 1 或 2。与此类似,在万维网上,两个任意页面之间的距离是 19 个点击,而从任何网页转到雅虎所需的点击则是 2~3 次。从中心节点来观察世界,它的确非常小。

  几十年来,许多人受艾尔德和莱利的影响,认为网络是随机的。最近这一观点在许多方面受到了挑战。瓦茨和斯托加茨模型提出了关于群集的简单解释,把随机网络和群集现象统一了起来,中心节点又进一步改变了网络研究的状态。我们迄今为止提到的两种模型都无法解释中心节点的存在。因此,中心节点迫使我们重新思考关于网络的知识,并且提出 3 个根本性的问题:中心节点是如何出现的?在某一既定网络中,可能出现多少个中心节点?为何先前的模型都无法预见中心节点的存在?
  两年来,我们设法回答了大部分疑问。我们发现,中心节点并不是相互联系的宇宙中的罕见的偶然现象。相反,它们的存在符合严格的数学定律,它们的普遍存在迫使我们以全新的思路考虑网络的问题。揭示并解释这些定律的过程,体验起来就像乘坐过山车般刺激,从中,我们更多地了解了我们的复杂的相互联系的世界。这些知识,比过去 100 年来积累的还要多。

第 6 章 80/20 规则

  在学术领域之外,帕雷托以其经验主义式的观察而享有盛名。他是个勤劳的园丁,他注意到 80% 的豆子,是 20% 的豆英结出来的。他也仔细观察了经济不平等现象,发现意大利 80% 的土地被总人口的 20% 占有。近来,帕雷托的 80/20 定律或法则,又变成了墨菲管理定律:80% 的利润是 20% 的员工创造的;80% 的客户服务问题是 20% 的消费者提出的;80% 的决策是 20% 的会议时间里作出的。这一定律还演变成了一些其他的至理名言。例如,80% 的案件是 20% 的罪犯制造的。
  不论是用在什么情况下,80/20 定律都说明了同一类现象:在大多数情况下,我们 4/5 的努力往往付之东流。我们还可以给 80/20 定律再添加几条:万维网上 80% 的链接指向 15% 的网页;80% 的用出自 38% 的科学家;好莱坞 80% 的链接连上了 30% 的演员。人们可能禁不住想把 80/20 定律用在任何场合。假如这样的话,就有点夸大事实了。实际上,凡是符合帕雷托的定律的系统都有些特别。造成这种特别的因素,对于我们理解复杂网络也起到了关键作用。

  受艾尔德和莱利的启发,我们预计会证明网页之间都是随机链接的。正如我们在第 2 章谈及的那样,网页上的链接应该呈中间高的正态分布,表明大多数文档的流行程度都差不多。但是我们的网络机器人描绘的网络上,有一些节点只有几个链接,另外一些中心节点则有大量的链接。最使我们惊奇的是,当我们试图把节点连接性的柱状图和双对数图匹配起来时出现的情况。我们发现不同网页上的链接分布严格依据数学上的幂律。
  不是搞物理或数学的人极有可能从没听说过所谓的“幂律”。自然界的大多数数量序列都呈正态的钟形分布,这和随机网络的峰状分布很相似。例如,如果统计一下你认识的所有男性朋友的身高,并绘制柱状图,你会注意到大多数人的身高在 152183 厘米之间,柱状图会围绕这些值出现峰值。除非你结交的朋友中有篮球明星,一般情况下,很少有人的身高会超过 213244 厘米。身材较矮的人的数量也类似:身高在 92122 厘米的人也会很少见。由于自然界大多数的数量序列,如人的智商、某种气体中分子的速度等,都遵循这种峰状分布,因此人们对这种无所不在的钟形曲线非常熟悉。
  最近几十年来,科学家注意到,在某些情况下,自然界产生的数量序列会按照幂律分布,而不是钟形曲线分布。幂律和钟形曲线迥然不同。首先,幂律分布不存在峰值。符合幂律分布的柱状图是一个不断下降的曲线,说明在几个大事件之后有许多小事件。假如某个行星上的外星人的身高符合幂律分布,大多数生物的身材较矮,人们要是看见身高上 30 米的巨人从大街上走来,也不会感到惊奇。实际上,如果那个星球上有 60 亿居民,其中至少会有一个人的身高会超过 2438 米。因此,幂律分布的最突出特点,不仅是其中有许多小事件,而且是许多小事件伴随着少数极大的事件。这种超乎寻常的大事件是不可能存在于钟形曲线内的。
  后来,我们发现,可以从另一个角度解决这个问题。这是不是由于某种同样简单的定律造成的呢?我们之所以尚未认识这一定律,只不过是因为以前还从未试图寻找过这样的定律?这一问题给我们带来了丰硕的成果。几个月后,通过分析好莱坞的演员网络,我们发现它也遵循同样的数学关系:认识 k 个其他演员的演员,也遵循幂律。后来我们发现艾尔德和数学同事也遵循同样的幂律。细胞中的分子网络也加入了这一行列。与 k 个其他分子相互参与反应的分子也符合幂律。论文引用构成的网络也符合幂律分布。无数个现今已经被我们或其他科学家研究过的复杂网络结果都符合惊人的简单而一致的形式:拥有 k 个链接的节点遵循幂律,且每个系统都有独一无二的次数幂,大多数系统的次数幂值都在 2
3 之间。

  随机网络和遵循幂律的网络之间的巨大差异,可以通过对比美国的道路交通网和航线网而得到一个直观的感觉。在道路交通网中,城市是节点,而连接它们的公路则是链接。这个网络异常平均:每个主要城市都至少有一条干线公路连接;同时,没有任何一座城市的干线公路有上百条。大多数的节点都很相似,链接数量大体相当。正如我们在第 2 章里所讨论的,这种一致性来自于随机网络,符合峰值分布曲线的特点。
  飞机航线网和交通网有极大的不同,航线网的节点是直接由航班联系起来的机场。坐飞机的时候仔细看看座椅后背上的飞行杂志上印的航线图,一眼就能看到少数的几个枢纽,相当于中心节点。比如在美国,就有芝加哥、丹佛、亚特兰大、纽约等城市的机场,从这里有飞往美国各地的航班。大多数的机场都很小,在航线图上表现为仅有儿个航线连接的节点,这些航线把它们和几个枢纽连在一起。这样一来,和公路交通图的情况不同,航线图上就有连接上百个小机场的大型枢纽,即中心节点(图 6.1)。
  类似的不均衡现象正是呈幂律分布网络的特点。在大多数真实网络中,大多数节点只有儿个链接,这些数量众多的较小的节点与少数儿个巨大的拥有无数连接的中心节点共存。幂律从数学上解释了这一现象。如果只在小型的节点之间存在几个链接,还不足以保证整个网络完全联系起来。由于少数几个中心节点的存在,使得网络连成了一体。
  在随机网络中,分布中的峰值意味着大多数节点的链接数量都相当,偏离此数量的节点极其少见。因此,随机网络的节点连通性具有自身的尺度特征,这种特征由普通节点体现出来,并受等级分布峰值的限制。与此相比,在幂律分布的网络中,缺乏峰值。这说明在真实网络中,不存在带有普遍性的典型节点。我们看到的是连续的有等级差别的节点,从罕见的中心节点到无数的小节点一级一级分布开来。最大的中心节点后面紧紧跟着两个较小的中心节点,然后是十几个更小的节点,以此类推,直到最后的无数的小节点。
  幂律分布迫使我们放弃关于典型节点的想法。在连续的等级分布中,我们无法找出一个特定的节点,说它能代表其他节点的特性。这样的网络不存在内在的尺度。因此,我的研究小组将符合幂律的网络描述为“无尺度”。意识到自然界的大多数复杂网络都符合幂律分布后,无尺度网络的概念迅速渗透到大多数与复杂网络相关的规则中。

  图 6.1 随机无尺度网络。随机网络的分布是一个钟形曲线,说明大多数节点都有同样数量的链接,而且不存在链接特别多的节点(左上)。因此随机网络和国道公路网络相似。在国道组成的网络上,城市就等于节点,而国道则是连接城市的链接。大多数城市所连接到的国道数量都基本相同(左下)。而无尺度网络的幂律分布则说明大多数节点都有很少的链接,它们由少数几个高度链接的中心节点联系成一体(右上)。看上去这样的网络和飞机航线图非常相似。在航线图中,有大量的小机场,它们通过少数几个大的枢纽机场联系在一起(右下)。

  1999 年,我们发现无处不在的中心节点具有等级差别,并且符合幂律。但是当时的两种网络理论都没有提到这些特点,人们只是觉得这都是巧合。艾尔德和莱利的随机网络理论,以及瓦茨和斯托加茨对其理论在节点串方面的扩展,都强调有 k 个链接的节点会以指数级减少——这比起幂律预计的要快得多,这两伙研究者都通过严密的数学论证,指出中心节点并不存在。在万维网中发现幂律的存在,不仅使我们吃惊,还迫使我们承认中心节点确实存在。缓慢降低的幂律分布很自然地能和高度链接的异常节点结合起来,它预言每个无尺度网络都会有几个大的中心节点确定网络的拓扑结构。人们发现,大多数在理论上具有重要意义的网络,包括从万维网到细胞内部的种种类型,都是无尺度的,允许中心节点的存在。我们会发现,这些规则决定了真实网络的结构稳定性、动态行为、稳健性、容错性以及承受攻击的能力。它们的存在,可以证明控制网络进化的极为重要的组织原则。

  帕雷托本人从未使用过 80/20 的说法,这个说法是后来研究帕雷托的经济学家造出来的。在 19 世纪末,他注意到,自然界和经济界中有几个量对无处不在的钟形曲线构成了挑战,使得其中的分布不再符合钟形曲线,而是符合幂律。他最著名的发现是揭示出收入分配也符合幂律,指明大部分财富到了极少数个人手中,而大多数人挣的钱都很少。帕雷托的发现指明大约 80% 的钱被 20% 的人挣去了。
  幂律是用数学公式表明了少数儿个大事件承载了大多数的活动。
  在纯粹随机的系统中,很少出现幂律。物理学家已经注意到,在大多数情况下,幂律预示着从无序到有序的过渡。因此,我们在万维网中发现了幂律,而且是以精确的数学术语描述的,证明了真实网络远不是随机的。这里网络揭示出的是有序和逐渐显现的行为原则。
  幂律是 20 世纪后半期最惊人的理论进步之一,它浮现自混沌理论、不规则碎片形和相变之间。在网络中发现幂律,表明了通向其他自然现象也存在我们预先没有想到的链接,并将网络置于理解复杂系统共性的最前沿。实际上,万维网、好莱坞网络、科学家网络、细胞网络以及其他许多复杂系统,都遵循幂律,并且首次揭示出在复杂网络背后也存在某种定律。

  水分子 H2O 的分子结构图看起来像是一个圆圆的 O构成的大脑袋上长了两个 H 状的耳朵,有点像米老鼠,大家对此都很熟悉。对其大小和内部结构,我们都了解得细致人微。这一点都不奇怪:水是地球上最常见,也是人们研究最多的物质。但是面对液态的水,即由数十亿的黏着在一起的水分子构成的一杯水,我们仍有许多难题。
  气态物质都很简单:分子在空间飞行,只有相互撞上才会往意到对方。晶体则正相反,但相对而言也很简单:分子相互手拉手,紧密结合在一起,构成了极度完美的刚性点阵。然而,液体却是这两种极端状态之间的微妙平衡,将水分子吸引到一起的力量不足以使其变成固态。水分子陷于混沌和有序之旧,跳着庄重的舞蹈:有些分子聚集到一起,构成小小的有序的组群,共同移动,但瞬间又会分手,其他的分子结合成新的组群。降低这杯水的温度并不能显著改变水的舞蹈,降温只能使水分子的动作更显高贵——更沉稳、更庄严。然而,到了 0℃,特殊的事情发生了。水分子突然形成了完美的晶体形式,它们从涣散的状态变成坚固有序的形式,依据的是某种神秘的力量。冰往往是冷和完美秩序的象征,它是自发形成的。
  水变成冰,是最佳的相变实例。在 20 世纪 60 年代之前,物理学家花费了数十年的时间才理解:许多物质都存在相变,不过形式可能和固态水存在明显的差别。例如,铁磁金属中的每个原子,都具有磁矩或磁自旋,通常以穿过原子的箭头来表示。在高温下,铁磁金属的原子的磁自旋指向各个不同的方向。不过,当温度降到某个临界点,所有的原子都会将磁自旋指向同一方向,形成磁体。
  液体结冰,以及磁体的出现,都是从无序到有序的相变。与变成晶体的冰相比,液态水是相当无序的。在凝固温度下,水会神奇地放弃无序的状态,选择一种高度对称有序的状态。同样道理,铁磁金属中随机指向的原子磁自旋也出于混沌无序的状态。一且降到临界温度,它们会神奇地选择同一个方向。这种突然的转变中蕴含了理解自然奥秘的关键,科学家和哲学家无不对此深感兴趣:有序究竟何以产生自无序?

  磁体的有序和无序状态对应的是物质的完全不同的热能状态。在相变的临界点,系统需要在两种状态间作出选择,就好像站在山脊上的登山者需要选择从娜一边下山一样。未作好决定之前,系统常常犹疑徘徊,这种摇摆在临界点达到极致。
  这些摇摆带来的结果可以通过实验测量得到。接近临界点时,同一物质内有序和无序混合在一起,系统对两种状态都进行试探。在接近相变温度的金属中,会出现原子簇,其磁矩指向同一个方向。金属越接近离临界点,这种有序的磁原子簇就越大。20 世纪 60 年代,物理学家找到了越来越多的实验证据,表面在临界点附近,有几个关键量符合幂律。其中包括,原子之间的通讯距离,即相关长度,经常作为测量节点串大小的大体依据。测量结果表明,离临界点越近,相关长度会随之增加,增加比例符合幂律,并带有独特的临界指数。金属离相变温度越近,磁矩之间的磁矩越大。在临界温度附近,磁体的磁力受指向同一方向的磁矩的比例影响。它也符合幂律,带有另一个临界指数。
  物理学家仔细研究了不同的系统是如何从无序过渡到有序的,并从中发现了更多符合幂律的相变过程。液体加热变成气体,或是将铅冷却到足够低的温度使其变成超导体,都遵循同样的定律。这种无序-有序转变具有极高的数学一致性。可问题在于,谁也不知道其中的原因是什么。为什么液体、磁体、超导体等会在某个临界点失去本来的属性,都一致遵循同样的幂律?这些完全不同的系统,为何会呈现如此高的相似性?幂律在其背后起了什么作用?

  1965 年圣诞节前后的一周,人们终于在理解从无序过渡到有序的奥秘方面得到了第一个突破性的发现。当时,乌尔班纳的伊利诺伊大学的物理学家利奥·卡达诺夫(Leo Kadanoff)突然意识到:在临界点附近,我们就不能再把原子当成独立的粒子看待,而应该把它们看作是属于一个个社区,共同行动的群体。可以把原子看作是装在一个个的盒子里,每个盒子里的原子都有同样的行为方式。
  自然界往往不欢迎幂律。在通常的系统中,所有的量都遵循钟形曲线分布,而且相关性迅速衰退,只允许指数定律的存在。但是,一旦系统被迫产生相变,一切也随之改变。继而就出现了幂律——这是自然界给出的明确无误的征兆,表明混沌正让位于有序。相变理论清晰明确地表明了,从无序通往有序的道路,受到自组织力量的影响,这是幂律给辅就的。

  学者们了解到,在接近临界点的时候,有序正准备从无序中产生,所有相关的量都遵循具有某个特定临界指数的幂律。不论我们]研究的是水结成冰,岩浆冷却成岩石,金属变成磁体,或是陶瓷变成超导体,同样的定律总是起作用,生发出神秘的幂律。我们终于了解到,复杂系统产生出秩序之际,也会失去自己独一无二的特点,显示出和大批的其他系统类似的特性来。
  事实上,在 20 世纪 80 年代和 90 年代,物理学家、生态学家、材料科学家、数学家或经济学家,在其研究的领域只要发现自组织现象的存在,就会同时发现幂律和普适性也同样存在。看起来所有的网络都有共性:在中心节点背后,有一个相当严密的数学表达,即幂律。
  这把我们带向了下一个迷题。如果幂律代表的是系统正从混沌过渡到有序,那么在复杂网络中正发生何种转变?假如幂律出现于临界点附近,那么对于真实网络,是什么在调节它,使其达到临界点,并且呈现出无尺度的特性?在物理学家揭示了相变的机制之后,我们开始理解临界现象。现在,严密的理论允许我们高度精确地计算出系统转为有序时所有的量。但是到目前为止,我们在本书中才只探讨了中心节点问题。我们现在知道,中心节点是幂律导致的结果——这表明了自组织和秩序的存在。当然,这是一个重大的突破,使我们不再将网络看作是随机系统。但是最重要的问题,即与中心节点和幂律有关的机制究竟是什么,仍然没有答案。真实网络是不是处于从无序到有序过渡的连续状态?为什么在各种各样的网络中,不论是演员构成的网络还是万维网,都会出现中心节点?为什么这些网络会遵循幂律?是否存在某种基本的定律,迫使不同的网络都呈现出同样的形态?自然界是如何编织这些网络的?

第 7 章 富者愈富

  简单的富者愈富现象,竟然是大多数网络的潜在特性,这能够解释我们在万维网和好莱坞的网络中都观察到的幂律现象。
  艾尔德和莱利的随机模型是建立在两个简单的,但同时往往被人忽视的假设的基础之上。首先,我们从一系列节点出发。一旦有了所有的节点,我们假设节点的总数都确定了,而且在网络的生命周期内都不会改变。其次,所有的节点都是一样的。由于看不出节点之间有何差别,我们只是随机将他们链接起来。在网络研究的 40 多年的时间里,都没人对这些假设提出任何疑问。但是发现中心节点后一以及描述中心节点的幂律一迫使我们放弃这两个假设。
  建立增长网络的模型比较容易。我们从一个小小的核心开始,不断增加节点。我们先假设每个新节点有两个链接。这样的话,如果开始只有两个节点,那么第三个节点就会同时和它们两个建立链接,第四个节点有三个节点可供选择。我们该如何选择和其中的哪两个节点建立链接呢?为了简便起见,我们还是按照艾尔德和莱利的办法,从三个节点中随机选择两个,将它们和新节点链接在一起。这一过程可以无限延续下去,每添加一个节点,就将其随机和网络中的两个节点链接在一起。通过这个简单的运算法则生成的网络,称作模型A,与艾尔德和莱利的随机网络模型存在的区别就在于其增长的特性,不过这种区别意义重大。虽然我们选择链接的时候是随机的、民主的,但是模型 A 中的节点并不平等,很容易就能确认其中的赢家和输家。每一次,所有的节点被链接的机会均等,这就使较早的节点具有明显的优势。事实上,除了极少见的统计上的波动外,第一个节点会成为最富有的,因为它积累链接的时间最长。最穷的节点会是最后加入系统的节点,只有两个链接,因为其他的节点还没有机会和它建立链接。模型 A 是我们试图解释万维网和好莱坞网络中的幂律的第一个尝试。电脑仿真很快就使我们认识到,我们尚未找到真正的答案。等级分布,即区分无尺度网络和随机模型的功能,下降得过快,其幅度是指数级的。虽然早期的节点是明显的赢家,但是指数级幅度预计这种节点仍然太小,而且太少。因此,模型A 无法解释中心节点和连接者现象。不过,它却表明了增长本身无法解释幂律的出现。
  我们大多数人都有几个熟悉的新闻源头。我们会不假思索,链接到其中熟悉的某个网站上。我长期阅读《纽约时报》,因此我会毫不犹豫地选择 nytimes.com 这个链接。有人可能会选择有线电视新闻网(CNN)的 CNN.com 或是全国广播公司的 MSNBC.com。然而,此中最关键的在于我们选择链接的网页不是通常的节点,它们都是中心节点。这些节点越是知名,指向它们的链接就越多,它们吸引的链接越多,在万维网上就越容易找到它们,我们也就因此更熟悉它们。最终我们大家都遵循一种下意识的偏见,更有可能链接到自己所知道的节点,即必定是万维网上那些链接更多的节点。我们都喜欢中心节点。
  关键就在于,我们在万维网上决定选择何种链接的时候,都遵循优先情结:在两个链接中任选一个的时候,如果其中的一个链接的链接数是另一个的两倍,那么链接到它的人会是另一个节点的两倍。虽然每个人的选择很难预计,但是合在一起作为群体,我们的选择却遵循严格的规则。
  优先情结在好莱坞也起作用。制片人的工作是制作赚钱的电影,他们知道哪些影星更受欢迎。演员名单受两个相互制约的因素影响:演员是否适应某个角色,以及该演员是否出名。这两个因索使得选星过程也带有偏见,链接更多的演员更有机会获得新的角色。事实上,演员出演的影片越多,就越有可能出现在导演的视野中。这样一来,满怀抱负的年轻演员就处于非常不利的地位,这也是好莱坞内外的人都知道的一条类似第22条军规的规则:要想获得好角色,就必须出名;可要想出名,就得有好的角色让你演。
  万维网和好莱坞网络迫使我们放弃关于随机网络的第二条重要的假定——其民主的特性。在真实网络中,链接都不是随机的。相反,声望可以吸引链接。链接更多的网页更有可能得到链接;关系联系紧密的演员更有可能得到新的角色;被引用得多的论文更有可能再次被引用;连接者交的新朋友更多。网络进化受微妙且铁面无私的优先情结的控制,受其影响,我们不知不觉就会更多地连到链接更多的节点上。
  我们发现真实网络受两个定律的控制:增长和优先情结。每个网络都是从很小的内核开始,随着节点的增加不断增长。这些节点在决定和那些已有的节点链接的时候,会优先考虑链接较多的节点。这些定律和早先的模型明显不同,以前的模型假定网络内的节点数量是恒定的,且所有节点都是随机链接的。

  无尺度模型中为何会出现中心节点和幂律?首先,增长在其中起了重要作用。网络的增长意味着早先的节点比后来者有更多机会积累链接:假如某节点最后一个加入网络,那么网络中的其他节点都没有机会和他建立链接;假如某个节点是最早存在于网络的,那么后来的所有节点都有机会和它建立链接。因此,增长特性会给先存在的节点带来明显的优势,使其成为链接最丰富的节点。不过资历本身还不足以解释幂律的出现。中心节点还需要第二个定律的帮助,即优先情结。因为新节点乐于和链接多的节点建立链接,早到的链接多的节点会经常被选中,也会比晚到的链接少的节点增长得更快。由于越来越多的节点添加进来,它们也都选择链接多的节点,最早存在的一批节点必然会变得与众不同,积累起大量的链接,它们会变成中心节点。由此,优先情结就引发了富者愈富的现象,帮助链接较多的节点通过后来的节点获得异乎寻常多的链接。
  必须增长或优先情结同时具备,才会生成无尺度网络。没有优先情结作用的增长网络,会呈现指数等级分布,这和禁止中心节点出现的钟形曲线有些相似。如果网络不增长,我们就又回到了静态模型,它无法产生幂律。
  我们设计无尺度模型的目标并不高,主要就是想证明增长和优先情结这两个简单的定律能够解决中心节点和幂律两个谜题。尤其是鉴于开始时,对于真实网络的拓扑结构,我们忽略了许多因素,目的是为了使模型更简化、更透明。其中最明显的一个因素,是在无尺度模型中,所有链接都是在新节点加入时增加的,而在大多数网络中,新链接可以自发产生。例如,当我为我的网页添加一个指向 nytimes.com 的链接,就创建了一个连接两个既有节点的内部链接。在好莱坞网络中,94% 的链接都是两个业已成名的演员首次合作而建立的内部链接。无尺度模型所缺,而真实网络具备的另一个特点,是在许多网络中,节点和链接可以消失。实际生活中,许多网页会关门歇业,同时带走数以千计的链接。链接也能重新安排,比如,当我们决定将指向有线电视新闻网的链接改为指向纽约时报网站。这些现象和其他现象一起,在某些网络中经常出现,但是在无尺度模型中,却找不到它们的踪影。这表明,真实网络的进化要比无尺度模型的预言复杂得多。要想理解我们复杂世界里的网络,就得把这些机制引入到统一的网络理论中,并解释其对网络结构的影响。
  在我们将无尺度模型的论文提交后,雷卡·阿尔伯特和我开始研究无尺度网络中内部链接和链接重新布局所带来的影响。不过做此研究的并不只有我们这伙人。我们的论文在《科学》杂志发表一一个月后,我了解到在全世界,好几个实验室在研究类似的课题。比如我的长期合作者,现在波士顿大学担任研究员的路易·阿曼罗(Luis Amaral),就正在研制包括了年龄增长,以及演员退休后不再获取新的链接等因素的无尺度模型。阿曼罗和基因·斯坦利(Gene Stanley),以及安东尼奥·斯凯拉(Antonio Scala)和马克·Bartheleémy 两个学生一起,证明了如果节点在特定年龄后不能获取新的链接,中心节点的规模就会受到限制,使中心节点的比例小于幂律所预计的。同时,何塞·门德斯和谢尔盖·多洛戈夫切夫(Sergey Dorogovtsev)也在波尔图独立研究一个类似的问题;很快,他们关于无尺度网络的一系列颇有影响的论文中的首篇就获得了发表。门德斯和多洛高夫切夫通过假设随着节点年龄增长,它们会逐渐丧失吸引链接的能力,证明了渐进的年龄增长不会破坏幂律,只是会改变次数幂,进而影响中心节点的数目。同是来自波士顿大学的保罗·克拉皮夫斯基(Paul Krapivsky)和西得·雷德纳(Sid Redner),与墨西哥的弗朗索瓦·列夫拉兹(Francois Leyvraz)一起,利用优先情结解释指向节点的链接与节点现有的链接数量并不是简单的正比关系,而是遵循某些更复杂的功能。他们发现这些作用会破坏网络的幂律特征。
  由于这些人的努力,我们现在已经有了一套内容丰富、完整的网络增长和进化理论。我们了解到,内部链接、链接重排、删除节点和链接、节点老龄化、非线性效应,以及其他许多影响网络拓扑结构的过程,可以构成完美的演变网络的理论架构,其中包括了无尺度模型的一个特殊案例。这些过程会影响网络的成长和演变,并不可避免地改变其中心节点的规模和数量。但在大多数情况下,在增长和优先情结同时起作用时,中心节点和幂律都会出现。在复杂网络中,无尺度结构不是例外,而是常态。

  通过再现自然创建复杂系统的每一个过程,这些模型试图抓住网络的建造机制。假如我们能够正确地模拟网络模型的构建方式,那么最终得到的网络模型就会和真实网络相当接近。因此,我们的任务从描述网络拓扑结构,转移到了理解网络进化演变的机制上来。
  研究焦点的变化也导致了探讨网络的术语的变化。经典网络模型的静态特性,直到我们不得不往模型中注人增长因素才浮现出来。与此类似,直到幂律迫使我们引入优先情结,随机性才成了问题。当我们了解到结构和网络进化无法分割,就再也无法回到左右了我们思维几十年的静态模型模式上去。思维上的这些转变创造了一系列对立的概念:静态之与增长,随机之与无尺度,结构之与进化。
  幂律的存在,是否说明真实网络是从无序到有序的相变的产物?我们得到的答案很简单:网络并不处于从随机到有序的路上,它们也不处在随机性和混沌的边缘。相反,无尺度拓扑结构证明了,在网络形成过程中,一直有一些组织原则在起作用。这里面毫无神秘之处,因为增长和优先情结能够解释自然界网络中的基本特性。不论网络多大、多复杂,只要存在优先情结和增长因素,它就会保持中心节点和无尺度拓扑结构。
  假如没有接下来的一系列发现,无尺度模型会一直是学术界热衷探讨的话题。最重要的在于我们了解到,凡是值得进行科学研究,且具有实践意义的网络,都是无尺度的。万维网提供的数据足够庞大,也足够细微,使我们相信,幂律可以解释真实网络的现象。这一认识导致了大量的发现,这一过程一直延续到现在。好莱坞网络、细胞的新陈代谢网络、论文引用网络、经济网络、语言网络(许多不同的研究小组证明了语言具有无尺度特性。在语言网络中,节点是词语,而链接则是明显的词语搭配和语义关系,如同义词、反义词等)等都属此类。一时间,在许多科学研究领域,无尺度拓扑结构产生的根源变得重要起来。
  成熟的网络演变理论,使我们能够精确预言尺度指数和网络动能。这样,我们对周围复杂的相互联系的世界的理解就上升到了一个新的高度,使我们比以前任何时候都接近理解复杂性的架构。
  但是无尺度模型也带来了新问题。其中一个不断浮现在我们眼前:在富者愈富的世界中,后来者如何生存?对于此问题答案的追寻,把我们带到了一个本来大家认为极不可能的领域:20 世纪初产生的量子力学。

第 8 章 爱因斯坦的遗产

  Google 之所以令我着迷,在于它打破了我们对无尺度模型的基本预言,即先到者具有优势。在无尺度模型中,链接最多的节点,是最先出现的节点。因为它们积累链接的时间最长,已经发展成了中心节点。1997 年发布的 Google 在万维网上是个迟到者。当时流行的搜索引擎,如 AltaVista 或 Inktomi 等已经早在 Google 之前主宰了互联网很长时间,使 Google 明显地处于下风。然而,在不到 3 年的时间里,Google 就成长为最大的节点,同时也成了最受欢迎的搜索引擎。
  当然,商业史上不乏后出现的公司通过创新产品从老牌公司抢走顾客的案例,一个著名的例子就是苹果电脑。本来是它先创造了手持电脑的概念,即牛顿掌上电脑系统,可是后来这款电脑却完全被 Palm 掌上电脑给取代了。假如我们把产品看作是复杂的商业网络中的节点,而消费者是节点之间的链接,就可以把苹果电脑的例子描述为其链接被重新指向了 Palm。
  大多数网络都存在这种“新星效应”。但在无尺度模型中,不存在这种后来者升到主宰地位的空间,因为在无尺度模型中,所有的节点都是同样的,这点和我们到目前为止讨论的其他模型是一致的。当然,无尺度模型中节点确实也存在差别,这主要在于节点所获得的链接的多少不同。链接数量也是节点进入网络的时间函数。但是在大多数复杂系统中,每个节点都有自己独一无二的特点,即使我们不知道它们的链接能力,也能明显看出这些特点。网页、公司、演员等都有其内在的品质,这些品质会影响其在竞争环境中获取链接的能力。有的出现得虽晚,但是却能在很短的时间内获得大量的链接。有的虽然到得早,但却没积累起多少链接,白白浪费了其先到的优势。要想在模型中反映出大多数网络中所存在的激烈竞争,就必须承认每个节点都存在差别。
  在竞争环境中,每个节点都有特定的适应性所谓的适应性,就是相比于周围的人,你结交朋友的能力;它是某家公司相比于其他公司吸引消费者的能力;它是演员相比于其他演员使自己受欢迎的能力;它是网页相比于其他数百万计的网页吸引用户回头访问它的能力。适应性可以将节点处于竞争前沿的能力进行量化。对于人类,适应性可能是源自基因的某种特性。它可能和公司的产品和管理质量相关;和演员的天赋有联系;也和网站的内容有关。
  我们可以为某个网络中的每个节点赋予适应性值,用来模拟其与其他节点竞争获得链接的能力。例如,我的网页在万维网上的适应性值为 0.00001,而 Google 的则是 0.2。这些数具体是多少倒不重要;但其比例差距却显示出这两个网站吸引浏览者的能力差别。事实上也是如此,普通用户可能觉得 Google 比我的个人网站有用 20000 倍。
  引入适应性概念并不排除增长和优先情结这两个控制网络进化的基本机制。不过,它却改变了竞争环境中的吸引因素。在无尺度模型中,我们假设节点的吸引力只受其链接数目的影响。而在竞争环境中,适应性也起作用:适应性高的节点链接就多。将适应性加入到无尺度模型的简单办法,是假设优先情结受到节点的适应性和链接数目的共同影响的乘积。每个节点都通过对比适应连通性乘积来决定和谁链接,并且很可能和乘积高的节点链接,因此它就更具吸引力。对于具有同样链接数的节点来说,适应性高的能够获得更多的链接。然而,假如两个节点的适应性相同,早出现的节点仍占优势。
  这一简单的适应性模型,结合了竞争和增长因素,是我们试图解释 Google 现象的首次努力。该模型的设计使我们能够区分节点的不同,并使后来者有机会出人头地。我们很快就了解到适应性带来的影响比这深远得多。
  由于适应性的作用,早到者未必是最后的赢家。相反,处于主导地位的是适应性,中心节点的得失成败全在于它。在无尺度模型中,节点的连通性增加量相当于时间增加量的平方根。适应性模型预言的行为却极为不同,它告诉我们节点仍旧按照幂律 tβ 获取链接,但是反映节点获取新链接速度的节点动态指数 β 各不相同。该指数和节点的适应性成正比,也就是说如果某节点的适应性值是其他任意节点的两倍,那么它的动态指数也就是其他节点的两倍。这样一来,节点获取链接的速度就不再是最重要的因素,适应节点就不再受何时进入网络的影响,很快就能把适应性低的节点抛在后面。Google 就很好地证明了这一点:虽然是个后来者,但凭借高超的搜索技术,它比竞争者获取链接的速度都快,并最终超越了所有的竞争者,如同美貌战胜了资历。

  在常温下,气体原子以不同的速度相互碰撞,有的快,有的慢。用物理学上的行话说,就是有的原子能量高,有的能量低。如果给气体降温,所有原子的速度都会慢下来。要想让它们彻底停下来,就要把气体降到绝对零度,这一温度是无法达到的。爱因斯坦预计,如果全同的粒子足够冷却,粒子中的一大部分会安顿在最低的能量点上。也就是说,在绝对零度以上的某个临界温度,原子可以处于最低能量状态。当粒子进入这一状态后,它们会形成新的形态,称作“玻色-爱因斯坦凝聚”。
  如今,我们了解到爱因斯坦的发现不仅适用于气体,在许多和气体很不一样的量子系统中,都存在类似粒子凝聚的现象。玻色-爱因斯坦凝聚成了理论物理学家的标准工具箱,帮助我们理解诸如恒星形成、超导电性等看起来彼此毫无联系的现象。比安柯尼在试图理解适应性模型的行为模式的时候使用的就是这个工具箱。

  通过简单的数学转换,比安柯尼用适应性取代了能量,为适应性模型中的每个节点分别赋予了能量值。突然之间,计算结果就有了意想不到的意义:结果和爱因斯坦在发现凝聚现象的 8 年前经历的有些相似。这有可能完全是出于巧合。但是事实上,在适应性模型和玻色气体之间确实存在精确的数理对应关系。根据这种对应关系,网络中的每个节点都对应玻色气体中的一个能量级。节点的适应性越高,其对应的能量级就越低。网络中的链接对应气体中的粒子,每个也都有特定的能量级。往网络中添加新的节点,就好比是往玻色气体中添加新的能量级;往网络中添加新的链接,就好比是往玻色气体中添加新的玻色粒子;在这种对应关系中,复杂网络和巨大的量子气团相似,其中的链接的行为类似于亚原子粒子。
  我们没有预料到网络和玻色气体竟有这种对应关系。毕竞,玻色气体是量子力学中独特的现象。它受亚原子物理学原理的控制,允许出现违反直觉的、在宏观世界不会发生的事情。这些原理,和我们这本书中谈及的控制网络的原理十分不同。例如,互联网中的节点、链接是宏观对象;对路由器和电缆我们也可以随意连通或切断。谁都不会真的相信它们会受量子力学的支配。然而,几十年来,我们一直把网络当作数学领域的几何模型。发现真实网络是快速演变的动态系统后,将复杂网络的研究推到了物理学的怀抱里。也许我们面临着另一个文化转换。确实,比安柯尼发现的对应关系意味着,网络和玻色气体在控制其行为的原理上是相同的。复杂网络的一些特性将微观和宏观世界联系到一起,其带来的效应,和这种联系的存在本身一样令我们好奇。
  这种对应关系带来的最重要预言,就是某些网络会出现玻色-爱因斯坦凝聚现象。简言之,就是,在某些网络中,胜者通吃。就像在玻色-爱因斯坦凝聚中,所有的粒子都凝聚到低能量级,使得其他能量级没有粒子;在某些网络中,最适应的节点从理论上讲会吸引所有链接,其他节点一个也捞不着。结局就是胜者通吃。

  每个网络都有独特的适应性分布,这种分布告诉我们网络中的节点相似性或差异性有多大。某些网络中的大多数节点的适应性大体相当,其分布符合钟形曲线。而另一些网络的适应性范围差别很大,少数节点比大多数的适应性高出许多。比如,对于所有的网络浏览者来说,Google 就比我的个人网页有趣上千倍。事实上,几十年前发展出的用来描述量子气体的数学工具使我们看到,网络的行为和拓扑结构可以独立于链接和节点的属性,而仅仅受其适应性分布的支配。虽然从万维网到好莱坞每个系统都有各自独特的适应性分布,比安柯尼的计算仍旧表明,以拓扑结构而论,所有的网络只划分为两个可能的类别。大多数网络中的竞争对于网络的拓扑结构没有明显的影响。然而,在某些网络中,胜者通吃,会获取所有的链接,因而带有明显的玻色-爱因斯坦凝聚特征。
  第一种类型包括所有的此种网络:虽然内部节点为获取链接而激烈竞争,但网络仍保持无尺度的拓扑结构。这种网络呈现出适者致富的行为特征,意味着最适应的节点必将成为中心节点。不过,赢家的优势一直不明显。最大的中心节点后面紧紧跟着较小的节点,第一和后面的差距不大,网络随时呈现出等级节点的分布符合幂律的现象。在大多数的复杂网络中,幂律和争取链接的竞争并不会发展到水火不容之势,而是能够和平共处。
  如果网络属于第二类,就会出现胜者通吃现象,也就是说最适应的节点获取所有链接,留给其他节点的很少。这样的网络呈现星状拓扑结构,其中的所有节点都连接到中心节点。在这样的中央辐射状网络中,孤家寡人的中心节点和其他节点之间有着巨大的差异,因此胜者通吃型网络和我们早先谈及的无尺度网络有着很大的差别。在无尺度网络中,节点有明显的等级分布,符合幂律。胜者通吃型网络不是无尺度的。相反,这种网络中有一个单一中心节点和多个微型节点,这是一个重要的区别。实际上,Google 的迅速崛起并不是胜者通吃行为的表现。它只向我们说明,适者致富。当然,Google 是适应性最强的中心节点之一,但是它从来没能获取所有链接,变成中心的明星。它和其他几个链接数量和自己差不多的节点共享这份荣光。如果真是胜者通吃,就不会存在潜在的挑战者。
  有没有真的反映出胜者通吃规律的真实网络?我们现在可以预言,可以通过查看网络的适应性分布,来判断它是遵循适者致富还是胜者通吃的规律。不过,适应性一直是一种难以捉摸的属性,因为我们尚未完全发展出精确度量单一节点适应性的工具。但是胜者通吃行为对网络结构的影响一眼就能看出,因此它只要存在,我们就不会看走眼。它会破坏无尺度拓扑结构中中心节点的等级分布,使其变成星状网络,某个单一的节点会获得所有链接。现实世界中,有那么一个节点,绝对不会逃出我们的观察。该网络具有玻色-爱因斯坦凝聚特点。这个节点就是微软公司。

  我们可以把操作系统看作是争夺链接(即用户)的节点。每当有用户安装了 Windows,就等于给微软增加了一个链接。无尺度模型预言最早出现的操作系统应该是最流行的。如果真是那样,我们用的都应该是 DOS。而在更现实的适应性模型中,较适应的操作系统会从不太适应的操作系统那里获取用户,不论那个操作系统出现得早或晚。
  如果市场上占主导地位的是适者致富的无尺度网络,就应该存在操作系统的等级分布,在里面最流行的操作系统后面紧紧跟着其他的操作系统。事实上大多数行业中都存在这样的等级分布。例如,电脑制造商就是一例。根据 2000 年的全世界的出货量,康柏占有 13% 的份额,戴尔占有 11%,惠普和 IBM 各占 7%,富士通-西门子占 4%。其他的制造商合在一起占 55% 的份额,将市场进一步细分为更小的部分。由于大多数的调查只公布前五名的电脑厂商,因此很难检验它们的分布是否真的符合幂律。不过,我想它大致应该如此。电脑市场的严格等级表明,电脑制造商受适者致富原则的影响,在这个市场中,没有任何厂家能够左右一切。
  然而,在操作系统市场上,根本就不存在这样健康的竞争和等级分布。没错,Windows 不是唯一的操作系统,所有的苹果电脑产品依然使用 MAC OS(苹果电脑的操作系统名称,指 Macintosh Operating System)。现在许多电脑仍装有 Windows 的前身 DOS,微软霸权的唯一像样的挑战者 Linux 的市场份额也在不断扩大,大多数需要大量数据处理的科学家和网络工程师使用的主要是 UNIX。但是在 Windows 的阴影下,这些操作系统都显得十分渺小。Windows 的各个版本占据了 86% 的个人电脑。第二大操作系统是苹果电脑的 MACOS,只占有 5% 的份额。古老的 DOS 占有 3.8%。紧接着是 Linux,所占份额是 2.1%。剩下的所有其他操作系统,包括 UNIX 在内,只占不到 1% 的份额。
  从本质上说,微软处于通吃的地位,它这个节点可不是比竞争对手略大一点点。以用户的数量而论,没有任何竞争对手可以和它相比。我们的行为都像玻色粒子,凑成了 Windows 用户这一个凝聚。我们购买电脑,安装上 Windows,就等于为微软凝聚添砖加瓦。操作系统软件市场带有典型的玻色-爱因斯坦凝聚特征,显示出明显的胜者通吃规律。虽然也有其他操作系统不断竞争,力图不被人们遗忘,但微软牢牢处于凝聚中心,成为链接到绝大多数消费者的中心明星。

  只要我们认为网络是随机的,就会把它们理解为静态的。无尺度模型反映了我们认识上的进步,了解到网络是动态系统,由于节点和链接的增加而不断变换。适应性模型使我们能够用竞争的系统的概念来描述网络。现在,玻色-爱因斯坦凝聚又解释了为什么一部分赢家会获得通吃的机会。
  承认了适应性的存在,是否就等于否定了无尺度模型?事实绝非如此。在呈现出适者致富的网络中,竞争会导致无尺度拓扑结构的产生。到目前为止我们研究的大多数网络——如万维网、互联网、细胞、好莱坞网络以及其他许多真实网络——都属此类。赢家和其他依次分布的中心节点共享荣耀。
  然而玻色-爱因斯坦凝聚为胜者通吃网络的存在提供了理论解释。一旦发生这种情况,无尺度拓扑结构就会消失。到目前为止,在真实系统中,只有操作系统市场出现了胜者通吃的现象,微软独占整头。是不是还有其他系统呈现类似的现象呢?很可能。不过,要想全面认识这样的网络,尚需假以时日。

第 9 章 阿基里斯的脚踵

  随着美国全国对电能的依赖逐年俱增,只要一停电,人们就惊恐万分。电力公司为了增加电网的稳定性,并降低成本,共享电力设施,在出现紧急情况的时候会相互支援。结果,原先各为孤岛的电网开始连接到一起,制造出了人类制造的最大的结构,所有线路的总长相当于地球到月球一个来回。
  如今的电网上有数千台的发电机组,有数百万千米的线路,10 亿以上的载荷。这个巨大的电能巨兽具有高度的连通性,而且非常敏感,几千千米外的扰动都能测出。但是 1996 年的大停电事故凸显了这个强大系统内隐藏的弱点。相互连通的系统的确提高了全国资源的使用效率,并降低了成本。但是,这也意味着,如果系统中出了问题,就会在整个系统内传播开来。西部大停电造成的破坏和生产力损失达到了 15 亿美元以上,这凸显了复杂网络中经常被人忽视的一个问题:由连通性所导致的脆弱性。

  所有人类设计的东西都会出现错误或故障。例如,汽车发动机出了故障,车主往往被迫叫来拖车。与此类似,电脑电路上的小小的布线错误很可能导致电脑完全瘫痪。然而自然系统却与之不同。纵观地球的整个地质历史,物种是以每年百万分之一的速度在消亡。据估计,地球上有 300 万到 1 亿种物种,那么这就意味着每年有 3~100 种物种消亡。不过这种自然的物种灭绝看来没大有什么危害。经历了数百万年的演化,面对错误和故障,生态系统产生了一种令人惊叹的包容能力,就连尤卡坦陨星撞击这样的大灾难都能承受。这次陨星撞击灭绝了成千上万的物种,其中就包括恐龙,但整个生态系统仍然挺了过来。因此,生态系统显示出一种人造系统所不具备的容错性。
  一般说来,自然系统具有独到的生命力,能抵御多种特殊情况。虽然内部的故障也会影响其行为,但是它们却能在高故障率的情况下保持基本的功能。这和大多数人造产品截然不同。对于人造产品来说,某一个部件的错误往往会导致整个设备的瘫痪。近来,所有专业的科学家都开始认识到了自然设计的弹性,并希望我们人类能够找到办法,改善人造物品的设计。因此,稳健性就越来越成为许多科学领域所探索的一个特性。
  稳健性是生物学家主要关注的对象,他们想了解细胞如何在极端的环境,以及时常出现的内部故障的情况下存活并保持功能的。社会学家和经济学家关注它,是因为它能解决人类组织面临饥荒、战争、社会和经济政策改变的情况下如何保持稳定性的问题。它也是生态学家和环境科学家关注的问题,它引起了全世界对于饱受工业发展威胁的生态系统的可持续性发展的研究热情。对于相互依存的通讯系统来说,稳健性是专家们的终极目标,因为这样的系统必须保证时刻准备就绪,不论其构成部分出现何种问题。
  大多数容错性高的系统都有一个共同的特点:它们的功能是通过高度互联的复杂网络保证的。细胞的稳健性在于拥有复杂的调节网络和新陈代谢网络;社会的适应力植根于相互联系的社会网络;经济的稳定由精巧的金融和调节机构构成的网络来保证;生态系统的稳定性是由物种相互作用精心编织的网络实现的。看来,自然界通过相互连通性来达到高稳健性。网络架构上的这种共同点似乎不仅仅是由于巧合。

  节点故障很容易使网络变成孤立的无法交流的碎片。例如,同时关闭进出佛罗里达的杰克逊维尔市和莱克市的公路,不仅会把这两个城市孤立起来,而且会切断整个佛罗里达半岛和美国其他地区的公路联系。这种碎片现象是典型的网络故障特点,数学家和物理学家对此作过很多研究。概括说来,我们的问题就是:如果随机删除网络节点,它需要多长时间才能变成相互隔离的碎片?我们需要删除互联网上多少个路由器,才能孤立联网的电脑,使它们之间无法再通讯?
  显然,删除的节点越多,就越有可能孤立更多的节点。然而对随机网络进行了几十年的研究之后,我们发现网络的崩溃不是渐进的过程。只删除几个节点,对网络的整体性影响不大。然而,如果移除的节点数量达到某个临界点,系统会突然间分裂成不相联系的孤岛。随机网络中的故障给我们提供了一个反相变实例:有一个错误临界阀值,只要不达到这个点,系统就会相对完整;然而,一超过这个阀值,网络就会崩溃。
  我们在 2000 年 1 月使用电脑实验测试了互联网对于路由器故障的容错性。我们使用了现有的最好的互联网地图,随机选择节点并移除。我们逐渐增加移除的节点数量,希望找到互联网崩溃的临界点。让我们惊讶的是,网络拒绝崩溃。我们一直删除了 80% 的节点,剩下的 20% 的节点还连在一起,形成一个紧密互联的节点串。这一发现证明互联网和人类发明的其他系统不同,它具有高度的稳健性,能够抵御路由器故障。事实上,密歇根大学的安·亚伯的研究也证实在任意时间里,互联网上都有几百个路由器发生故障。虽然有这么多时常发生,而且不可避免的错误,网络用户却很少注意到互联网服务有什么明显的中断。
  很快,我们就明白,这种特点并不是互联网独有的。我们在按照无尺度模型生成的网络上所做的电脑仿真证明,任何无尺度网络,都可以承受相当比例的节点损失而继续工作。无尺度网络的稳健性,来自它迥异于随机网络的一个特性。对于互联网、万维网、细胞以及社会关系网络等无尺度网络来说,它们的稳健性来自其拓扑结构——这对于依靠这些网络的诸位来说不啻为好消息。
  这种拓扑稳健性的根源在哪儿?无尺度网络的明显特点在于网络内部存在中心节点,这些高度连通的节点使网络能够连成一体。故障并不区分普通节点和中心节点,所有节点发生故障的概率是相同的。这好比是从一个装有 9990 个白球、10 个红球的袋子里随机掏出 10 个球来,最有可能出现的情况是取出了 9 个白球,1 个红球。因此,如果所有的节点发生故障的概率相同,更多的故障影响的是小节点,因为小节点的数量多。
  而小节点对网络的整体所起的作用是有限的。假如我们随机选择机场将其关闭,被选中的极有可能是多如牛毛的小机场。对于整个美国来说,这些小机场的消失不大会引起人们的注意。少了这样的小机场,你仍然能够从纽约飞到洛杉矶,或是从圣达菲飞到底特律。只有少数的恰好需要途径这样的小机场的人才会受到影响。即使有十几、二十几个这样的小机场都关闭了,也只有一小部分乘飞机的人会受到影响。
  与此类似,在无尺度网络中,故障最有可能降临在小节点头上。这样一来,这些网络就不会由于一定数量的故障而崩溃。偶然删除一个中心节点也不会带来致命的危害,因为按等级分布的中心节点中会有其他的保持网络的整体性。因此,这些网络的拓扑可靠性根源在于无尺度网络的结构不均衡性:故障更多地影响小节点。
  哈维林立即意识到,无尺度网络对于故障必然有独特的反应。他和自己的学生一起,计算了对于随机选择的网络,不论是随机网络还是无尺度网络,需要移除多大比例的节点才能使网络崩溃。一方面,他们的计算证明了一条有名的结论,即随机网络在节点被删除到某一临界点时会崩溃。另一方面,他们发现对于无尺度网络来说,如果次数幂等于或小于 3,这一阀值就不存在。令人惊讶的是,大多数值得研究的网络,不论是互联网还是细胞,都是无尺度的,而且其次数幂都小于 3。因此,这些网络只有当所有节点被移除后才会崩溃。也就是说,无论如何,它们都不会因为移除部分节点而崩溃。
  我们通过模拟侵截者攻击互联网的中心节点的行为进行了一系列新的实验。攻击者选取的不是随机节点,而是网络的中心节点。我们在仿真实验中也首先移除最大的中心节点,依此类推。我们的攻击造成的结果是显而易见的。删除第一个中心节点并不会使系统崩溃,因为剩下的中心节点仍然能把网络聚拢为整体。然而,在删除了多个中心节点后,造成的破坏就开始明显地呈现出来。大片的节点脱离了网络,成为与主网络隔绝的节点串。我们进一步删除更多的中心节点,就目睹了网络的大崩塌。虽然在一般的故障情况下根本就不会出现的崩溃临界点,在网络遭受攻击的时候突然出现了。在临界点附近,删除了仅仅几个中心节点,就把互联网分割成了细小的相互隔绝的碎片。
  即便是圣达菲或是其他任意一个小机场同时关闭,人们也不大会注意到,但是如果芝加哥奥海尔机场关闭几小时,肯定会成为报纸的头条消息,因为这会影响整个美国的空中运输。万一有什么事件,迫使亚特兰大、芝加哥、洛杉矶、纽约的机场同时关闭,即便是其他的所有机场仍然开放,美国的空中交通也会在几小时内陷人停顿。电脑仿真告诉我们,互联网也有类似的问题。如果侵截者对互联网的最大的一些中心节点成功实施了攻击,其潜在的危害是巨大的。这一结果并不是由于互联网设计不好,或是其协议存在缺陷。这种面对攻击的脆弱性,是所有无尺度网络与生俱来的特性。
  事实上,我们的研究小组在研究了酵母细胞,试着将高度连通的蛋白质从其交互网络移除之后,也发现了类似的网络崩塌现象。生态学家在实验中删除食物链的高度连通节点后,也发现了同样的系统崩溃现象。当把最大的节点移除后,到达一个临界点,网络就会瘫痪。因此,无尺度网络面临攻击的情况,和随机网络面临故障的情况类似。不过这之间也存在重大的区别,我们无需删除大量的节点就能到达临界点。破坏少数几个中心节点,一个无尺度网络就能立即瘫痪。

  综合这些成果,我们发现无尺度网络不怕故障。然而这种容错性却使它们面对攻击具有天生的脆弱性。删除了连通性最强的节点后,网络很快就分裂成了相互无法通讯的孤岛。因此,无尺度网络结构中隐藏着人们未曾料到的阿基里斯的脚踵,其面对故障的稳健性和面临攻击的脆弱性是共存的。
  复杂系统内稳健性和脆弱性共存的现象,是我们理解其行为模式的关键。仿真实验证明了,细胞的蛋白质网络,在发生随机突变的情况下不会崩溃。事实上,我们可以删除细胞网络中的许多节点,而不会对生物体造成致命伤害。不过,假如某种药物或疾病关闭了编码生成连通性最强的蛋白质的基因,细胞就无法生存了。与此类似,生态系统可以很容易地挺过随机的物种灭绝。不过,如果高连通性的关键物种被移除,生态系统会瞬间崩溃。

  在这个问题上,人们对加利福尼亚的海獭研究得比较深入。19 世纪的时候,由于人们过度捕猎获取海獭的毛皮,它在加州海岸消失了。联邦执法官员在 1911 年禁止猎捕这种可爱的动物,海獭种群迅速恢复了。由于海獭以海胆为食,海獭多起来后,海胆数量减少了。海胆一少,海胆最喜欢吃的食物海藻的数量大幅增长了起来。海藻的增加也就为海洋鱼类增加了食物,避免了加州海滩的退化。因此,保护好了一个物种,即处于中心节点的物种,就极大地改变了海岸的经济和自然生态。
  虽然无尺度网络难以抵御攻击,但要想使其崩溃,需要同时移除数个中心节点。这往往意味着需要同时移除 5%~15% 的中心节点。因此,网络侵截者需要同时攻击破坏数百个互联网上的路由器,而这是非常耗费时间的。这样一来,虽然互联网有自己的弱点,但其拓扑结构中依然蕴涵了能够抵御随机故障和恶意攻击而不至于瘫痪的机制。不幸的是,仔细分析后,我们发现事实并非如此。接下来我们会发现,面对攻击,把宝押在拓扑稳定性上,是错误的做法。

  电线受热会膨胀,这种热量可能来自炎热的天气;但是如果线路负荷过重,电线也会发热,使其膨胀变长。1996 年 8 月 10 日 15 点 42 分 37 秒,气温达到了创纪录的水平,俄勒冈州的奥尔斯泰特-基勒线路因发热延长而下坠,靠近了一棵树。一道闪电过后,这条 1300 兆瓦的线路就瘫痪了。电能是无法存储的,因此这股巨大的电流必须立即转到附近的线路上。转移是自动进行的,电流被压到了附近喀斯喀特山脉东边的 115 千伏和 230 千伏低压线路上。
  然而,这两条线路可没法长时间承载这么强大的电流。两条线路的发热率达到了 115%,也因此瘫痪了。115 千伏的线路发生了连锁故障,过量的电流使罗斯-莱克星顿线路也出现了过热现象,垂落到一棵树上。事情到了这一步,局面就无可挽回了。Mc-Nary Dam 电厂的 13 个发电机组出现了故障,造成了电流和电压扰动,立即将加利福尼亚-俄勒冈州边界处的南北太平洋电网分割开了。这样,西部电网就分割成了相互隔绝的孤岛,造成了美国 11 个州和 2 个加拿大省份的大停电。
  1996 年大停电事故就是一场典型的科学家所说的级联故障。网络如作为交通传输系统,本地的故障会将故障效应或责任传递给其他节点。如果额外的载荷小得可以忽略不计,那么系统的其他部分可以很容易不留痕迹地吸纳它,几乎使人察觉不到发生了故障。而假如额外的载荷过大,相邻的节点无法承载,它们或者自身出现故障,或是重新把载荷传递给相邻的节点。不论发生哪种情况,都会出现我们所说的级联故障,而故障的规模和影响力取决于首先出问题的节点在系统中所占的位置及其能力。

  级联故障并非电网所独有。在互联网上,如果某个路由器出了问题,会自动提示传输协议跳过故障节点,将信息包发送到其他的路由器。如果出现故障的路由器承担的流量非常巨大,那么就会给相邻的节点带来巨大的压力。路由器不会由于单纯的流量过大而瘫痪,它们仅仅会造成排队现象,即尽自己所能处理尽量多的信息包,把剩下的抛开。因此,路由器如果流量太大,就会造成拒绝服务攻击,只有少量的信息包可以通过。由于信息包出现丢失使得发送者无法接到信息送达的确认,就会重新发送信息,这将进一步加剧网络的拥堵。这样,只要删除互联网上几个大的节点,就能很容易地造成类似俄勒冈州电力传输系统出现的那种灾难性故障。
  经济领域也经常出现级联故障。比如,很多专家将 1997 年的亚洲经济危机国际货币基金的诱因,归结到国际货币基金组织(IMF)给亚太国家的中央银行施加压力,限制其向出现问题的商业银行提供紧急信用保障这一做法上。此问题我们将在第 14 章详细探讨。这些商业银行转而向公司企业寻求贷款,使国际货币基金组织——这一尚存争议的最大中心节点——所作的决定变成了一连串的银行和企业崩溃案例。
  生物体系统也经常出现级联故障,这种现象往大处说,能影响到生物栖息地;往小处说,能影响到细胞。正如我们通过海獭的例子所看到的,失去某些物种,会引发一连串的反应,导致生态系统的重组。与此类似,细胞内分子聚集如果出现了巨大的变化,也会导致级联反应,最终致使细胞死亡。
  显然,删除的节点连通性越高,就越有可能使整个系统瘫痪。哥伦比亚大学的邓肯·瓦茨的发现证明了这一点,他研究了一个专门为弄清级联故障的遗传特点而设计的模型。这个模型既能描述大停电这样的现象,也能描述相反的现象,比如书籍、电影、唱片等的级联走红现象。他的仿真实验证明大多数的级联反应并不是瞬间发生的:故障往往存在了很长时间而无人注意,最终导致了整体的瘫痪。然而,试图降低这种级联反应的频率则会带来不可避免的后果,即一旦发生了级联反应,那么该反应会更具破坏性。
  除了这几点以外,我们对级联故障的理解是极为有限的。拓扑稳健性是网络的结构特点。而级联故障则是复杂系统的动态特点,相对而言这一领域较少有研究涉及。要是人们发现仍有许多未知的规则控制着级联故障,我不会感到诧异。这些规则的发现将对从互联网到市场营销等许多领域造成深远的影响。
  本章所讨论的容错性对我们来说不啻为好消息。网络稳健性意味着如果我们体内有某种化学物质出了故障,造成了小小的不适,我们仍然能继续保持正常的机能。网络稳健性揭示了,为什么我们极少注意到互联网的路由器故障,以及为什么某些物种消失了,不会导致环境灾难。
  然而,这种拓扑可靠性的代价,是面对攻击时的脆弱性。将任意这种系统中高等级的中心节点移除,就会使系统崩溃。对于互联网,这是个坏消息,因为这意味着侵截者可以设计出相应的战略,危害整个互联网的基础设施。这对我们的经济体系也是个坏消息,因为这意味着针对经济网络的特点,也可以设计出战略来使其崩溃。本章所描述的研究结果,迫使我们承认,拓扑结构、稳健性和脆弱性三者是共存的。任何复杂系统都有自身的弱点。我们了解到拓扑结构的重要性,使我们能够充分认识中心节点的作用。这是保护它们的第一步。
  2001 年发生的“9·11”恐怖袭击事件同时表明了两点:一是中心节点的强大影响力;二是网络的承受力。很显然,袭击的目标不是随机选定的:这些目标都是美国最显而易见的经济和安全目标。恐怖分子选择这些目标,就是意图摧毁全球资本主义的中心节点。虽然“9·11”袭击造成了美国 20 年来最惨重的人类悲剧,但恐怖分子并没有达到他们的最终目的:摧毁整个网络。不过,他们的确诱发了一连串的级联故障,不断扰动我所描述的世界。然而,虽然世贸中心的双塔被摧毁了,但所有的网络——包括互联网、经济网络——依然完好。这生动地表明了中央化的人类计划体系所带有的脆弱性和自组织网络的承受力之间的差别。

第 10 章 病毒与时尚

  杜加斯曾居住在是加拿大法语区,曾是飞机乘务员,他常被称作“艾滋病零号患者”。这倒不是因为他第一个被检查出患有艾滋病,而是因为 1982 年 4 月在 248 个检查患有艾滋病的人中,有 40 个曾和他有性关系,或是与和他曾有性关系的人进行过性交。他处于一个正在形成的复杂的男同性恋网络的中心,这一网络存在于北美的东西海岸,范围包括旧金山、纽约、佛罗里达和洛杉矶等地。
  他的核心地位不是凑巧获得的。杜加斯是北美第一个被检查患有卡波西水痘样疹的人。到了 1983 年,事情越来越明朗了,杜加斯和其他几百个同性恋男子所患的疾病是传染性的,而杜加斯又是其中第一个知道这一点的。但是他继续坚持说自己得的只是皮肤癌。而癌症是不传染的,因此,好几年来,他
  一直不承认他会给自己的性伙伴带来危害。他对自己迷人的容貌和性方面的征服力非常自豪。后来他对医疗人员坦白了自己性爱好的许多秘闻。他估计自己每年的性伙伴在 250 人左右。有人估计他的性伙伴人数高达 20000.10 来年的时间里他在同性恋俱乐部和公共浴室乱交,至少有过 2500 个性伙伴。
  艾滋病以往是一种同性恋传播为主的罕见疾病,现在开始危及北美医疗保障体系。这只用了短短几年的时间,杜加斯在其中起了极大的作用。他的经历开了传统的流行病防治方法失败的可怕先例,证明了在我们现今这个高度流动、高度连通的社会中中心节点的作用。的确,一旦和病毒与流行病联系起来,中心节点的作用就和普通节点大为不同了。

  赖安和克洛斯发现每年接受新品种的农民逐年迅速增加,形成一条曲线,直到达到某个最大值,随后增长速度又几乎以同样的速度降下来。这形成了一条钟形曲线。新产品跨越了创新者的试用这一关之后,在他们的推荐下,早期的接受者会很快跟上。接下来就是大批的早期大众,直到有一半早晚会接受新品种的人都参与进来。超过这一点后,新增加的人数开始减少,这些人特别慎重,直到新品种带来的好处看得见摸得着,铁板钉钉之后才会接受。这些迟到的大多数,是那些直到自己的庄稼地周围种的玉米都变成了杂交玉米之后才会心悦诚服地接受新品种。曲线的末尾,必然是落在后面的少数几个人,这些人直到自己变成了少数派之后,才会接受新生事物。
  赖安和克洛斯所研究的钟形曲线,并不是爱荷华州的农民所独有。大多数创新的推广,都遵循类似的规律,这是市场营销和规划专家预测新产品需求的时候的一个有力工具。不过,使用这一工具却无法回答从流行病学家到首席执行官都关心的一个问题:社会网络对于病毒或创新的传播起到了什么作用?

  研究人员利用药房的处方记录,跟踪药物沿着社会链接推广的路线。研究结果表明,最早期采用新药的,和第一批大规模采用新药的人,都是那些拥有大量社会链接的人。这些高度连通的医生,更有可能和创新者有关系,因而能更快地了解新药。这些医生接受了之后,新药就会从这些中心节点推广到社会关系较少的同事那里,这些人形成了较晚些的大规模接受者群。最后就轮到了那些落后者,即那些坚持到最后才肯采用新药的人。
  辉瑞制药的研究证明创新是从创新者传播到中心节点,然后从中心节点将信息传递给他们所拥有的无数链接,通过社会或专业网络,到达最广大的人群。中心节点是无尺度网络的有机构件,它们的实际数量很少,但却高度连通,是它们将社会关系网络连成一体。

  在市场营销学中,中心节点一般被称作“观点领袖”、“强力用户”或“影响者”。这些人比普通大众能就某种产品和更多的人接触。他们通过自己广泛的社会关系,是最先注意到并使用创新者的经验的人。虽然他们自己并不一定是创新者,但是他们接受新思想或创新后,对其传播所起的作用却至关重要。如果中心节点拒绝某种产品,就会形成一堵难以穿越且影响巨大的高墙,面对这堵墙,这种创新只有失败。如果他们接受某种产品,就能影响大批的人群。
  社会学家和市场营销专家非常清楚这种观点领袖的存在。但是以前他们一直把中心节点看作是特殊现象,并不了解其中的原因,也不知道有多少这样的中心节点。这种情况直到最近才改变。社会网络模型不允许中心节点的存在,只有无尺度网络才第一次使中心节点的存在变得合理起来。我们将会发现,中心节点对于思想、创新、病毒等的传播,都带来了变化。

  对于理解传播和扩散理论来说,意识到超过某一关键阈值是时尚或病毒传播的前提,是一个重大的理论进步。现在,所有的扩散理论都引入了关键阈值的概念。流行病学家将其加入到传染病传播模型中,研究像艾滋病病毒这样的传染病大流行的可能性;市场营销类的教科书中也谈论它,用来估计某种产品在市场上畅销的可能性,或是用来解释为什么有些产品就是卖不出去;社会学家用它来解释女性之间相互传授计划生育的方法;政治学者利用它来解释政党和运动的生命周期,并预测和平示威转变为骚乱的可能性。
  几十年来,在研究扩散问题时,一个简单但同时有说服力的范例主导着我们的思维方式。如果想估计某种创新传播的可能性,我们只需要了解其传播速率和关键阈值即可。没有人对这种范例提出疑问。然而,最近我们了解到,某些病毒和创新根本就无视这种范例的存在。

  电脑病毒的传播无法用传统的流行病模型进行预测。在互联网上,电脑不是随机连接的。相反,互联网的网络实质是具有无尺度的拓扑结构。因此,应该使用无尺度网络来建立电脑病毒模型,而不是此前的研究所使用的随机网络。在更接近实际的无尺度网络中研究病毒传播,结果非常惊人:在无尺度网络中,传染性阈值神奇地消失了!也就是说,即使病毒的传染性不强,也照样会传播,并且经久不散。这一发现否定了 50 年来扩散理论研究积累的成果。在无尺度网络中,病毒传播根本无视值的存在,人们简直就没有办法阻止它们的传播。
  病毒这种难以预测的行为方式根源于互联网的拓扑结构的不平衡,无尺度网络被中心节点主宰控制。因为每个中心节点都和大批的电脑相连,因此受到其中某个感染的几率也就高一些。一旦中心节点被感染,就会把病毒传播给所有与它相连的电脑。因此,中心节点成了病毒存在和传播的重要途径。虽然毒性强的病毒能很快传播到任何网络的所有节点,可是在无尺度网络环境中,传染性不那么强的病毒照样畅通无阻,而且生存能力同样强。
  这些研究成果不只适用于电脑病毒。模型稍加改动,就能描述观念、创新、新产品和传染病的扩散。而且这些模型还大体上描述出了促进宗教传播的因素:保罗是一个高度连通,而且移动性很强的中心节点,他使得早期基督教传播到了尽可能多的人。观念和创新也沿着社会网络的链接一级一级传播。因为社会网络具有无尺度拓扑结构的特征,电脑病毒的异常现象也就存在于这些系统中。

  在我们每个人的上百个社会链接中,只有极少数的关系亲近到能相互传播性病。因此,在我们这个高度互联的社会网络中,艾滋病只能沿着某个极为稀疏的亚网络传播。相对而言,艾滋病的传染性不强,按说,它的传播速度该下降了不少了,而且应该近乎消失了。不过,尽管如此,艾滋病已经感染了 5000 万的人,而且这一数字依然在上升。人们很可能忍不住要把的里雅斯特的研究成果简单化,用来解释艾滋病在社会网络中无尺度拓扑结构的快速传播。然而由于并非所有的社会链接都是性链接,我们就有必要问一下,传播这种致命疾病的性网络的拓扑结构如何?

  早期的艾滋病传播,主要是由于同性恋行为,然而现在异性恋已经成了主要的传播方式。我们已经证明了,中心节点对于传播过程起关键作用。鉴于他们的特殊角色,相应的解决办法大胆但又残忍:因为资源有限,就应该先治疗中心节点。也就是说,当有了疗法,但是却缺乏资金为所有的需要的人提供治疗,就应该先提供给中心节点。结果表明,如果我们试图为所有程度大于预先设定的值的节点提供治疗,不论把限度设定在何种程度,这一传染病的阈值都会是有限的。治疗的中心节点越多,该传染病的阈值越高,这一病毒消亡的可能性就越高。
  问题在于我们无法确知中心节点在哪里。因此,佐尔丹·戴索着手解决一个更困难的问题。虽然我们无法很确定地识别中心节点,但是几十年来的研究,已经使我们掌握了大量的社会学研究方法,使我们能够在既定的社会群体内识别高危人群,以及极有可能成为传染源的个体。社会地位、年龄、职业和其他许多因素都起作用。因此,我们能够大体识别中心节点。毫无疑问,在找到其中一些节点的同时,许多其他的中心节点仍然无法发现。但是我们最需要问的,是这一并不完美的办法是否有效。由于即使尽了最大努力去识别中心节点仍然不够,那我们能建立起控制这一传染病的阈值吗?为了回答这一问题,我们必须假定,节点不是随机接受治疗的,医疗机构会采用一种不均衡的政策,优先治疗性链接多的个体。这一包含预测在内的方式使我们能够将这些识别治疗高度连通的节点比较有效的政策和随机治疗的方式进行比较。负责作此对比的是佐尔丹·戴索。结果让我们都非常惊讶。当然,如果采取随机治疗的政策,病毒传染的阈值持续为零,我们无法阻止病毒传播。但是,只要是采取偏向高连通性节点的政策,即便是轻微的偏向,就能使阈值变成有限值。也就是说,即便是我们无法找到所有的中心节点,但只要朝着这个方向做,就能降低疾病传播的速率。
  但是这种有所选择的政策会带来重大的伦理问题。事实上,我们的研究结果表明,在资源有限的情况下,应该给那些滥交的人提供药品:某个人的性伙伴越多,其被选中治疗的可能性就越高。对滥交的人治疗得越好,受传染的人就越少。我们是否有此准备,为了大多数人的利益,放弃链接少的病人?我们是否有准备为性链接多的妓女提供药品,而忽略更富有,但性链接少的中产阶级患者?
  只有一种学术上的办法能解决这一道德争议:疫苗。目前,全世界每年在艾滋病疫苗研究上的费用为 3.5 亿美元。相比之下,美国和欧洲每年花费在艾滋病治疗上的药品费用为 30 亿美元,而一架喷气式战机的价格也在 10 亿美元以上。可见,花在疫苗研制上的费用实在是太少了。在争论谁该先得到治疗的同时,我感到我们应该采取一切可能的措施来阻止这一疾病的蔓延,即便这种政策可能意味着向滥交者提供优越条件。

第 11 章 互联网的觉醒

  自从 1995 年美国国家自然科学基金会(NSF)放弃了对互联网的指挥操纵权之后,就没有任何中央权威机构控制或记录互联网的增长和设计了。
  目前,互联网的演变完全受按需求的、本地化的、分布式的决策所决定。任何人,从企业到教学机构,都无需中央机构的允许,就能为互联网添加节点和链接。而且互联网也不是单一的网络,有许多独立的、互联的网络共存,其中包括 WNET、vBNS 或 Abilene 等。
  大家可能以为会有那么个组织,在必要的时候能关闭停止整个互联网。这种想法错了。虽然我们能说服某个机构关闭它所管理的一部分网络,但是任何公司或个人,所能掌控的也只是互联网上微不足道的一部分。互联网背后的网络已经变得极其分布式、非中央化、本地化,即便是想绘制一个完整的网络图都变得不可能了。
  试图绘制完整的互联网图具有重要的现实意义。如果不知道互联网的拓扑结构,就不可能设计出更好的工具和服务。目前互联网上使用的协议,是根据一个很小的网络,以及 20 世纪 70 年代的技术和需求设计的。随着网络的增长,新的应用出现了,这些协议开始变得无法满足我们的需要。事实上,当今互联网的大多数应用,对于当初设计其基础设施的人来说是不可想象的。例如,电子邮件的产生就比较偶然。黑客汤姆林森(Rag Tomlinson)当时想找到一种办法,通过修改文件传输协议,让网络也能传输信件内容。对于自己技术上的突破,汤姆林森一直秘而不宣。他第一次给同事演示自己创造的系统时,警告对方说:“这事儿谁也不要告诉!这不是我们该干的。”不过电子邮件的秘密还是泄漏出来了,而且成了早期互联网上最重要的应用。
  万维网的出现也与此类似。互联网的基础设施并没有对万维网的出现做好准备。万维网是一种典型的“成功灾难”,这种新功能设计泄漏到现实世界后以极高的速率迅速增殖,而此时其设计尚未完善。现在,浏览万维网和收发电子邮件几乎成了互联网应用的全部。假如互联网的创造者能预见到这一切的话,他们肯定会设计一套完全不同的基础设施,使人们的上网体验更加流畅。而现实是,我们使用的技术,必须经过极大的改进,才能适应人们对互联网不断增长、不断创新的需求。

第 12 章 破碎的万维网

  大多数搜索引擎其实根本就不试图索引整个网络。原因很简单:拥有索引文档最多的搜索引擎,并不一定是最好的。当然,如果你要找的信息很偏,那么覆盖率高的引擎效果会更好。但是,如果搜索的是常见的话题,更大的索引并不一定能带来更好的结果。我们大多数人,看见搜索引擎返回的成千上万的搜索结果,已经不知所措了。我们更不愿意看见有朝一日某个搜索会带来上百万个结果。因此,超过某个特定点后,改进算法从搜索引擎数据库中选择最佳的页面,要比单纯增加搜索结果更有益。
  涉及万维网浏览,不论是人工浏览还是网络机器人浏览,经济方面的激励(或是缺乏此种激励)都已经不再是唯一的限制因素。万维网的拓扑结构就限制了我们无法看到网络的全部。万维网是一个无尺度网络,由千千万万的中心节点、节点和链接构成。但是,接下来我们会注意到,这一大尺度拓扑结构中,还有无数的小尺度结构,它们严重影响了我们通过单击所能找到的链接的能力。
  虽然万维网上有 10 亿份以上的文档,但十九度分隔决定了,万维网很容易浏览。它很大,同时也很小。但是万维网背后的小世界却有些误导作用。如果两个文档之间存在联系路径,该路径通常应该很短。但是实际上,并不是所有的页面都能相互链接。从任何一个页面出发,我们只能链接跳转到 24% 的其他文档。其余的文档对我们来说是不可见的,无法浏览到。
  这一结果的产生,是由于技术方面的原因,万维网的链接是有方向的。换句话说,沿着某个特定的 URL 地址,我们只能单向旅行。在有向网络中,如果两个节点之间没有链接,你可以通过其他节点将它们连起来:例如,如果想从 A 出发到D,你可以从节点 A 开始,到节点 B,而 B 和节点 C 相连,C 的链接又指向节点 D。但是倒回来却不行。在非有向网络中,你可以正着走,也可以倒着走,A→B→C→D 如果是通的,那么反过来 D→C→B→A 也行。然而,在有向网络中,我们却不能保证反向路径一定存在。极有可能的是,你要想回来,就必须沿着不同的路径:从 D 开始,你可能需要访问一大堆中间节点才能回到 A。万维网上到处都是这种有向的路径。这从根本上决定了万维网的适航性,或称可浏览性。
  有向网络并不是一种从根本上全新的网络类型:不管网络是无尺度的还是随机的,其链接可能是有向的,也可能是非有向的。到目前为止,我们接触的大都是非有向链接。事实上,大多数网络,从社会网络到蛋白质网络,都是非有向的。但是另外一些网络,从万维网到食物链,则是有向的。这种有向性对网络的拓扑结构产生了影响。对于万维网研究来说,Alta-Vista 的安德烈·布罗德(Andrei Broder)和 IBM 及康柏的研究人员合作,确定了有向性对万维网的影响。他们研究了 2000 万个节点,这近乎是 1999 年整个网络所有页面的 1/5。他们的测算表明,有向性带来的最重要的结果,就是万维网并不是一个单一的均匀网络。事实上,万维网分隔成了 4 个主要的大陆(参见图 12.1),在每个大陆上,我们都要适应不同的交通规则。


  图 12.1 有向网络形成的大陆。像万维网这样的有向网络,自然而然会分隔成几个大陆。在中央处,每个节点都能从另外的节点链接到。处于 IN(入)大陆的节点排列特点在于,通过链接,你能最终回到中央,但是从中央出发,你却无法回到 IN 大陆。相比之下,处于 OUT(出)大陆的节点能从中央出发链接到,然而当你到达 OUT(出)大陆后,却找不到回到中央的链接;最后,在 OUT(出)大陆和 IN(入)大陆之间,有管道相连。处在触须上的节点,只和 IN 大陆或只和 OUT 大陆相连;少数节点则形成了孤岛,无法从任何剩余节点链接到。

  第 1 个大陆包括整个网络的 1/4。这个大陆一般称作中央网络,包括了像雅虎、有线电视新闻网(CNN)等网站。其典型特点在于这里浏览便捷,属于这些网站的任意两个文档间都有路径。这并不是说中央网络的任意两个节点间都有直接链接。而是说在中央网络,任意两个节点间,都存在能够相互访问到的路径。
  第 2 个和第 3 个大陆分别叫做 IN 大陆和 OUT 大陆,和中央网络规模相当,但导航困难。从 IN 大陆的页面,你可以到达中央网络,但是从中央网络出发却没有路径能让你回到 IN 大陆。相比之下,从中央网络出发,很容易到达 OUT 大陆的节点,但是一旦离开了中央网络,就找不到回来的链接了。OUT 大陆上主要是公司网站,很容易从外部进入。但是一旦进入后,却出不来。第 4 个大陆是由网络触须和隔断的孤岛构成的。所谓的孤岛就是与外界隔绝的相互链接的页面,从中央网络出发无法链接到这些页面。某些此类隔绝的区域包含有成千上万的网络文档。万维网上有 1/4 的文档处在这种孤岛或触须上。通常,网页的位置和内容没有什么关系;它主要是由其关系决定,通过出和入的链接,与其他文档产生关系。
  4 个大陆的存在严重限制了万维网的适航性。我们在上面能航行多远,取决于出发点在哪里。从中央网络的某节点出发,就能到达属于该大陆的所有页面。然而,不管我们点击多少次,万维网上仍有大约一半的内容对我们来说是不可见的,因为从中央出发,无法到达 IN 大陆和孤岛。如果我们跳出中央,进入 OUT 大陆,很快就会走进死胡同。如果我们从触须或是孤岛出发,万维网就会显得非常小,因为我们只能看见处于同一个孤岛上的文档。如果你的网页处于孤岛上,搜索引擎就永远无法发现它,除非是你主动将 URL 地址提交给搜索引擎。
  因此,我们能否绘制整个万维网的地图,就不仅仅是资源或经济条件是否具备的问题。链接的有向性造成了碎片状的网络,使它分隔成 4 个大陆。搜索引擎对于网络的一半内容,即互联的部分和 OUT 大陆部分,很容易绘制出地图,因为属于这些地方的节点,很容易从人们经常访问的中央网络的某一节点出发访问到。然而,万维网的另一半,即孤岛和 IN 大陆的那一部分,却处于隔离状态。不管网络机器人多努力,也找不到那上面的文档。这就是为什么大多数搜索引擎都允许用户提交其网站的地址。提交后,网络机器人就开始从该地址出发,发现以前从未见过的万维网区域。假如你不愿意主动提供此类信息,许多节点就会继续处于这种未发现的区域之中。
  存在大陆这一现象,并不是万维网所独有,所有的有向网络都存在这样的情况。比如,论文相互引用形成的“引用网”就是如此。每篇科学论文都会引用其他相关论文。某篇数学论文可能会引用其他的探讨相似问题的数学论文,间或引用生物学或物理学论文,用以说明其研究结果的应用性。这样一来,所有的发表的科学作品就都是某个网络的组成部分,在这个网络中,其节点是学术作品,而链接则是引用关系。这种链接是有向的。比如,从本书末尾的参考书目出发,大家可以找到我所引用的论文。然而从那些论文出发,你却无法回到本书,因为那些文章没有引用本书。引用网是一个非常特殊的有向网络,其中的 IN 和 OUT 部分反映的是研究论文的历时性,其中央部分即使存在的话,也非常小。自然界中也有一些有向网络。食物链告诉我们哪些物种依靠哪些物种生存。这些链接很少是双向的:比如狮子吃羚羊,但反过来就不成立。
  2000 年 6 月,芝加哥大学的法律教授卡斯·桑斯坦(Cass Sustein)对 60 个政治网站进行了随机调查,发现其中只有 15% 的站点有指向不同政见网站的链接。相比之下,60% 的站点有指向政见类似网站的链接。旨在研究万维网上民主话语的研究也得到了类似的结果:只有 15% 的网页有指向不同意见网站的链接。桑斯坦担心,由于网站都限制指向不同意见的链接,正在出现的网络世界其实助长了社会分化和隔离。万维网上社会和政治分化背后的机制其实是自我加强的:这些机制还会改变万维网的拓扑结构,将网络世界分隔开。因此,4 个大陆并不是万维网所仅有的分隔。仔细观察后能发现大陆还会进一步分为更小的村庄和大城市。这里的村庄和城市指的是由某个共同的观念、爱好或习惯所联系到一起的网站,构成了社区。比如爵士乐爱好者就形成了很完整的基于网络的社会群体,喜欢观鸟的人也一样。东欧的宗教原教旨主义者和他们的在美洲的意识形态相同的人也拥有共同的虚拟空间。欧洲的反全球化活动人士和他们在日本的同盟采取同样的战略和行动。
  社区是人类社会的基本构件。格拉诺维特的朋友圈,即社区的基本成分,就表明了这一点。不过,最近这些社区的行动越来越被万维网的拓扑结构显示出来,这一点也许是社区成员未曾注意的。我们的数字生活带来的一个副作用,就是我们的信仰和从属关系都公开化了。我们每次上网,都在将网络的用途和我们才智上的好奇心相联系。因此,热衷于观鸟的人会把我们带到与此有关的网站,使我们能够估测观鸟爱好者的社会群体。
  识别、判断这种基于网络的社区具有巨大的潜在用途。比如,找到喜欢跑车的社会群体,就能使汽车生产商最有效地推广他们公司的产品,比如在这样的中心节点放置相关广告。反艾滋病的活动人士可以利用社会群体方面的知识,调动那些关心这一疾病的人,把他们变成强有力的游说人士和活动团体。民族特色节日的组织者可以利用基于网络的社区方面的优势,宣传最近的一些民族活动,促进草根阶层组织的产生。问题在于,在整个万维网上,有数十亿的页面。在如此巨大的网络上,我们能找到所需的社区吗?
  1964 年,最高法院大法官波特·斯图尔特曾说过一句很有名的话:“今天我不应试图进一步(对淫秽)做出定义。另外,也许我根本就没办法成功地做出易于理解的定义。但是当我看到这类东西的时候,我就知道这是淫秽的。”我们在试图定义“基于网络的社区”的时候也面临类似的问题。看见此类社区,我们都知道它们就是,但是每个人心里又各自有略为不同的标准。造成此种现象的其中一个原因,在于不同的社区之间没有明显的分界。事实上,同一个网站可以同时隶属于不同的团体。例如,某个物理学家的网页可能混杂有指向物理学、音乐、登山,以及其他个人爱好方面的链接。我们该把这个网页归到哪一个社会群体?
  将内容和拓扑结构两者结合起来考虑,问题就不那么困难了。例如,我们可以专注于找到包含一个或两个关键词的文档。斯坦福大学的拉达·亚当米克(Lada Adamic)最近研究了一些通过搜索“abortion-pro choice”(堕胎——选择优先,即支持堕胎)和“abortion-pro life”(堕胎——生命优先,即反对堕胎)而找到的网络社区。其中 pro-life(反对堕胎)查询找到的文档有 41 个,人们能从每个网页跳转到任何其他的网页。相比之下,pro-choice(支持堕胎)行动则“碎裂”成多个相互断开的网站。
  这种相互竞争的社区的结构,对它们推销、组织自己的能力产生了很大的影响。亚当米克指出,反对堕胎人士搞的反对堕胎法案消息能够很容易地传播到其他的反对堕胎网站,因为它们之间的链接比较多。而且,由于支持堕胎网站上有反对堕胎网站的链接,支持堕胎的人也能读到这些信息。然而,支持堕胎的人要想获得类似的宣传效果,就得在多个相互断开的网站进行宣传。因此,反对堕胎不仅宣传做得好,而且组织也好——因为这方面的网站相互联系更紧密。
  万维网远远不是节点和链接平均分布组成的海洋,而是分裂为 4 个大陆,每个大陆上都有各自的村庄、城市,看上去就像是相互重叠的社区。我们所有的人都具有虚拟的身份,隶属于其中的一个或多个。
  和建筑师设计的建筑一样,万维网的架构是两个重要因素共同作用的结果:代码和人类的集体行为作用于代码的结果。代码可以由法庭、政府、公司等管理。然而,第二个因素,即人类的集体行为,却不是个别用户或机构所能控制的,因为万维网的设计就没有中央——它是自组织的。这需要数百万的用户各自的活动集合起来才能达到。其结果是,万维网的架构远远超过各部分简单的相加所得到的和。万维网大部分真正重要的功能,和后来出现的属性,都来自于其大规模自组织拓扑结构。
  万维网上的民主就是一个很好的例子。我们已经认识到,无尺度拓扑结构意味着网络上绝大多数文档都是不可见的,因为大部分链接都被少数的高度受欢迎的网站占有了。是的,在万维网上我们有言论自由。然而,我们的声音却太微弱了,其他人听不见。只有少数几个接入链接的文档不可能通过随意的浏览发现。我们浏览时一次又一次转向中心节点。某个文档是否可能被搜索引擎索引上,在很大程度上倚赖指向它的链接。只有一个指向自身链接的文档,被搜索引擎索引的几率只有 10%。相比之下,有 21 个到 100 个内指链接的文档被网络机器人找到并索引的可能性接近 90%。
  你能否找到我的网页,只受一个因素的影响:它在网络上的位置。如果许多人发现我的网页比较有趣,并添加指向我的网页的链接,那么这个节点就会慢慢变成一个较小的中心节点,搜索引擎最终肯定会注意到它。如果所有的人都无视我的网站,那么搜索引擎也不会注意它。这样我的网站就会加入不可见的网站行列,而其实这是大多数网站的命运。因此,万维网的大尺度拓扑结构进一步加强了对我们行为和可见度的限制,其力量超过了政府部门或业界。规则来了又走,但是不变的是控制它的拓扑结构和基本的自然法则。只要我们继续将链接目标的选择权交给每个人,就无法显著地改变万维网的大尺度拓扑结构,而且必须接受其带来的结果。

第 13 章 生命地图

  1987 年 2 月,《自然》杂志刊登了一个划时代的发现:人们找到了躁狂抑郁症(manic depression 或 bipolar disorder)的基因。在美国,躁狂抑郁症影响到 1%5% 的成人,其中有 25%50% 的人会至少有一次尝试自杀。如果直系亲属中有人患有躁狂抑郁症,那么个体罹患这种病的可能性要高 5~10 倍,因此人们普遍认为躁狂抑郁症和基因紊乱有关。人们刚刚掌握了查找特殊基因和疾病之间的关系的方法,研究人员就展开了查询躁狂抑郁症基因的竞赛。经过研究宾夕法尼亚州兰开斯特的安曼家族,确定了罪魁是 11 号染色体。然而 2 年后,该研究小组放弃了这一研究结果。不过这个错误没有使其他的基因研究人员灰心。1996 年,在第一项发表的研究结果公布约 10 年后,3 个独立的研究小组发表了他们的研究结果,找到的是其他染色体上的基因。其中一项对安曼家族再次进行研究,确定的是 6 号、13 号和 15 号染色体。另一项研究的对象是哥斯达黎加中央峡谷的一个孤立的种族,确定了是 18 号染色体。研究一个苏格兰大家族的报告则锁定了 4 号染色体。
  这些结果并不相互矛盾。它们只是说明,大多数疾病,从躁狂抑郁症到癌症,并不是由特定的某一个致病基因引起的。事实上,多基因通过隐藏在我们的细胞中的复杂网络相互作用,它们同时起作用。科学家面对的是找出细胞的构造物的巨大任务,从基因到蛋白质他们都要考虑到。因此直到最近为止,科学家一直都只关注生物学上的问题,而不是网络。但是现在人们已经找到了相关的零件,后染色体生物学开始关注全局问题。新的振奋人心的发现,正在给生物学和医学带来变革,这些发现向我们清晰明确地表明:如果我们想理解生命——并最终战胜疾病——就必须从网络的角度思考问题。

  不久前,人们还广泛认为与生物体的生物进化相关的重要信息都储存在基因中。基因的确具有复杂的结构,决定其编码的蛋白质的结构和功能范围,并可将这一信息遗传给下一代。然而,最近科学家发现,基因也具有重要的功能,是复杂的细胞网络成员。基因的主要功能在细胞所有环境因素的调节下才能表现出来。基因的复杂结构可以通过其序列图查出来。我们现在已经掌握了好几种重要生物的基因序列,这包括从大肠埃希菌(Escherichia coli)到人类。不过我们只是刚刚开始这第二场具有同等革命性意义的科学实践:查明基因的功能。为了达到这一目的,我们需要启动第二个基因组计划,即是绘制细胞内部网络地图。我们有了“生命之书”。现在我们需要的是生命地图。

  细胞内部是个分隔小于三度的小世界。也就是说,大多数分子经过 23 个反应路径就能联系到一起。因此细胞中的扰动绝不限制在原地:某个分子的化学物质富集变化很快就会传递到大多数其他分子。新墨西哥大学的安德里亚·瓦格纳(Andreas Wagner)和牛津布鲁克斯大学的戴维·A·费尔(David A.Fell)的研究支持这一发现,两人都独立得出了 E.coli 的新陈代谢网是无尺度的,并具有小世界的特性的结论。
  虽然三度分隔小得出乎我们的意料,但这并不是我们的发现中最吸引人的。因为这 43 种生物体体积各不相同,我们估计分隔会随着生物体变大而变大,就像万维网的直径会随着文档的增多而变大一样。令人惊讶的是,测算表明,不论是细菌的微型网络,还是多细胞生物的发达的系统,网络中的分隔都是一样的。虽然原始细菌的细胞和多细胞生物的细胞之间结构的差别可能像纽约市和小村庄之间的差别,一归结到它们的动态相关网络,所有的细胞看上去都像是个小城镇。进一步挖掘,我们意识到大多数细胞的中心节点也一样。也就是说,大多数生物体内连通性最强的分子都是一样的。三磷腺苷(ATP)几乎毫无例外都是中心节点,紧跟其后的是二磷腺苷(ADP)和水。
  ATP、ADP 和水成为中心节点一点也不让人惊讶。在细胞中,ATP 是多功能、便捷的能量存储库,由它驱动数百种生物化学反应。通过给反应提供能量,ATP 会失去一个磷酸基,转变成 ADP;这样,在新陈代谢网络中,ATP 和 ADP 都和大批分子相连,参与获取能量的反应。把连通性最强的前 10 种分子合在一起看,就能比较容易地看出端倪了。对于无尺度模型,一个重要的预计就是链接数量多的节点是较早进入网络的节点。从新陈代谢的角度来看,这意味着连通性最强的分子应该是细胞内最“老”的分子。瓦格纳和费尔的分析也确实表明,连通性最强的分子的进化历史较早。这些分子中的一部分可能是所谓的“核糖核酸(RNA)世界”的残余物,这是 DNA 出现前的进化步骤,而其他一些则是最古老的新陈代谢方式的组分。因此,首发优势似乎遍布于生命出现的过程中。
  假如所有的生物体都具有同样的无尺度拓扑结构,以及同样的节点分隔度数,共享同样的中心节点,那么不同生物体的细胞之间如何区分呢?细菌细胞和人体细胞之间存在结构上的差异吗?事实上,它们之间的差异非常之大。对比一下所有 43 种生物体的新陈代谢网,我们发现只有 4% 的分子在所有的生物体中都存在。虽然中心节点是一样的,但是不同生物体的连通性不那么强的分子却是五花八门,各不相同。生命就像是城市的某个郊区,所有的房子都是一个设计师设计的,但是房子的建筑工人和内部装修人员却不同,使各个房子具有不同的特点,这可能表现在地板的材料、窗子的大小等等方面。从空中看,所有的房子外观都相似,然而我们靠得越近,就越能看出它们的不同。
  结果表明,蛋白质相互作用网络具有无尺度拓扑结构。也就是说,细胞中的大多数蛋白质都担负特定的功能,与其他另外一个或两个蛋白质相互作用。不过,少数蛋白质却有能力和大量的其他蛋白质建立物理上的联系。这些中心节点对于细胞的正常运作和生存具有决定性的作用。事实上,我们能够证明;改变某个中心节点蛋白质的基因,在 60%
70% 的情况下都会导致细胞的死亡。相比之下,影响连通性不强的蛋白质的突变,导致细胞死亡的可能性小于 20% 。
  结合这些研究结果,新陈代谢的大尺度拓扑结构和蛋白质相互作用网络表明,在细胞架构中有高度的和谐:不论研究哪种层次的组织,都会发现无尺度拓扑结构。这些细胞中的探索说明好莱坞和万维网只是重新发现了生命活动在 30 亿年前就发明了的拓扑结构。细胞只是非常非常小的世界,具有其他一些非生物网络的拓扑结构。似乎生命就只能设计出这样的网络。
  在这种架构下,生命是如何形成的?我们刚一提出这个问题,就得到了答案。在我们的关于蛋白质相互作用网络拓扑结构的发现发表半年后,我在一个月内收到了 3 份电子邮件。每一份都是不同的研究小组撰写的论文。令人惊讶的是,这 3 个研究小组中,每一个都独立提出了同样的简单而美妙的解释,说明细胞的无尺度拓扑结构是源于细胞繁殖过程中的常见错误。
  细胞繁殖是通过复制自身物质,再分裂而实现的。说到繁殖的细节,简单的细菌和复杂的人体细胞可能有所不同。不过某些步骤却是一样的。首先,要想制造出有同样的遗传属性的下一代细胞,就必须忠实地复制 DNA 信息。然而这一过程并不是完全不出错的。虽然细胞具有精致的复制机制,能够保证DNA 序列能够相当忠实地继承下去,但是有 1/1000 的信息却会每 200000 年随机变异 1 次。另一个常见的错误是基因复制。
在复制过程的某一罕见的事故中,断裂 DNA 分子的末端会连接在一起,出现基因复制。其结果是,上一代 DNA 的不同长度的片断,会在后代的基因组中出现两次。这种复制在有些时候会让细胞死亡。但是在其他一些情况下,同一基因的多个副本可能具有进化上的优势,并传递给未来的世代。血色素就是个很好的例子。
  起初细胞只有 1 个血红蛋白基因。大约 5 亿年前,在高等鱼类的进化过程中,出现了一系列的基因复制,使基因组中出现了 4 个血红蛋白基因。现在,每个血红蛋白基因分别编码血红蛋白中 4 种珠蛋白。
  基因复制对细胞网络有重大影响。它制造出了两个同样的基因,它们又制造同样的蛋白质,反过来又和同样的蛋白质相互作用。这样就创建出了新的节点,即复制基因产生的蛋白质。其相邻的蛋白质,即复制蛋白质与之相互作用的蛋白质,现在会既同上一代蛋白质,又和同样的下一代蛋白质相互作用。因此,与复制蛋白质有联系的蛋白质中的每一个,都获得了一条额外的链接。在这一场博弈中,高度连接的蛋白质获得了属性优势:和连通性较差的伙伴相比,它们更有可能和复制的蛋白质拥有链接。并不是说中心节点经常复制。而是说,由于中心节点和更多的蛋白质链接,它们有可能和复制的节点之间具有链接,这样它们就有了一条额外的连接,这也是一种形式的优先情结。
  这一解释的最重要的特点,就是它将无尺度拓扑结构的来源,和众所周知的生物机制,即基因复制联系了起来。它指明,基因复制可以同时向蛋白质结构网络中添加额外的一种蛋白质,使其增长;并经常向连通性强的蛋白质添加新的链接,从而导致优先情结的产生。要想判断这是不是唯一成立的解释,现在为时尚早,因为可想而知,不同的机制有可能生成同样的拓扑结构,只不过我们尚未探索这些机制。这究竟能否解释新陈代谢中的无尺度结构也还不清楚。无论如何,这一解释说明了细胞现存的机制可以生成无尺度拓扑结构。因此,此时我们已经准备好了,可以转向下一个重要的问题了:生命地图是否会帮助我们更好地理解致病机制,并促使我们最终能够治愈所有的疾病?

  在所有的人类疾病中,癌症是研究得最深入的了。医学界对癌症所投入的异乎寻常的精力,的确带来了几项重大的突破。其中最重要的可能要数 p53 基因的发现。沃格尔斯坦认识到 p53 基因编码的 p53 蛋白质是肿瘤抑制物质。它的作用就好似车上的刹车装置,肿瘤抑制基因的作用就是使细胞维持在静止期,甚至使细胞产生自杀作用。健康细胞存在少量的 p53 细胞周期调控因子。如果放射线或其他伤害损害了这个细胞,p53 基因就会抑制细胞的异常生长,使细胞有时间自我修复,避免向恶性转化。然而,如果损害无法修复,p53 蛋白质就会激活一组基因,使细胞产生自杀作用。
  如果细胞的“刹车”——p53 编码的蛋白质——出了问题,这个细胞就会失去控制,异常生长。癌症细胞和健康细胞的不同之处,就在于它们能够异常生长。事实上,50% 的人类所患的癌症,都和 p53 基因突变有关。这一发现激发了雪崩似的研究潮,从 1989 年起,相关论文超过了 17000 篇。为了纪念人类认识 p53 细胞周期调控因子在癌症研究中的中心地位,1993 年《科学》杂志将其命名为“年度细胞周期调控因子”。鉴于 p53 细胞周期调控因子得到了这么大的关注,大家可能以为人们现在一定已经找到了治愈癌症的办法。因为我们只需开发出能够保证 p53 细胞周期调控因子正常工作的药物就行。但是,为什么这么大规模的研究,一直没能带来治疗癌症的特效药呢?
  虽然 p53 基因对于人类所患的癌症具有重大的意义,但是仅仅修复 p53 基因却无法治愈这一致命疾病。网络是症结所在。我们之所以无法彻底理解癌症,是因为细胞像互联网一样,是个网络。
  三位研究者辩道,我们必须摆脱对 p53 细胞周期调控因子的迷信,而应关注他们称作“p53 网络”的东西,即与 p53 细胞周期调控因子相互作用的分子和基因的集合。他们这样写道:“细胞和互联网类似,都是‘无尺度网络’:一小组蛋白质高度连通,控制着大量其他蛋白质的活动,同时大多数蛋白质只和少数其他的蛋白质相互作用。在这个网络中,蛋白质就是节点,连通性最强的节点是里面的中心节点。在这个网络中,随机去除某些节点,几乎不会影响网络的性能。但这样的系统也有阿基里斯的脚踵。”
  大家可能记得,网络的“阿基里斯的脚踵”,指的是其中心节点的脆弱性。细胞中连通性不强的分子失去作用,不会带来严重的影响,但是像 p53 细胞周期调控因子这样的细胞网络中心节点的突变,却会让细胞癌变,使生物体死亡。这就说明了为什么使用药物联合攻击和 p53 细胞周期调控因子相互作用的分子,慢慢会对细胞造成更严重的影响,就像攻击 p53 细胞周期调控因子的效果一样。
  沃格尔斯坦、莱恩和莱文在《自然》杂志发表的论文证明了通过网络的角度思考问题具有普遍的意义。为了保护互联网、量化黑客攻击等目的而想的办法对细胞生物学产生了积极的影响,因为细胞生物学考虑的是保护健康人体细胞不受致病生物体的威胁。互联网研究和细胞生物学研究的核心问题是相似的。第一步,是绘制这些系统背后的网络地图。然后,从这些地图出发,归纳出控制这些网络的规律。
  p53 网络最重大的意义,已经超出了其对于细胞和互联网的类推关系的启发。它指出了药物治疗和药品开发的新思路。研究 p53 网络的最终目的是寻求治愈癌症的方法。我们接下来会讨论这一问题,而且这是一个反复筛选的过程。在大多数情况下,癌症疗法都是以破坏为目的:这些方法通过药物或放射线破坏癌细胞的细胞网络来杀死癌细胞。随着我们对 p53 网络的理解的深入,使我们看到了另一条道路:我们首先需要破译这一网络的拓扑结构,彻底了解里面所有的相互作用。有了这样的地图,我们就能开始从正面着手,找到修复 p53 细胞周期调控因子功能的药物,而无需破坏其周围的网络。
  直到不久以前,我们还只能治疗一些疾病的表征,这包括癌症、心脏病、精神疾病等。从化学实验室到热带雨林,我们到处找寻稀有的化学物质,希望借助它们能够制造出治疗某些疾病的神奇药物。根据某些资料的估计,市场上现有的药物,其治疗目标,只是 30000 种人体蛋白质中的 500 种。虽然对于许多疾病,都有多种药物,但这经常是一种反复筛选的过程,以确定哪种药物对某个特定的病人有作用。
  深入了解细胞内的生物化学网络后,将彻底改变这种臆测的治疗方式。有了关于细胞网络图表精确的了解,加上能够确定不同的细胞相互作用强度的诊断工具,未来的医生将能够在不让病人服药的情况下,测量人体细胞对某种药物的反应。生命地图中包含有基因协同作用的详尽知识,有了这些,有朝一日,对于像躁狂抑郁症或癌症这样的疾病,在发病前我们就能诊断出来。这样的知识能够帮助我们开发极为精细、准确的药物,这样的药物只对出问题的细胞起作用,而不影响健康细胞。换句话说,这样的药物能够提供真正的治疗。
  通过药物改变人体内某种化学物质的浓度,能够减轻某种疾病的症状。不过,由于细胞是由具有小世界特性的复杂网络控制的,由药物导致的扰动,不可避免地会影响许多其他的化学物质,很可能导致人们不想要的副作用。使用药物治疗躁狂抑郁症,可能会使病人死于并发的心脏病。而令某人并发心脏病发作的药物,可能对另外的病人没有任何副作用。毕竟,我们大家的眼睛、头发的颜色都不同,因此我们对于不同药物产生不同的新陈代谢反应也丝毫不感到奇怪。手中有了生命地图,加上新近开发的 DNA 芯片这样的能够监督基因间链接的工具,医生将能够获得某种药物对分子和基因的影响的详细信息。确定药物是否会产生副作用将不再是全靠主观臆测。到时候,我们会有个性化的药物,允许市场上销售只对 10% 的人口有效,而对其他人可能致命的药物。
  近年来,如果你曾受到躁狂抑郁症的折磨,那么,你第一次去看医生,可能要花 1 小时的时间,让医生仔细了解你的想法和情绪。最终医生会给你开一服药。假如以前你从未想过中枢神经系统化学物质和大脑的活动以及健康状况之间有什么关系,那么服过药后,你就会有些了解了。注射进你体内的化学物质很快就能控制你的行为和冲动。你会发现自己的行为、思考方式都是以前从未经历过的。在大多数情况下,第一种药没有效果。它可能使你变得躁狂,也有可能更加抑郁。几周后,为了获得更好的效果,有可能需要换药。病人通常需要在几个月的时间内换 5~6 种药,才能找到效果最好的药物。这些药虽然能够减轻症状,却无法治愈疾病。它们只是暂时改变人中枢神经系统化学物质的属性,抵消基因网络故障带来的变化。一旦停药,中枢神经系统化学物质的不平衡立即会恢复,同时躁狂抑郁症的症状也会重新出现。

  1996 年,酵母基因组计划的完成令科学界震惊:酵母基因组包含有 6300 个基因。人们预计到的,只是其中的 1/4,并且只能模糊地阐明这 1/4 基因的功能。考虑到人类在生物进化中的重要地位,生物学家估计人类基因组至少会有 100000 个基因。人们认为只有这个数量,才能解释智人(现代人)的高度复杂性。2001 年 2 月,人类基因组计划成果公布了。结果是,我们的基因数量,只是预计的 1/3——只有大约“30000 个”。考虑到线虫的 20000 个基因只需编码 300 个神经细胞,而我们人类只多了 10000 个基因,却要对付大脑中的 10 亿个神经细胞,因此,基因数量仅仅是 1/3 的增长,也足够能解释我们和简单的线虫之间的差别了。
  简言之,基因的数量和人类的复杂性并不成正比关系。那么,复杂性意味着什么呢?网络给出了答案。从网络的角度考虑,我们的问题就成了:基于同样数量的基因,能够产生多少不同的、具有潜在特性的行为方式的遗传网络?原则上讲,假如有两个同样的细胞,只要它们的某个特定基因,一个是开启,另一个上的是关闭,它们的行为就会不同。假设这每个基因都能独立地开启或关闭,那么有 N 个基因的细胞,就能表现出 2N 个不同的性状。如果我们把典型细胞表现出的潜在行为特性看做是复杂性的度量标准,那么蠕虫和人类的差异就十分巨大:人类的复杂性是蠕虫的 103000 倍!
  人们将 20 世纪看做是物理学的世纪,而预言 21 世纪是生物学的世纪。10 年前,我们可能想把它称作基因的世纪,现在,面对这个我们刚进入的世纪,很少有人会这么说了。这个世纪极有可能是复杂性科学的世纪,它也一定会是生物网络的世纪。要说有某个领域,在其中从网络出发的思维模式会引发革命的话,我认为那就是生物学领域。

第 14 章 网络经济

  这些并购案都有自己的理论依据吗?当然,反全球化的活动人士不这么认为,他们谴责大企业控制了从政策到时尚等的一切。不过,如果我们将公司视作复杂的网络,其节点就是公司,链接则是各种经济和金融纽带,那么这些现象就是不可避免的。事实上,在网络化的经济中,中心节点必须随着网络的增长而增长。为了满足他们对链接的渴求,商业网络上的节点学会了吞掉较小的节点,这是其他网络中未曾见过的新方式。由于全球化迫使节点增长,并购就成了不断增长的经济所带来的自然的结果。
  受到物理学和数学网络复兴的推动,最近一批新发现记录了从公司结构到市场中网络的巨大能力。我们已经了解到,一个只包括少数几个独裁者的节点稀疏的网络控制了《财富》1000 强公司中所有的重要约会;在生物技术领域,同盟网络决定了公司的成败;公司内部的结构网络决定了企业是否能够适应瞬息万变的市场;充分利用了消费者特点的战略能够带来市场营销的成功。链接和联系越来越重要,理解网络成了适应快速演变的新经济的关键。
  所有 20 世纪产业背后的网络都有相同的结构,这与其所处的领域没有关系。这是一种树形结构,首席执行官就是树根,枝枝权权代表的是不断专业化、相互不重叠的部门经理和员工。沿着树枝往上,责任越来越小,来自树根部的命令到这里声音就显得很微弱了。
  虽然这种树形结构无所不在,但里面也存在不少问题。首先,信息向上传达的时候必须小心过滤。假如过滤不理想,所有的枝权信息传到最上层就会出现信息过载。随着公司的扩张,树不断长大,最上层的信息不可避免要出现爆炸似的增长。其次,整合带来的是难以预料的组织僵化。典型的例子是福特汽车工厂,这里是最先完全实行分级管理的制造工厂之一。他们的问题是,组织级别搞得太好了。福特的生产线高度整合优化,即便是汽车设计上的小小变动,也需要将工厂关闭数周或数月。这种优化导致了所谓的“拜占庭式巨无霸”,使公司组织过于庞大,难以对商业环境的变化作出反应。
  树形结构特别适合大规模生产,而这是直到最近为止经济成功的模式。然而现在经济价值蕴含在新观点和信息之中。我们已经达到了能够生产所有能想象得到的东西的程度。现在,重要的问题是:该生产什么?
  公司面临着信息爆炸,另外在瞬息万变的市场上,又需要前所未有的灵活性,因此企业模式正处于彻底转型的过渡阶段。这并非是指少数员工的工作性质描述上的变化。这要求人们对如何在伴随信息经济而来的后工业时代适应新商业环境重新进行根本性思考。
  这种重新思考最显眼的一点,就是从树形结构转换到网络或网络组织,一种平面的,具有大量相互连接的节点的组织。有价值的资源从实物财产转变成了比特和信息,公司运作从垂直整合转向了虚拟整合,商业的触角从地域性的变成了全球性的,库存的生命周期从几个月缩短成几个小时,商业战略从自上而下变成了自下而上,工人则转变成了雇员和自由经纪人。
  新产品需要公司内外的同盟支持,这就要求公司有新的拓扑结构。为了满足这一点,中层经理开始消失。原本处于从属地位的雇员开始负责主要产品的生产管理。项目小组、公司内外的同盟组织,以及外包生产等越来越时兴。因此,想在变化迅速的市场上进行竞争的公司,正从静态的优化的树形结构转变为动态的、演变的网络结构,以获得适应性更强、更灵活的管理结构。拒绝作出这种变化的公司很容易就会被挤到边缘。
  公司内部的变革只是网络经济带来的结果之一。另一个结果是使人们认识到公司不可能独立运作。公司总要和其他的机构合作,采纳其他企业证明成功可行的商业模式。这种与其他的企业保持高层联系的任务,往往落在首席执行官和董事会成员身上。接下来我们就会看到,网络的效用对这些相互作用起到了根本性的作用。

  公司的董事会,一般由十来个人组成,对于公司的未来具有莫大的权力。它负责作出所有的重大决策,包括让业绩不佳的首席执行官下课,以及批准重大的并购等。因此,各个企业都不遗余力招纳人脉畅通,经验丰富的经理。成功的首席执行官、律师以及政客都常有人找上门来,同时出任好几个公司董事会的职务。
  虽然有人担心董事会成员如果在多个董事会任职,就没有时间在每个地方都做好,大多数公司还是希望他们的董事会成员有在其他董事会任职的经历。由于董事们会将在某个董事会中学到的知识和经验用到解决另一个董事会遇到的问题上,这种董事会成员组成的相互联结的网络,就对企业经验的传播,以及大公司政治经济影响力的保持,起到了至关重要的作用。
  在经理网络中,每个节点是一个董事会成员,和处于同一董事会的其他成员建立有链接。当公司数量达到了数千个,每个公司的董事会成员有十几个,这个网络的规模就相当不小了。《财富》1000 强公司组成的网络,包括了 7682 个经理,10100 个管理位置。如果每个经理只在一个董事会任职,这个网络就会分隔为小小的,各自闭合的圆圈,每个圆圈就是一个董事会。然而,实事并非如此。79% 的人只在一个董事会任职,14% 的人在两个董事会任职,约 7% 的人在 3 个或 3 个以上的董事会任职。这个结果表明,这些少数重叠任职的经理,建立了一个只有五度间隔的小世界网络。事实上,对于整个包含 6724 个经理的网络,任何两个经理之间的距离,是 4 到 6 次握手。
  经理网络之所以有小世界的特性,是因为有 21% 的人任职于一个以上的董事会,他们将这个复杂网络联系成了一体。在这些人中,弗农·乔丹所起的作用非常特殊。他在 10 个董事会任职,常常与《财富》1000 强企业的 106 个经理人会面。乔丹是企业精英中最具核心地位的经理,他和其他大多数经理的距离是 3 次握手。
  乔丹的职业给我们提供了一个生动的例子,证明了公司主管组成的相互联系的小世界决定了公司的大部分任职情况。事实上,在大多数情况下,如果乔丹加入了某个董事会,他至少认识一个其他的董事会成员。20 世纪 70 年代早期,乔丹是颇有影响力的公民权利组织全国城市联盟(National Urban League)的头儿,他反复呼吁黑人应该加入企业的精英阶层。1972 年,化学产品制造商赛拉尼斯企业(Celanese Corpora-tion)的总裁约翰·布鲁克斯(John Brooks)告诉他说:“我觉得你该通过你的嘴巴来赚钱……你一直在谈黑人加入董事会的事儿,你干嘛不加入赛拉尼斯的董事会呢?”
  乔丹加入赛拉尼斯董事会后不久,他又接到两个电话,有人邀请他加入美国海丰银行(Marine Midland Bank)和银行家信托公司(Bankers Trust)的董事会。乔丹不知道自己该选择接受哪一个,就给约翰·布鲁克斯打电话,咨询他的意见。约翰的回答很简洁:“你别无选择。对方可是银行家信托公司。”乔丹问他那又怎么了,布鲁克斯只是简单回答道:“你觉得自己是怎么得到提名,邀请你加入银行家信托公司的董事会的?我就在那个董事会。是我提名你的。”在银行家信托公司董事会,乔丹和威廉·M·埃林豪斯(William M.Ellinghaus)共事,后者也担任 JC Penny 公司的董事。一年后,乔丹接到邀请,要他加入 JC Penny 的董事会。
  三年后,乔丹请施乐公司的首席执行官彼得·麦克库劳(Peter McCullough)担任全国城市联盟的总裁。后者提出了下面的条件:“只要你来施乐的董事会,我就当你公司的总裁。”乔丹同意了。三年后,乔丹成了施乐的主管,又接到邀请加入美国运通(American Express)的董事会,当时该董事会中已经有了另外两个施乐的主管。1980 年,乔丹加入了 RJ Reyn-olds 的董事会,就不足为奇了。事实上,赛拉尼斯的首席执行官和另外一个 JC Penny 的董事会成员都在 RJ Reynolds 的董事会,而且乔丹和 RJ Reynolds 的首席执行官私交甚厚,后者是赛拉尼斯董事会的主管之一。
  早先结交的熟人使经理人员后来有人可挖。因此,小世界的动能协助创造了拥有巨大权力的“老伙计网络”,或称精英阶层。他们对经济和政治生活具有无可比拟的影响力。乔丹目前就职于 Akin, Gump, Strauss, Hauer & Feld 律师事务所,这是华盛顿最大的一家律师事务所。他之所以在这里,也可以和“老伙计网络”扯上关系:拉乔丹进来的事务所合伙人罗伯特·施特劳斯(Robert S. Strauss),是施乐董事会的主管之一。
  乔丹的职业路途也绝非独一无二。在各个行业中,都存在网络效应。例如,在硅谷,公司间大量的人员流动创造了紧密的公司间人际关系链接。在招募新雇员,吸引管理人员加盟的时候,这种微妙的社会关系网络被充分加以利用。和董事们相互拉拢其他公司的董事一样,公司现在的雇员也可以利用他们的社会链接,通过社会关系网络招募的雇员辞职不那么频繁,而且比通过其他途径招募来的人工作勤勉。
  董事会管理位置的关系和硅谷雇员这两个网络中所体现出的微妙的、环环相扣的关系,很好地揭示了美国经济背后复杂的社会和权力网络。但是要想了解经济究竟如何运作,我们还需要理解这些高度相关、相互影响的经理,是如何操纵企业和其他经济实体的。

  制药业数据库(Pharmaceutical Industry Database)为 1709 家公司和研究所之间的 3973 项研究和开发协议提供信息。分析表明,中心节点并不是偶然出现的,而是根植于制药业背后的网络的无尺度天然属性。事实上,与恰好 k 个其他研究机构建立伙伴关系的公司的数量,反映了它们在网络内部拥有的链接的数量,这一数量符合幂律,表明这是一个无尺度拓扑结构。等级分布的高度连通的大企业,将大量的小公司聚拢在一起,将它们无缝地编织进无尺度的不断演变的经济体系中。
  研究、创新、开发、销售都变得越来越专门、独立,我们的经济正变成网络经济,在这个体系里,所有行业中的企业,要想生存,就必须依赖战略同盟和伙伴关系。德国和意大利的公司间的供应商、转包商之间的关系记录得很全面;日本企业长期以来就依靠公司间的合作来分担技术创新的责任;而韩国商业模式则是将多元的小公司置于大型集团的伞下;硅谷的公司经常借助大公司和小公司的合作来获得技术转化的优势。这些同盟关系,有时又称作市场变换,或伙伴关系变换,使我们得以一窥世界商业环境之一斑。
  虽然这些公司间的同盟对于经济运行有重大的影响,然而经济理论对它却一直漠视,这十分令人惊讶。直到最近,经济学家还将经济系统看做是一系列自治的、匿名的个体仅仅通过价格体系相互作用的组织,这种模型往往被称作是经济学的标准正式模型。一般认为,公司和消费者的个体行为对市场的状况影响极小。经济状况实际上是由就业、产量、通货膨胀等合在一起的总量影响的,与构成这种总量的相互联系的微观活动关系不大。公司企业是和“市场”相互作用,而不是公司与公司之间相互作用。这个市场,是个虚拟的,所有经济活动都与之交互的媒介。
  现实中,市场只不过是个有向网络。公司、企业、金融机构、政府部门,以及其他所有的潜在经济的参与者都是里面的节点。链接则量化了这些机构之间各种各样的相互作用,其中包括销售、购买、合作研究和市场营销项目等。链接的“权数”则表明这些交易的价值,并且表明从服务商到接收者的这种交易方向。这一有权数、有方向的网络的结构和进化,决定了所有宏观经济活动的结果。
  在市场中,标准的策略是在当前的交易中获取最大的利益。而在网络中,优选的方案则是从长远上计议,让对方感到受了恩惠,对你有信心。因此,从网络的视角看经济,买方和卖方并不是竞争关系,而是合作关系。他们之间的关系经常是长期的、稳定的。
  这种链接之间的稳定性,使公司可以关注各自的核心业务。如果这种合作伙伴关系破裂,其后果将是严重的。大多数情况下,关系的破裂只影响到链接的双方。然而,有时候这种破裂关系也会传遍整个经济体系。我们接下来将会看到,宏观经济问题会将整个国家带入金融危机,而合作伙伴关系的破裂则会严重影响新经济中的明星产业。

  一家虽然规模不小,但远非主导地位的财产发展公司的破产,为何会引发世界最大的股票市场的动荡,并让“世界上经济最强大的国家”的总统在两年之后还要对其做出解释?如果我们把经济视作高度相连的公司和金融机构网络,就有可能理解这些事件发生的原因了。在这样的网络中,节点故障很少影响系统的完整性。然而,有时候特定节点的故障却会带来级联故障,动摇整个系统。
  亚洲金融危机就是一场大规模的级联金融故障的实例。我们在第 9 章就讨论过这一问题,它是连通性和相互依赖所带来的自然结果。不过,亚洲金融危机却并非是其首例:两年前,南美和墨西哥曾经历过类似的级联故障,而且可以肯定,这也不是最后一例,虽然银行、政府部门都竭力避免出现这种情况。
  在假设所有的公司组织都和想象的市场相互作用的经济框架中,这种情况是无法解释的。级联故障是网络经济的直接结果,是由全球经济体系中没有任何单一组织可以独立运作这一事实带来的必然结果。从网络的角度理解了宏观经济的相互依赖性,能帮助我们预见并限制未来的危机。从网络的角度考虑问题,能教会我们监督破坏的路径,通过识别、加强节点,来为网络添加防火墙,阻止小故障变成烧毁宏观经济的烈火。
  我们不能将亚洲及拉丁美洲金融危机这种级联故障看作是快速发展的国家不稳定的金融系统带来的副作用。发达国家的经济,例如美国经济,虽然有资金、有相应的专业人士在危机发生发展成全球危机之前来根除其根源,也并非对这种级联故障完全免疫。对于稳定的经济体系,与相关性紧密联系的脆弱性依然存在,例如电子商务泡沫的破碎就是一例。
  康柏、思科系统以及其他一些公司,是一种新的商业战略的领袖:外包生产。不久前成为首家破产超过万亿美元的思科公司,是这一趋势的推动者。该公司通过一种崭新的、大胆的制造模式,实现了利润 30%40% 的增长:它销售的所有产品都不是自己造的。思科和大量的制造商建立了稳固的关系,这些公司生产、装配带思科品牌的产品。康柏和其他许多企业竞相效仿思科的模式。
  外包生产需要建立紧密的供应商体系,保证所有的原件都能按时交货。因此,当某些供应商无法交付某种基本零件,如电容、闪存等,康柏的生产网络就瘫痪了。当时,该公司手持电脑设备方面零件的缺货就达到了 600000
700000 件。定价 499 美元的康柏随身电脑在易趣和亚马逊网站上拍卖的价格达到了 700~800 美元。思科也遇到了一个不同的问题,但其危害却相似:订单都满足了之后,思科忘了让自己的供应链停下来,结果其零部件库存猛增到了 300%。
  这个问题带来的最终结果非常惊人:从 2000 年 3 月到 2001 年 3 月,采取外包模式的公司的市场损失,——包括思科、戴尔、康柏、Gateway、苹果、IBM、朗讯、惠普、摩托罗拉、爱立信、诺基亚、Nortel——超过了 120000 亿美元。这些公司和他们的投资者所遭受的惨痛损失,生动地表明了忽略了网络效应将带来的后果。这种唯我的态度,即认为公司的财务平衡是唯一重要的因素,限制了人们从网络的角度进行思考。不理解一个节点的行为如何会影响到其他节点,很容易就会摧毁一部分网络。
  专家们一致认为,这种级联效应损失并不是网络化经济不可避免的缺陷。这些公司之所以遭受了挫折,是因为他们未能完全理解这种变革对其商业模式带来的要求,就开始进行外包生产。等级式的思考无法适应网络化经济。在传统的企业组织中,组织内部可以作出快速的变化,以其他方面的收益弥补局部的损失。可在网络化经济中,每个节点都必须盈利。可是参与网络游戏的公司没有看到这一点,在不知道如何借助网络优势盈利的情况下却要面对连通性带来的风险。一出问题,它们又无法作出正确的决断。比如在思科案例中,公司遇到麻烦后,管理层关闭了供应链,结果却导致了更大的麻烦。
  在宏观经济和微观经济两个层面,网络化经济都站住了脚。虽然好几家公司实行外包生产模式经历过重大损失,但这种模式依然变得越来越普遍。金融相互依存,越来越无视洲际、国家的界限,它只能通过全球化来加强。管理方面正面临革新。我们必须采取新的、以网络为出发点的看待经济的方式,理解相互关系所带来的影响,抚平发展的道路。

  当时为 Hotmail 提供最初资金的德雷珀,费希尔和尤尔韦特松风险资本公司(Draper,Fisher and Jurvetson)的蒂姆·德雷珀(Tim Draper),说服了巴蒂亚和史密斯在每份 Hotmail 电子邮件的末尾加上这么一句:“Get Your Private, Free Email at http://www.hotmail.com.” (登录 http://www.hotmail.com 注册获得个人免费 Hotmail 账户)因此,只要 Hotmail 用户一给朋友发送电子邮件,就等于为该公司做了宣传。有关 Hot-mail 的消息在无尺度网络中散播开来,利用的正是“爱虫”病毒传播的途径。由于在这样的网络中,不存在创新的传播临界阈值,因此 Hotmail 才有可能获得成功。不过,它能这么快、获得这么大的成功,却完全出乎人们的意料。
  Hotmail 的巨大成功的源泉来自何处?传播速率高的创新和产品,获得网络更大部分的几率也更高。Hotmail 通过去除影响个人接受它的阈值来加强了传播速率。首先,它是免费的;因此选择它的时候人们无须判断决策是否明智。其次,Hotmail 的用户界面很容易注册,只需两分钟,人们就能注册完成;因此花费的时间也几乎为零。第三点,一旦注册了,每发送一份电子邮件,就等于为 Hotmail 做了一个免费的广告。将这三个特点结合起来,该服务就具备了极高的传染性,这种传染性是传播的内在机制。传统的市场营销理论告诉我们,将免费服务、较低学习路径和通过消费市场快速获取结合起来,就能将产品置于阈值之上。正因如此,这样的产品才能抓住每一个消费者。基于对复杂网络中扩散的新的理解,我们现在知道,上面的解释只说对了一部分。没错,这样的产品传播速率很高,但同时也没有阈值。产品和观念,只有在得到消费者网络中高度连接的中心节点的青睐后,才会传播开。
  Hotmail 模式能复制吗?千万别在这上面下赌注。以 Epi-demicMarketing.com 为例。该公司 2000 年花了 210 万美元,为其超级碗(Super Bowl)大做广告,梦想发掘出网络的巨大能量。在超级碗(Super Bowl)广告中,一个男子走进一间公厕,里面的清洁工给了他一份小费,这正好和通常的情况反了。Epidemic 公司希望人们能理解他们的广告中巧妙表述的信息,即该公司会对顾客作出的努力进行回报。他们的商业模式,是向那些在自己发出的电子邮件中添加了该公司提供的商业链接的人支付酬金。这样一来,关于某公司或促销的信息就能口口相传,再现 Hotmail 的巨大成功。然而,该模式却缺乏病毒式营销的关键因素:人们对于向亲戚朋友发送这些链接不感兴趣。因此,Epidemic 公司在 2000 年 6 月赔掉了它筹集的 760 万美元后,炒了 60 名员工的鱿鱼并关门大吉,也就毫不奇怪了。
  Hotmail 表明了消费者网络的巨大能量。某些产品无须昂贵的电视和报纸广告就能卖得动。它们能像病毒那样迅速传播。虽然这一模式未必适合所有的产品,但利用病毒式营销的某些方面却往往能促进各种商品的销售。不过 Epidemic 公司的失败表明 Hotmail 的成功模式无法简单复制。Hotmail 的经验应该是新的市场营销方式的出发点,提示人们将传统的战略和对网络效应的理解结合起来。

  电子商务泡沫的破灭,往往是因为许多热衷于互联网的人的片面的思维模式。大多数新公司的建立,都是依靠简单的想法,认为只要提供在线服务,就足以复制新经济中的成功案例。然而,除了很早下手的一些公司,如亚马逊、美国在线,或易趣,大多数别的公司都失败了。互联网带来的真正财富,不是成千上万新的网络公司的诞生,而是现有商业的转型。从夫妻店到大型的跨国集团公司,我们都能看见互联网的踪迹。
  网络并不是万能的灵丹妙药,它并不能使哪一家公司在具体的商业环境中百毒不侵。网络在所扮演的角色中真正重要的一方面,是它能帮助现有的企业迅速适应变化的市场状况。网络的概念,暗含了多维思考。
  在商业和经济中,网络的多样性令人目眩。有政策网络、所有权网络、协作网络、企业网络、网络市场营销等——只要你能叫出名堂来,就有这样的网络。我们不可能把所有的各式各样的相互作用整合进一个单一的包容一切的网络。然而,不论我们审视哪一个级别的公司组织,都能找到自然界网络中起主导地位的稳健、通用的法则。经济和网络研究所面临的困难,是如何将这项法则应用于实践。

第 15 章 没有蜘蛛织网的网络

  虽然现实中的网络虽然并不如艾尔德和莱利预言的那么的随机,但机会和随机性确实在其形成过程中起到了非常重要的作用。真实网络不是静态的,增长对其拓扑结构的形成起了关键作用。真实的网络不像星状网络那么中央化,而是具有等级,不同级别的中心节点将网络连为一体。高度连接的节点下面有连接数量稍逊的节点,其后又有更小的节点。没有处于中央位置的,控制、监督一切的中央节点。也没有任何节点能够具有不可或缺的地位,拿掉任何一个都不会导致网络的坍塌。无尺度网络是一种没有蜘蛛的网络。
  由于没有蜘蛛,这个网络就不是小心翼翼设计出来的。真实网络是自组织的。它们提供了生动的实例,使我们看到数百万节点和链接的独立个体行为,能够导致惊人的行为方式的产生。这种没有蜘蛛的无尺度拓扑结构是其进化的必然结果。自然界每创造一个新的网络,都要遵循创造先前的网络时所遵循的同样的法则。控制复杂网络出现的法则的稳健性,解释了无尺度拓扑结构为何普遍存在。它可以描述各种各样非常不同的系统,如语言网络、细胞内蛋白质链接、人与人之间的性关系、电脑芯片的设计图、细胞的新陈代谢网络、互联网、好莱坞网络、万维网、共同创作论文形成的科学家网络、经济网络,等等。

  新科学诞生中最迷人的一面是其创造的新语言,使我们能够利用这些新的语词传播思想。在这种新语言诞生之前,我们绞尽脑汁也难以表达清楚。网络理论的复兴也为我们这个相互连接的世界创造了新的语言。社会中的连接者,好莱坞的明星,生态系统中的关键物种,忽然就联系到了一起。他(它)们在各自环境中的重要性,使他(它)们成了所在环境中的中心节点。从网络的角度思考这一策略,将影响人类的所有活动领域,以及大多数的研究领域。这不仅仅是一种有用的换位思考或研究工具。网络自身是最复杂的系统中的一员,节点和链接使用各种手段建立起我们这个相互链接的大千世界。
  这一新语言存在的生动案例,在 2001 年 9 月 11 日后显示了出来,当时网络获得了大多数人们此前所不熟悉的意义。导致悲剧的大多数因素都充分利用了网络思维。肇事者是基地组织这个恐怖分子网络,他们不是一星期就能建立起来的。他们被宗教信仰所驱使,对现有的社会政治秩序不满,成千上万的人在连续多年的时间里加人到这一组织中。这个网络不时增加一个节点,具有无蜘蛛网络的所有特点。事实上,基地组织没有变成有中央集权的网络,它也没有使用军队和 20 世纪的企业所惯常采用的树形结构。它发展成了一个自组织无蜘蛛网络,网络中的等级化的中心节点使组织联系在一起。
  “9·11”事件后,管理咨询师沃尔迪斯·克雷布斯(Val-dis Krebs)绘制了一幅 4 架飞机上的 19 个劫机犯,以及官方认定和他们有联系的 15 个人之间的网络图。克雷布斯以前就经常用网络理论分析企业之间的通讯联络。克雷布斯小心地把公布于众的 34 个恐怖分子之间的联系输人,依据其关系的亲疏给每个链接赋予了权数。他所获得的网络非常能说明问题,任何想理解这个发动致命攻击的社会细胞内部机理的人都能看懂。对于了解真实网络形态的人,看到这幅图一点都不奇怪。据传袭击的设计者是穆罕默德·阿塔(Mohamed Atta),他确实是链接最多的节点。不过,他也只是与 23 个节点中的 16 个有联系。紧随他的是马尔瓦·沃希(Marwan Al-Shehhi),他的链接是 14 条。沿着这个列表往下看,会看到链接极少的节点,他们是该组织周边的人。
  该图也显示了,虽然阿塔居中心地位,但拿掉他并不能使这个组织瘫痪。其他的中心节点依然能将网络维持在一起,在没有他参与的情况下也可能发动袭击。很多人认为“9·11”事件的肇事者的组织结构特点,也正是所有恐怖分子组织结构的特点。由于具有分布式的自组织拓扑结构,基地组织极为分散,又能自给自足,即便是去除了本·拉登和他最亲近的亲信,也可能无法根除它带来的威胁。这个网络中没有真正的蜘蛛。
  现今世界上最具进攻性的组织,从基地组织到哥伦比亚的毒枭,都不是等级森严的军事组织,而是自组织恐怖网络。在它们之中没有明显的组织和秩序标志,我们经常称之为“非正规军”。不过这样称呼它们,我们又将复杂性和随机性等同看待了。实际上,恐怖分子网络遵循严格的法则,形成其拓扑结构、组织结构,以及它们的功能。它们利用自组织网络的所有的自然优势,包括适应性和对内部故障的容忍度。我们最大的敌人,可能在于对这种新秩序不熟悉,而且缺乏有效的语言来表述我们的经历。
  当然,针对基地组织的战斗最终将取得胜利。其手段,可能是去除网络中足够多的中心节点,到达使其崩溃的临界点;或是切断其所有的资源,促使其发生内部级联故障。然而,促使基地组织崩溃并不能终结这场战争。别的观念和功能类似的网络毫无疑问会取而代之。恐怖网络并不是本·拉登和他的手下发明的。他们只是利用了伊斯兰好战分子的愤怒,并充分利用了自组织法则。我们要是想赢得这场战争,唯一的希望是对付恐怖组织产生的根源,即促使网络增长背后的社会、经济、政治根源。我们必须努力根除恐怖分子节点建立链接的需求和渴望,为他们提供机会,使他们有机会融人更具建设性、更有意义的网络。对于赢得每个网络战争,不论我们多么高明,如果无法对付其建立链接的渴望,即形成自组织网络的前提条件,这种战争就永远不会结束。

  德国国会大厦这个权力的最高象征,从楼梯到旗杆,完全被包裹在金属银色的织物下面,将其变成了一件公共艺术品。5000 英尺(约 1525 米)的蓝色绳子将超过 100 万平方英尺(约 9.3 万平方米)的聚丙烯织物连在一起,覆盖了这个建筑的每一寸,成了我们生活的时代中最壮观的艺术景观。
  这一作品的作者是生于保加利亚的艺术家克里斯托(Christo)和法国艺术家珍妮-克劳德(Jeanne-Claude)。他们的作品包括《包装新桥》(Wrapped Pont Neuf)(用黄色的织物包装了塞纳河上的新桥),《围绕群岛》(Surrounded Islands)(以约 56 万平方米的粉红色布料捆绑在佛罗里达州迈阿密比斯坎湾内的 11 座岛屿周围)。从多个角度看,《包装德国国会大厦》是他们几十年的包装艺术的顶点。然而,若仅仅将这两位艺术家看作是包装建筑、桥梁或其他对象的人,就过于简单化了。他们的作品蕴含了深厚的哲学意义:“通过遮盖获得启示。”(revelation through concealment)他们的作品通过遮盖细节,使我们将注意力完全集中到外部形式上。这种包裹强化了我们的视觉,使我们更注意所观察的对象,将日常的已经变得平凡无奇的对象变成不朽的雕塑和建筑艺术作品。
  从某种意义上讲,在本书中,我们就是沿着克里斯托和珍妮-克劳德的思路观察世界的。为了观察细胞或社会这种复杂系统背后的网络,我们先遮盖了所有的细节。只观察节点和链接,我们有机会观察整体架构的复杂性。通过与具体细节拉开距离,我们得以一窥复杂系统背后的组织原则。遮盖显示出了控制网络状世界进化的基本法则,使我们理解这个错综复杂的剧情的架构如何能影响从民主制度到癌症治疗等事物。
  到达了这一步之后,我们该继续朝何处走?答案非常简单。我们必须揭开遮盖物。我们的目标是理解复杂性。为了达到这一目标,我们必须跨越结构和拓扑结构,开始关注链接上的动能。网络只是复杂性的骨架,是使我们的世界运转的公路系统。要想描写这个社会,我们必须弄清楚社会网络的链接上的相互动态作用。要想理解生命,我们就要研究新陈代谢网络的链接上的反应动能。要想理解互联网,我们必须在错综复杂的链接中加入交通流动。要想理解某些物种为何在生态系统中消失,我们必须承认某些生物更容易被捕获。
  在 20 世纪,我们已经竭尽全力去揭示、描述复杂系统中的零件。我们试图理解自然的努力,就好像是打碎了玻璃屋顶,却不知如何将碎片拼合起来。我们面临的复杂问题,从通讯系统到细胞生物学,都要求提出新的框架。如果手头没有地图就匆忙上路是不成的。好在不断发展的网络革命已经提供了许多关键的地图。虽然前面的未知世界中还有许多“恶龙”,但新世界的形状已然可辨,一个个大洲逐步出现在我们的视野中。最重要的是,我们弄明白了网络绘图法的法则,使我们在面临新的系统的时候总能绘制出新的地图。现在我们的任务就是沿着这些地图,完成我们的旅行,将一个个节点和链接片断连缀起来,弄清楚它们之间的相互动态作用。我们还有 90 多年的时间来达到此目标,将 21 世纪变成复杂性科学的世纪。