实际网络都兼有确定和随机这两大特征,确定性的法则或特征通常隐藏在统计涨落之中,因此,对复杂网络各种性质的统计描述十分重要。虽然目前提出的大多数网络统计性质仅描述网络的拓扑性质,但是由于网络节点的连边表示它们形形色色的相互作用,所以这种统计描述也包含动力学的成分,具有非常重要的意义。
具备几百年的图论研究基础,又经过98年以来飞快的新进展,已经建议过的网络统计性质很多,受到相当重视的也有几十种。一般人都没有看过所有建议网络统计性质的论文。所幸考斯塔(Costa)等人2007年初在Advances in Physics上发表了一篇相当全面、又有合适选择的综述文章[1]。本章主要参考这篇文献,对最重要的网络统计性质作简要的介绍。请注意我们只讨论无向图。
6.1 平均距离、谐平均距离、效率与脆弱性
在本节中我们将集中介绍描述节点之间相隔远近的统计性质。
6.1.1 测地线
测地线定义为两个节点(i,j)之间边数最少的一条道路。
测地线的边数就称为i,j之间的距离。
如果考虑边权,对于所谓的“相异权”,即两点之间的边权越大,它们的“亲密程度”越小的权,例如地理距离、旅行时间、道路造价等,测地线长应该定义为两个节点(i,j)之间各边权和(,其中l表示道路L上的一条边,wl表示它的边权),距离应该定义为测地线长最小的一条道路;对于所谓的“相似权”,即两点之间的边权越大,它们的“亲密程度“越大的权,例如车次、航班等,测地线长应该定义为两个节点(i,j)之间各边权倒数之和的倒数()。
6.1.2 平均距离
平均距离定义为网络中所有节点对之间测地线长的平均值,。
这个定义容易按照上述的考虑边权规定推广到含边权的情况。
6.1.3 效率
效率定义为,即两个节点之间测地线长倒数之和的平均值,表示网络平均交通的容易程度。
对含边权情况,上式中的应该代之以前面定义的。在一条道路上的各边可能有些包含相似权,有些包含相异权的情况,应该按照类似于电阻串、并联的方法计算。
6.1.4 谐平均距离
定义的一个问题是:如果网络是一个不连通图(这样的实际网络很多,例如演员合作网络和科研合著网络都是高度不连通的),则不连通的节点对会使这个定义式发散。为了解决这个问题,可以定义谐平均距离为:。
6.1.5 脆弱性
一个节点i的脆弱性定义为:,其中为从网络中去掉节点i之后的网络效率。整个网络的脆弱性定义为:,即脆弱性最大节点的脆弱性。
本节的这些定义对于描述实际的传输(物质、信息、能量等)网络有非常大的意义。如何仅仅依赖局部信息搜索含权的最短路径(距离)、考虑堵塞时如何搜索最佳路径、如何搜索敌方网络的脆弱性最大节点以及如何保护、隐藏我方网络的脆弱性最大节点等都始终是重要的实际问题。
6.2 集群系数、圈系数、富人集团系数、集团度
在本节中我们将集中介绍描述环和完全图的统计性质。
6.2.1 集群系数(三环或者三完全图的统计描述)
集群系数描述网络中节点的邻点之间也互为邻点的比例,也就是小集团结构的完美程度。
网络的集群系数可记为:,其中,表示网络中三角形(三环或者三完全图)的总数,,表示网络中“三元组”(即缺少一边的三角形)的总数,表示网络邻接矩阵的矩阵元。目前大多数人认为网络的统计性质用邻接矩阵表示是最好选择,既清晰、准确,又便于规范地编程序。
一个节点的集群系数可以定义为:,注:此定义是错的,分子上没有3。其中,表示网络中包含节点i的三角形的总数,,表示网络中包含节点i的“三元组”的总数。
一个节点的集群系数也可以记为:,其中表示节点i的邻点之间的连边数,表示节点i的度,定义为节点i的邻边数。
则网络的集群系数也可记为:。
如果考虑边权,一个节点的集群系数可以定义为:,其中表示两个节点(i,j)之间边上的边权,表示节点i的点强度,定义为,即节点i的邻边边权之和。
含边权节点的集群系数也可以另外定义为:,其中。
6.2.2 集群系数与度的关系
定义:,其中是度为k的所有节点集群系数的平均值,是节点i的集群系数,。
如果,很多人认为这个规律可以说明网络存在“层次结构”,即网络可以划分为明显的一个一个层次。也可以说网络节点聚合成许多小群体,而这些小群体又在某一个层次上聚合成较大的群体,如此形成一个个分层次的群体结构(对于所谓群体和层次的严格定义我们还要在本章后面讨论)。称为“层次指数”。这种思想来源于芮瓦兹(Ravasz) 和巴拉巴斯(Baraba´si)在2003年发表的一篇论文[2],他们在论文中建议了一个规则分形结构的网络模型,证明了当规则形状的小群体按照确定法则分层次地连接起来构成网络时,就可以保持幂函数的度分布,以及上述的集群系数与度的幂函数关系。如果研究原来的BA无标度网络模型(没有群体和层次结构),则幂函数的集群系数与度的关系就不复存在。同时,他们报道了在演员合作网、语言网、万维网和以域为节点的因特网中实证得到的集群系数与度的关系。在的双对数坐标平面上,虽然这四种网络的实证数据都比较混乱,但是仍旧可以(虽然有些勉强)大致看出的关系。他们还举出了路由器为节点的因特网以及电力网的相应实证研究结果作为例子,说明在这些具有地理特征,因此不可能具有鲜明层次结构的网络中,的关系不再近似成立。尽管他们的这些论述不能看作是一个严格的论证,但是肯定含有不可被忽视的合理性。我们都知道,无标度网络的拓扑结构关键是含有不同层次上的“枢纽”点,它们具有不同的高连接度。如果网络是分为集团的,那么这些枢纽点一定连接了更多的集团。由于集团内部连接更为紧密,而集团之间连接相对稀疏,枢纽点一定具有比较小的集群系数。所以在有集团、层次结构的无标度网络中,表明节点平均集群系数随节点度下降的规律应该是合理的。在文献[2]发表之后,报道了在许多实际网络中观测到的关系,但是其中大部分的实证数据也都比较混乱,没有达到比较高的可信度。由于篇幅,本书不再一一介绍。
6.2.3 圈系数
定义节点i的圈系数为,其中表示经过节点i,j,k的最小圈所含的边数(若节点j,k邻接,为3,若节点i,j,k不由任何一个圈连接,),表示经过节点i的可能圈数。圈系数大致表示经过节点i的圈多少,但是圈越大,对圈系数的贡献越小。
定义整个网的圈系数为,其中N表示网络节点总数。
6.2.4 富人集团系数
定义网络的富人集团系数为,其中度大于k的节点集合(k富人集团)表示为,表示这种集合(k富人集团)的数目,求和项表示这种集合(k富人集团)中互相邻接的节点数目的2倍,富人集团系数表示度大于k的节点集合(k富人集团)中互相邻接的节点比例。
含权网络的富人集团系数定义为,其中为节点i的点强度。
6.2.5 集团度
文献[3]把网络中的完全子图,也就是所有两个节点之间都连接一条边的子图,称为“集团”。一个m-集团定义为一个包含m个节点,m(m-1)/2条边的完全子图。包含一个节点i的所有不同的m-集团数目称为节点i的“m-集团度”。作者们建议统计实际网络中节点m-集团度的分布,并且报道了域为节点的因特网、路由器为节点的因特网、万维网、数学科研合著网、新陈代谢网、蛋白质作用网、中国科技大学的朋友关系网中m从2到5的节点m-集团度的分布。这些分布都显示相当好的幂函数。
6.3 度、度分布、度相关性
度是对节点互相连接统计特性的最重要描述,也反映重要的网络演化特征。
6.3.1 度、度分布
度定义为节点的邻边数,可记为:。
平均度定义为:。
最大度定义为:。
如果考虑边权,一个节点的点强度定义为:,其中表示两个节点(i,j)之间边上的边权。网络的平均点强度定义为:。
度分布定义为任意选一个节点,它的度正好为k的概率。
6.3.2 度的相关性
定义:表示度为k的节点与度为k’ 的节点邻接的条件概率,其中表示度为k的节点与度为k’ 的节点邻接的综合概率(即同时发生的概率)。
定义:为“度为k的节点的邻点平均度”,更方便的定义是:,其中表示节点i的邻点集合,表示度为k的节点集合。如果曲线的斜率大于零,称为度正相关,说明平均来看,度大的节点趋向于和同类度大的节点连接,反之亦然;如果曲线的斜率小于零,称为度负相关,说明平均来看,度大的节点趋向于和异类度小的节点连接,反之亦然;如果曲线的斜率等于零,称为度不相关,说明平均来看,度连接完全随机,没有对邻点度的选择性。
如果考虑边权,定义:为“度为k的节点的含权邻点平均度”。
6.3.3 同类性
网络的同类性定义为一条边两端点度值的皮尔森系数(请参看本书第三章第三节)的平均值,可以记为:,其中表示第条边的端点集合,M表示网络的总边数。
含边权的网络同类性定义为:,其中表示第个边的边权,H表示网络中总边权数[4]。
6.4 边权网及边权的一些统计性质
无权网络仅仅给出节点相互作用存在与否的定性描述,实际网络中节点之间相互作用的强度也反映重要的性质与功能,一般需要引入边权来描述。本章将加边权的统计性质分散在各节之中,但是还有一些性质没有不含权的对应。本节介绍两种这样的性质[5]。
6.4.1 单位权
定义节点点强度与度之比为此节点的“单位权”或者“社会惯性”:。它的最小值是1,对应无权情况,这时它的点强度等于它的度。边权越大,它的点强度越大于于它的度,社会惯性也就越大。
6.4.2 权的差异性
定义:表示此节点的“权差异性”,其中表示节点i的邻点集合。若这些邻点的权都相同,则权差异性与节点i的度的倒数成正比,差异性最小;若只有一条边的权不为零,其它近似为零,则,差异性最大。
通常更关心所有度为k的节点权差异性的平均值:,其中为度为k的节点的集合,||为这个集合中的节点数。
6.5 二分图的二分度
图论定义的二分图中,节点集合可以理想化地分割为两个互补的子群,而且边只存在于不同的群之间。虽然许多实际网络属于这样的理想二分图,也存在一些只是近似二分图的实际网络,其中存在少数同类节点之间的边。这时就需要引入一个描述二分图近似程度的统计量。
定义近似二分图的“二分度”为:,其中表示节点i所属的类别,若 若,定义式中的分数分子表示连接两个同类节点的边发生的概率,分数分母表示总边数。
二分图中的其它重要统计性质将在第七章中介绍。
6.6 中心度与中心化
中心度指采用定量方法对每个节点处于网络中心地位的程度进行刻画,从而描述整个网络是否存在核心,存在什么样的核心。
可以从不同角度定义中心度,但是不管采用什么定义,一般得到的中心节点都具有具体网络功能的特别重要性。我们在本节简介以下定义[6]。
6.6.1 度中心度
对中心程度的一个可能最简单的观点是:度最大的节点就是中心点。
由此定义:,其中表示节点x的度,n表示网络节点总数,n-1表示最大可能的邻点数。
图6.1 星形网、环形网、单链网(引自文献[6])
作为例子,参看图6.1(引自文献[6]),一个星形网(中心有一个节点,其余节点仅和它连接)的中心点的度为n-1,其余节点度为1。一个环形网(所有节点排成一个环形)所有节点的度都是2。一个单链网两端点的度是1,其余的度都是2。显然星形网中心点的中心度最大,单链网两端点的中心度最小。
6.6.2 紧密中心度
第二个观点认为中心点应该是所有其它节点到此点总距离最小(总边数最少)的节点,也就是中心点应该是网络的拓扑中心,它并不一定度最大。
由此定义:,其中表示节点y到节点x的距离(测地线的长),n表示网络节点总数,n-1表示最大可能的邻点数。
例如图6.2左图表示用度中心度标记的一个网络,图6.2右图表示用紧密中心度标记的同一个网络(图引自文献[6])。显然只有紧密中心度定量描绘了网络中节点的拓扑中心程度。
图6.2 左图表示用度中心度标记的一个网络,右图表示用紧密中心度标记的同一个网络(引自文献[6])
6.6.3 介数中心度
图6.3 显示拓扑中心节点的介数中心度并不是最大的一个例子(引自文献[6])
第三个观点认为中心点应该是信息、物质或能量在网络上传输时负载最重的节点,也就是介数(经过此点的测地线条数)最大的节点。它并不一定度最大,也不一定是网络的拓扑中心。
由此定义:,其中表示节点j与节点k之间的测地线条数(介数),表示节点j与节点k之间经过节点x的测地线条数(节点x的介数),(n-1)(n-2)/2表示最大可能的点介数(任意其它两节点测地线都经过节点x)。
以图6.3为例(图引自文献[6]),拓扑中心节点的介数中心度仅为0.028,并不是最大,介数中心度最大的一些节点并不是拓扑中心。
6.6.4 流介数中心度
第四个观点认为中心点应该是信息、物质或能量在网络上传输时经过路径最多的节点,也就是不一定只计算最短路径。这是由于实际传播常常并不走最短路径。
由此定义:,其中表示节点j与节点k之间的路径条数,表示节点j与节点k之间经过节点x的路径条数。
图6.4 显示拓扑中心节点的介数中心度并不是最大的一个例子(引自文献[6])
图6.4(图引自文献[6])对图5.3中的网络重新进行流介数中心度标注,显然拓扑中心节点的中心化地位得到了一定体现。
6.6.5 中心化
中心化操作是在根据实际需要选择或者定义中心度之后,按照中心度的大小从中间向外排列各个节点,得到一个“中心化”的网络。这可能有利于在社会网络中找出领袖、在交通网中找出瓶颈、在流行病传播网中找出危险中枢、以及雪崩网络中的危险中心环节等。
可以为此定义网络的“中心化程度”:,其中表示网络,表示所定义的中心度最大节点的中心度值。容易知道,若各节点的中心度都相同(无中心),,若只有一个节点的中心度为1,其余节点的中心度都为零,。也就是少数中心节点越突出,中心化程度越高;各个节点的中心度差异越小,中心化程度越低。
6.7 谱分析
本书5.5节已经强调了网络邻接矩阵的重要性。邻接矩阵的特征谱包含了网络的重要信息,有着重要应用[7,8]。我们在本节的最后一章还要再比较仔细地讨论谱分析,在这一节中仅简介几个基本概念。
6.7.1 节点数为n的简单无向图的邻接矩阵特征
1、此矩阵为实对称()的方阵。
2、此矩阵有n个实特征值:。
6.7.2 邻接矩阵的谱密度
邻接矩阵的谱密度定义为:,其中,若;否则。
6.7.3 邻接矩阵谱密度的k阶矩
邻接矩阵谱密度的k阶矩定义为:。
已经严格证明了
,其中A表示邻接矩阵,Ak表示邻接矩阵自乘k次得到的矩阵,表示邻接矩阵的秩。
也已经严格证明了
表示网络中从某个节点经过k-1个中间节点回到自身的k边闭合回路的条数。
6.7.4 谱密度与子图中心度
1、令,它表示经过节点i,长为k边的闭合回路条数。
2、定义子图中心度为:,即经过经过节点i的所有闭合回路(环)条数的加权和(k越小,权越大)。
3、已经严格证明了,网络的子图中心度为:。
已经有文献报道几个著名网络演化模型的邻接矩阵谱密度计算。其结论显示不同网络拓扑结构对应不同的邻接矩阵本征谱。对此将在下一章中介绍。
6.8 模体
定义:模体是出现频率高的网络连通子图。
常常用节点数、边数、每个节点的度都相同的随机网所产生的相应连通子图出现频率来衡量一个实际网络中这子图的出现频率是否高。
例如一个大型软件网络中的模体是重要、反复重复的子程序。
6.8.1 模体的Z-记分
模体的Z-记分定义为:,其中表示一个实际网络中模体i的出现次数,表示所有节点数、边数、每个节点的度都相同的随机网所产生的相应模体出现次数的平均值,表示所有节点数、边数、每个节点的度都相同的随机网所产生的相应模体出现次数的平均方差。
Z-记分越大的模体在网络中越显示重要的拓扑地位。
6.8.2 模体的出众度
模体的出众度定义为:,其中表示模体i的Z-记分,说明相对于其它模体,模体i的重要性。
6.8.3 含权网中的模体性质
1、模体g的强度:定义:,其中表示子图g的边集,表示子图g的边数,表示子图g的平均边权。
2、模体g的一致性:定义:,若都相同,则为常数;若的一个特别大,以至于其它对求和都可以忽略,则相对也很小,,一般更小,所以模体g的一致性可以表示其中权的一致性。
已经有大量实证调研结果报道,说明不同实际网络中显示不同的重要模体,而且都对应重要的实际意义。我们不作详细介绍。
6.9 群落、派系与层次
社会网络通常都显示一群一群的结构,所谓“物以类聚,人以群分”。社会网络研究从来重视群落(也翻译为社团、凝聚子群等等)的概念。与此相关的层次、派系也是重要的概念。这些概念在目前的复杂网络(包括大量的非社会网络)研究中同样受到重视。但是,迄今为止,仍缺乏得到普遍承认和采用的关于群落和层次的定量定义,对派系也有不同的定义。
6.9.1 群落
1、定义:
社会网络研究中通用的群落定义是“群落是满足如下条件的一个参与者子集,其中参与者之间具有相对较强、较直接、较紧密、较经常、较积极的关系”[9-11]。
目前复杂网络中比较广泛应用的群落定义仍旧是类似的,例如:群落是内部连接密集、对外连接稀疏的节点集团。
曾经有人提出过一些定量的定义,但是没有被广泛采用。
2、划分:
大家更感兴趣的似乎不是如何定量定义群落,而是如何在一个实际网络中最合理地划分群落。对此的研究结果非常多。解绉、汪小帆的综述文章[12]比较全面地总结了这个方向的研究动向和成就。其中所引用的论文中,影响最大的可能要算Newman [13-15] 和Palla等人 [16] 的论文。划分群落的算法可以分为凝聚法和法这两大类。凝聚法的基本思想是计算各节点对之间的某种“相似性”,然后从相似性最高的节点对开始添加边。相反地,在算法中,一般试图找到已连接的相似性最低的节点对,然后移除连接它们的边。Newman的一组论文中提出了划分群落的一系列重要算法,包括凝聚法和法[12]。他提出的、著名的G-N算法是一种方法,其基本思想是通过不断地从网络中移除介数最大的边,从而将整个网络分解为各个层次的群落。这个思想无疑是合理的,然而,这种分解要进行到哪一步终止?在哪一步会得到哪一个层次的群落?这是问题的关键。
为解决这个问题,Newman等人引进了一个衡量划分质量的量——模块度,定义为。当打算将网络划分为个群落时,其中表示一个维的对称矩阵,矩阵元表示连接两个不同群落(第个和第个)中节点的边在所有边中所占比例;矩阵中对角线上各元素(表示同一群落(第个)中的边所占比例)之和为。表示群落内外连边情况在统计意义上相同,分不出清楚的群落;表示可以划分出个完全清晰,即不连通的群落。用G-N算法每分解一步,就对该截取位置对应的网络群落结构计算,当得到它的局部峰值时,即对应一个层次上比较好的群落划分。
图6.5 一个简单的网络(左),和相应的柱状图(右) (引自文献[17])
这样划分的结果相当于把网络“映射”为一个社会网络研究中所谓的“柱状图(dendrogram)”,如图6.5(引自文献[17])所示。这种图是一种树图,树叶就是节点,而树枝连接这些节点,或者在更高的层次上,连接节点的群落。如果能成功地、符合实际地完成这种映射,就能成功地划分出网络的各个群落,同时清晰地显示网络的层次结构。
Palla等人的论文[16]最早指出:在相当多的网络中,群落强烈地相互交连,以至于用类似的、映射为柱状图的方法不能划分它们。他们建议借助派系的概念。在传统的社会网络研究中,派系指“至少包括三个节点的最大完备子图”[9],也就是说派系中的任意两个节点之间都是边连接的,而且派系之外不存在另外的、同样连接这个派系中所有参与者的节点。Palla等人[16]定义一个含k个节点的派系为一个“k-派系”。如果两个k-派系共用k-1个节点,称它们“相邻”。如果一个k-派系可以通过若干个相邻的k-派系到达另一个k-派系,就称前后这两个k-派系为彼此连通的。Palla等人建议把所有彼此连通的k-派系构成的集合定义为一个k-派系群落。在这些定义的基础上,Palla等人建议了寻找派系,然后确定k-派系群落的算法,并且编写了相应的、命名为C-Finder的程序。
3、节点在群落中地位的描述:
1)节点的“群落内度”的Z记分:
定义节点i的群落内度Z记分为:,其中表示群落中一个节点i与同群落中其它节点连边数;表示群落中所有节点的平均值;表示群落中所有节点的方差。
若则称节点i为平庸节点;若则称节点i为低能节点;若则称节点i为高能节点;
2)节点的“群落参与系数”:
节点的群落参与系数定义为:,其中表示从节点i到某一个S群落的边数;表示节点i的度;表示群落的总数。
若节点i的所有边都在自己的群落内,;若节点i的边在所有群落内均匀分布,。
6.9.1 层次
如上所述,层次的定义常常和群落的定义紧密联系。也可以仅仅研究层次。有关层次的研究论文相当不少,但是大部分论文都把层次作为一个大家可以直觉地接受的定性概念来处理,没有给出定量的定义。少数比较定量地定义层次的文献并没有引起广泛的注意。
作为例子,一个可能的定义如下。如果g为一个网络G中的一个子图,为它的补集,即,则定义:
1、g的“膨胀集”,,为g中节点和它们的邻点的集合。
2、g的“浸蚀集”,,为的补集。
3、g的“d-膨胀集”为 (膨胀d次)。
4、g的“d-浸蚀集”为 (浸蚀d次)。
5、g的“d-环”为它的相邻两次膨胀集的差集。
6、d就称为层次,连接g的相邻两次膨胀环(d-环和d+1-环)的边数称为g的“层次度”。
本节(及前面各节)中没有注明出处的定量论述都引自文献[1]。
6.10 度分布熵、目标熵以及不同的网络信息熵
熵是十分有用而且发人深思的热力学概念。本书第一章第一节以对这个概念的回顾开始本书的议论。许多年来,熵的概念被推广到许多其他领域,转化为许多新鲜的意思,但是万变不离其宗,熵作为无序性的量度这个基本含义始终没有变化。在复杂网络研究中,也有人提出了一些有用的熵概念。本节予以简略介绍。
6.10.1 度分布熵
度分布熵定义为:,其中k为节点度的一个取值,P(k)表示这个取值发生的概率。对比热力学中传统的熵概念,度分布熵相当于把每个节点度的取值看作一个“微观状态”,把这个取值发生的概率看作这个“微观状态数”,来计算熵。因此,度分布熵表示网络度分布的无序性,也就是对于所谓的“网络异质性”的一种“宏观”描述。
度分布熵的最小值对应于规则网,这时的最简单情况是所有节点的度都相同,也就是(例如平面上规则二维格子的每个交叉点的度都是4),这时显然有:。规则网中也可能有几个可能的度取值,这时的运算类似。
度分布熵的最大值对应于均匀的随机网,也就是存在N个可能的度取值,每个值发生的概率是,这时有。
6.10.2 目标熵
目标熵定义为:,其中kj为节点j的度,P(i,b)表示从节点i开始,到节点b终结的一条最短道路。这样定义的目标熵表示从节点i开始,使用随机行走方法沿着这条道路搜索到节点b的概率。请注意从节点i开始,有个方向可以搜索,而途中每个节点j处,又有个方向可以搜索,所以每个节点的度越大,目标熵越小。
6.10.3 搜索信息熵
参照第一章第二节中介绍的信息熵定义和意义,搜索信息熵定义为:,其中为上述的目标熵,求和遍及从节点i开始,到节点b终结的所有最短道路。这样定义的搜索信息熵表示从节点i开始,搜索到节点b沿的一条特定最短道路所需要的香农信息。
可以定义网络的平均搜索信息熵为:,N为网络的节点数。它描述在这个网上搜索的难易程度。
6.10.4 接受信息熵
接受信息熵定义为:,它描述从节点i开始搜索确定另一个节点所需要的平均香农信息。
6.10.5 隐藏信息熵
隐藏信息熵定义为:,它描述从任意一个节点搜索到节点b所需要的平均香农信息。
显然有:。
6.10.1 交换信息熵
节点i的目标交换信息熵定义为:,其中是邻接矩阵元,表示从j点通过,到达目标节点i所需香农信息占据整个信息量之比。
节点i的道路交换信息熵定义为:,其中表示从j点开始,通过节点i所需香农信息占据整个信息量之比。
对整个网络:,。
本节(及前面各节)中没有注明出处的论述都引自文献[1]。
6.11 多标度分形的分数维谱
本书第一章第五节已经介绍过分形和分数维的概念,并且举出康托尔三分集作为例子,计算了它的分数维。上个世纪八十年代有人提出:这样类型的,可以用一个分数维数字描述的分形是最简单的情况,实际中大多数分形都更远为复杂,需要用一系列分数维数字描述,称为多标度分形[18]。本节予以简略介绍。这些概念对网络的描述应该十分有用,但是到目前为止,有关研究报道还相当少,是一个值得开垦的研究方向。
图6.6 康托尔三分集
6.11.1 康托尔三分集上的密度分布
不停地去掉一条线段的中间1/3,剩下的就是如图5.6所示的康托尔三分集。现在我们考虑线段上均匀携带质量,因此需要考虑其“线密度”(即单位长度上的质量)。这是稍微复杂的情况。若在演化过程中用n表示“去掉中间1/3”的操作次数,由于总的质量越来越集中在更短的一些线段上,线段密度随操作次数n的增加而增大。每次三分割之后都留下两段线段,第n次分割之后每段上的质量为,这时每段线段的长度为(分割前整个线段长为1),因此有关系:,。每段的密度为:。称为“奇异性指数”,描述当无穷次分割后,密度发散的奇异性。
6.11.2 非均匀质量分布的康托尔三分集
线段上的质量非均匀分布才是一般情况。我们讨论一种不太复杂的情况。设每次分割之后,把分割前每段上的质量以概率p分给左段,以概率1-p分给右段,则第n次分割之后,每小段上的质量不同,其中任何一段上的质量可以用通式表示,自左至右,。凡是k相同的小段质量和密度相同,看作一个子集。其上质量为,(可以证明)其中线段个数为。
令,则有:,,运用斯特令公式,当时,有,上式可写为:,其中,。当时,近似可以得到标度律:,其中标度指数就是当时这个“多标度分形(即无限分割得到的质量不同的线段子集合)”的分数维,它不再是一个常数,而是的函数。每个相同的子集中的线段有相同的密度和相同的分数维数值。
6.11.3 多标度分形的分数维谱
令,则,使用曲线可以形象地表示分数维随子集的变化,这是更常用的分数维谱。
6.11.4 实际分形的分数维的测量
上面所说的都是理想化的“规则分形”。自然界中广泛存在的实际分形都不规则,只有统计意义上的自相似,而且自相似性只存在于一定的“标度(尺度)”范围内。
最简单、常用的实际分形分数维的测量方法是“盒子计数法”。用个方格子(具有与实际系统相同的空间维数)来“覆盖”所描述的系统(例如用平面格子来覆盖中国地图,中国地面占据的格子数目为),小于格子线度的系统图形细节认为看不到。令,在坐标平面上找到实际数据的“线性区域”,就是标度范围,此区域数据线性拟合得到的斜率就是分数维。
实际分形的多标度分数维谱的测量技巧比较复杂,本书限于篇幅不再介绍。有兴趣的读者可以参看文献[18]。
6.12 漫谈复杂网络的统计描述
本章简介了不少网络拓扑性质的统计描述量。曾经提出过的量还有许多。这些参量从各个角度描述复杂网络的拓扑性质,似乎都是必须的。那么,一个自然的问题是:描述复杂网络拓扑性质的统计参量还必须有多少?更进一步的问题是:已经有的统计参数都必须吗?都吗?是否可能知道描述普遍的复杂网络需要多少个统计参量?它们都是什么?哪些最重要?
已经有人在深入思考这些问题,并且已经进行了相当程度的研究[1]。然而,完全回答这些问题显然不容易。就我们的观点,目前如果能进行有关上述问题的普遍研究自然很好,但是如果搞清楚大家重视的任何两种统计参量之间的相关函数关系,也是有关这些问题的扎扎实实的进展。应该说目前这两个方向的研究都比较缺乏,都需要引起大家的重视。
第六章参考文献
[1] L. DA F. COSTA, F. A. RODRIGUES, G. TRAVIESO and P. R. VILLAS BOAS, Advances in Physics, 56(1) (2007) 167.
[2] E. Ravasz and A-L. Baraba´si, Phys. Rev. E, 67 (2003) 026112.
[3] W. K. Xiao, J. Ren, F. Qi, Z. W. Song, M. X. Zhu, H. F. Yang, H. Y. Jin, B. H. Wang and T. Zhou, Phys. Rev. E, 76 (2007) 037102.
[4] C. C. Leung, H. F. Chau, Physica A 378 (2007) 591.
[5] 李梦辉、樊瑛、狄增如,加权网络(郭雷等编:复杂网络),2006,上海:上海科技教育出版社,第八章, 27-48。
[6] 王林、张婧婧,复杂网络的中心化,复杂系统与复杂性科学,3(1) (2006) 1。
[7] R. Albert and A-L. Baraba´si, Rev. Mod. Phys., 74 (2002) 47.
[8] 赵永毅、史定华,复杂网络的特征谱及其应用,复杂系统与复杂性科学,3(1) (2006) 1。
[9] S. Wasserman and K. Faust, Social Network Analysis: Methods and Applications, 1994, Cambridge: Cambridge University Press。
[10] 罗家德,社会网分析讲义, 2005, 北京: 社会科学文献出版社。
[11] 刘军,社会网分析导论, 2004, 北京: 社会科学文献出版社。
[12] 解绉,汪小帆,复杂网络中的社团结构,复杂系统与复杂性科学,2 (2005) 1。
[13] M. E. J. Newman, M. Girvan, Phys. Rev. E, 69 (2004) 026113.
[14] M. E. J. Newman, Phys. Rev. E, 69 (2004) 066133.
[15] A. Clauset, M. E. J. Newman, C. Moore, Phys. Rev. E, 70 (2004) 066111.
[16] G. Palla, I. Derényi, I Farkas, T Vicsek, Nature, 435 (2005) 814.
[17] F. Radicchi, C. Castellano, F. Cecconi, V. Loreto and D. Parisi, PNAS, 101 (2004) 2658.
[18] 屈世显, 张建华,复杂系统的分形理论与应用, 1996, 西安:陕西人民出版社。
第七章 一些网络演化模型
前面,本书用了六章篇幅介绍了进行复杂网络研究所需的一些基础知识,包括复杂性科学、统计物理学、博弈论、数理统计、图论、以及网络统计性质等领域的一些相关介绍。从本章开始,我们将转入对十年来复杂网络研究成就的介绍。同样的,这十年来关于复杂网络的研究突飞猛进,成果日新月异,恐怕没有人能阅读所有的文献,更不可能在这本小书中概括全貌。本书只能按照作者自己的观点,挑选一部分内容来介绍。本章将从前面一再提到的两篇开创文献开始,介绍十年来对于网络演化的一些理论认识进展。
7.1 ER随机网模型
20世纪中叶匈牙利数学家额尔多斯(Paul Erdös)和任易(Alfred Rényi)(见本书第二章开始的简介)在前人研究的基础上发展的随机图论被认为是传统图论向现代网络理论发展的一个里程碑。他们带动了相当一些数学家进行随机图论研究。回忆本书第一章介绍的、认为“随机就是复杂”的算法复杂性,读者会发现这两种研究(算法复杂性和随机图论)的理论、观点相近,都把随机描述与复杂的实际世界联系,而且正好处于同一时期,这决不能说是偶然的。很可能与算法复杂性相似,随机图论的研究热潮同样反映了研究、认识复杂系统的早期趋势。
本节只能非常简单地介绍随机图。为了对比,我们首先借用一个例子来介绍规则网络的性质。
7.1.1 规则网络简介
在本书第一章中讨论过,传统物理学和许多其他科学早就认为我们周围的实际系统是由大量基本单元构成的,而且希望从这些基本单元的性质得到系统的动力学规律。几百年来沿用的,作为这种方工具之一的坐标体系假设这些基本单元位于规则空间中的格点上,而且它们之间的相互作用的方向一般都沿着连接格点的直线段。这实际上就是对实际系统的规则网络描述,只不过没有这样明确说出来而已。如果没有下面介绍的几种观点作为对照,本来也没有必要强调这种描述的网络本质。
图7.1 一种规则网的草图(引自文献[1])
为了和下面介绍的额尔多斯和任易的ER随机网络模型比较,我们用图7.1作为例子来讨论规则网络。这是一种最简单的规则网模型,在其中,N个节点排列成环形(以避免边界问题),每个节点与其最近邻的m个节点连边(图中m=4)。很容易得到这个网络的最主要统计性质。
度分布:,即度分布是函数。平均度:,与N无关。
平均集群系数:,对于图7.1有,与N无关。当。
最大距离:,平均距离:。
上述结论的定性部分,即度分布是函数,平均度与N无关,平均集群系数与N无关,最大距离和平均距离与N正比,显然对规则网络普遍成立。
7.1.2 ER随机网模型
图7.2 一种随机网的图示(引自文献[1])
ER随机网模型的最简单表述为:1、给定网络节点总数N。 2、在每一步时间,任意选择两个节点,以概率把它们连边,其中是给定的总边数(),是最大可能连边数。 3、当边数达到时停止演化。 4、用此模型可能生成的网络总数为个,每个出现的概率相同,平均边数为条。
这个模型可以有另一个等价的表述形式:从N个编号的节点出发,依次考虑每一对节点以概率p的连边。边数的期望值自然就是。
7.1.3 ER随机网的最主要统计性质
类似地容易得到这个网络的最主要统计性质。
平均度:,与N正比。度分布(ER和Ballobás给出了严格证明[1]):,即度分布是围绕的泊松分布。这里虽然没有列出详细的证明过程,但是上面的表示式和泊松分布的结论很容易理解。
平均集群系数:(注意任意两点间连边概率都是p,所以任意一个节点的邻点之间的连边概率也是p),与N成反比。
平均距离:我们做一个近似的分析。任选一个节点,与它相距为1的节点(邻点)有个,而每个邻点又有同样多邻点,所以与它相距为2的节点有个,与它相距为 结论是:度分布是泊松的,平均度与N正比,平均集群系数与N反比,平均距离与lnN正比,显然与规则网络十分不同。 7.1.4 ER随机网邻接矩阵的谱密度 第六章第七节中已经介绍了网络的邻接矩阵谱密度的概念。它的定义是:,其中N是网络的节点数,λj为网络邻接矩阵的N个实本征值中的弟j个,δ为δ函数,即,若;否则。 满足的随机图(p是ER模型中的连边概率,c和z是常数)会显示十分类似于逾渗现象的临界现象。当时,图为不连通的森林,时,突然出现网络的全连通集团,且在时包含所有节点。只考虑情况时,随机图的邻接矩阵谱密度会在时收缩到被称为“维格纳(Wigner)分布”(在量子、统计、固体物理学中有许多重要应用)的著名函数[1]: 。 (7.1) 这个分布可以在-坐标平面上表示为一个半圆,如图7.3所示。这是随机网络的一个关键特征。 规则网的邻接矩阵谱密度显然是跳跃状(许多函数)。 图7.3 三幅叠放的、数值模拟得到的ER随机图谱密度。参量为:p=0.05, N=100(实线), 300(长虚线), 1000(短虚线)。(引自文献[1]) 7.2 WS小世界网模型 7.2.1 实际复杂网络位于规则网与随机网之间 如上所述,很可能规则网和随机网先后被当作实际系统的描述工具,然而,规则网的度分布是函数,平均度与N无关,平均集群系数与N无关,最大距离和平均距离与N成正比,邻接矩阵谱密度呈现跳跃状(许多函数);而随机网度分布是泊松的,平均度与N正比,平均集群系数与N反比,平均距离与lnN正比,邻接矩阵谱密度是Wigner分布,十分不同。到底哪一个更符合实际? 文献[1]报道了一些实际系统平均距离以及平均集群系数与N关系的实证调研结果。图7.4左图显示了万维网、因特网、电影演员合作网、科研合作网、性接触网、大肠杆菌的新陈代谢网、蛋白质相互作用网、某些局部地区的食物链网、论文引用网、电话呼叫网、英语词汇网的平均距离与N关系的实证调研结果。大部分数据落在的直线附近,只有万维网、科研合作网和美国西部电力网的数据偏差较大。这些系统都应该被认为是复杂的。这说明实际复杂系统的平均距离与N关系大致符合于ER随机网模型的结论。 图7.4 一些实际系统平均距离(左)和平均集群系数与N关系(右)的实证调研结果(引自文献[1]) 图7.4右图显示了上述系统平均集群系数与N关系的实证调研结果。如果实际复杂系统的平均集群系数与N关系类似地大致符合于ER随机网模型的结论,大部分数据应该也落在上右图中的虚直线附近,然而,图7.4右图显示实际情况与此大不相同,实际数据倾向于显示平均集群系数与N无关。 看来结论是:实际复杂系统在平均距离特性上类似于ER随机网模型,而在平均集群系数特性上类似于规则网模型。实际网络位于“规则与随机之间”。这个结论多么相似于我们在第一章中介绍的对复杂的理解和对复杂性定义的结论!真是“殊途同归”。 7.2.2 小世界网模型 那么,位于规则与随机之间的实际复杂网络模型到底是什么样的?如何在一个简单模型中把规则与随机恰当地结合?1998年,两位年轻的美国物理学家瓦兹(Watts) 和斯绰伽兹(Strogatz) 于1998 年在Nature 上发表了影响很大的论文[2], 提出了他们的“小世界网络”模型,回答了这个问题,开创了网络研究的新纪元。 图7.5显示了瓦兹和斯绰伽兹的小世界重连边模型。它从上节所述的规则网模型开始,以概率 p随机地“重连”每条边(任选此边的一个端点不变,脱开另一端点,随机选择网络中另一节点为端点),同时保证没有自连接和重复边(即保持为一个简单图)。这样,当p=0时,每个节点都有k个邻点,完全没有“随机跳跃边”,显示一个规则网模型;而在时,随机重连边的期望值是p N k(),显示一个位于规则与随机之间的模型;当p=1时,所有边都随机重连,模型转化为一个ER随机网模型。 图7.5 瓦兹和斯绰伽兹的小世界重连边模型(引自文献[1]) 为什么叫做“小世界网”?用人际关系网作为例子,大部分人际关系可能都是“近程”的,例如家属关系、同学(同事)关系等,类似于上述规则网模型中的邻边;然而许多人都有远方的人际关系,例如移居海外的亲属、创业于边疆的同学等,类似于上述的远程跳跃边。美国人经常在遇到想不到的人际关系时感叹世界太小。想象你要到某一个“外国”去办事,但是没有多少钱(正像上世纪80年代初许多我国留学生、访问人员的经历那样),最好能找到一个亲戚或朋友在你刚去的一段时间帮你一些忙。为此,常常不得不“亲戚套亲戚、朋友托朋友”来找到这种关系。我们常常发现原来想象的不知道要绕多大圈子才能找到(太远也就没有什么用)的关系原来并不远,目的地原来就有长时间不联系的近亲或者十分知己朋友的好朋友,可能给你帮很大忙。此时我们可能会像美国人那样,感叹一句:“世界是多么小啊!”。 7.2.3 小世界网的最主要统计性质 p=0时,平均集群系数:,这里我们用大写的K表示小世界模型对应的规则网中每个节点的常数度值。在时,任一个节点的两个邻点仍旧是它的邻点的概率分别都是(1-p)(以概率p重绕,即不再连接,所以连接概率是(1-p)),它们之间也邻接的概率也是(1-p),因此小世界模型的平均集群系数的期望值为[1]:,与N无关。当然,这只是一个近似估计。 小世界模型的平均距离解析计算曾经是一个比较困难,因而引起热烈讨论的问题,目前大家普遍接受的是纽曼(Newman), 穆尔(Moore)和瓦兹(Watts)用平均场方法得到的解析表示式[1]: ,其中: 。 (7.2) 由此公式不容易看出平均距离对N的依赖关系。更形象、准确地,瓦兹和斯绰伽兹数值地显示了平均集群系数和平均距离对N的依赖关系,如图7.6所示: 图7.6 数值得到的小世界模型平均集群系数以及平均距离对N的依赖关系(引自文献[1]) 图7.6中和分别表示小世界模型对应的规则网中的平均集群系数和平均距离,和分别表示小世界模型中的平均集群系数和平均距离。图中显示当p从零增加时,产生的少数随机跳跃边对平均集群系数影响很小,然而却立即大大降低了平均距离。因此,在区域存在一个相当大的p取值范围,使得小世界模型显示类似于规则网的大平均集群系数和类似于随机网的小平均距离,符合于上述的实际网络调研结果。 P=0时,小世界模型的度分布与上述规则网相同,是函数,所有节点的度都为K。P>0时,由于每条边保留一个端点不变,重连后每点至少有K/2条边,可以把节点i的度写为,,其中以(1-p)概率留在原处,从其它节点以p概率重新连接到节点i。容易理解,当N够大时,这两部分的概率分布为[1]: 。 (7.3.1) 。 (7.3.2) 由此可得:,其中。这个度分布函数近似于泊松分布,如图7.7所示: 图7.7 当K=3时,度分布的数值模拟结果,图中各数据点为N=1000的小世界模型数值模拟结果,各条线由上面解析度分布函数得到,实心圆点表示相同参数的随机图度分布(引自文献[1]) 这说明小世界模型的度分布类似于随机图的度分布。下一节将说明这并不符合于实际网络的性质,小世界模型只能说明实际网络中平均集群系数和平均距离对N的依赖关系。 7.2.4 小世界网的邻接矩阵的谱密度 图7.8显示了数值模拟得到的小世界网模型的谱密度。可以看到随p增大,谱密度逐渐从规则网的跳跃状(许多函数)演化到完全随机网的半圆函数,因此小世界网模型在说明实际网络谱密度这一点上也是成功的。 图7.8 数值模拟得到的小世界网模型的谱密度,各图中实线显示的半圆表示随机网的谱密度,以便比较。(a) p=0; (b) p=0.01; (c) p=0.3; (d) p=1(引自文献[1]) 7.3 BA无标度网模型 7.3.1 实际复杂网络的异质性 小世界模型可以说是上世纪后期“复杂居于规则与随机之间”这一理解的新形势再版。然而,仔细想想这句话,可能产生不满意甚至怀疑。既然规则与随机都是简单的,那么复杂就不应该“简单地”位于它们中间,而应该在很多方面高于它们,显示各种各样规则与随机不具有的“更高级”特性。如果是这样,那么使得实际复杂网络与规则与随机网络都不同的,比起它们都“更高级”的最重要性质是什么? 回忆上一章介绍的许多网络统计性质,度分布可能被列入最令人注意的性质之中。一个网络节点直接连接邻点的多少常常表示它在网络中的重要性。例如电影演员、科研人员合作网中,节点度基本上描述了一个节点获得合作成果(影片或论文)的多少,也就是他们在合作中的地位重要程度;交通网中,节点度描述了一个节点在网中的“枢纽”程度等等。规则网的度分布是函数,即所有节点的度完全相同,或者分为有限组,每组内全同;而随机网的度分布是泊松的,绝大部分节点的度落在一个平均值附近。这两个极端的简单网络的度分布都呈现某种“均质性”。实际复杂网络的度分布如何?比这两个极端的简单网络的度分布高级吗?这个问题是重要且有趣的。 两位年轻的美国物理学家,巴拉巴斯(Barabási)和阿尔波特(Albert)于1999 年在Science 上发表了同样影响很大的论文[3], 提出了他们的无标度网络模型,并举出例子来说明许多实际网络都具有所谓的“无标度性”,即精确或近似地显示遵循幂函数的度分布。他们的工作揭示:实际复杂网络中节点重要程度的分布是强烈“异质性”的。那么,异质比均质高级吗?我们说是的。均质常常意味着均匀、平衡、无序(或极端有序反而导致的平庸、简单),而异质常常意味着不均匀、非平衡、(建筑在复杂基础上的)有序。我们周围丰富多彩的世界正是无处不在的不均匀、非平衡、复杂而有序造成的。“实际复杂网络中基本单元度分布的无标度性”显示了各个基本单元的“重要性”或“作用”非常不相同。在人群中像爱因斯坦那样的优秀人物是极少数;在食物链中像狮子、老虎那样的“顶端生物”也一定是极少数。比他们多不知多少倍的“芸芸众生”远远谈不上“优秀”,但却是支撑他们的基础。这些层次、组织等特征正是复杂性的一种体现。 图7.9显示了万维网、路由器层次的因特网、电影演员合作网、高能物理学家科研合作网和神经科学家合作网的度分布,它们都精确或近似地遵循“幂律”。在文献[3]发表之后的几年中,许多文献接续发表,报道了更多实际网络的幂律度分布。 随之而来的问题是:为什么会有幂律度分布?或者说幂律度分布是那里来的?是什么机制产生的?这是物理学家最感兴趣的话题。 图7.9 (左)万维网的(a)出度;(b)入度分布;(右)(a)路由器层次的因特网;(b)电影演员合作网;(c)高能物理学家科研合作网;(d)神经科学家合作网的度分布(引自文献[1]) 7.3.2 无标度网模型及其度分布的平均场解析 巴拉巴斯和阿尔波特提出的无标度网模型包括两个要素:增长和优选。前者强调复杂网络是一个开放系统,新的基本单元不断加入,节点总数在不断增加;后者强调节点连接新边的概率应该单调依赖于它已经有的度,即所谓“富者更富”法则。这两条无疑是符合实际的。任何实际复杂系统一定不是理想孤立,而已经掌握大量财富的人一定比穷小子更容易赚钱。在这两条原则基础上提出的模型表述为: 1、时具有较少的个节点,以后每个时间步增加一个新节点,连接到m个旧节点上。 2、新节点连接到旧节点i的概率正比于它的度,即连接概率为:,其中表示旧节点i的度,N表示网络节点数。 3、如此演化,直到达到一个稳定演化状态。 巴拉巴斯和阿尔波特的数值模拟说明在t够大时模型产生的网络会达到一个稳定演化状态,这时度分布遵循幂律。 如同本书2.3节所讨论的,对于一个具体细节依赖于随机因素的动力学过程,平均场方法的思想就是抛开这些具体细节,仅仅考虑全局的、平均的动力学效果。在许多情况下,可以把某些动力学现象的发生概率近似为常参量,列出微分方程形式的平均场方程。它们可以用大家熟悉的微分方程解法来求解,但是并不代表还原论方框架下的系统动力学机制。根据这种思想,巴拉巴斯和阿尔波特建议了无标度网络演化模型的平均场方程为; 。 (7.4) 考虑t时刻,在t够大时近似有。在初条件下,可解得:,,即所有节点的度都以幂函数形式增加,但是同一时刻达到的度值不同,且在t够大时达到度分布遵循幂律的稳定演化状态。令,可得 ,以及。 注意到,与无关,由此得到: , (7.5) 代入前式,可得到: , (7.6) 在t够大时,忽略,有,其中(注意),即度分布遵循幂律。 如果网络照样增长,但是连接旧点是完全随机的,可以类似地列出平均场方程为: 。 (7.7) 可以类似地解出:,即度分布遵循指数函数。 7.3.3 无标度模型的其它最主要统计性质 已经推导出无标度模型的平均距离随N变化遵循函数:[1]。比较规则网、随机网、小世界网,随着网络尺寸N的增加,规则网的平均距离增加最快,无标度模型增加最慢,随机网居于中间,而小世界网又居于规则网和随机网之间。因此,如果只考虑平均距离如何随N变化,无标度网并不居于规则网与随机网之间。这再一次提醒我们,好的模型并不一定包罗万象,反之,它们常常针对实际系统一个重要规律,作出阐明。 也已经推导出无标度模型的平均集群系数随网络尺寸t增加而变化的规律为[4]: 。 (7.8) 随着网络尺寸的增加,规则网的平均集群系数完全不变化,衰减最慢;随机网衰减最快;无标度模型居于中间,而小世界网又居于规则网和无标度模型之间。 图7.10显示了数值模拟得到的无标度模型的谱密度。它与规则图或随机图的谱密度明显不同,也不是二者之间的过渡。插入图表示三角形谱密度的尾部近似地遵循幂律衰减。三角形谱密度表示特征向量集中在具有最大度的一些枢纽节点上。 图7.10 取时数值模拟得到的无标度模型的谱密度。N=100(实线), 300(长虚线), 1000(短虚线)。半圆表示随机图的谱密度作为对比(引自文献[1]) 7.4 BA无标度网模型的主方程解 本书2.4节已经介绍了主方程方法。本节介绍BA无标度网模型的主方程解[5]。 7.4.1 研究的问题是一个马尔柯夫链 2.4节已经介绍过,只有马尔柯夫过程或者马尔柯夫链才能使用主方程方法,因此应用主方程的第一步是证明待研究的问题是一个马尔柯夫链。 这里要研究的问题是:在第i时间步,即ti时刻,加入BA无标度网络的节点i在t时刻的度ki(t)是多少? 由于每一时间步加入的新点以概率连接旧点,所以任一个旧点i在t时刻的度ki(t)是一个随机变量,而且若节点i在t-1时刻的度为ki(t-1),则它在t时刻的度ki(t)只决定于它在t-1时刻的度,以及在t时刻是否连接新点,与t-1时刻之前的历史无关,因此这问题是一个马尔柯夫链。 7.4.2 主方程 令为节点i在t时刻具有度k的概率,考虑t时刻到t+1时刻的演化,可以把2.4节介绍的马尔柯夫链主方程变化为: , (7.9) 其中表示节点i的度从k-1一步转化为k的概率,也就是节点i在t时刻与一个新点连接的概率。在上一节中已经得到:每个新点连接m个旧点,每个旧点的连接概率为:。表示节点i的度从一步转化为的概率,即。因此,主方程可以写为: , (7.10) 边界条件为:,即t时刻的新点的度一定为m。 7.4.3 主方程的解[5,6](文献[6]对原始文献[5]的转述简明清晰,更适于国内读者): 把主方程改写为: 。 (7.11) 由准连续近似,有:。 一个特定节点s的平均度为:, 把上式两边乘k, 对k积分,由分部积分可得: , (7.12) 即:,且, (7.13) 得出通解: , (7.14) 由边界条件得到: 。 (7.15) 离散的分布律可以表述为函数形式。例如,对于分布:x = 0时,概率为p;x = 1时,概率为q,可以写成。类似地,可以把节点在t时刻度为k的概率分布写为: 。 (7.16) 令,注意到和的解是, 由函数的积分得 。 (7.17) 由上面的节点在t时刻度为k的概率分布式,可得到够大时,稳态分布为: , (7.18) 与平均场方法结果相同。 7.5 BA无标度网模型的率方程解 本书2.6节已经介绍了率方程方法。本节介绍BA无标度网模型的率方程解[7]。 7.5.1 率方程 文献[7]建议:BA无标度网模型每增加一个新节点,使具有度为k值的节点数Nk增加的速率为: , (7.19) 其中表示选取一个节点,其度为k-1的几率;表示度为k-1的节点的个数;表示取一个节点,其度为所有可能值的总几率(是被选的、度为j 的节点总数),因此表示一个新点连接旧点时正好选中度为k-1的节点的归一化几率;表示一个新点连接旧点时正好选中度为k节点的归一化几率(请注意:若选中k-1的节点,则Nk增加1(加上这个节点);若选中k的节点,则Nk减少1(这个节点的度将变为k+1);若选中其它度值的旧点,则与Nk的演化无关。);()表示新节点对Nk演化的贡献,只有讨论度为m值时才需要考虑这个点。 7.5.2 率方程的解[6-8] 定义为k节点的比例,为取一个节点,其度为所有可能值的归一化总几率,代入上面的率方程,可以得到一个递归方程: , (7.20) 由此可得到:。将代入,得到。 考虑BA模型的数值结果,设,把上式在准连续近似下变为积分,可得到近似解为: 。 (7.21) 对BA模型,有,只有在时才有,与上述平均场方法和主方程方法结果符合,如果在更一般的情况,则有。 7.6 部分优选、部分随机选择模型 可以认为,BA模型展示的无标度规律(幂律)与ER随机网模型展示的指数度分布是两个极端情况,自然界中的大多数实际网络的度分布介于这两者之间。好莱坞演员合作网与科学论文合著网的度分布可能是这种“中间度分布”的比较典型例子[9-12]。既然BA模型的核心是网络生长过程中的优选机制,而ER随机网模型的生长机制是随机选择,那么,描述这许多实际网络的演化模型就应该采取部分优选、部分随机的生长机制。刘宗华和来颖诚等人很可能是第一个提出这样的网络演化模型的人。他们建议的模型展示的度分布为幂律与指数函数的某种混合[13]。 刘-来模型中最重要的假设就是引入了一个可调参数,其变化范围为[0,1]。当取0时,刘-来模型就变成BA模型;当取1时,就变成随机网模型[13]。模型可以简单地表述为: 起始时考虑个节点,然后每一个时间演化步增加一个新节点,每个新节点发出条边连向已存在的节点。这些与BA模型完全一样。不同的是,在BA模型中,边的连接是按照几率进行的,即度大的节点有更大的几率获得新边,而刘-来模型认为除了这种优选机制之外,连边也会受到随机因素的影响。例如在万维网的网页节点链接过程中,除了按照网页的知名度(认为正比于它的度,即被链接的次数)去选择外,对于每个具体的网页设计者,还必须考虑许许多多各种各样的其它因素。极其大量的网页节点需要考虑的因素各不相同,千变万化,常常又没有相互的关联性,就相当于随机连接。有鉴于此,刘-来模型建议连接几率取如下形式: , (7.22) 其中为可调参数,刻画连接几率中确定性与随机性贡献的相对权重,求和对给定时间的所有节点进行。显然, 为新节点随机连向节点的几率, 则为新节点优选连向节点的几率。 通过与BA模型相似的推导,可得方程(6.22)导致的度分布为 , (7.23) 其中标度引子及常数分别为[13] 。 (7.24) 当时,方程(6.24)变成的幂律分布;当时, 方程(7.24)变成指数分布。 方程(7.23)与(7.24)是在假定为常数的条件下获得的。然而,实际过程中每个新节点所连的边数不一定完全相同,演化过程中可能随时间涨落。为了对这种情形建模,刘宗华、来颖诚等人选择一个常数,并假定可以在范围内变化。特别地,令,其中为具有零平均值,且均匀分布在内的随机变量。由类似推导可得[13] 。 (7.25) 这里标度指数与依赖于时间并可由下式给出 。 (7.26) 而为由下式定义的随机函数 。 (7.27) 当时, 。这说明当新节点的连接度有涨落时,刘-来模型的度分布具有与无涨落时相同的标度形式,只是标度指数随时间变化而已。进行平均时,标度指数就与的情形相同。也就是说这个模型具有对度涨落的鲁棒性。 这种可给出不同网络结构的一般网络模型也可由其他途径实现。比如我们可令连接几率取如下的非线性幂律优选形式 (7.28) 当在[0,1]内变化时,方程(6.28)将给出随机模型、BA模型以及它们之间所有情况的度分布[14-16]。文献[15]证实这种网络模型也具有对度涨落的鲁棒性。另一种实现度分布可调节的途径可通过令连接几率取如下的形式来实现 (7.29) 这里为初始吸引[5]。方程(6.29)导致的度分布为 (7.30) 其中。 7.7 局域世界模型 李翔和陈关荣在2003年发表了影响很大的“局域世界模型”[17](本节参考李翔教授对文献[17]的中文翻译稿写出)。他们列举了对世界贸易网(World Trade Web)的研究作为例子[18],说明由于全局信息常常缺乏,BA模型建议的“全局优选连接机制”通常只能在“从事选择”节点的某个或某些“局域世界”中起作用。在这个贸易网中,一个节点就代表一个国家;两个国家之间有贸易关系,则相应两个节点之间存在连接边。容易理解,许多国家都致力于加强与各自的区域经济合作组织(如欧盟(EU)、东盟(ASEAN)、北美自由贸易区(NAFTA)等)之内国家之间的经济合作和贸易关系,在这些区域经济合作组织内,才考虑优先与那些最强大的国家多进行贸易,而在这些区域经济合作组织之外则与许多国家很少贸易来往,也就谈不上选择。类似的例子还可以举出许多。他们由这个思想出发提出了局域世界模型。 模型可以表述为: 1、 网络初始时有m0个节点和e0条边; 2、随机地从网络已有的节点中选取M个节点,作为即将新加入网络的节点的“局域世界”; 3、 加入一个新节点和m条边,根据BA模型的优先连接概率来选择与局域世界中的m个节点相连,)。 当(极端情况1),新加入的节点与其局域世界中所有的节点相连接,优先连接原则已不起作用,本模型退化为6.3节中介绍的BA无标度网络模型的随机连接情况。可以类似地列出平均场方程为: 。 (7.31) 并且类似地解出:,即度分布遵循指数函数。 当(极端情况2),每个节点的局域世界其实就是整个网络,并且随着时间增长而增长,本模型退化为BA无标度网络模型,平均场方程为:,可以解出。 在的一般情况,局域世界模型的度分布当然会呈现指数分布与幂律分布之间的分布。李翔与陈关荣解析地证明了:这时,如果局域世界规模M被固定为一个远大于m的常数,则本模型同样具有与BA无标度网络相近的无标度特性,即。 李翔和陈关荣的局域世界模型进一步提出了复杂网络呈现指数分布与幂律分布之间分布的一种重要物理机制,为后来的进一步研究打下了基础。 7.8 赋权演化网络的BBV模型 本书在第二、五章中介绍过赋有表征节点相互作用强度、频率等意义的“边权”的赋权网络,以及各种赋边权的统计参量定义。除了边权的实际意义之外,越来越多的实验数据显示一些真实网络的拓扑结构与边权间可能具有某种相关性[19-28]。随着网络的逐步增长,新加入的节点必然会引起权重动力学的演化,从而导致节点强度与度之间的关联。如前所述,节点与之间的权重为,节点的点强度为,则许多实证研究表明点强度和度之间存在一种幂律关系[19-28] 。 (7.32) 比如, 对于科学论文合著网,点强度和度的关系为线性关系[12];而对于全球航空网,点强度和度的关系显示了非线性关系,其中[29]。 由此,容易推导出对具有幂律分布的无标度网络,其强度的分布也一定是幂律的。若无标度网络的度分布为,则其强度分布为,其中是强度分布指数。如果节点强度的范围在范围内,其中与分别为最小和最大强度,则利用条件,可得,,因此无标度网络的最大强度随网络大小的增加而增加。 从此出发,可以容易地理解赋权网络演化模型。这个模型最先是由巴黎特(Barrat),巴斯莱米(Barthelemy)与维斯匹纳尼(Vespignani)建立的,通常称为BBV模型[20,21]。BBV模型基于一个简单的权重驱动动力学假设,生成了与真实权重网络极为相似的统计性质,如网络权重随时间的增长演化规律,及强度分布的无标度性等。模型可以简述如下:从初始的个相互连接的种子节点开始网络生长,此时每条边的权重为,然后每步增加一个节点直到大小为。每步增加的节点发出条边,以如下的几率按照点强度优选连接到已有的节点 。 (7.33) 这个规则放弃了通常的度优选连接,而改用强度优选连接。模型定义每条新边的权重为,并且新边的存在会引起网络权重的变化。具体表现为:新点连接节点,会使它的点强度增加一个小量,从而使节点的点强度变为。这个新增加的小量将按如下方式分配到节点的其它边上 (7.34) 图7.11为这种网络增长过程的示意图,这里的为常数。文献[21]考虑了依赖于节点的情形。 图7.11 新增节点引起权重的重新分配示意图(引自文献[20])。 可以把设置为权重的标度,用它重新标度及等量。为简单起见我们令,于是BBV模型就只依赖于无量纲的参数。考虑到节点的点强度变化来自于两个方面:被连边及的邻居被连边,因此的演化可由如下方程给出 。 (7.35) 类似地,度演化的速率方程为 。 (7.36) 比较方程(6.35)与(6.36)可见,因此有,即方程(6.332)中的情况。从方程(6.35)与(6.36),进一步可得点强度分布及度分布,其中标度常数为[20,21] 。 (7.37) 因此BBV模型为无标度网络,其指数。当时,BBV模型恢复为BA模型。 类似地,我们可得出边权的演化方程。当节点或得到新边时,边i,j的权重就会增加,其对应的率方程可写为 。 (7.38) 从此方程可得边权的分布为,其中[20,21]。 7.9 可调集群系数的HK模型及其改进模型 小世界模型显示大的集群系数却不显示无标度特性,BA模型显示无标度特性却又不显示高集群系数。因此,构造出一种既有高集群系数又有无标度特性的网络就很有意义。实现此目的一个直观想法,是将BA网的集群系数调高。现已发现网络的集群系数可以通过多种方法进行改变,其中一个比较典型的方法是断边重连法[30-32]。其具体做法如下:随机挑选两条边,一条连接节点A与B,另一条连接节点C与D。让每个节点改变伙伴,则原始的边A-B与C-D就不复存在而代之以新边A-D与B-C。如果这个操作导致相关节点(A-D)上的集群系数之和变大,则此操作有效;否则放弃此操作,再重新选取两条新边。如此进行下去,就可增大网络的集群系数。这个方法的优点之一是在调节集群系数时,各节点的度及网络的度分布保持不变。 断边重连法是在网络结构已构造好以后才改变集群系数,另外一种比较典型的改变集群系数的方法是在网络的生长过程中进行调节与控制。其基本思想是考虑到集群系数实际上描述的是第三个节点与前两个节点一起形成三角形的几率,因此如果在网络的形成过程中有意让节点形成三角形,则可实现改变集群系数的目的[33-36]。这种方法是由荷尔姆(Holme)与金(Kim)提出的,我们称其为HK模型[33]。这种方法的依据是群落中一对新朋友的建立往往是通过他们共同的朋友介绍而成,这是一种进行新边连接的“三角形形成法”(TF)。TF做法为:如果节点与之间的一条边是前一步以优选法则连接的,则再增加一条边,从节点连向随机选择的节点的一个邻点,这样构成一个新的三角形。用TF法生成网络的HK模型可以简单地表述为:在BA生长模型中,当新加的节点发出条边到已存在的节点时,不是让它们全部按优选连接,而是按TF法进行连接。即当一个带有条边的节点被加到网络中时,第一条边以优选连接,然后剩下的条边以几率进行TF连接,以几率进行优选连接。平均来说,每个新加的节点以TF法连的边数为,这就是集群系数的控制参数。当时,此模型就变回BA模型。文献[33]证明用TF方法给出的度分布为。 最近,武晓雁与刘宗华将此方法推广到了具有群落结构的社会网[35]。他们考虑到这种网由若干个群落组成,群落内部的连线密度要远大于群落之间的连线密度,因此群落网可看成由若干个稀疏连线连接的群落构成[37]。除了群落内的连线用TF方法实现外,群落间的连线也应该用TF方法实现,即它们也可以是通过朋友介绍而成。由此,可调集群系数群落网的构造算法如下: 1、初始时,有个群落,每个群落内有个相互连接的节点。我们这里令。 2、在每个时间演化步,每个群落以几率加一个新节点,即增加的总节点为。每个新加的节点发出条边到同群落中的其它节点,我们这里取。第一条边以几率优选连接到节点,其中求和对同群落中所有的节点进行;第二条边则随机地以几率连到节点的一个邻居,以几率优选连接到同组中的另一节点。因此节点的演化方程为 (7.39) 其中项来自于节点的个邻居。 3、 在每个时间演化步,我们以几率在每个群落内用优选连接选择一个节点,并让它发出条边到其它群落内的个节点,即总增加的连线为。这个节点可这样选取:首先从其它两个群落中随机确定一个群落, 然后优选选出一个节点连第一条边;第二条边则以几率连向所选节点的任一邻居,以几率优选连向此组内的任意节点。它们对的演化贡献为 (7.40) 其中项来自于其它的两个群落。 4、重复步骤(2、)与(3、)直到每个组内的节点数为,即网络中的总节点数为,演化在时停止。 将上面两个方程加在一起得 。 (7.41) 通过简单计算可得其度分布为[35] 。 (7.42) 显然, 为幂律分布且与无关。 考虑到集群系数,,其中为节点的个邻居之间实际连接的边数。从算法(1、)到(4、)可知,正比于,因此我们有 。 (7.43) 即控制着集群系数。此模型的优点是其度分布与集群系数可分别地由可调变量与控制,并可连续的调节。图6.12显示了此模型集群系数随变化的数值验证, 其中“圆圈”与“三角形”分别代表与的情形,可见数值模拟与理式(21)式符合的很好。 图7.12 集群系数随的变化关系,其中”圆圈”与”三角形”分别代表与的情形。 7.10 JGN社会网络模型 社会网都在随时间演化,不断有新朋友加入与老朋友的淡出。除了刚刚讨论的HK模型及其改进模型外,现已发展了许多其它的社会网模型[38-42]。社会网通常包含如下一些特点: 1、固定的节点数:虽然朋友关系可维持数小时,数天或数年,但跟人的生命相比仍可当作小尺度,因此,在集中研究朋友关系时,可以近似地认为社会网的人数固定,没有生老病死。2、有限的度:当一个人的朋友数达到一定数目后,由于精力有限,交新朋友的速度就会大大降低。 3、大的集群系数:如果两个人有公共的朋友,他们成为朋友的可能性就会大增。 4、朋友关系的衰减:朋友关系存在一段时间后,如不增加新的营养就会衰减。 图7.13 (引自文献[38]) Jin, Girvan与Newman建议的社会网络模型一次运行产生的网络。 根据这些特点,金(Jin),吉文(Girvan)与纽曼(Newman)建议了一个社会网演化模型。JGN模型可以简单地表述如下[38]: 令为网络中的节点对数,为已存在边的数目,其中为第个节点的度。令为近邻对的总数,为节点结成对的速率,其中为相互都为朋友的节点对数目。然后, 1、在每一步,从网络中随机均匀地选对节点来相连。如果选的那对节点间没有连线,且这两个节点都没有达到最大连接数,则给它们加一条线。 2、在每一步,用正比于的几率随机选个节点。对每个选定的节点,随机地从它的邻居中选一对点。如果它们之间没有连线且它们都没有达到最大连接数,则在它们之间加一条线。 3、在每一步,用正比于的几率选个节点,其中为一常数几率。 对每个选定的节点,随机地从它的邻居中选一点并删去它们之间的连线。 图7.13显示了由此模型的一次运行产生的一个样本网络,其参数为与。这个网络的集群系数为,而其对应的随机网络为。 7.11 自组织耦合演化模型 在大多数复杂网络模型中,“网络的动力学”和“网络上的动力学”是分开的,研究者们常常忽视网络拓扑结构的形成和网络功能性质的涌现之间的相互影响。当网络结构与节点的动力学状态无关,或者这两方面的变化速度相当不同的时候,这样做是合理的。然而,在学术研究、艺术创作、金融交易、全球气候变化和大脑中神经元网络的突触可塑性等实际现象中,人们发现,结构和功能可以从同一个过程涌现出来,这时,节点的状态以及它们之间的相互作用都随时间演变,二者互相反馈。所以,对于这些问题,应该采用合适的、基于耦合演化机制的新模型。然而,只有很少的模型能同时自发涌现出网络的无标度结构和节点集体动力学[43]。另一方面,研究者们经常假设新节点知道整个增长网络的全局信息,而这对于规模巨大的系统而言通常是不可能的。从这种意义上来讲,需要建立基于局部相互作用机制的模型来了解能否从自组织动力学涌现整个系统的结构和功能性质。 网络节点的状态与连边关系协同演化的模型,可以称为耦合演化网络模型(co-evolution network model)[44],也称为自适应网络模型(adaptive network model)[45]。由局部信息引起连边关系的变化,从而导致宏观性质涌现的网络模型,则称为自组织网络模型(self-organized network)[46]。下面,我们介绍自组织耦合演化模型的一个例子——描述基于竞争排斥原理的无标度网络生成过程的模型。 在自然界的生态系统中,有些物种能够共存在同一环境下,并且以同样的食物资源为生。但是,在利用这些资源的方式上存在着微小但却非常重要的差别。比如,取食同一种植物为生的不同昆虫,有的吃嫩叶,有的吃老叶;有的从叶子正面取食,有的从反面取食;有的吃叶柄,有的吃茎干;有的在夜间进食,有的在白天进食;......。用生态学术语描述,则称它们占据着不同的生态位(niche),这就是“生态分离现象”。占据同一或者相近生态位的物种之间存在强烈的竞争。生存压力迫使它们的特性与局部平均水平逐渐偏离,并且渐渐引起物种的进化分歧。这是在长期的演化过程中,物种对于生存竞争作出的自发反应,是新物种形成与存活的重要因素。在生态学的教科书[47]上,这被归纳为竞争排斥原理,表述为:作为竞争的结果,几乎很难看到,两个相似的物种占据相似的生态位。相反,它们会这样地相互错开生态位,即,各自采用的食物和生活方式,可以使自身在竞争者面前占据有利的状态。或者简言之:没有两个占据同一生态位的物种能够共存。这又可以称作生态学的“泡利原理”。 最近,南京航空航天大学课题组建议推广、运用竞争排斥原理来理解其他类型的复杂系统[48]。推广的竞争排斥原理认为,个体迫于生存压力,倾向于表现得与众不同,从而不断更新自身的状态,同时,个体之间的关联也会相应地发生变化。这些自然倾向应该可以促成社会领域中的不同团体的产生,正如自然界中物种的形成一样。此外,耦合演化的相互作用可以导致复杂网络中多种类型的幂律的拓扑关系,以及像节点状态的多重分形、自发分级和进化分歧等一些功能的产生。 图7.14 (引自文献[48])三个迭代规则:a) 一个新节点连接到网络中原已存在的任意节点上(m=2,m0=4)。b)每个节点 i 随机选择其邻居 Jsed(i),并让其状态值在邻居Jmax(i)的值增加。c)如果年轻节点(I)与邻居节点J 的状态值比小于阈值 h,则将两者断开,同时,如果从邻居 j 中选出的节点中Jsed(j)与I 点的状态之间比值大于等于h时,就将Jsed(j)连接到I上。 南航课题组用三个迭代规则建立模型:(1)网络的演化开始于一个简单的、有m0个节点的完全图。给网络上每一个节点i分配一个介于(0,1)之间的随机实数w(i)作为初始状态。每个演化时间步内,将某个新节点i' 加入到现有的网络中,从i' 任意地连接m条边(m 图7.15 (引自文献[48])耦合演化的无标度网络的幂律度分布。a) h=3.0时的度分布,不同m值对应的线重合到单一的线上,其 =2.39;插图:当h=3.0和m=1时的入度分布β=2.0。b)h分别为3.0,4.0,5.0,6.0时,与阈值有关的度分布。插图:相应的入度分布,所有的直线中N=104,⊿I=10和m0=20. 图7.16 (引自文献[48])a) 同类性系数与网络大小相关的渐近幂律衰减:当N 103 ,,α与阈值h有关。b) 与网络大小有关的集群系数幂律衰退,。对网络位形做了10次系综平均。 节点状态和拓扑连接的耦合演化产生了复杂网络的大多数结构特性。数值模拟显示出节点度的幂律分布:,如图7.15a所示。这里对网络结构没有作系综平均。计算表明,在h=3.0的情况下,所有m值相应的度分布保持不变,斜率γ=2.39。入度是计算一个节点接受年轻节点所发出的连边的数目。该分布同样为幂律,如图7.15a的插图中所示。双对数线的斜率大概在β=2.0左右。这与引文网的一个模型[51]的数值结果以及实证数据[52,53]很好地吻合。图7.15b中展示了与关联阈值h有关的幂指数γ的变化。γ取值在(2.0,3.0)区间,这也和真实的复杂系统符合得很好。插图显示了不同阈值下的入度分布的幂律行为。另外,计算出的同类性系数r在图7.16a中表示,这种系数描述网络的度-度关联。它们反映了社会网络正相关的统计学特征。此外,它们也表现出网络规模的渐近的幂律衰减,即,。到目前为止,这是一个在本模型中首次发现的特殊性质。它有待于真实复杂系统的实证数据验证。图7.163b显示了与尺寸大小有关的集群系数:。指数范围为(1.2-1.4),对应的阈值范围为[3.0,8.0]。作为比较,随机图中值为1.0。 在较低阈值下(例如,h=2.0和1.5)的数值模拟显示,迭代规则会导致不同于幂律度分布的行为(详见图7.17的实线和虚线,无序度a=0.0)。然而,当我们允许一小部分节点(比如10%到20%,即无序度a=0.1和0.2)不运行规则3的截断操作的时候,可以迅速重新得到无标度特性(见图7.17)。同时,度-度关联重建了相应于无标度特性的正相关属性。这意味着由确定性规则制约的复杂系统中可能存在或多或少的规则弛豫,无序在无标度性质的形成中可能起着重要的作用。 图7.17 (引自文献[48])当h值较低(如:h分别为2.0和1.5,无驰豫:a=0)时的度分布偏离幂律,但是,分别引进10%(h=2.0,a=0.1和20%(h=1.5,a=0.2) 对规则(3)的驰豫后,幂律分布得到恢复.其他的参数与图7.15中的相同。 由竞争排斥引起的节点状态的更新过程和拓扑结构变化的相互联系导致了节点的集体行为,它表现为网络结构特性之外的功能特征。自发分级和多重分形就是本模型中最突出的结果。 节点状态的分级行为从耦合演化中自发地涌现。如图7.18所示,将所有的节点状态分成100个间隔,画出节点数量⊿N(L)的柱状图。结果表明节点状态的分布是相当不连续的,完全不同于初始的均匀分布,而且与原先的退出者模型[49]团体形成是可比的(见文献49图1)。从退出者模型中继承的,两端的两个突出的状态(见图7.18)可以被认为是具有消除中间基因型倾向的进化分歧的结果。在这里,同一地区的物种由于相似基因型之间存在强烈的竞争似乎使自身渐渐从局域的平均水平偏离。无论如何,对同域物种形成的耦合演化机制的适用性作详细研究是很有价值的。应用到引文网络中,这意味着长期的耦合演化会逐渐地消除处于中间水平的文章的发表机会。随之而来的是,文章的质量倾向于向两极分化。此外,超出退出者[49]模型的是,我们的数值结果还能支持自组织机制下的无标度网络的分级模型[54]的假设。但是,值得注意的是,不需要声誉等级的幂律函数作为优先连接的先决条件,无标度特性可以与他们模型的前提一起从耦合演化过程得到。 图7.18 (引自文献[48])节点数量⊿N(L)的柱状图,横坐标是节点状态值w(i)的离散化等级L。其中h=3.0,m=18,其他参数与图7.15(a)中的相同。 为了寻找节点状态整体的多重分形[55],首先根据节点参与到网络中的先后排成状态的时间序列。一旦最后一个节点加入到系统中,然后,让耦合演化停止,将节点状态的序列分成许多相同的长度为L的盒子,并且计算每个盒子n中i节点的状态值w(i)的总和,称为。从统计学角度看,与盒子的尺寸大小成幂律关系。第n个盒子中的奇异强度定义为幂律的指数 (7.44) 按这种方法,盒子能够根据的值组成不同的子集。子集α包含窗口α之内含有的所有盒子。子集α中的数密度N(α,L)是Hausdorff维度为f(α)的分形,即 (7.45) 奇异谱f(α)完全地刻画了节点状态w(i)序列整个测度的多重分形性质。我们可以使用合适地归一化的作的第q阶矩为节点序列分布的度量: (7.46) 然后给出α(q)和f(q)的定义,分别为下列形式: (7.47) (7.48) 这里δ=L/N,表示盒子大小和系统规模的比率。可是,豪斯多夫(Hausdorff)维数f(α)的定义仅当公式(7.48)中分子和分母对于不同δ取值时保持线性关系时才有效。我们可以分别定义,x=lnδ。在图7.19中心的至少4-5条线中可以看出这两者基本呈现线性关系。插图中显示出多重分形的奇异谱f(α)(N=9728,L=,l=1,2,…,6)。这里的情况不同于宋(Song)等人[54]对拓扑结构的分形的量度。有趣的是,我们的模型给出了以无标度网络作为内在骨架的以长程关联梯度驱动增长[56]的多重分形实体的另一个范例。我们发现,节点状态的多重分形与结构的无标度特性同时涌现或消失。我们检验了这两个特性在和ΔI∈[5,15]范围内的联系。所以,这样的模型为社会系统的无标度结构、多重分形以及正相关度关联提出了一个共同的新机制。 图7.19 (引自文献[48])根据相继加入到网络中的节点的时间次序,用盒子计数法检验节点状态多重分形的存在。插图:节点状态w(i)的多重分形的奇异谱f(a)。网络的h=3.0,m0=20,m=18. 结构和功能上的宏观特性的同时涌现使我们能够同时在可变细节的耦合演化的新平台上去理解因特网[56],通过不同的交通或者通信途径相连的居民点的复杂网络(有些是无标度的),其中包括全球空间范围内的人口分布网[57]。此外,还可以理解中纬度气候网络[58]、引文网络[52,53]、生态学网络中的物种数量分布[59]、音乐家网络[60]、演化最优算法的维持多样性的方法[53,61]等等。我们发现,它们都是由状态随时间改变的个体组成,个体之间的连边可以改变,并且这些系统中或多或少存在竞争排斥现象。事实上,本模型的机制是另一种优先连接机制。就是说,节点状态关联取决于阈值而不是依靠节点的度,这也是本模型与之前的其他模型的不同之处。虽然从退出者模型出发,却超越了退出者模型,我们可以计算个体的一般性质(更新状态使个体自适应于竞争排斥,而且他们之间的关联相应地发生改变)作为在一些复杂系统自组织演化的驱动力。这些系统以不同拓扑量的幂律分布和具体的功能为特征。进一步地,从竞争排斥耦合演化过程的模型出发,我们期望得出认识具有相似机制的不同复杂系统的涌现特性,例如无标度、物种分化、度相关性以及多重分形性质的一般思路。 除了网络的无标度拓扑性质与具体功能的协同涌现以外,耦合演化网络(自适应网络)模型还可以描写网络上的动力学和拓扑结构的跃变现象。从不同的研究角度来认识,可以描述为分岔或者相变。 一些接触过程描写了某种性质,例如信息、政治观点、宗教信仰或者传染病沿着网络中连边的传播,它们给出了研究动态相互作用的一个简单框架。这一类问题中最简单的模型是传染病流行的SIS模型。该模型描述一群形成社会网络的个体。每个时间步内,所考虑的每个个体或者是易感染疾病的(S)或者已经感染疾病的(I)。一个易感染疾病的个体与已感染个体在接触后以一定的概率p被感染。已感染的个体以概率r康复,即再一次转变为易感染体。如果在静态网络上考虑,SIS模型至多只有一次动态转变。在转变之前,只有无疾病态是稳定的,一旦经过转变之后,可以产生在感染态在整个网络上蔓延的传染病状态。 如果考虑易感染个体可以试着避免与已感染个体接触这样一个附加过程,空间SIS模型可以变为一个自适应网络模型。这种情况已由格罗斯(Gross)等人研究过[45]。在他们的模型中,一个给定的易感染个体以概率w与一个已感染的邻居断开连接,并与另一个易感染个体之间形成一条新的连接。正是这一附加规则将SIS模型变成一个自适应网络。正如格罗斯等人在文献[45]中所述:即使是适度的重连概率也能有效地改变系统的动力学。在无疾病态和感染态中均会出现意想不到的非连续转变和双稳区域(见图7.20)。爱尔哈德(Ehrhardt)[62]等人也报道过相似的发现,他们在一个适应性的网络上研究了更新的传播以及相似的现象。 图7.20 (引自文献[45])格罗斯(Gross)等人研究的两种参数的分岔图。分岔点将两种动力学机制的区域在参数空间分割开来,这两种动力学机制定性的来说是存在差别的。点划线标示了一个过渡临界分支,它对应于无疾病系统中流行病能够传染的阈值。系统中既有流行病能够继续存在的区域以鞍节点分支(虚线)、Hopf分支(实线)和循环的褶皱分支(点线)为边界。 文献[45]中的自适应SIS模型在较高的重连比率下会到达振荡态,这时流行病的传播呈周期性变化。一方面,重连过程孤立了已感染个体,从而减轻疾病的传播。另一方面,重连过程引起易感染个体之间连边的累积,因此,形成内部紧密连接的集团。起始阶段,孤立效果起主要作用,能降低已感染个体的密度。但是,当易感染个体的集团变得更大且连接更强时,出现一个阈值,超过阈值时,传染病会在易感染的人群中传播。这会导致易感染个体的集团崩溃,流行病传染加快,从而构成了一个循环。该循环在上述模型中仅存在于较窄的区域内(见图7.20),此参数区域出现了振荡。如果考虑重连比例会与人群的意识进而与传染病的流行程度相关联,那么,振荡幅度会变大。 在自适应SIS模型中,上面讨论的自适应网络的特点会再次出现:已感染个体的孤立和单个的紧密连接的易感染个体的集团的涌现,这是从局部规则出发导致全局结构的一个例证。 研究自适应网络的另一种方法是应用统计物理学思想,该方法可以以相变的形式来揭示临界点。这种相变的一个实例可以参看荷尔姆(Holme)和纽曼(Newman)合写的论文[63]。该文特别讨论了人群中观念的形成,例如宗教信仰,其可能存在的信仰种数只受人群规模的。不同信仰的邻居之间以φ的概率说服对方,以1-φ的概率来重新选择邻居。 最终,这会导致网络进入一个状态,此时,网络为一些不连通的子网,而每个子网中的人均拥有一致的观念。当时,人们的观念无变化,最终网络当中观念的分布与初始分布相同。当时,没有重连发生,在最终的状态中,观念的种数不会超过网络初始状态时非连通子网的个数。应用有限尺寸的标度分析方法,Newman和Holme指出在这些极端状态的中间状态中,存在一个临界值,在该处,网络会发生连续相变。并且在相变点,可以观察到临界转变的减慢过程。这样,网络需要一个相当长的时间来达到状态。在这种状态,不同观念的信奉者人数趋向于幂律分布。 由荷尔姆(Holm)和纽曼(Newman)所提出的相变可能正是造成[63]中结果的关键因素。在另一篇文章中,吉尔(Gil)和詹尼特(Zanette)[]用相似的模型研究了两种抵触观念之间的相互竞争。在这种情况下,矛盾通过说服邻居或者断开连接来解决。这表明,一个临界点是存在的,在该处,网络的状态只有非常少的连接能够存在。基于之前的结果,我们可以猜想这是相变点附近临界慢化的直接结果。 由于耦合演化网络(自适应网络)模型能够同时描写复杂系统中相互作用结构和功能的涌现过程,它已经被人们广泛地关注,并且将会成为未来复杂网络理论和实证研究的重要方向。目前已经有不少文章发表。一个比较全面的综述文章[65]已经刊载在Journal of Royal Society--Interface杂志上。 7.12 其它运用统计物理学方法的模型研究 7.12.1 WS小世界模型和BA无标度模型的改进模型 WS小世界模型和BA无标度模型在科学界,特别是理论物理学界产生了很大影响,有不少人追随他们,提出改进的模型或进行进一步的研究。本节列举这些论文中的很少一部分。 纽曼等人(Newman和Watts)在1999发表文献,其中特别值得注意的是讨论了WS小世界模型上信息或流行病传播的逾渗相变及其临界性质[66]。 多罗果夫切夫等人(Dorogovtsev和Mendes)在2000年发表文献,建议在BA无标度模型中增加对节点活性随年龄衰减的考虑。这样改造后的模型的平均场方程更难于求解,但是作者仍旧得出了解析结果[67]。这两位作者还在2001年建议在BA无标度模型中考虑节点数目加速增加的情况,并且同样作出了平均场解析[68]。 Chneg X, Wang H and Ouyang Q(欧阳颀)在2002年建议了一个包含两类不同节点和两类不同边的网络演化模型,并且作了平均场解析[69]。作者们是从事包括生物系统的复杂系统研究的,他们很清楚在典型的复杂系统中基本单元和它们之间的作用都是多类型的。这篇论文提出的重要问题恐怕至今还没有受到足够重视。 7.12.2 一些网络拓扑统计性质的解析求解 清华大学的Yao, Zhang, Chen和Li在2005年报道了他们在广义BA无标度模型中用平均场方法和率方程对集群度分布以及集群度与度的相关性作了解析研究[70]。 南京航空航天大学的田亮, 朱陈平、施大宁、古志鸣以及中国科技大学的周涛在2006年报道了他们建议的一个考虑节点不同活性,并且其活性可以改变的网络演化模型,并且用主方程和平均场方法解析得到了模型产生网络的度分布和集群系数[71]。 华中科技大学的关治宏和Wu在2008年建议了一个考虑节点之间物理位置及其距离的网络演化模型,并且用平均场方法作了解析[72]。 7.12.3 含权网网络演化模型 实际网络中节点之间的相互作用强度都是不同的,把作用强度作为边权是合理的考虑,所以含边权网比不含权网含有更多的信息。约克等人(Yook S H, Jeong H, Barabasi A-L and Tu)在2001年可能首先建议含权的无标度网络演化模型,并且作了平均场分析[73]。 巴斯勒米等人(Barthelemy M, Barrat A, Pastor-Satorras R and Vespignani)在2005年对含权网的研究作了一个综述[74],非常有参考价值。 Pan, 李翔和汪小帆在2006年报道了对含权局域世界网络演化模型的研究,并且作了平均场近似的解析[75]。 7.12.4 生成函数的应用 搭拉斯塔等人(Dall’Asta, Marsili and Pin)在2007年发表预印件[76],建议了一个节点在进行某种任务时形成集体行为的模型,在解析中用到许多方法。作者们强调生成函数方法十分有用。 生成函数的应用十分广泛,下一小节还要举出刘宗华和胡斑比用生成函数方法求解流行病传播模型的例子。 7.12.5 复杂网络上流行病的传播的一些解析研究 复杂网络上物质、信息、或者能量的传播是具有重要理论和实际意义的研究课题,本书在第八章中还要更仔细地介绍。 克莱兹科夫斯基等人(Kleczkowski和Grenfell)在1999年报道了他们对小世界网络上麻疹一类(康复后可免疫)流行病传播的研究。作者列出了作为平均场近似的SIR方程,并且得到了解析解[77]。这可能是第一篇关于复杂网络上流行病传播的重要论文,它说明了小世界网络中的少数随机跳跃边大大加快了流行病的传播。 帕斯托等人(Pastor-Satorras and Vespignani)在2001年用平均场近似(SIS方程)解析地讨论了无标度网络上肺结核一类(康复后不可免疫)流行病的传播。这篇论文影响很大,发表后引起了热烈的讨论。这主要是由于它的平均场解析导出了一个重要结论,即一个无标度网络上流行病传播的有效传染几率阈值为零[78]。以文献[79,80]为代表的一批论文在此后热烈的讨论了这个问题,指出了例如网络大小、网络集团结构等多种因素对流行病传播阈值的影响。 在文献[81]中,刘宗华和胡斑比曾经用生成函数方法帮助求解一个他们提出的在具有群落结构的复杂网络上流行病传播的模型,这是另一个生成函数方法在复杂网络研究中应用的例子。 Shi、段志生和陈关荣在2008年用平均场方法(SIS方程)解析讨论了一个有新特色的、各种拓扑结构复杂网络上流行病的传播模型,并且建议了防止流行病传播的新策略[82]。 7.12.6 一些可严格解析的复杂网络模型 利用数学家研究的结论,构造可严格解析的网路模型,以求对复杂网络的拓扑结构与统计性质的关系有更好理解,这是网络研究的一个方向。本节仅举两个例子。 周涛、严钢和汪秉宏提出了随机阿波罗网络(RAN)模型[83]。它由阿波罗网络[84]引入随机化规则得到,是一种最大可平面网络。RAN具有较大的集群系数和较小的平均距离,同时兼有小世界与无标度两种特征,并且集群系数与度的相关性遵从C(k)~ k-1,很好地反映了真实系统的统计性质。他们采用率方程方法解析得到了度分布的幂律指数和集群系数的表达式。此外,他们还研究了RAN的鲁棒性、渗流和流行病传播过程,发现RAN对于恶意攻击的反应在节点数目N较小时不敏感地依赖于N,这与BA网络的情况相反。对于流行病的早期传染速度,在RAN上的传播比BA网络上慢。这可能表明,大的集群系数会降低流行病在爆发期的传播速度。有趣的是,吴枝喜等人[85]另辟蹊径,采用主方程方法给出了RAN度分布的严格推导过程,他们的结果与周涛等人的解析表达式具有相同的渐近行为。 章忠志等建议了一个介于规则和小世界网络之间的演化模型,这模型可以演示从“大世界”到小世界网络的相变。他们还解析得到了度分布、集群系数、平均距离等性质的表达式[86]。 第七章参考文献 [1] R. Albert and A-L. Baraba´si, Rev. Mod. Phys., 74 (2002) 47. [2] D. J. Watts and S. H. Strogatz, Nature, 393 (1998) 440. [3] A-L. Barabasi and R. Albert, Science, 286 (1999) 509. [4] 汪小帆、李翔、陈关荣,复杂网络理论及其应用,2006,北京:清华大学出版社。 [5] S. N. Dorogovtsev, J. F. F. Mendes and A. N. Samukhin, Phys. Rev. Lett., 85(21) (2000) 4633. [6] 史定华、刘黎明,演化网络——模型、测度及方法(郭雷、许晓明等主编,复杂网络),2006,上海:上海科技出版社,1-27页。 [7] P. L. Krapivsky, S. Redner and F. Leyvraz F, Phys. Rev. Lett., 85(21) (2000) 4629. [8] 史定华,复杂网络的随机刻画和演化规律,将发表于“力学进展”,2008。 [9] P. P. Zhang, K. Chen, Y. He, T. Zhou, B. B. Su, Y. Jin, H. Chang, Y-P. Zhou, L-C. Sun, B-H. Wang, D-R. He, Physica A, 360 (2006) 599. [10] H. Chang, B. B. Su, Y-P. Zhou, D-R. He, Physica A, 383 (2007) 687. [11] M. E. J. Newman, Phys. Rev. E, (2001) 016131; (2001) 016132. [12] A-L. Barabasi, H. Jeong, Z. Neda et al., Physica A, 311 (2002) 590. [13] Z. Liu, Y-C. Lai, N. Ye and P. Dasgupta, Phys. Lett. A, 303 (2002) 337. [14] P. L. Krapivsky, S. Redner and F. Leyvraz, Phys. Rev. Lett., 85 (2000)4629。 [15] Z. Liu, Y-C. Lai, N. Ye, Phys. Rev. E, 66 (2002) 036112。 [16] T. Zhou, B-H. Wang, Y. Jin, D-R. He, P. P. Zhang, Y. He, B. B. Su, K. Chen, Z.–Z. Zhang and J–G. Liu, Int. J. Mod. Phys. C, 18 (2007) 297. [17] X. Li and G. R. Chen, Physica A, 328 (2003) 274. [18] X. Li, Y. Y. Jin, G. Chen, Physica A, 328 (2003) 287. [19] T. Antal and P. L. Krapivsky, Phys. Rev. E, 71 (2005)026103. [20] A. Barrat, M. Barthelemy and A. Vespignani, Phys. Rev. Lett., 92 (2004) 228701. [21] A. Barrat, M. Barthelemy and A. Vespignani, Phys. Rev. E, 70 (2004) 066149. [22] W -X. Wang, B -H.Wang, B. Hu, G. Yan and Q. Ou, Phys. Rev. Lett., 94 (2005) 188702. [23] W -X. Wang, B. Hu, T. Zhou, B -H.Wang and Y.-B. Xie, Phys. Rev. E, 72 (2005) 046140. [24] Z. Wu, X. Xu, and Y. Wang, Phys. Rev. E, 71 (2005) 066124. [25] W -X. Wang, B. Hu, B -H.Wang and G. Yan, Phys. Rev. E, 73 (2006) 016133. [26] M. Tang, Z. Liu and J. Zhou, Phys. Rev. E, 74 (2006) 036101. [27] M. Tang, Z. Liu, Commun. Theo. Phys., 49 (2008) 252. [28] M. Tang, Z. Liu, X. Zhu and X. Wu, Int. J. Mod. Phys. C, 19 (2008) 927. [29] A. Barrat, M. Barthelemy, R. Pastor-Satorras and A. Vespignani, Proc. Natl. Acad. Sci., 101 (2004) 3747. [30] S. Maslov and K. Sneppen, Science, 296 (2002) 910. [31] V. M. Eguiluz, G. Cecchi, D. R. Chialvo, M. Baliki and A. V. Apkarian, e-print cond-mat/0309092. [32] B. J. Kim, Phys. Rev. E, 69 (2004) 045101. [33] P. Holme and B. J. Kim, Phys. Rev. E, 65 (2002) 026107. [34] S. N. Dorogovtsev, J. F. F. Mendes and A. N. Samukin, Phys. Rev. E, 63 (2001) 062101. [35] X. Wu and Z. Liu, Physica A, 387 (2008) 623. [36] M. E. J. Newman, Phys. Rev. E, (2001) 025102. [37] Z. Liu and B. Hu, Euro. Phys. Lett., 72 (2005) 315. [38] E. M. Jin, M. Girvan and M. E. J. Newman, Phys. Rev. E, (2001) 046132. [39] J. Davidsen, H. Ebel, S. Bornholdt, Phys. Rev. Lett., 88 (2002) 128701. [40] M. E. J. Newman, Phys. Rev. E, 68 (2003) 026121. [41] J. D. Noh, H. Jeong, Y. Ahn and H. Jeong, Phys. Rev. E, 71 (2005) 036131. [42] Q. Xuan, Y. Li and T. Wu, Phys. Rev. E, 73 (2006) 036105. [43] R. Albert and A-L. Barabási, Phys. Rev. Lett., 85 (2000) 5234; S. Mossa, M. Barthelmy, H. E. Stanley and L. A. N. Amaral, Phys. Rev. Lett., 88 (2002) 138701; G. Bianconi and M. Marsili Phys. Rev. E, 70 (2004) 035105; K. Park and Y-C. Lai, Phys. Rev. E, 72 (2005 ) 026131. [44] A. Barrat, M. Barthelemy and A. Vespignani Phys. Rev. Lett., 92 (2004) 228701; S. Bornholdt and T. Rohlf, Phys. Rev. Lett.m 84 (2000) 6114; C-P. Zhu, S-J. Xiong, Y-J. Tian, N. Li and K-S. Jiang, Phys. Rev. Lett., 92 (2004) 218702; P. Fronczak, A. Fronczak and J. Holyst, Phys. Rev. E, 73 (2006) 046117; Y-B. Xie, W-X. Wang and B-H. Wang, Phys. Rev. E, 75 (2007) 026111; M. G. Zimmermann, V. M. Eguluz and M. S. Miguel, Phys. Rev. E, 69 (2004) 065102; P. Holm and M. E. J. Newman, Phys. Rev. E, 74 (2006) 056108; M. Liu and K. E. Bassler, Phys. Rev. E, 74 (2006) 041910; C-S. Zhou and J. Kurths, Phys. Rev. Lett., 96 (2006) 1102; J. M. Pacheco, A. T. Traulsen and M. A. Nowak, Phys. Rev. Lett., 97 (2006) 258103. [45] T. Gross, C. Dommar D’Lima, B. Blasius, Phys. Rev. Lett., 96 (2006) 208701. [46] R. Albert and A-L. Barabási, Phys. Rev. Lett., 85 (2000) 5234; S. Mossa, M. Barthelmy, H. E. Stanley and L. A. N. Amaral, Phys. Rev. Lett., 88 (2002) 138701; G. Bianconi and M. Marsili, Phys. Rev. E, 70 (2004) 035105; K. Park and Y-C. Lai, Phys. Rev. E, 72 (2005) 026131; T. Zhou, B-H. Wang, P-L. Zhou, C-X. Yang and J. Liu Phys. Rev. E, 72 (2005) 046139. [47] J. L. Chapman and M. J. Reiss, Ecology: Principles and Applications, 2nd ed, 1999, Cambridge: Cambridge University Press, p 110. [48] C-P. Zhu, T. Zhou, H-J. Yang, S-J. Xiong, Z-M. Gu, D-N. Shi, D-R. He, B-H. Wang, New J. Phys., 10 ( 2008) 023006. [49] P. Dittrich, F. Liljeros, A. Soulier and W. Banzhaf Phys. Rev. Lett., 84 (2000) 3205; A. Soulier and T. Halpin-Healy, Phys. Rev. Lett., 90 (2003) 258103; A. Grolund and P. Holme Phys. Rev. E, 70 (2004) 036108. [50] T. Kalisky, L. A. Braunstein, S. V. Buldyrev, S. Havlin and H. E. Stanley, Phys. Rev. E, 73 (2006) 025103. [51] A. Vázquez, Phys. Rev. E, 67 (2003) 056104. [52] D. Braha and Y. Bar-Yam, Phys. Rev. E, 69 (2004) 016113; C. R. Myers, Phys. Rev. E, 68 (2003) 046116. [53] S. Fotunato et al., Phys. Rev. Lett., 96 (2006) 218701. [54] A. Chahabra and R. V. Jensen, Phys. Rev. Lett., 62 (19) 13;19, C-P. Zhu and S-J. Xiong, Phys. Rev. B, 63 (2001) 193405. [55] H. A. Makse, S. Havlin and H. E. Stanley, Nature 377 (1995) 608. [56] R. Pastor-Satoras, A. Vazquez and A. Vespignani, Phys. Rev. Lett., 87 (2001) 258701. [57] J. Ozik and P. J. Roebber, Phys. Rev. E, 72 (2005) 046213. [58] A. A. Tsonis and P. J. Roebber, Physica A, 333 (2004) 497. [59] D. I. Iudin and D. B. Gelashvily, Nucl. Instrum. Methods A, 502 (2003) 799; S. Souissi et al., Nonlinear Anal.: Real World Appl., (2005) 6705. [60] P. Cano and M. Koppenberger Proc. 5th Int. Symp. on Music Inf. Retr. (ISMIR’04), 2004 (Barcelona, Spain, October). [61] T. Back, D. B. Fogel and Z. Michalewicz ed. Handbook of Evolutionary Computation, 1997, Bristol: Institute of Physics Publishing. [62] G. C. Ehrhardt, M. A. Marsili, F. Vega-Redondo, Phys. Rev. E, 74 (2006) 036106. [63] P. Holme, M. E. J. Newman, Phys. Rev. E, 74 (2007) 056108. [] S. Gil and Phys. Lett. A, 356 (2006) ; D. H. Zanette and S. Gil, Physica D, 224 (1-2) (2006) 156. [65] T. Gross and B. Blasius, J. Royal Soc.—Interface, 5 (2008) 259. [66] M. E. J. Newman and D. Watts, Phys. Rev.E., 60(6) (1999) 7332. [67] S. N. Dorogovtsev, J. F. F. Mendes, Phys. Rev. E, 62(2) (2000) 1842. [68] S. N. Dorogovtsev, J. F. F. Mendes, Phys. Rev. E, 63 (2001) 025101(R). [69] X. Chneg, H. Wang and Q. Ouyang, Phys. Rev. E, 65 (2002) 066115. [70] X. Yao, C-s. Zhang, J-w. Chen, Y-d. Li, Physica A, 353 (2005) 661. [71] L. Tian, C-P. Zhu, D-N. Shi, Z-M. Gu, T. Zhou, Phys. Rev. E, 74 (2006) 046103. [72] Z-H. Guan and Z-P. Wu, Physica A, 387 (2008) 314. [73] S. H. Yook, H. Jeong, A-L. Barabasi and Y. Tu, Phys. Rev. Lett., 86(25) (2001) 5835. [74] M. Barthelemy, A. Barrat, R. Pastor-Satorras and A. Vespignani, Physica A, 346 (2005) 34. [75] Z. Pan, X. Li and G. R. Chen, Phys. Rev. E, 73 (2006) 056109. [76] L. Dall’Asta, M. Marsili and P. Pin, ArXiv: 0712.3906v1 [physics.soc-ph] [77] A. Kleczkowski, B. T. Grenfell, Physica A, 274 (1999) 355. [78] R. Pastor-Satorras and A. Vespignani, Phys . Rev. Lett., 86 (2001) 3200. [79] V. M. Eguı´luz and K. Klemm K, Phys . Rev. Lett., (10) (2002) 108701. [80] R. Pastor-Satorras and A. Vespignani A, Phys . Rev. E, 65 (2002) 035108(R). [81] Z. Liu and B. Hu, Europhys. Lett., 72 (2) (2005) 315. [82] H. Shi, Z. S. Duan and G. R. Chen, Physica A, 387 (2008) 2133. [83] T. Zhou, G. Yan, and B. H. Wang, Phys. Rev. E, 71 (2005) 046141. [84] J. S. Andrade, Jr., H. J. Herrmann, R. F. S. Andrade and L. R.da Silva, Phys. Rev. Lett., 94 (2005) 018702. [85] Z.-X. Wu, X.-J. Xu and Y.-H. Wang, Phys. Rev. E, 73 (2006) 058101. [86] Z-z. Zhang, S. Zhou, Z. Shen, J. Guan, Physica A, 385 (2007) 765.