数学家是一种把咖啡变成定理的机器。
A mathematician is a machine for turning coffee into theorems.
Alfred Renyi
Alfred Renyi
随机图的历史
在 1959 和 1968 年期间,数学家 Paul Erdos 和 Alfred Renyi 发表了关于随机图(Random Graph)的一系列论文,在图论的研究中融入了组合数学和概率论,建立了一个全新的数学领域分支—随机图论。

随机图的定义
本文只关注无向图的场景。顾名思义,随机图(Random Graph)就是将一堆顶点随机的连接上边。好比在地上撒了一堆豆子,而豆子之间是否用线来相连是根据某个概率值来确定的。通常来说,对于随机图而言有两种定义方式
- 【定义一】给定
和
的定义是随机从
个顶点和
条边所生成的所有图集合中选择一个。其中,这样的图集合的势是
因此获得其中某一个图的概率是
- 【定义二】给定
和
,
的定义是有
个顶点,并且两个顶点之间以概率
来决定是否连边。
事实上,这两个定义是等价的, 个顶点的图最多拥有的边数是
而
恰好有
条边,并且它们分配的概率是均等的,因此两个顶点之间是否存在边的概率就是
这里的
指的是组合数。i.e.
另一方面,对于 而言,顶点两两之间是否存在边的概率是
而
个顶点的图最多拥有
条边,于是边数为
i.e.
进一步地,通过以上两个公式可以得到:
在定义一中,可以直接算出所有顶点的平均度是 但如果要计算图的其余指标,用第二种定义
反而更加容易,因此后续将会重点关注第二种定义,为方便起见,记号简化为
随机图的度
图的度(degree)指的是对于某个顶点而言,与它相关联的边的条数。对于随机图 而言,它的边数大约是
最多与该节点相连接的顶点数为
整个图的顶点平均度是(边数 * 2) / 顶点数,用记号
来表示,意味着顶点平均度是
当
充分大的时候成立。换言之,

对于随机图 中的一个顶点
而言,我们想计算它恰好有
条边的概率值。事实上,对于除了
之外的
个点而言,有
个顶点与
相连,
个顶点与
不相连,其概率是
同时需要从这
个点中选择
个点,因此,顶点
的度恰好是
的概率是
特别地,当 时,上述概率近似于泊松分布(Possion Distribution)。事实上,
并且
因此,在 时,
近似于泊松分布,
随机图的连通分支
对于随机图 而言,它的连通分支个数是与顶点的平均度
息息相关的。特别地,当
时,每个顶点都是孤立的,连通分支个数为
当
时,任意两个顶点都有边相连接,整个图是完全图,连通分支的个数是
顶点的平均度从
到
的过程中,连通分支的个数从
演变到
最大连通分支顶点数从
演变到
那么在这个变化的过程中,最大连通分支的顶点数究竟是怎样变化的呢?是否存在一些临界点呢?数学家 Erdos 和 Renyi 在 1959 年的论文中给出了答案:
对于随机图 而言,用
表示最大连通分支的顶点个数,那么对于图的平均度
而言,
- 当
那么
- 当
那么
- 当
那么巨连通分支(Giant Component)存在,同时存在很多小的连通分支,在临界点
的附近时,
这里
- 当
那么图
是全连通图,i.e.
在这个定理中,对于顶点的平均度 而言,存在两个临界点,分别是
和
当
时,巨连通分支不存在,所有连通分支的量级都在
以下;当
时,巨连通分支开始出现,量级大约是
当
时,随机图存在一个巨连通分支和很多小的连通分支;当
时,图是连通图。

整个定理的证明有点复杂,但本文将会介绍两个临界点的计算。先来考虑第一个临界点 的情况:
用 来表示随机图
中的最大连通分支的顶点个数,
表示图
中不在最大连通分支的顶点比例,i.e.
图的顶点不在最大连通分支的概率。
对于不在最大连通分支的顶点 而言,其余的
个顶点分成两种情况,Case(1):要么
与之不相连,此时概率是
Case(2):要么
与之相连,但此时的顶点不能在最大连通分支中,那就只能在剩下的
个顶点中,其概率是
于是,对于所有顶点而言,它不在最大连通分支的概率是
于是,
根据 和
可以得到当
充分大时,有
令 它表示最大连通分支的顶点个数在所有顶点个数的占比,从而可以得到近似方程:
令 则
它的导数是
通过计算可以得到:
- 当
时,
在
上成立,i.e.
在
上的唯一解是
换言之,
- 当
时,
在
成立,
在
成立。换言之,
在
上除了零之外还有解
此时会存在巨连通分支,
是解。
因此,最大连通分支的顶点数在这个点会出现突变, 是该方程的第一个临界点,并且是出现巨连通分支的临界点。
再来考虑第二个临界点 的情况。对于极限状况而言,假设仅有一个顶点不在最大连通分支中,那么
此刻,
两边求对数可以得到 因此,
也是一个临界点,并且是出现全连通图的临界点。
随机图的六度分离
六度分离又称为小世界现象,它的含义是在地球上任意选择两个人,他们之间最多相隔 个相识关系。换言之,来自世界上任何地方的两个人都可以通过不超过
个相识关系所连接起来。

图中两个顶点的距离定义为两个顶点之间的最短路径长度,图的直径就是图中任意两点的距离的最大值。对于随机图 而言,如果
则是不连通的,因此通常只需要考虑
的情况,甚至只考虑
的全连通图。任取一个顶点
,则有
个距离为
的顶点;
个距离为
的顶点;
个距离为
的顶点;
个距离为
的顶点;
同时, 而言,顶点的个数为
这意味着
通过等比级数的公式可以得到
因此,
而随机图的直径的量级是与 成正比的,因此,随机图的直径量级同样是
如果
并且每个人认识
个人,于是随机图的直径量级是
参考文献
- Erdos Renyi Model:https://en.wikipedia.org/wiki/Erd%C5%91s%E2%80%93R%C3%A9nyi_model
- Giant Component:https://en.wikipedia.org/wiki/Giant_component
- Erdős P, Rényi A. On the evolution of random graphs[J]. Publ. Math. Inst. Hung. Acad. Sci, 1960, 5(1): 17-60.
- Albert R, Barabási A L. Statistical mechanics of complex networks[J]. Reviews of modern physics, 2002, 74(1): 47.
- 《巴拉巴西网络科学》,艾伯特-拉斯洛·巴拉巴西(Albert-LászlóBarabási),2020.