数据准备与处理
完成课程作业时,搜集了国内城市的地铁网络资料,共计4230个地铁站,为每个城市使用原始法构建出地铁网络,并计算每个网络的几何特征指标,进行相互比较,得出地铁网络演化的基本规律。本文将以深圳为例,介绍可视化和鲁棒性分析步骤,研究枢纽节点与附近交通和土地利用的关系。
深圳全市面积1997.47平方千米,海域面积1145平方千米,下辖9个行政区和1个新区。
截至2020年,全市常住人口1756万,地铁运营里程为422.6千米,位于中国内地第五名,运营线路十一条,地铁站点为236个。
地铁网络构建
原始法:以地铁站点为节点,如果地铁站点之间存在一条地铁线路可以直接到达,中途未发生停靠,则认为这两地铁站之间存在一条边。
对偶法:以地铁线路作为节点,如果存在两地铁线路在同一地铁站点会发生停靠,则认为这两节点之间存在边。
本文以原始法来构建复杂网络,因为地铁建设成本高,占地面积大,所以受其物理性质影响,城市的地铁线路较少,故使用对偶法研究地铁网络难以反应网络基本性质,无法获得有价值的结论。
地铁网络数据获取
通过编程获得一份名称为全国地铁站信息的数据集,数据集包含站点的名称、POI编号,拼音名称、地铁站经度、纬度、路线名称和城市名称。
原始数据
地铁网络数据处理
对数据集进行处理,以深圳地铁站的信息绘制出网络的点和边的表格,点表格以地铁站为节点、地铁线路为标签和地铁站的经纬度表示位置,边表格反应了地铁站之间的连接关系,最后利用Gephi对网络进行可视化。
同样利用python编程构建各个城市的地铁网络,使用Networkx库计算网络的几何特征进行评价分析。
软件操作
1. 打开gephi软件,导入点表格,字符集应选择GBK,图的类型选择无向图。
导入点表格
2. 按照上一步相似的步骤,导入边表格,最后获得一张无向图。
生成图
3. 利用Geo Layout插件使网路节点按照经纬度位置进行排列。
节点按照经纬度排列
4. 对节点的外观进行调整,按照地铁所属于的线路来进行配色,根据节点的权来决定节点的大小。
调整节点的颜色和大小
5. 显示节点的站点名称,调节其大小和字体,注意字体如果出现乱码,可以选择宋体等格式。
设置节点的标签的字体
6. 在预览里面对图进行美化,调整边的厚度和弯曲程度,进行出图。
生成的预览图
出图效果
地铁网络分析
深圳地铁网络几何特征如下表所示,节点数表示的系统中的组成个数,现如今深圳有236个节点,代表了有如此数量的地铁正在运行,数量在全国排行第五,边数代表了节点交互关系的总和,网络直径是网络中所有节点对之间的最大距离,平均路径代表所有节点对之间的平均距离,聚类系数刻画了一个节点的邻居节点之间的稠密程度,平均度是所有节点的度之和与节点总数之比。
深圳度最高的地铁站是车公庙,度值为8,总共有四条地铁线路从这里经过,介数中心度最大的节点也是车公庙,通过该节点的最短路径越多,介数中心度越大。可以从数据表格可以看出,节点的度越大,它的介数中心性也越大。
从节点的度的分布来看,度为2的节点数最多,其次是4,偶数比奇数要多,这是地铁网络的规模和物理性质所导致的。
选取七个不同规模城市的地铁网络进行对比分析,其余城市的具体数据请见附表。
地点 | 节点数 | 边数 | 网络直径 | 平均路径长度 | 聚类系数 | 平均度 |
上海 | 381 | 443 | 43 | 15.809 | 0.00805 | 2.325 |
成都 | 284 | 324 | 40 | 13.874 | 0.00176 | 2.282 |
重庆 | 191 | 206 | 41 | 14.558 | 0.00297 | 2.157 |
香港 | 96 | 104 | 27 | 9.87 | 0.00521 | 2.167 |
合肥 | 95 | 96 | 37 | 14.817 | 0 | 2.021 |
石家庄 | 60 | 60 | 34 | 11.036 | 0 | 2 |
东莞 | 15 | 14 | 14 | 5.333 | 0 | 1.867 |
从表格数据中可以发现节点数越大,网络的规模、网络直径、平均路径、聚类系数和平均度也越大,当节点数达到200时,网络的聚类系数开始不为0,当节点数达到60左右,平均度为2,在数据当中,尽管香港的地铁数并不多,但依旧有比较高的聚类系数,原因可能是香港可建设用地较少,人口密度高,这导致了香港地铁网络的布设非常的密集。
鲁棒性,是指如果移走网络中的少量节点或边后网络中的绝大部分节点仍是连通的,那么称,这个网络具有鲁棒性,它反应了网络系统在受到外界破坏或内部结构发生变化时,所能保持网络原有功能的能力。深圳地铁网络的鲁棒性表现如下图所示。蓄意攻击下和随机攻击表现出不同的变化趋势,蓄意失效的破坏性大于随机失效。
深圳地铁网络鲁棒性
其中,随机攻击策略采用的是以P为概率去除网络中的节点以及与节点相连的边,遍历每个节点,到一个节点时同时生成一个1到100以内的随机数,如果随机数小于100与P的乘积,则点将会失效,不会参与网络的构建,遍历完所有节点后,计算网络指标。
蓄意攻击策略采用的是依次去除网络中度较大的节点,首先所有N个节点先构建成网络,根据每个节点度的大小依次排列,假定失效比例P的节点,去除P*N个排在前面的节点,计算网络指标。
地点 | 节点数 | 边数 | 网络直径 | 平均路径长度 | 聚类系数 | 平均度 |
上海 | 381 | 443 | 43 | 15.809 | 0.00805 | 2.325 |
北京 | 347 | 389 | 54 | 16.766 | 0.00192 | 2.242 |
成都 | 284 | 324 | 40 | 13.874 | 0.00176 | 2.282 |
广州 | 250 | 274 | 51 | 16.824 | 0 | 2.192 |
深圳 | 236 | 272 | 42 | 13.598 | 0.00367 | 2.305 |
武汉 | 212 | 230 | 52 | 15.852 | 0.00236 | 2.17 |
杭州 | 207 | 223 | 54 | 17.391 | 0 | 2.155 |
重庆 | 191 | 206 | 41 | 14.558 | 0.00297 | 2.157 |
西安 | 160 | 166 | 48 | 16.067 | 0 | 2.075 |
南京 | 159 | 164 | 49 | 16.768 | 0 | 2.063 |
苏州 | 154 | 163 | 34 | 13.718 | 0 | 2.117 |
天津 | 144 | 152 | 32 | 12.323 | 0 | 2.111 |
郑州 | 131 | 141 | 35 | 12.117 | 0 | 2.153 |
宁波 | 97 | 99 | 35 | 12.978 | 0 | 2.041 |
香港 | 96 | 104 | 27 | 9.87 | 0.00521 | 2.167 |
合肥 | 95 | 96 | 37 | 14.817 | 0 | 2.021 |
长春 | 87 | 90 | 36 | 11.724 | 0 | 2.069 |
沈阳 | 85 | 88 | 29 | 10.75 | 0 | 2.071 |
昆明 | 83 | 89 | 24 | 9.85 | 0 | 2.145 |
无锡 | 80 | 83 | 31 | 10.795 | 0 | 2.075 |
南宁 | 80 | 82 | 27 | 10.791 | 0 | 2.05 |
南昌 | 70 | 71 | 33 | 11.621 | 0 | 2.029 |
厦门 | 70 | 72 | 31 | 11.306 | 0 | 2.057 |
哈尔滨 | 62 | 64 | 27 | 10.092 | 0 | 2.065 |
石家庄 | 60 | 60 | 34 | 11.036 | 0 | 2 |
贵阳 | 55 | 55 | 29 | 10.718 | 0 | 2 |
徐州 | 51 | 51 | 21 | 8.805 | 0 | 2 |
福州 | 46 | 45 | 30 | 10.797 | 0 | 1.957 |
常州 | 43 | 42 | 28 | 10.155 | 0 | 1.953 |
呼和浩特 | 43 | 42 | 25 | 9.792 | 0 | 1.953 |
济南 | 40 | 39 | 28 | 10.527 | 0 | 1.95 |
佛山 | 34 | 33 | 24 | 9.357 | 0 | 1.941 |
太原 | 23 | 22 | 22 | 8 | 0 | 1.913 |
乌鲁木齐 | 21 | 20 | 20 | 7.333 | 0 | 1.905 |
兰州 | 20 | 19 | 19 | 7 | 0 | 1.9 |
温州 | 18 | 17 | 17 | 6.333 | 0 | 1.889 |
东莞 | 15 | 14 | 14 | 5.333 | 0 | 1.867 |
作者信息
本文内容整理自2019级本科生LSX的《复杂网络导论》自选主题作业。