貨流分布
對複雜網路的研究已經滲透到各個領域中,如社會網路中的科研合作網、性關係網、公司董事網、科研引用網、語言網,技術網路中的計算機網路、信息網路中的全球資訊網,生物網路中的新陳代謝網、神經網路和蛋白質網路,以及輸運網路中的電力網路、電話網路、交通網路等等.近年來,由於計算機數據處理和運算能力的飛速發展, 套用複雜網路研究的成果不斷出現,科學家們發現大量的真實網路既不是規則網路,也不是隨機網路,而是具有與前兩者皆不同的統計特徵的網路.這樣的網路結構中最重要的,也是奠基性的工作有兩個,它們分別是:
(1)1998年Wats和Strogatz在Nature雜誌上發表文章,引入了小世界網路模型, 以描述從完全規則網路到完全隨機網路的轉變;
(2)1999年Barabási和Albert在Science上發表文章,指出許多實際的複雜網路的連線度分布具有冪律形式.這樣的一些網路被科學家們叫做複雜網路,對於它們的研究標誌著第三階段的到來.
隨著小世界效應及無標度特性的提出, 從物理學到生物學乃至社會學在內的眾多學科掀起了研究複雜網路的熱潮.許多學者開始利用複雜網路的理論來研究交通運輸網路複雜性.早期的研究如Amaral等學者(2000)研究了航空網路的拓撲結構, Latora等(2002)對波士頓捷運的網路特性進行了初步研究, Sienkiewicz等(2005)分析了波蘭的21個城市的公共運輸運輸網路的拓撲結構特性,發現他們的度分布不是服從冪律分布就是服從指數分布.北京交通大學高自友教授課題組對城市交通系統的複雜性進行了大量的研究,建立了以複雜網路思想研究城市交通系統複雜性的基本框架, 高自友等(2005)研究了城市公交網路的無標度特性及度分布指數,並以北京市公交網路為例完成了實證分析.高自友等(2006)指出了一些今後關於城市交通網路複雜性問題的研究主題.鐵路運輸在的日常生活和經濟建設中起著非常重要的作用,很多研究者構建了各種鐵路網路模型來研究這一運輸系統的特性,但大都只是從結構方面進行研究, 例如, Benguigui等(1991)研究鐵路網路結構的分形特性.還有, Sen等(2003)對印度的鐵路車流網路進行研究, 發現其最短路徑長度為2.16,聚類係數為0.69,故該網路為典型的小世界網路;趙偉等(2006)對中國鐵路客運網的特性進行了深入研究, 利用全國鐵路客運時刻表的數據構建了兩種不同的網路模式:鐵路地理網和車流網,統計結果表明鐵路地理網是樹狀網路, 車流網是具有無標度性質的小世界網路.本文以鐵路貨運量作為研究對象,從鐵路貨運網路的角度,結合複雜網路相關理論研究了鐵路貨運量的分布特性、拓撲映射及網路的統計特性,發現構建的網路具有小世界及無標度的特性,這為研究鐵路網路貨運量的分布特性及其流量複雜性提供了一個新的研究方法與視角.
分布特性
本文以全國各大鐵路站之間6萬多條貨運量數據記錄為研究對象,對於281個鐵路車站分別統計了其流出與流入的貨流總量,可知,各個鐵路車站年流出貨量大部分集中在3 000萬到6 000萬噸之間,貨流相對集中,而極少數車站的年流出貨能力可達到過億噸的水平,以北京站為例,年流出貨量在2億噸以上, 充分體現出了北京站作為全國鐵路的樞紐和集散中心的重要地位.同時,這種流量的不均勻性表現了貨流分布具有冪律特性.流入貨量總體集中在1 000 萬噸到2 500萬噸之間,以北京為例,年流入貨量達到1億噸以上,遠遠超過其他鐵路車站的流入貨運量,北京無疑在全國鐵路網中占據重要的地位, 是一個明顯的貨流Hub節點.
相關性分析
在很大程度上, 經濟因素決定了鐵路貨物運輸量在各個城市之間的分布,因此利用各城市當年的GDP總量與貨物運輸總量的相關係數r可以從直觀上反映二者的大致關係, 根據當年的城市GDP總量,計算其與貨運總量的相關性,可以用來衡量二者之間相關程度,可以看出,無論對於各個站點的年流出貨量還是流入貨量而言, 與城市年GDP總量的相關性都比較大,這也從側面反映了貨運量與城市經濟發展的同向變化的總體趨勢.
靜態參量分析
4.1 貨運量網路拓撲構造方法
鐵路貨運依賴於鐵路網的結構特點及城市的重要程度.本文統計了全國各等級的鐵路貨運站之間的年貨運量, 涉及281個鐵路站點.將這281個車站作為網路中的節點,若兩個車站之間存在貨運量,就將兩點之間連一條邊.由於貨運量是有向的,即對於每一個節點而言, 即有流出的貨運量又有流入的貨運量,可以構造流出量和流入量拓撲網路圖.另外為了結果的有效性和普適性,需要剔除一些點對之間流量過小的一些邊,比如對於年貨運量而言,綏化到鹹寧的年貨運總量只有29噸,遠遠小於其他城市對之間的年貨運量,此城市之間雖然存在貨流但數量級相對非常小, 在網路拓撲時就對其進行忽略.在本文中給定一個臨界值Q,根據所選取Q值的不同就可以生成一個新的流量網路.容易理解對於Q值來說, 取值越大就意味著拓撲網路中的邊的數量越少,越能體現貨運網路中節點的相對重要性, 文中取Q為120萬噸和10萬噸兩個臨界值,下面對其形成的不同拓撲網路的特性進行分析.
4.2 度分布
度是複雜網路中用來描述節點特性的重要指標,表示節點連線其他節點的數目,一般用ki表示節點i的度.網路中節點的度分布情況用機率分布函式p(k)來描述, 等於網路中度數為k的節點的個數占網路節點總數的比值.為了減少現實網路中因規模較小而引起的誤差,用P(k)表示度分布累計分布函式對於臨界值 Q=120萬噸的流出與流入貨流量雙對數圖均近似一條直線 ,貨流出、入量分布近似於冪律分布.可以認為貨流出量的拓撲網路具有無標度特性, 是一個無標度網路 .出量統計中, 網路的平均節點度 K =0.77, 每一個站點平均與其他 1 個站點之間存在直接的貨運量關係.最大度的節點是北京, 其最大度 Kmax =37, 作為集散中心,在整個鐵路貨運網路中起到核心組織作用;入量統計中, 得到與出量相同的平均度分布 .
對於臨界值 Q=10萬噸時 ,貨流出、入量度分布圖在雙對數坐標中近似服從指數分布的形式 ,可以認為此時的網路具有小世界的特性 .出量與入量網路 K =13.3, 每一個站點平均與其他 13個站點之間存在直接的貨運量關係, 具有最大度的節點是北京 .
4 3 平均路徑長度
.網路的平均路徑長度 L定義為任意兩節點之當Q=10萬噸時, L=2.2, 貨物從一個城市到達另一個城市需要中轉 1到 2個城市,可達性較好.
4.4 聚類係數
假設在給定的網路中 ,節點 i有 Ki條邊將它與其他的節點相連線, 此 Ki個節點稱為節點 i的鄰節點.定義節點 i的聚類係數 Ci為此 Ki個節點實際銜接邊的數 Ei與全部可能邊數的比值,即Ci =Ei/[ Ki(Ki -1)/2]節點的聚類係數越大 ,表示相鄰節點內部聯繫程度越高, 該點與其周邊節點構成的子網路越容易形成區域聚集,該節點的區位條件也就相對好 .在鐵路貨運網路中的意義是 , A城市與 B城市有貨運量來往, B與 C也存在的條件下, A與 C存在貨運量的機率.
研究結論
本文從一個新的角度對全國鐵路貨運量進行了研究 ,探究了鐵路貨運網路貨運量分布的冪律特性 ,並分析了貨流量與 GDP之間的關係 .結合複雜網路的思想,將鐵路車站及其之間的貨運量關係進行了網路映射 ,從而可以抽象成一個包含車站和貨運量信息的有向網路.Q作為一個限制量 ,其不同取值會對網路的形態以及總體的特性具有很大的影響 ,所以本文充分考慮到臨界值 Q的作用 ,對不同 Q值所對應的網路結構進行了研究, 可以生成具有無標度和小世界特性的複雜網路, 這可以為研究鐵路貨流分布複雜性及其鐵路網路規劃與設計提供理論依據.