格線[生物學與信息學]

格線[生物學與信息學]
格線[生物學與信息學]
更多義項 ▼ 收起列表 ▲

格線(Grid),在信息學中,格線是一種用於集成或共享地理上分布的各種資源(包括計算機系統、存儲系統、通信系統、檔案、資料庫、程式等),使之成為有機的整體,共同完成各種所需任務的機制。

基本信息

格線定義

格線是一種新興的技術,正處在不斷發展和變化當中。學術界和商業界圍繞格線開展的研究有很多,其研究的內容和名稱也不盡相同因而格線尚未有精確的定義和內容定位。比如國外媒體常用“下一代網際網路”、 “Internet2 ”、“下一代Web”等來稱呼格線相關技術。但“下一代網際網路(NGI)”和“Internet2”又是美國的兩個具體科研項目的名字,它們與格線研究目標相交叉,研究內容和重點有很大不同。企業界用的名稱也很多,有內容分發(Contents Delivery)、服務分發(Service Delivery)、電子服務(e-service)、實時企業計算(Real-Time Enterprise Computing,簡稱RTEC)、分散式計算Peer-to-Peer Computing(簡稱P2P)、Web服務(Web Services)等。中國科學院計算所所長李國傑院士認為,格線實際上是繼傳統網際網路、Web之後的第三次浪潮,可以稱之為第三代網際網路套用。

格線是利用網際網路把地理上廣泛分布的各種資源(包括計算資源、存儲資源、頻寬資源、軟體資源、數據資源、信息資源、知識資源等)連成一個邏輯整體,就像一台超級計算機一樣,為用戶提供一體化信息和套用服務(計算、存儲、訪問等),虛擬組織最終實現在這個虛擬環境下進行資源共享和協同工作,徹底消除資源“孤島”,最充分的實現信息共享 。

格線(Grid)這個詞來自於電力格線(PowerGrid)。“格線”與“電力格線”形神相似。一方面,計算機網縱橫交錯,很像電力網;另一方面,電力格線用高壓線路把分散在各地的發電站連線在一起,向用戶提供源源不斷的電力。用戶只需插上插頭、打開開關就能用電,一點都不需要關心電能是從哪個電站送來的,也不需要知道是水力電、火力電還是核能電。建設格線的目的也是一樣,其最終目的是希望它能夠把分布在網際網路上數以億計的計算機、存儲器、貴重設備、資料庫等結合起來,形成一個虛擬的、空前強大的超級計算機,滿足不斷增長的計算、存儲需求,並使信息世界成為一個有機的整體。

早期格線的目標是期望能夠像使用電力一樣方便地使用分布在網路上強大而豐富的計算能力,而不用理會這種計算力是在哪個地點、以何種形式產生的。格線技術被看作是繼傳統網際網路、Web之後的第3次網際網路浪潮,也被稱為第3代網際網路套用,其主要特點是通過提供資源級的共享,從而消除信息孤島、實現應用程式在更高層次上的互動與協作。目前,在格線計算的研究上,對信息與知識孤島的消除、實現對它們的共享也已成為一個研究的側重點。目前格線計算主要可以分為計算格線、信息格線與知識格線3個層次 。

滿足條件

格線必須同時滿足三個條件:

•在非集中控制的環境中協同使用資源;

•使用標準的、開放的和通用的協定和接口;

•提供非平凡的服務。

無線數據

工業使用的無線系統大多採用與蜂窩行動電話相似的射頻連線,用點對點,或點對多點進行數據傳送。但是,麻省理工學院媒體研究室指出,傳統的無線語音通信方式,在數據服務中表現出過分地不足:非常剛性的系統結構中,雖經謹慎的系統預計,仍然丟失信號。

相反,格線式無線網路是一個由多重複鏈路的接/發節點構成的系統,節點間彼此互助,將數據沿網路傳送,特別適合惡劣工作條件。格線的安裝不必過於謹慎,隨便把它們丟到什麼地方,它就可以變成可靠的、靈活的系統,並能隨意擴展到千千萬萬個設備上。

網路共性

麻省理工學院為格線式網路開發的拓撲結構,是一個點對點對點,或對等點對對等點的系統,也就是一個由具有重複接/發功能的節點組成的網路。每個節點都能接收/傳送數據,也和路由器一樣,將數據傳給它的鄰接點。通過中繼處理,數據包用可靠的通信鏈路,貫穿中間的各節點,抵達指定目標。

相似於網際網路和其他點對點路由網,格線式網路擁有多個冗餘的通信路徑。如果一條路徑在任何理由下中斷(包括射頻干擾中斷),格線網將自動選擇另一條路徑,維持正常通信。一般情況下,格線網能自動地選擇最短路徑,提高了連線的質量。根據實踐,如果距離減小兩倍,則接收端的信號強度會增加四倍,使鏈路更加可靠,還不增加節點發射功率。格線式網路里,只要增加節點數目,就可以增加可及範圍,或從冗餘鏈路的增加上,帶來更多的可靠性。

自我配置和自修復性:格線式網路具有自我配置的特性,不需要人為的干預。增添新設備或舊設備移址都十分簡單,只需在新址接通電源後,格線網就會發現這個新節點,自動地把它納入現有的系統。格線式網路不僅生來就有高可靠性,而且還有高適應性。如果感測器或數據接收端,與固定的射頻通信源相距太遠,只需要在其間多布置幾個中繼節點,間隙便可填平。線連的網際網路上,如果某個路由器停止工作,數據包則經其他的節點,選擇另一個鏈路傳送數據。與此相似,如果格線式網路中某個節點或鏈路失靈,數據包也會自動選擇其他的路徑。一、兩個節點的丟失,對格線產生不了致命的影響,格線式網路具有自愈的能力,不需要外來的人力重新安排路徑。

冗餘性和可擴性:真實世界裡的冗餘性意味著系統的安全儲備程度,和使用者精心管理的緊張程式。沒有冗餘的系統是不可靠的系統;冗餘太多的系統,又帶來太大的浪費。格線式網路的無線絡中,冗餘是節點密度帶來的基本功能。為了可靠性,需要精心設計的系統,在格線中只要多幾個節點便完成。每個節點有多條鏈路,根據情況自動選擇路由。其他的無線系統,很少有這種取得冗餘的方式。格線式網路也有極好的可擴性,可以擴展到管理幾百到幾千個節點。因為這個系統沒有中央控制單元,增添多個連結點或網關,不存在任何麻煩。

可靠性、適應性和可擴性是今天無線通信和工業控制十分重視的性能。點對點的網路有良好的可靠性,但無法擴展到使節點擁有多條鏈路。一點對多點的網路可以管理多個端點,但可靠性受制於訪問點和端點的配置。在環境條件惡劣的情況下,一點對多點的網路難以提高可靠性。與它們相反,格線網在環境或結構的制約下,內在地賦含可靠性和適應性,並可被任意擴展到幾千個端點。

1.

自我配置和自修復性:格線式網路具有自我配置的特性,不需要人為的干預。增添新設備或舊設備移址都十分簡單,只需在新址接通電源後,格線網就會發現這個新節點,自動地把它納入現有的系統。格線式網路不僅生來就有高可靠性,而且還有高適應性。如果感測器或數據接收端,與固定的射頻通信源相距太遠,只需要在其間多布置幾個中繼節點,間隙便可填平。線連的網際網路上,如果某個路由器停止工作,數據包則經其他的節點,選擇另一個鏈路傳送數據。與此相似,如果格線式網路中某個節點或鏈路失靈,數據包也會自動選擇其他的路徑。一、兩個節點的丟失,對格線產生不了致命的影響,格線式網路具有自愈的能力,不需要外來的人力重新安排路徑。

2.

冗餘性和可擴性:真實世界裡的冗餘性意味著系統的安全儲備程度,和使用者精心管理的緊張程式。沒有冗餘的系統是不可靠的系統;冗餘太多的系統,又帶來太大的浪費。格線式網路的無線絡中,冗餘是節點密度帶來的基本功能。為了可靠性,需要精心設計的系統,在格線中只要多幾個節點便完成。每個節點有多條鏈路,根據情況自動選擇路由。其他的無線系統,很少有這種取得冗餘的方式。格線式網路也有極好的可擴性,可以擴展到管理幾百到幾千個節點。因為這個系統沒有中央控制單元,增添多個連結點或網關,不存在任何麻煩。

3.

可靠性、適應性和可擴性是今天無線通信和工業控制十分重視的性能。點對點的網路有良好的可靠性,但無法擴展到使節點擁有多條鏈路。一點對多點的網路可以管理多個端點,但可靠性受制於訪問點和端點的配置。在環境條件惡劣的情況下,一點對多點的網路難以提高可靠性。與它們相反,格線網在環境或結構的制約下,內在地賦含可靠性和適應性,並可被任意擴展到幾千個端點。

格線式網路在工業控制中使用時,還可以實現分散式控制和診斷式監測。

無線通信

今天的格線式無線區域網路主要使用基於802.11a/b/g的標準,但能夠被任何射頻技術擴充,例如UltraWideband或802.15.4 Zigbee。因為連網智慧型裝在每個節點上,不用任何中央交換機。格線的運作只取決於帶有網路處理器,交換功能和系統軟體的每一個智慧型節點。

為了在格線內部實現節點間的通信,每個節點都具有自我發現的能力。首先,它們必須決定是否只在無線系統中當成一個訪問點,如同網路主幹為另一個節點傳送數據,或者扮演一個組合功能的角色。其次,這些特定的節點使用查詢/回響協定確定它的近鄰。這些運算不能占用太大的資源,不能超過鏈路可獲頻寬的1%到2%。

節點相互識別中,主要權衡的是路徑信息,例如信號的接收強度、吞吐量、出錯率和等待時間。這些數據必須在鄰接的各點上互動,又不能占用太大的頻寬。然後,根據這些數據決定最佳路徑。所以,任何瞬間都可取得當時的最佳質量。

鏈路發現和路徑選擇都在後台進行,所以每個節點都知道當前有哪些鄰接點,並頻繁地運算,找出最佳路徑。如果某個節點出於維修、重新安排,或故障等任何原因停止工作,鄰近的節點立即重新記錄,重新運算,選擇路徑。這種自我修復或故障超越的能力,是格線式無線網有別於其他無線通信的主要標記。

每一個節點都是一個自我管理的節點,又是一個網路的有機組成部分。該網路可從某個指定點進行管理和配置,形成一個實體。使用系統管理程式SNMP,監測某個特定的單元、節點、域或整個網路。發現協定(Discovery Protocols)簡化了搜查和定位某個指定節點的過程,並把它們顯示在管理者的螢幕上。

格線網依賴各種管理、控制和發現的報文,所以需要安全措施,採用帶內報文、加密隧道,防範竊聽和攻擊。標準化的安全技術例如802.1x和Advanced Encryption Standard加密,確保了節點和設備的安全。

格線魅力

業界的重量級公司,例如Cisco和Intel,確認格線技術是當下無線通信符合邏輯的下一步延伸。格線的使用可以幫助各企業迅速地建立起新的無線網,或在不需要線連基站的條件下,擴展現有的WLANs。具有格線多鏈路的基站,容易實現負荷的均衡,因為它們可以為數據傳輸選擇最佳的路徑。此外,工業用戶還能用嵌入的無線格線,迅速建立起感測器和控制器的網路,進行工業管理和運輸管理。

格線技術的新崛起者和傳統IT老公司,紛紛出售他們具有格線功能的無線區域網路。負責標準制定的相關機構,正在擬定把格線納入802.11(即WiFi),以及剛剛與公眾見面的802.16(亦即WiMax)標準的補充細則。嵌入式市場方面,格線技術開始形成標準,例如ZigBee。

其實,格線的基本概念並不是什麼新發明,僅僅是把網際網路連線世界裡的實踐,擴展進無線世界。PacketHop工程副總裁Sott Burke說:“今天固定式的網際網路就是一個大型的固定式格線網。”

格線網上的每個設備收/送它自己的數據時,同時又為其他的設備扮演了一個路由器的角色。每個設備的內在智慧型,使它能自動配置一個有效的網路,並當某個節點超載到失效之際,重新調整鏈路。格線網的優點不僅容易設定,並能從一個中央連線鏈路,無線地擴展覆蓋一個很大的地區,而且具有很強的生存能力。

也許這是軍事機密,無線格線是美國五角大樓高級防務研究機構(Defense Advanced Research Project Agency)推出的研究成果。PacketHop的早期技術,源於斯坦福研究院為五角大樓進行的研究,為野戰士兵裝備輕巧的高速無線數據網。佛羅里達崛起的新公司MeshNetworks也是源於高級防務研究機構,開發格線技術。

軍事部門和安全部門仍然是格線產品最直接的市場。“這個市場需求量很大,”Burke先生說。

企業格線

Nortel和幾家從事格線開發的新公司,確認格線式WLAN會給企業帶來更多的利益。今年上半年Nortel向市場提出了Wi-Fi格線產品--Wireless 7200 Series。“傳統的WLAN方案中,每個節點都和主幹網連線,但我們在格線式WLAN中免除掉這個需要,”無線格線網商務開發經理Peter Zwinkels說,“使我們在布線困難或布線費用太高的未布網地區,實現了無線區域網路。”

這些地區包括室內外面積很大的空間,例如倉庫和高爾夫球場。電源是難題之一,也許這裡連交通管理的紅綠燈和路燈都沒有。但是, Nortel向公眾承諾,只要傳統的連線網路能生成的地方,就能用乙太網本身向節點提供電源。

Intel在新澤西州Dartmouth大學的格線試驗中,把每個學生在校園空間的每個地方,與該校的網路連線。春季實施的這個計畫,為學生提供了寬頻連線,並且需要向電話公司和電纜公司付費。

這些研究表明,格線主要用於廣域寬頻無線連線。雖然市場信息表明Wi-Fi熱點正匆忙地在美國的咖啡店、火車站、機場……興起,但無線ISPs和電信公司認為,他們可以用Wi-Fi熱點的擴展格線吸引用戶,在銷售網際網路、標準的行動電話和3G服務中當作贈品。格線技術可以巨大地加速寬頻服務的發展趨勢:取代大量的T1和ADSL線路,每個無線節點都是熱點,只需要一條高頻寬的連線,就能用無線格線覆蓋整個地區。Nortel把這個歸納成“熱區”,並宣稱這個系統不僅價格便宜,而且覆蓋性能優於當前熱點的大雜燴。

使用“熱區”

某些城市準備為工作人員推出類似的服務。Verge Wireless公司為例,它已在Baton Rouge和紐奧良市,推出熱區型的格線服務。

某些ISPs仍在等待無線通信的最終方案,用WiMax為難以連線的地區提供寬頻服務。但Nortel認為,以Wi-Fi為基礎的格線技術,可以更好地滿足這些地區。“沒有DSL線路的地區,WiFi格線可以為一個小村莊,100~200戶居民提供寬頻服務,”Zwinkels先生說。“MiMax要求用戶安裝特殊設備,但Wi-Fi格線只需要用戶用標準的PMCIA卡插入計算機。”

射頻識別技術(RFID)之後,嵌入式格線得到進一步發揮。取代固定式的掃描設備,格線上的感測器和控制器在無線網上彼此交談,傳送信息。波士頓的Ember公司,專門製造RF晶片,用在大型運輸機上,監視被運送的貨箱。感測器滿布在各個貨箱上,不僅記錄了貨箱內物品的詳細資訊,而且傳送出運輸過程中貨箱存放的狀態。為了反恐的目的,美國各航空港將迅速使用這種無線監測系統,取代緩慢昂貴的海關人力檢查。

“貨箱就是一個網,每個貨箱在一個較大的格線式網路內,形同一個節點,”Ember的商務主管Jim Schoenberjer說。“因為貨箱本身就是網路的組成部分,所以港口或機場都不再需要安裝天線,格線是一個基礎設施很少的通信系統。”

嵌入式格線還可以用來收集家庭水電氣表的讀數,或裝進電燈開關,減少不必要的電線。Ember公司正在擬定ZigBee標準,它是EmberNet技術的一個組成部分。

格線標準

很多新公司如BelAir Networks,Tropos,FireTide和Strix System都在研發格線產品。雖然大多數產品都是在Wi-Fi的標準下擴展出來的,但各家的方法是不同的。這些專利的產品彼此缺少互操作性,所以不能在一起工作。既然格線要進入社會基礎設施,標準的制定是一件迫切重要的事情。

按照IEEE的規矩,為了制定一個標準,首先要由某個單位提出倡議,然後成立研究小組,最後才有標準制定的工作組。

2003年十二月底,Intel和Cisco就宣布要在溫哥華IEEE會議上提出倡議,制定格線式無線網路的標準。

“當前的情況是明白的,”出版物Wi-Fi Plant的編輯Eric Griffith說。“Nortel和一大堆新公司都在搞格線產品,如果把這些產品放在一起,彼此完全不能交談。有些公司用蜂窩技術,有些公司用802.11a。蜂窩格線可以沿電話線桿架設,達到較遠的範圍。802.11a在短距離的使用中效果好,不受802.11b或802.11g干擾。”

經由Intel、Cisco、MeshNetworks和其它公司的倡議,IEEE成立了格線研究組,希望最終把格線補充入無線區域網路的標準。今年一月,研究組舉行了第一次會議。評論家認為標準會在“最小公分母”的原則下完成。那時,各種專利協定的銳利功效會受到很大的限制。所以,MeshNetworks公司正在重新打包它的專利,當作可授權產品,瞄準各無線設備製造商,2004年第二季度開始對外授權。

“非常有趣,Intel捲入這件事情,”Griffith說。“Intel絕對願意從晶片級上為格線提供標準。我的印象里,Intel想彌補過去的小小過失,他們太晚地進入Wi-Fi,現在一定要在WiMax和格線上走到前沿。”

格線式無線區域網路是無線通信發展的邏輯歸宿。從現有無線標準繁衍出新的功能,最能符合大多數廠商和用戶的利益。一意孤行的專利標準雖然有暫時的優勢,但得不到技術進一步發展的認同。只有把握技術發展主流,參與國際共同研究,才是最把穩的方式。

個案研究:美國德州加蘭德市

加蘭德(Garland),距達拉斯城東北15英里,人口22.1萬,為社會安全人員,例如警官、消防隊員和醫院急診室工作人員更換通信系統。Lockheed Martin去年九月取得這個契約,選用了MeshNetworks的格線技術,代替蜂窩式通信系統。新系統將覆蓋57平方英里,是全世界最大的格線式移動通信網。按計畫,該項目2004年第二季度完成,先提供移動數據服務,然後再有圖像和語音服務。

格線技術為加蘭德市帶來很大的利益,比原來基礎設施的頻寬提高了50倍。“我們免除掉老系統要求的通信塔、線路租金和分區等頭痛的事情,”通信經理Darrell McClanahan說。“格線系統保持1Mbps的正常吞吐量,高峰可達6Mbps。”

新系統只需要PC卡、無線中繼器、網關、地理位置軟體,經過改裝的Pocket PC掌上機和指揮控制中心的伺服器。中繼器和網關掛在建築物、街燈,或交通管制紅綠燈上,為下一個中繼器和設備提供能源。PC卡和PDAs也扮演中繼者和路由器的角色,使網路變得非常強健。地理位置軟體在不用GPS的條件下,提供緯度、經度和海拔高度等信息。該系統支持工業標準TCP/IP,DHCP和SNMP。

加蘭德市選擇格線通信系統前,於2003年在NexGen城沿190高速公路5平方英里的地區做試驗,兩輛汽車相反的方向行駛在每小時60英里的速度時,以通過量1.5Mbps成功地完成了實時的流式圖像,VoIP呼叫。

移動通信專家Tim Scannell談格線

問:按Zigbee國際聯盟的發起,IEEE 802.15.4的一個重要的可操作概念就是用來組建格線網。每個802.15.4節點可用作動態的路由器,從一個網關延伸到無限的距離,只要在這個區域內布置節點。這並非一個新概念,但要它能自我組建、自我治癒仍然是一種挑戰。

是否可以用IEEE 802.15.4完成格線式網路,IEEE 802.16技術是否也有類似的可行性?即通過內部合作,實現寬頻訪問網際網路無限制的可及範圍?

答:當我們鋪設了日益增多的無線網,使用了各式各樣不同的技術,這些網將最終用格線的環境連在一起,成為最強的,或至少能跨越不同的邊界和標準的相互通信。蜂窩技術沿一個單元通信塔向下一個通信塔跳躍,使用戶無縫地漫遊在格線通信框架內,攫取最強的可獲信號,構成無線連線。

Cometa Networks這樣的新公司,探索重疊使用802.11(Wi-Fi)網,在大範圍內提供格線無線訪問環境,其基本目的還是城域網(MANs)的想法。問題在於為了實現可操作性和可靠性,網上的每個訪問點不能中斷運行。如果某個區段中斷,就會變成弱鏈路區,服務遭到損害,和聖誕節的大面積燈串妝飾中不亮的燈泡相似。

Zigbee承諾把無線功能注入大量設備和非通信系統例如內置的環境控制,但不是格線的最佳選擇。Zigbee不適用於連續的通信系統,因為預設定之外的時間,或不被激活的節點處於睡眠狀態。但它能保持電池的長壽命,一個電池用5年,使系統在很長的周期內生存。Zigbee可以傳送小型的數據包,但不適用於大容量的信息。

射頻識別系統(RFID)也有類似之處,用在傳送有限的數據信息,系統的大部分處於被動地位,直到讀入器激活它們。最終,我們將更多地使用主動的RFID系統,用於零售業和物流運輸。

雖然格線管理、控制和收費都存在問題,但都能解決。我們已能監視和控制射頻,用分層技術和各種算法就能管理從A點向延伸點Z的數據流。Zigbee和RFID的格線可以通信和交換數據,但802.11將是更加通用的技術。

結構體系

格線特徵

在介紹格線的特徵之前,我們首先要解決一個重要的問題:格線是不是分散式系統?這個問題之所以必須回答,因為人們常常會問另一個相關的問題:"為什麼我們需要格線?現在已經有很多系統(比如海關報關係統、飛機訂票系統)實現了資源共享與協同工作。這些系統與格線有什麼區別?"

對這個問題的簡要回答是:格線是一種分散式系統,但格線不同於傳統的分散式系統。IBMGlobal Service與EDS是在這個分散式領域最著名的公司。構建分散式系統有三種方法:即傳統方法(我們稱之為EDS方法)、分布自律系統(Autonomous Decentralized Systems, ADS)方法,格線(grid)方法。ADS通常用於工業控制系統中。格線方法與傳統方法的區別見下表:

特徵 傳統分散式系統 格線

開放性 需求和技術有一定確定性、封閉性 開放技術、開放系統

通用性 專門領域、專有技術 通用技術

集中性 很可能是統一規劃、集中控制 一般而言是自然進化、非集中控制

使用模式 常常是終端模式或C/S模式 服務模式為主

標準化 領域標準或行業標準 通用標準(+行業標準)

平台性 套用解決方案 平台或基礎設施

通過以上對比,格線具有以下四點優勢 :

(1)資源共享,消除資源孤島:格線能夠提供資源共享,它能消除信息孤島、實現應用程式的互連互通。格線與計算機網路不同,計算機網路實現的是一種硬體的連通,而格線能實現套用層面的連通。

(2)協同工作:格線第二個特點是協同工作,很多格線結點可以共同處理一個項目。

(3)通用開放標準,非集中控制,非平凡服務質量:這是Ian Foster最新提出的格線檢驗標準。格線是基於國際的開放技術標準,這跟以前很多行業、部門或者公司推出的軟體產品不一樣。

(4)動態功能,高度可擴展性:格線可以提供動態的服務,能夠適應變化。同時格線並非限制性的,它實現了高度的可擴展性。

格線體系

格線之所以能有以上所說的種種優勢特徵,是由格線的體系結構賦予它的。格線體系結構的主要功能是劃分系統基本組件,指定組件的目的與功能,刻畫組件之間的相互作用,整合各部分組件。科研工作者已經提出並實現了若干種合理的格線體系結構。下面介紹影響比較廣泛的兩個格線體系結構:格線計算協定體系結構(Grid Protocol Architecture,GPA)和計算經濟格線體系結構(GRACE)模型 。

OGSA(Open Grid Services Architecture)被稱為是下一代的格線體系結構,它是在原來“五層沙漏結構”的基礎上,結合最新的Web Service 技術提出來的。OGSA包括兩大關鍵技術即格線技術和Web Service 技術。

隨著格線計算研究的深入,人們越來越發現格線體系結構的重要。格線體系結構是關於如何建造格線的技術,包括對格線基本組成部分和各部分功能的定義和描述,格線各部分相互關係與集成方法的規定,格線有效運行機制的刻畫。顯然,格線體系結構是格線的骨架和靈魂,是格線最核心的技術,只有建立合理的格線體系結構,才能夠設計和建造好格線,才能夠使格線有效地發揮作用。

OGSA最突出的思想就是以“服務”為中心。在OGSA框架中,將一切都抽象為服務,包括計算機、程式、數據、儀器設備等。這種觀念,有利於通過統一的標準接口來管理和使用格線。Web Service提供了一種基於服務的框架結構,但是,Web Service 面對的一般都是永久服務,而在格線套用環境中,大量的是臨時性的短暫服務,比如一個計算任務的執行等。考慮到格線環境的具體特點,OGSA 在原來Web Service 服務概念的基礎上,提出了“格線服務(Grid Service)”的概念,用於解決服務發現、動態服務創建、服務生命周期管理等與臨時服務有關的問題。

基於格線服務的概念,OGSA 將整個格線看作是“格線服務”的集合,但是這個集合不是一成不變的,是可以擴展的,這反映了格線的動態特性。格線服務通過定義接口來完成不同的功能,服務數據是關於格線服務實例的信息,因此格線服務可以簡單地表示為“格線服務=接口/行為+服務數據”。

在當下,格線服務提供的接口還比較有限,OGSA 還在不斷的完善過程之中,下一步將考慮擴充管理、安全等等方面的內容。

格線協定

格線[生物學與信息學] 格線[生物學與信息學]

Ian Foster於2001年提出了格線計算協定體系結構,認為格線建設的核心是標準化的協定與服務,並與Internet網路協定進行類比。其示意圖如圖所示 。

該結構主要包括以下五個層次 :

構造層(Fabric):控制局部的資源。由物理或邏輯實體組成,目的是為上層提供共享的資源。常用的物理資源包括計算資源、存儲系統、目錄、網路資源等;邏輯資源包括分散式檔案系統、分布計算池、計算機群等。構造層組件的功能受高層需求影響,基本功能包括資源查詢和資源管理的QoS保證。

連線層(Connectivity):支持便利安全的通信。該層定義了格線中安全通信與認證授權控制的核心協定。資源間的數據交換和授權認證、安全控制都在這一層控制實現。該層組件提供單點登錄、代理委託、同本地安全策略的整合和基於用戶的信任策略等功能。

資源層(Resource):共享單一資源。該層建立在連線層的通信和認證協定之上,滿足安全會話、資源初始化、資源運行狀況監測、資源使用狀況統計等需求,通過調用構造層函式來訪問和控制局部資源。

匯集層(Collective):協調各種資源。該層將資源層提交的受控資源匯集在一起,供虛擬組織的應用程式共享和調用。該層組件可以實現各種共享行為,包括目錄服務、資源協同、資源監測診斷、數據複製、負荷控制、賬戶管理等功能。

套用層(Application):為格線上用戶的應用程式層。套用層是在虛擬組織環境中存在的。應用程式通過各層的應用程式編程接口(API)調用相應的服務,再通過服務調動格線上的資源來完成任務。為便於格線應用程式的開發,需要構建支持格線計算的大型函式館。

格線運用

現在國內國外運用得最多的可能是在一些大型院校的計算格線(實現計算資源的共享。 什麼是計算資源: 簡單來說就是計算能力,CPU。 計算資源共享就是CPU計算的共享)。人們把一個集群(cluster, 也就是常說的機房,通常有幾十台作業系統為Linux的計算機)的計算機連成一個局域型格線。這樣就好像把這幾十台電腦連成了一台超級計算機,計算能力當然大大提高了。這種局域計算格線主要運用於一些科研的研究。比如說生物科學。當生物科學的研究員需要高性能的計算資源來幫助他們分析試驗的結果時,他們就把這些分析試驗的程式提交(submit)給格線,格線通過計算再把結果返回給這些研究員。計算結果可能是一些圖像(rendering)也可能是一些數據。這些計算如果在單一PC(Personal computer, 個人計算機)上運行的話,往往會花費幾個月的時間,然而在格線中運行一,兩天也就完成了。這就是格線技術最直觀的優點之一。當然有一些大型主機(super-mainframe)也有很強的計算能力(比如常說的IBM deepblue,打敗人類西洋棋大師Kasparov那位),但是這種主機太昂貴,而且配置(deploy)往往不方便,是名副其實的重量級(heavyweight)計算。1996年初,美國數學家和程式設計師喬治· 沃特曼編制了一個梅森素數計算程式,並把它放在網頁上供數學家和數學愛好者免費使用,這就是著名的“網際網路梅森素數大搜尋”(GIMPS)項目。現在只要人們去GIMPS的主頁下載那個免費程式,就可以通過計算格線來搜尋新的梅森素數。SETI@Home,一個分散式計算的項目,通過網際網路上的計算機搜尋地球外智慧訊息,格線在分散式計算的成功運用。)的網站指出,世界上最強大的計算機IBM 的 ASCI White,可以實現每秒12萬億次的浮點運算,但是花費了1億千萬美元;然而SETI@HOME只用了50萬美元卻實現了每秒15萬億次浮點運算。

格線另外一個顯著的運用可能就是虛擬組織(Virtual Organisations)。這種虛擬組織往往是針對與某一個特定的項目,或者是某一類特定研究人員。在這裡面可以實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源的全面共享。比如說中國2008年奧運會開幕式研究組就可以運用格線組成一個虛擬組織。在這個虛擬組織里,任何成員不管在哪個地方都可以有權訪問組織的共享資源(如 開幕式場地圖紙,開幕式資金,開幕式節目單);而且可以和另一地方的虛擬組織成員進行交流。這個虛擬組織就像把所有奧運會開幕式的資源,信息,以及人員集中到了一個虛擬的空間,讓人們集中精力研討開幕式項目的問題,而不必考慮其他的問題。據個實例,由英國利茲大學,牛津大學,約克大學和謝菲爾德大學合作的DAME項目就是致力於研究和運用虛擬組織。DAME架構在這四個大學合建的白玫瑰格線White Rose Computational Grid (WRCG)上,運用於對飛機故障的快速檢測和維修。

基礎設施

首先,我們來看看有哪些典型的格線基礎設施組件,每一種組件如何對應用程式的架構、設計和部署產生影響。下面是格線基礎設施中的一些主要組件 :

安全性。安全性是格線計算中的重要問題。每一種格線資源都可能需要遵從多種不同的安全策略。單點登錄認證是一種必不可少的方法。得到普遍遵守的協商授權機制也是很必要的。

資源管理。當提交一項任務的時候,格線資源管理器需要考慮如何為該任務指派資源、如何監視其狀態以及如何返回它的執行結果。

信息服務。由於格線資源管理器在指派資源之前要經過綜合全面的考慮,因此它需要知道哪些格線資源是可用的,以及這些資源的容量與當前使用的情況。這些有關格線資源的知識是通過格線信息服務(Grid Information Service,GIS)維護和提供的,又稱為監視與發現服務(Monitoring and Discovery Service,MDS)。

數據管理。數據管理主要解決任務如何傳輸數據以及如何訪問共享存儲的問題。

其他特性

可靠性

可靠性是計算領域內永恆的話題,格線環境也不例外。實現這一難題最好的方法是預見所有可能出現的失敗情況,並提供解決這些情況的手段。最可靠的方法能夠“容納異常情況的出現”(surprise tolerant)。格線計算的基礎設施必須處理主機中斷和網路中斷等情況。下面列出一些需要考慮的方法:

•使用檢查點-重啟機制。

•用持久性存儲保存中間結果。

•用心跳監視機制跟蹤系統狀態。

•用健壯的系統管理解決方案最大程度地提高格線及其組件的可用性。

拓撲問題

格線計算的分散式本質使地理上和組織機構上的大跨度變得不可避免。隨著內部格線的拓撲擴展為外部格線拓撲,複雜程度也逐漸提高。比如說,非功能性操作需求,安全性、目錄服務、可靠性、性能等都變得更加複雜。讓我們來研究一下拓撲的問題。

網路拓撲。格線架構內的網路拓撲可能在很多不同方面上呈現出來。網路組件可以表示 LAN 或校園網的連通性,甚至還能表示格線網路之間 WAN 的通信情況。網路的職責是為所有的格線系統提供充足的頻寬。像基礎設施中其他的組件一樣,我們可以通過定製網路來提供更高級別的可用性、性能以及安全性。

出於安全性以及其他一些架構性的限制,格線系統從很大程度上來說是網路密集型的。尤其是數據格線,它可能在整個企業的網路內散布著一些存儲資源,因此在基礎設施的設計中,為了保證足夠的性能,關鍵因素就在於處理數量巨大的網路負載。

啟用應用程式時應該考慮的問題包括如何使網路通信量最小,如何使網路延遲最短。假設應用程式的設計已經能夠保證最小的網路通信量,那么就有幾種方法可以使網路延遲最短。比如說,千兆以太區域網路可以用來支持高速群集,或實現遠程網路之間的高速 Internet 骨幹網。

數據拓撲。我們最希望把任務指派到距離它所使用的數據最近的機器上執行。這樣可以降低網路的通信量,還可能降低可測量性方面的限制。

數據需要存儲空間。在一個格線的設計中,存儲的可能性問題是沒有止境的。存儲要求一定的安全性、要可以進行備份、要可管理,還/或要進行複製。在格線的設計中,您需要確定您的數據對於需要它的資源來說一直是可用的。除了可用性之外,您還需要保證數據得到適當的保護,因為您不能讓未經授權的人訪問到敏感的數據。最後,您需要最佳的數據訪問性能。顯然,頻寬和訪問數據的距離兩者是相互有關的,但是您不會希望讓 I/O 問題阻礙格線應用程式的運行速度。對於那些磁碟密集型的應用程式,或是數據格線而言,您可以將工作重點更多地放在存儲資源上,比如您可以使用那些能夠提供更高容量、冗餘程度或容錯機制的存儲。

相關詞條

相關搜尋

熱門詞條

聯絡我們