實現高可用性
每個套用過程的負責人都希望把他們負責的各種線上系統的正常運行時間最大化--最好是把它們變成完全的容錯系統。
內部和外部的約束使得這個問題變得幾乎不可能解決。預算的限制,部件的失敗,不完善的代碼,人的失誤,自然災害,以及不可遇見的商業變化,都是達到100%可用性(或者說高可用性)的障礙因素中的一部分。
seven R principle
冗餘(Redundancy)
名聲(Reputation)
可靠性(Reliability)
修補能力(Repairability)
恢復能力(Recoverability)
回響(Responsiveness)
活力(Robustness)
冗餘
多年來,製造商一直在設計他們的產品中保存一定的冗餘,包括多餘的能源供應,多處理器,記憶體分段,以及多餘的磁碟。對於整個採用熱備模式運行的伺服器系統來說也是如此。基礎架構分析人員在配置磁碟、磁碟控制器和伺服器使用雙路徑;把網路負載分散到兩條線上;以及提供備用的控制台,這也是採用了同樣的方法--總而言之,儘可能地減少單點的故障造成服務中斷的可能性。
名聲
後面三個"R"--名聲、可靠性和修補能力--緊密相關。名聲指的是主要供應商一貫的記錄。可靠性是關於產品中所使用的部件和代碼的可依賴的程度。修補能力是衡量供應商能夠多快,並且多方便地修理好(或者替換掉)有問題的部件。下面,我們將仔細看看這三項。在伺服器,磁碟存儲系統,資料庫管理系統和網路硬體以及軟體領域中,供應商的名聲是獲得高可用性的重要因素。最好是選用最好的供應商。你可以通過下面幾中方法來衡量一個廠商的名聲。
市場分額百分比
行業分析家和華爾街的報告
在該領域內的歷史記錄
客戶參考(尤其在確認諸如費用,服務,產品的質量,服務人員的培訓以及可信程度等因素時,這點格外有用)。
可靠性
軟體或者硬體的可靠性也可以通過客戶參考和行業分析家來證實。除了這些,你應該考慮採用經驗性部件可靠性分析的方法。這需要以下步驟:
檢查並分析問題管理日誌
檢查並分析供應商日誌
從操作人員那裡獲得反饋
從支持人員那裡獲得反饋
從供應商的維修人員那裡獲得反饋
同其他人的經驗做比較
研究行業分析家的報告
一個對於問題日誌的分析應該顯示出任何不尋常的失敗模式。你應該從供應商、產品、使用部門、發生失敗的時間和日期、失敗出現的頻率以及維修的時間等角度去研究它們。供應商經常保存站內維修日誌,你可以用它們來進行相似的分析。
你將發現操作人員的反饋通常是公正的,而且有啟迪的作用,能夠反映出各個部件真正的性能。尤其是對於那些離站的操作者們。例如每天早晨,在啟動前他們可能要對某一個特定的網路部件做數不清的重啟動,但是由於這一情況經常出現,他們可能懶得做日誌進行記錄。和不同支持人員,比如系統管理員、網路管理員和資料庫管理員進行的相似的交流可能反映出相似的要求。
你可能認為供應商的維修人員提供的反饋會有偏私,但是根據我的經驗,他們對於自己產品的反饋和使用那些產品的人的反饋一樣公正而且有啟迪的作用,能夠正確顯示出那些產品的可靠性。這樣,那些維修人員就成為評估部件可靠性、以及和其他公司的經驗做比較的一個有價值的信息來源。那些和你使用的平台、配置、提供的服務和客戶都很相似的公司的經驗特別有幫助。有名的行業分析家的報告也可以預測部件的可靠性。
修補能力
修補能力是技術服務人員能夠解決或者替換有問題的部件的能力。衡量這項能力的兩個通常的標準是完成維修的時間長短和維修工作多長時間就要進行一次。在比較成熟的系統里,維修的工作可以通過遠程診斷中心來完成,在那裡,錯誤被查明並修正或解決,並執行了永久的解決方案,這個過程只需要很少或者根本不需要操作人員的介入。
恢復能力
恢復能力指的是克服瞬間的失敗的能力,它使最終用戶端的可用性完全不受這類事件的影響。它小到從一個記憶體單元的錯誤中恢復,大到整個伺服器系統轉移到熱備的系統上而不丟失數據和傳輸。恢復能力還包括重新嘗試對於磁碟或者磁帶進行讀取或者寫入,還包括沿著網線重新嘗試傳輸。
回響
回響指的是緊急情況下,所有相關人員及因素解決問題、排除故障的能力。它包括有訓練有素的供應商和內部支持人員能夠對問題做出快速而有效的反應。它還包括對於資源,比如磁碟或者伺服器的自動恢復能夠在多長的時間內起作用。
活力
關於高可用性的最後一個詞就是"活力",它描述的是可用性程式的整體設計。一個有活力的程式將能夠經受很多不同的考驗--無論是來自內部的還是外部的--而這些問題可能輕而易舉地就能夠破壞一個比較脆弱的系統的可用性。要保持活力需要對於檔案和培訓投入相當的額外費用。這些技術培訓包括:為了適應和平台、產品、服務和顧客相關的技術的變化的培訓;為了適應相關的人員變動的培訓;為了適應新經營方向、合併和收購等新的商業變化的培訓。
低碳管理
再思考轉變觀念(Rethink)
低碳研究(Research)
減少排放(Reduce)
再開發(Redevelop)
再循環節約能源(Recycle)
保護(Rescue)
恢復和彌補(Recover)
再思考轉變觀念
低碳管理者的首要任務是思想的轉變,一個企業,無論是領導者還是執行者,都必須首先轉變思想,把思想統一到對“低碳”的共識上來。
低碳研究
將環保納入企業的決策要素中,重視研究企業的環境對策。
減少排放
採用新技術、新工藝,減少溫室氣體的排放,減少溫室氣體的排放,減少和消除有害廢棄物的排放。
再開發
對產品進行再開發,變傳統產品為環保產品,積極採用“低碳標誌”。
再循環節約能源
再循環是對生產中所產生的廢物進行再利用,並構成企業內部的原來循環,或對廢舊產品進行回收處理,循環利用。
保護
積極參與社區內的環境整治活動,對員工和公眾進行低碳宣傳,樹立低碳企業形象。
恢復和彌補
在前期已經釀成了不可挽回的過失,通過後期的人為努力使環境得到最大程度的改善、還原。