性能監控

性能監控能通過壓縮平均恢復時間來減少應用程式的停機時間,或者記錄某個應用程式從發生問題到恢復正常,一共花費了多久,並且能夠通過檢查識別性能瓶頸來提高應用程式性能。

簡述

要確保投資的硬體、虛擬化策略或私有雲物有所值,需要實時跟蹤系統的性能,但如今物理和虛擬化技術混合套用的環境越來越多,多種虛擬機管理程式讓選擇合適的性能監控軟體變得更加複雜。

IT專家們需要方法來記錄分析和改善數據中心性能以及應用程式性能。性能監控軟體可以從多個來源獲得:

•系統廠商工具。許多大型伺服器廠商都提供監控工具來支持其產品,同樣也包括第三方產品。

•第三方工具。獨立軟體廠商同樣提供性能監控工具,部分原因是因為針對專有品牌伺服器的工具可能對競爭對手的設備支持不那么好。

•雲工具。性能監控工具現在已經可以通過軟體即服務(SaaS)方式獲得,對於希望省去安裝和管理麻煩的公司而言是個不錯的選擇。

•開源軟體工具。系統管理員社區已經開發了不少免費的性能監控實用工具。

性能監控軟體產品需要包含所有必需的核心功能,有些軟體還提供了許多擴展功能來協助排錯與管理。具備分析功能的軟體能夠讓用戶設定數據報告,以改善伺服器性能和容量規劃。在評估購買潛力時,需要從核心功能集出發考慮,接著在考慮自身環境可能需要的額外功能項。

核心功能

性能監控工具的核心功能

所有性能監控工具都應該能通過壓縮平均恢復時間來減少應用程式的停機時間,或者記錄某個應用程式從發生問題到恢復正常,一共花費了多久。
所有性能監控工具,都應該能夠通過檢查識別性能瓶頸來提高應用程式性能。

通過提升應用程式正常運行時間,並降低IT員工排查問題所花費的時間,這就是性能監控工具為企業省錢的方式。

對於無法監控伺服器、網路和存儲硬體核心功能性能的監控軟體,可以直接排除出備選列表。

伺服器監控 必備的四大核心領域:

•CPU使用狀況 處理器使用率百分比。

•本地磁碟I/O 本地磁碟使用率以及磁碟級別的吞吐量。

•本地磁碟空間 本地磁碟空間使用百分比。

•記憶體 系統記憶體使用以及可用記憶體百分比。

網路監控需要能夠記錄以下所示的關鍵網路性能參數:

•使用的總頻寬這裡指流入和流出伺服器的總頻寬。

•數據包傳輸量為總頻寬開銷提供合理的檢測參考;如果頻寬消耗高,而傳輸的包數量卻很少,那么可能存在問題,需要認真排查。

•數據包錯誤率了解有多少數據包傳輸錯誤正在產生十分重要,因為這說明在某處網路存在嚴重問題。

存儲監控 需要監控和報告以下共享存儲設備的重要參數:

•陣列可的用性與性能 若存儲為共享設備,一旦其發生問題,可能立刻影響到很多應用程式,監控存儲的狀態十分必要。

•數據卷的狀態陣列支持許多分卷,每個分卷都與某個應用程式關聯,所以獨立監控分卷性能也是應用程式監控的重要因素。

•陣列容量使用狀況 存儲空間不足常見的應用程式可用性問題,所以最總以使用和空閒空間數是性能監控工具必備的基本功能。

•上述內容大部分與硬體監控有關,軟體監控也十分重要。從歷史上看,簡單的應用程式部署拓撲環境中,監控軟體所能產生的效益不大。如今,軟體監控是硬體監控必要的夥伴。

針對應用程式監控的核心功能:

•監控公司核心基礎設施架構的系統軟體與組件。舉例來說,在虛擬化環境下,需要對虛擬機管理平台進行監控。

•為普通的商業軟體,如 Microsoft Exchange,以及開源應用程式,如 RabbitMQ,還有諸如Oracle資料庫的中間件,進行預配置的容量監控。

•具備軟體開發工具包,使軟體能夠定製應用程式和額外的監控指標。例如,特定軟體功能每秒調用次數以及平均回響時間等。

•能夠通過監控外部服務,來測量可用性與性能以及評估應用程式性能影響。

擴展功能

對於不太複雜的環境和運行在普通硬體上的簡單應用程式與組件來說,選擇具備上述核心性能功能的監控軟體足矣。但應用程式拓撲通常需要額外的功能,特別是運作在雲服務環境中。

性能監控軟體通常具備的擴展功能包括:

•聚合/隔離性能顯示 一個套用層可能包括10個或更多的虛擬機(VM),都執行相同的功能。雖然將虛擬機作為一個集合來監控也十分游泳,但在出現問題時,你需要深入獲取某個虛擬機的性能信息。

•聚合/綜合日誌 應用程式可能包含數十或數百個軟體組件。跟蹤性能下降問題具有挑戰,一份從各種不同的組件採集而成的聚合的日誌條目集,能夠方便用戶跟蹤事件的來龍去脈。

•警報 雖然警報通常包含在基本性能監控功能內,具備擴展功能的工具,可以定義閾值和警報路由邏輯。因此,可以將某一類的問題通知給網路組;其他通知給伺服器組。

•可配置的儀錶板 基礎設施和應用程式的圖形化快速輸出信息十分有用。一個可配置的儀錶板可以讓IT人員根據各自職責創建單獨的展示頁。

•應用程式編程接口(API) DevOps運動促使新的套用和基礎設施的自動化選項快速增長。許多選項使用性能監視數據觸發事件和行為。API對於支持數據中心IT任務自動化是至關重要的。

•記憶體級存儲技術 隨著大量從網站應用程式的傳來數據,並需要立即回響性能問題,將數據從磁碟中檢索可能會花費不少時間,在某些情況下無法被用戶接受。為了獲得更快的回響時間,領先的工具監控工具會提供記憶體級的存儲以及切片分割技術來解決快速回響的問題。

時間序列分析

經常對比性能和參數,容易發現觸發問題的事件和條件。存儲和顯示基於時間的分析也是性能監控軟體一種常用的擴展功能。

相關詞條

熱門詞條

聯絡我們