管理步驟
事件管理流程大概如下:當一個事件輸入的時候,首先要對事件進行檢查、定位。檢查事件的時候要與它不斷互動,明確它的影響範圍和緊急程度,還要進行初步的歸類評估。服務台(ServiceDesk)是事件的唯一入口,它接收事件後,操作人員通過查閱CMDB〔配置管理資料庫)進行處理。
1.事件的查明和記錄
服務台記錄一些標識客戶的基本信息,如姓名、工作地點、電話號碼等,而事件管理記錄詳細的事件信息,如事件發生的時間、受事件影響的服務等。這樣做的目的是便於確認事件的影響,問題管理可以根據這些信息查找事件原因,密切跟蹤事件進展。
首先,當用戶、服務台工作人員或其他IT部門人員發現或系統檢測到某系統發生事件時,就將其報告給服務台,服務台將基本信息輸入事件資料庫並報告給事件管理人員。通常所有的事件都是先報告給服務台,再由服務台工作人員將其輸入事件資料庫,服務支持小組是不允許直接記錄事件的。
其次,事件管理人員給事件一個唯一的編號(事件單號),記錄一些基本的事件分析信息(時間、症狀、位置、用戶、受影響服務、硬體等),並補充其他的事件信息(與用戶的互動信息和配置管理資料庫等。
再次,事件管理人員根據服務台提供的信息和事件資料庫信息判斷此類事件是否與已有的事件相同或類似,如果有就更新事件信息或建立原事件的從屬記錄,並在必要時修改原事件的影響度和優先權,如果沒有則創建新事件記錄。最後,事件管理需要判斷事件是否嚴重,如果嚴重就先向管理層報告並告知用戶有關情況,再採取進一步行動,如果不嚴重就直接進入下一步的事件初步歸類和支持。
2.初步歸類和初步支持
經過第一步的事件查明和記錄,可從用戶處獲取的事件信息基本上已得到,事件管理資料庫已經根據這些信息進行更新,接下來就是事件的初步歸類和初步支持。這裡強調初步,就是為了能夠儘可能快地恢復用戶的正常工作,儘量避免或者減少事件對IT服務質量的影響。
歸類的目的是發現事件原因以便採取相應行動。一般來說,許多事件是重複出現的,因此,當某個事件再次出現時,只需要根據已有的經驗和措施採取行動即可:,當新的事件出現時,就有一個與其問題和知名錯誤(知識庫)相匹配的過程,如果匹配成功就可直接用已有的方案將其解決,而不需要進一步調查,否則就要繼續進行下面提到的其他幾個步驟。
服務台如果沒有成功解決事件,就將事件轉交給二線、三線支持處理,然後負責記錄事件並聯繫各支持小組,採取必要的措施以確保用戶滿意。如果碰到未出現過的事件或事件解決過程非常複雜,就必須對事件進行調查和分析。
3.事件調查和分析
事件在第一階段和第二階段沒有圓滿解決時,專家支持小組應介入處理過程,對其進行調查和分析。
一旦事件被分派給某個支持小組,他們應當完成以下工作:確認接收事件處理任務,同時指定有關日期和時間以保障正常更新事件狀態和歷史信息,經過服務台及時通知客戶事件最新進展,說明事件當前所處的狀態;儘可能快地把發現的權宜措施提供給服務台和客戶;參考知名錯誤、問題、解決方案、計畫的變更和知識庫等對事件進行評審;必要時要求服務台根據協定的服務級別,重新評價事件影響度和優先權,並在必要時對其進行調整;記錄所有相關信息,包括解決方案、新增的或修改的分類;將所有相關事件的更新、花費的時間以及處理結果反饋給服務台以讓其終止此類事件。
4.解決事件和恢復服務
在分析和調查事件後,支持小組根據更新的事件信息,提議的權益措施和解決方案以及有關的變更請求,解決事件並恢復服務,同時更新有關事件信息
5.事件終止
解決事件和恢復服務後,事件到達終止階段。這個階段輸入的是上一階段更新後的事件記錄和已解決的事件,採取的行動主要是和客戶一起確認事件解決是否成功,輸出的結果為更新的事件信息和事件記錄。在事件解決後,服務台應該確保以下內容:有關用於解決事件的行動的信息是準確的、易懂的;根據事件產生的根本原因對其歸類;客戶同意事件解決方案和方案的執行及最終結果;詳細記錄事件控制階段的所有相關信息,如客戶是否滿意和滿意度如何,處理事件所花費的時間,事件終止的日期和時間。
相關軟體
對於不同規模的公司,所需要的事件管理流程也是不相同的。對於一個中小型的企業,IT人員只有幾個人,這時候就不需要很複雜的事件處理流程,只需要實現“請求-指派-處理-確認”的基本過程即可。對於一個大型的企業或者專業的IT服務公司,則需要組建專門的IT服務受理和監督機構、多級IT技術支持團隊,和與之適應的較為複雜完善的事件跟蹤流程。
使用URTracker進行事件管理,您將可以:
根據您的組織規模、人員配置情況,設計和實現最適合自身情況的流程。
對用戶提供了一個統一的IT部門聯繫接口。用戶可以及時獲知事件的處理進展和處理過程。
通過URTracker的“狀態實現”和“定時器”功能,控制不同級別事件或問題在每個處理步驟的回響時限和處理時限要求等。在超過時限時自動進行通知或升級指派操作。
支持將事件提交給一個組(如IT支持人員組),組中合適的人可以領取並處理事件。
將事件處理經驗總結歸納成知識庫文章,供用戶學習,從而減少類似事件的發生和相應的服務請求數量。
統計分析各種問題出現的頻率和分布,採取更有效的維護措施減少事故發生。