一、 可用性管理概念
可用性管理是有關設計、實施、監控、評價和報告IT 服務的可用性以確保持續地滿足業務的可用性需求的服務管理流程。
可用性(Availability)是指一個組件或一種服務在設定的某個時刻或某段時間內發揮其應有功能的能力。它通常以”可用率”來表示,即在約定的服務時段內,客戶實際能夠使用的服務的時間比例。
與可用性相關的概念有:
可靠性(Reliability):是指IT 基礎架構可以無間斷運作的能力,它主要取決于單個IT 組件的可靠性和IT 基礎架構的整體恢復能力。
可維護性(Maintainability):是指IT 基礎架構在出現故障后能夠被迅速恢復的能力。
安全性(Security):是指于某項服務相關的數據的保密性、完整性和可用性。
二、 可用性管理目標
可用性管理的目標是提供確保業務目標的成本合理的、可用性級別定義的IT 服務。即客戶需求應該和IT 結構及IT 組織所能提供的能力相一致。如果二者之間存在差距,就需要由有可用性管理流程來提供解決方案。
三、 可用性管理流程
1、可用性管理流程圖:
2、從“可用性管理流程運作過程所需信息輸入、關鍵活動、信息輸出”(如圖示)看可用性管理與其他流程運作的密切聯系:
? 事故管理:事故管理提供的事故信息可作為可用性管理分析IT 基礎架構和IT 服務可用性的重要數據來源。可用性管理通過提出合理的可用性解決方案減少了事故的發生。
? 問題管理:問題管理可以為可用性管理設計和監控IT 基礎架構和IT 服務的可用性提供有益的建議。問題管理提出的應急措施或解決方案也會直接或間接影響IT 服務的可用性。
? 配置管理:可用性管理需要根據配置管理數據庫提供的信息對IT 基礎架構的可用性進行監控和評價。配置管理則負責存儲有關IT 基礎架構可用性的信息并進行更新。
? 變更管理:可用性管理可向變更管理發出有關能力問題的變更請求,通過實施變更提高IT 基礎架構和IT 服務的可用性。變更管理在實施變更時應當通知可用性管理對變更組件或服務的可用性進行重點監控。
? 服務級別管理:可用性是服務級別協議中要重點考慮的IT 服務指標。可用性管理通過對業務可用性需求的分析,可以明確服務可用性目標,從而便于服務級別協議協商和簽訂服務級別協議。同時,可用性對服務可用性進行監控和報告也有助于服務可用性級別的提高。服務級別管理所確定的服務級別目標和IT 服務需求是可用性管理流程確定可用性需求和可用性目標的基礎。
? 持續性管理:IT 服務的可用性和持續性具有很大的相關性。為增強IT 服務可用性而采取的措施也同時增強了IT 服務的持續性。可用性管理負責對IT 基礎架構及IT 服務運作的進行可用性監控,而IT 服務持續性管理主要著眼于重大災難的恢復。IT 服務持續性管理可以為可用性管理提供有關關鍵業務流程的信息。
? 能力管理:IT 基礎架構的服務能力在很大程度上決定了IT 服務的可用性。可用性管理需要根據能力管理提供的數據進行IT 基礎架構的可用性設計。
四、 可用性管理主要活動
可用性管理流程運作過程中需要進行的活動主要包括可用性需求分析、可用性設計、恢復方案設計、編制可用性計劃、IT 組件維護管理、可用性改進、可用性評價和報告等活動。
? 可用性需求分析:為了保證IT 服務運作能夠滿足業務可用性需求,在確定服務級別需求和服務級別目標之前,必須確定組織的業務可用性需求和相應的IT 服務可用性需求。可用性管理人員在根據組織的業務可用性需求確定服務可用性需求時,必須同時評價實現服務可用性需求的成本相對于其提高的效益而言是否是合理的。事實上,一個合理有效的可用性需求通常是服務成本和服務品質平衡的結果。
? 可用性設計:在確定組織的服務可用性需求和可用性目標之后,可用性管理人員必須為實現該可用性需求和目標設計合理的IT 基礎架構可用性,以確保IT 基礎架構足以支持服務可用性目標的實現。可用性設計是一種主動的可用性管理,它通過為IT 基礎架構設計合理的可用性避免IT 服務可用性故障的發生。
? 恢復方案設計:恢復方案設計是一種消極的可用性管理,其主要目的是在IT 服務故障發生后,以最短的時間恢復IT 服務的可用性。構建一個具有完全可用性的IT 基礎架構是不可能的,或者構建這樣的IT 系統成本過于高昂而不符合成本效益原則。在這種情況下,恢復方案設計提供了很好的故障后支持,從而以盡可能低的成本維持IT 服務的可用性。
? 編制可用性計劃:明確的可用性計劃成功運作可用性管理和改進IT 組件及服務的可用性具有重要意義。可用性計劃不僅需要關注技術方面的問題,還應對可用性管理的人員、流程、工具和技巧等方面進行綜合考慮。
? IT 組件維護管理:為保證IT 組件的可用性,可用性管理人員必須對按照可用性計劃對IT 組件進行定期維護。有計劃的維護活動可以使業務部門提前做好準備,從而將維護活動對業務可用性的影響減小到最低程度。有時候,為了減少因維護而導致的宕機時間(Downtime),可以考慮將對多個組件進行集中維護。
? 可用性改進:當業務可用性需求發生變化或其他情況發生時,可用性管理人員需要考慮采取積極的措施以改進IT 組件和服務的可用性。在實施可用性改進的過程中,可用性管理人員需要監控并分析可用性的變化趨勢、確定業務可用性需求的變化以及由此而導致的IT 組件和服務的可用性需求的變化、明確可用性改進的成本
? 可用性評價和報告:對IT 組件和服務的可用性進行評價和報告可以明確可用性管理流程運作的效果,從而有助于改進可用性流程的運作質量。在進行可用性報告時,應當從客戶的角度進行報告。可用性報告需要向客戶及IT 服務經理提供有關關鍵業務功能、應用服務和數據的服務可用性方面的信息,而不是IT 組件的技術可用性方面的信息。可用性報告應當以客戶易于理解的語言撰寫。
五、 可用性管理關鍵指標
? IT 組件或服務項目可用性百分比;
? 一定時間內IT 組件的停機時間;
? 停機頻率;
? 實施可用性改進所耗費的成本;
? 因可用性改進而減少的事故的數量。
六、 可用性管理關鍵成功因素
? 制定明確的可用性目標;
? 保持可用性管理與能力管理、配置管理之間緊密協調;
? 制定充分的可用性計劃;
? 可用性目標應當在服務級別協議中予以明確定義;
? 客戶和IT 部門必須使用一致的有關可用性和停機時間的定義。
七、 綜述
可用性管理是確保資源、方法和技術得以適當拓展的流程管理,以支持與客戶簽訂的IT服務級別協議。可用性管理為服務級別管理提供支持,最大程度地減少意外突發事件的數量。可用性管理負責協調、設計、測量和管理IT管理設施的可用性,并會綜合考慮基礎設施和支持機構的各方面情況。它可以協調和集成各個松散結合的“孤島”,確保IT能夠按照必要的水平和成本提供所需的服務。可用性管理包括關鍵性業務功能、安全性、可靠性、容錯性、可維護性和服務可用性管理內容。