持續數據保護概念
持續數據保護:Continuous Data Protection,簡稱CDP。
CDP定義:
持續數據保護(CDP)是一種在不影響主要數據運行的前提下,可以實現持續捕捉或跟蹤目標數據所發生的任何改變,並且能夠恢復到此前任意時間點的方法。CDP系統能夠提供塊級、檔案級和套用級的備份,以及恢複目標的無限的任意可變的恢復點。
持續數據保護(CDP)技術是對傳統數據備份技術的一次革命性的重大突破。傳統的數據備份解決方案專注在對數據的周期性備份上,因此一直伴隨有備份視窗、數據一致性以及對生產系統的影響等問題。現在,CDP為用戶提供了新的數據保護手段,系統管理者無須關注數據的備份過程(因為CDP系統會不斷監測關鍵數據的變化,從而不斷地自動實現數據的保護),而是僅僅當災難發生後,簡單地選擇需要恢復到的時間點即可實現數據的快速恢復。
CDP技術通過在作業系統核心層中植入檔案過濾驅動程式,來實時捕獲所有檔案訪問操作。對於需要CDP連續備份保護的檔案,當CDP管理模組經由檔案過濾驅動攔截到其改寫操作時,則預先將檔案數據變化部分連同當前的系統時間戳(System Time Stamp)一起自動備份到存儲設備。從理論上說,任何一次的檔案數據變化都會被自動記錄,因而稱之為持續數據保護。
CDP與傳統備份技術的對比
形象比喻:傳統備份軟體就像是照相機,只在按快門的時候產生照片;CDP軟體則是攝像機,打開就不停工作,任何時間的圖像都不會錯過。
持續數據保護概念的出現使得用戶擁有了一個連續備份的夢想,CDP的願景極具吸引力,用戶期待它的早日實現。目前,一些大型存儲廠商已經推出類似CDP產品。
傳統備份效果有限
傳統的備份技術一般為手動備份或定時備份。
典型的手動備份流程是這樣的:每天在凌晨進行一次增量備份,然後每周末凌晨進行全備份。採用這種方法,一旦出現了數據災難,用戶可以恢復到某天(注意是以天為單位的)的數據,因此在最壞的情況下,可能丟失整整一天的數據。
定時備份技術比手動備份技術有所進步,定時備份屬於自動備份的技術範圍,一般為若干小時自動備份一次,比如:5小時備份一次。如果出現數據災難,用戶可以恢復到若干小時之前的數據,在最壞的情況下,可能丟失5小時內的數據。
但是對於數據量不斷變化增長的用戶來說,每一份數據的丟失都會造成利益的損失。
那么,能不能繼續縮小備份時間單位呢?比如,可不可以每小時進行一次增量備份呢?甚至每分鐘備份一次?基於傳統備份技術的解決是難以實現的。
CDP應運而生
既然傳統的磁帶備份間隔較長,那么怎樣才能夠做到連續的數據保護呢?CDP正是為了解決這個問題而出現的。
持續數據保護是一種連續捕獲和保存數據變化,並將變化後的數據獨立於初始數據進行保存的方法,而且該方法可以實現過去任意一個時間點的數據恢復。CDP系統可能基於塊、檔案或套用,並且為數量無限的可變恢復點提供精細的可恢復對象。
因此,所有的CDP解決方案都應當具備以下幾個基本的特性:數據的改變受到連續的捕獲和跟蹤;所有的數據改變都存儲在一個與主存儲地點不同的獨立地點中;恢復點目標是任意的,而且不需要在實際恢復之前事先定義。
所以,CDP可以提供更快的數據檢索、更強的數據保護和更高的業務連續性能力,而與傳統的備份解決方案相比,CDP的總體成本和複雜性都要低。
CDP技術分類
CDP持續數據保護技術分為真CDP(True CDP)和準CDP(Near CDP)兩類。
CDP的分類是相對於數據保護時間點而言的。準CDP技術是按照一定的時間頻率,持續的記錄並備份數據變化,每次備份有一定時間視窗,需要數據恢復時,可以恢復到過去備份的時間點,並不能形成完全意義上的持續保護,因此稱為準CDP技術。
而真CDP技術是持續不間斷的監控並備份數據變化,可以恢復到過去任意時間點,是真正的實時備份。
真CDP技術為什麼實際套用很少?
在實際套用中真CDP技術套用較少,一方面是技術原因,需要解決數據的持續不間斷監控和記錄的技術難題;另一方面是由於真CDP技術持續備份時產生的大量數據,遠大於其他備份方式產生的數據量,對數據存儲形成巨大壓力,也給用戶造成費用負擔,所以大多數CDP備份產品都採用準CDP技術。
準CDP技術目前在市場宣傳中已經突破了原有的限定,被廣泛用於代指可以按照一定的周期持續性保護數據的技術,如Symentac、EMC、飛康、愛數等公司採用的大多是快照技術,但也歸入了準CDP技術行列。
採用真CDP技術的國內災備企業大多是後起之秀,如壹進制公司的UnaCDP系列災備產品,就是採用真CDP技術,並且採用差量備份和增量備份相結合的策略,大大降低存儲量。並配合獨立研發的重複數據刪除技術,最佳化存儲空間,徹底解決真CDP技術的套用難題。