定義
檔案虛擬化可以讓用戶根據各種不同的限制條件來分離檔案數據,例如數據的讀取及管理方式等。傳統的檔案伺服器 採用這種技術可以具備更多的功能,還可以擺脫只能用CIFS或者NFS讀取檔案的限制,而原來這些功能只在網路附加存儲(NAS)設備上才能實現。在實際 工作環境中,用戶可能會遇到各種各樣的限制。致命的是,如果客戶數據和公司內部的數據放在同一個訪問目錄下,用戶想移動某個檔案或者目錄就會變的非常復 雜。
檔案虛擬化可以掩飾用戶讀取檔案的方式,這樣用戶就可以在客戶不受影響的前提下放心的移動和管理自己的數據檔案。 檔案虛擬化同樣適用於那些存儲架構增長較快並且數據讀取較為頻繁的用戶。檔案虛擬化還可以使遷移存儲系統變得更為簡單。這就是現在市場上有種類繁多的檔案 虛擬化軟體的原因。
類型
大部分廠商的檔案虛擬化產品都具備我剛才所談到的特性,當然它們還有一些其它的特性。剛才提到的特性在 Taneja Group被稱為網路檔案管理系統。採用檔案虛擬化後,不管是在NAS存儲中增加一個內部設備還是將外部設備整合到NAS存儲中去都變得非常方便。用戶可 以使用這種方式把客戶的數據與內部的數據分離開來,然後再轉移數據或者做其它操作就非常方便了。檔案虛擬化大部分時候被用作網路檔案管理系統。
用戶對性能要求及操作檔案的密度要求決定了哪些方案適合做檔案級別的虛擬化和哪些方案適合做目錄級別的虛擬化。基於檔案的虛擬化可以實現檔案級別的虛擬,這種情況下,用戶是否需要更高的性能取決於套用是in-band(帶內)還是out-of-band(帶外)。
不管是使用檔案級別還是目錄級別、in-band還是Out-of-band,用戶都可以找到多種選擇。通常情況下,在使用in-band和檔案級別的虛擬化時會有3到4種的方案可供選擇,而out-of-band和目錄級別的虛擬化暫時還不能同時使用。
有些技術也許只是對定期的數據遷移比較實用,對其他的任務則並不奏效,這樣用戶還需要花費額外的時間來管理數據。而這種技術不同,它可以永久的實現環境的虛擬化,不再需要增加其他額外的技術。
不要將檔案虛擬化跟全局命名空間混為一談。全局命名空間可以讓用戶在同一個掛載點訪問不同的檔案和目錄,這樣就省去了在NAS 系統和客戶端分別配置存儲的麻煩。
影響
這取決於用戶的實際情況。檔案虛擬化可以利用多種方式與檔案伺服器互動。有時需要與NAS API結合才能把客戶的請求重新定位到已改變位置的數據上。用戶複製或者遷移檔案的方式會影響環境的複雜性。如果有些數據依賴與你的檔案系統或者有些工具 只能在這個檔案系統上運行,那么就不應該用常規的方式來對這部分數據進行遷移或者複製。這時用戶需要認真考慮是否要在自己的環境中加入這些新技術。
如果用戶在in-band中使用了檔案虛擬化,系統就會出現一些延遲。這時用戶需要注意,在處理故障切換和新數據遷移時可能會出現問題。在複製和遷移時也會存在上面的問題。
可以使用這些技術來進行數據遷移,但是如果用戶使用的複製和遷移技術與這些新技術有衝突的話,那問題就很嚴重了。所以一定要考慮周全後才可以在生產環境中使用這些新技術。
優劣
檔案虛擬化通常要跟存儲設備結合在一起,通過將合適的數據放在相應的層上來達到簡化存儲管理和最佳化存儲的目的。採用這項技術可以的大大簡化存儲的基礎架構並且可以虛擬出更多可用空間,這樣就可以降低對數據進行遷移的次數。
在此之前,如果用戶的檔案系統已經占據了95%的硬碟空間,用戶必須儘快進行數據遷移。而現在用戶可以採用檔案虛擬化來轉移一部分數據,避免匆忙的進行數據遷移。總而言之,採用檔案虛擬化之前要整體全面的考慮存儲架構。
前面我提到過,採用了檔案虛擬化以後,在複製和遷移數據時可能會出現性能問題,但也可以採用一些方法來消除它們。如果用戶想把所有的檔案進行粒度分層,也許會發現對檔案進行重新分層是非常困難的。用戶需要長遠的去考慮這些問題,肯定能找到這種環境下遷移數據的方法。
產品
EMC Corp 的rainfinity 和F5 Network Inc 的Acopia 功能都非常強大,在市場上有絕對的競爭力。它們都可以提供用戶需要的任何功能,例如全局命名空間、檔案級別分層和目錄級別分層,而且它們還提供帶內和帶外 兩種方式供用戶選擇。
中小企業市場也引起了一些公司的關注。AutoVirt公司已經開始向中小企業提供數據遷移方案。澳大利亞的SmApper公司也開始涉足該領域。
檔案虛擬化不僅僅具有遷移分層功能,還可以告訴用戶每種數據需要制定何種策略,並且還具備降低程式負載的功能。所有上面的功能都是檔案區域網路所必需的,這也正是檔案虛擬化那么流行的原因。
評價
和塊級虛擬化簡化了SAN管理一樣,檔案虛擬化消除了企業級NAS系統的複雜性和局限性。 我們都承認非結構化數據急劇增長,並且IT很難控制那些數據,檔案虛擬化這時幫了一個大忙。
檔案虛擬化使物理檔案伺服器的基本細節和NAS設備抽象化,並跨那些物理設備創建了一個統一命名空間。命名空間指的是目錄和檔案及其相應的數據結構。通常一個標準檔案系統,如NTFS檔案系統,一個空間與一台計算機或檔案系統相關聯。通過把多檔案系統和設備都統一到一個單獨的命名空間下,檔案虛擬化提供了一個單一的檔案和目錄,並為管理員提供了一個更易於管理數據的單控制點。
和存儲虛擬化帶來的好處一樣,檔案虛擬化也可以在無間斷的情況下,把檔案數據遷移到另一台。存儲管理員可以在不影響用戶和套用的前提下,進行NAS設備的日常維護以及舊設備的廢棄。
當檔案虛擬化和集群技術相結合時,它的可擴展性和性能都顯著提高。一個NAS集群可以提供數量級吞吐量(Mbps)命令和IOPS.高性能計算(高性能計算)套用,如地震處理,視頻渲染,科研仿真,很大程度上依賴於檔案虛擬化技術為用戶提供可擴展的數據訪問。
三種架構方法,只有檔案虛擬化還處於起步階段。不同廠商的方法適用於不同的使用模式,沒有放之四海而皆準的。一般來說,你會發現現在市場上三種不同的檔案虛擬化方法:集成平台的命名空間,集群存儲派生的命名空間和網路虛擬的命名空間。
集成平台的命名空間是主機檔案系統的擴展。它們提供了一個特定的平台。這一類型的命名空間非常適合多站點協作,但他們往往缺乏檔案控制,因此他們就限制在單一檔案系統或作業系統內。 如博科StorageX,NFS v4和Microsoft分散式檔案系統(DFS)。
集群存儲系統結合集群和先進的檔案系統技術,創建了一個可支持無限增多的NFS 和CIFS請求的模組化可擴展系統。 這些集群系統是一個統一的,跨所有集群因素共享的命名空間。集群存儲系統非常適合高性能套用,把多檔案伺服器整合到一個單一的高可用性系統內。這些廠商主要包括Exanet,Isilon公司,NatApp公司(Data ONTAP GX),惠普(PolyServe)公司。
網路虛擬命名空間是由網路設備(通常稱為網路檔案管理器)創建的。網路檔案管理器存在於客戶端和NAS設備之間。 基本上充當路由器或交換機,這些設備在用戶和存儲之間展現一個虛擬的命名空間。 網路虛擬命名空間非常適合用於分層存儲部署和其他的非中斷數據遷移情況。