數據聯邦
在大型現代企業中,組織中的各部門使用不同資料庫管理系統來存儲和搜尋其重要數據,這幾乎是不可避免的。競爭、不斷發展的技術、合併、收購、地域分布以及擴展中不可避免的分散等因素都會造成這種多樣性。但只有將這些系統中的信息組合起來,企業才會認識到這些系統所包含數據的整體價值。
例如,在金融行業,合併幾乎是很常見的事。新創建的實體沿襲了原有機構的數據存儲。許多這樣的存儲都是關係資料庫管理系統,但這些系統常常來自不同的廠商;例如,一家公司可能主要用 Sybase,而另一家公司用 Informix® IDS。他們可能都有一個或多個文檔管理系統(譬如,Documentum 或 IBM Content Manager)用於存儲文本文檔(譬如,貸款副本等)。每種系統可能都有一些應用程式來計算重要信息(例如,某個特定客戶的貸款風險)或挖掘有關客戶購買模式的信息。
在企業合併之後,他們需要能夠從兩套存儲中訪問所有客戶信息,使用現有的和新的應用程式來分析他們新的資產組合,通常情況下,還要通過一個公共接口來使用兩個機構中經過組合的資源。雖然不同公司可能用完全不同的標識鍵來標識他們的客戶,但在合併後他們需要能夠標識他們公共的客戶,合併這些客戶的帳戶。在這些情況下,聯邦技術通過提供異構數據的統一接口有效地解決這一問題。
本文主要討論高級的資料庫聯邦技術,它們是通過代號為“Garlic”的技術來實現的,這種技術代表了 IBM 軟體的下一代信息聯邦增強功能。這些增強功能將使客戶機能夠訪問和集成數據,能夠專門計算各種關係型和非關係型數據源。隨著時間的推移,Garlic 技術將會不斷融入 IBM 所有提供聯邦技術軟體產品之中。客戶可以放心,不但他們對現有產品的投資會受到保護,而且以後無論選擇哪種產品,他們都將能夠利用這裡所描述的高級技術。這組聯邦技術會繼續得到增強,我們的客戶在所有這些產品上的投資會繼續產生實際的商業價值。
IBM 的聯邦資料庫系統為組合來自多個數據源的信息提供了功能強大的工具。IBM 的聯邦資料庫技術構建在早期產品 DB2 DataJoiner [3] 的最佳技術之上,並且在可擴展性和性能方面,通過套用 Garlic 研究項目 [2] 的一些位於前沿的特性而得到了增強,這些技術在該行業是獨一無二的。DB2 DataJoiner 引入了虛擬資料庫的概念,這個虛擬資料庫是通過聯邦多個異構數據源而創建的。DB2 DataJoiner 的用戶可以隨意查詢存儲在聯邦系統中任意位置的數據,而不必擔心數據的位置、實際數據源系統的 SQL 語言種類或者存儲的能力。相反,對於聯邦資料庫中的任何數據,用戶可以按照 DB2 的方式來進行操作。Garlic 項目展現了拓展這一思想來構建聯邦體資料庫系統的可行性,該系統可以有效地使用各種不同的、可能是非關係型數據源的查詢能力。在這些系統中(如當今的 DB2),中間件查詢處理器促進了最佳化執行方案,並彌補了各數據源可能缺乏的功能。
在本文中,我們描述 IBM 聯邦技術的主要特徵:透明性、異構性、高級功能、底層聯邦數據源的自治、可擴展性、開放性和最佳化的性能。然後,我們回過頭來向您展示 IBM 的資料庫聯邦技術是如何工作的。我們演示了在各種情形下如何使用聯邦技術,並推斷將來的一些發展趨勢。
數據聯邦的優點
優點是數據依然保留在原來的存儲位置,而不必構建一個集中式數據倉庫。
數據聯邦的缺點
數據聯邦查詢反應慢,不適合頻繁查詢,而且容易出現鎖爭用和資源衝突等問題。