內容簡介
數據倉庫和商業智慧型至少自1970年就具有相似的形式,並且持續享受著無限的技術生命周期。在1995年,我們的主要作者構建了第一個顧問公司,其中的作者之一認為數據倉庫已經結束了,這個浪潮已經開始回落。幸運的是,我們在找到工作之前獲得了更多的項目。1
2年後,數據倉庫和商業智慧型依然很強大,事實上,僅僅在過去幾年我們才看到它們在工業上的成熟。
成熟市場的一個標誌就是單源提供者的出現——對不願冒風險的公司來說這是一種安全的選擇。數據倉庫技術涵蓋了從深奧源系統知識到用戶接口設計以及具有最好實踐的BI套用。儘管許多銷售商在最近幾年都爭著把自己放在端到端的提供者位置上,但對於我們來說,很顯然,數據倉庫銷售商確實是那些可以提供端到端解決方案的人。在2001年,當我們首次討論這本書時,我們已經感覺到Microsoft要以一個誘人的價格強行將一個可行的、單源數據倉庫系統提供者的概念加入到現實世界中。
我們相信向單源提供者的轉變意味著必須將KimballMethod技術擴展到特定的產品級,使其可以直接投放單源提供者市場。我們選擇Microsoft工具集作為測試樣例有兩個原因,首先,SQLServer2005是一個強大的BI平台,Microsoft自20世紀90年代中期投資AnalysisServices引擎以來,就一直在擴展和增強商業智慧型方面投資巨大。投資的級別也因此巨大地翻升。隨著SQLServer2005開發的開始,SQLServer2005開發團隊增長到200人,Microsoft對於將商業智慧型引入主流市場很認真。其次,兩位作者都從1997到2002或2004在Microsoft工作,特別地,Joy曾是SQLServerBusinessIntelligence開發團隊中SQLServerBIBestPractices組的經理,這可以給予我們一系列很強的工作關係以及訪問關鍵的支持資源。
本書覆蓋了整個數據倉庫生命周期,因而可以給數據倉庫團隊的每個成員提供有用的指導,從項目經理到業務分析師、數據建模者、ETL開發者、DBA,分析型套用開發人員甚至業務用戶都可以從本書中受益。我們相信本書對從事MicrosoftSQLServer2005數據倉庫項目的任何人都非常有價值。
本書的主要讀者是在MicrosoftSQLServer平台上啟動項目的新的DW/BI團隊,我們假定您並沒有構建DW/BI系統的經驗,但假定您對Microsoft世界有一個基本的認識:作業系統、基礎設施組件以及資源。我們也假定您對關係資料庫(表、列和簡單SQL)有一個基本認識,並且對SQLServer2000關係資料庫有一定認識,儘管這並不是一個必備條件。貫穿全書,我們提供了許多其他書和資源的參考。
第二個讀者群是有KimballMethodDW/BI使用經驗但首次接觸MicrosoftSQLServer2005工具集的讀者,這些讀者可能需要閱讀一些資料以便了解基礎結構,特別是如果您從來沒有使用過WindowsServer更需如此。我們將指出對於那些曾經閱讀過我們的Toolkit書籍以及實踐過我們的方法的讀者需要複習哪些部分和章節,不過再次閱讀這些材料並沒有壞處。
不管您的背景如何,如果您從一個新項目開始將從本書受益匪淺。儘管我們確實提供了運轉現有的數據倉庫的建議,但在理想情況下,您不會對任何已有的數據倉庫或數據集市滿意,至少在新系統部署後對仍然留在原處的系統不會滿意。
作者簡介
曼蒂(JoyMundy),KimballGroup小組的成員,她負責諮詢、編寫和講授商業智慧型和數據倉庫。作為MicrosoftSQLServer產品開發團隊的實現者、顧問和成員,她在商業智慧型方面具有廣泛的經驗。
目錄
第Ⅰ部分需求、實施和體系結構
第1章定義業務需求
1.1長期成功的最重要的決定因素
1.2揭示業務價值
1.3業務需求示例:AdventureWorksCycles
1.4小結
第2章業務過程維度模型設計
2.1維度建模概念和術語
2.2其他設計概念和技術
2.3維度建模過程
2.4案例研究:創建AdventureWorksCycles訂單維度模型
2.5小結
第3章工具集
3.1MicrosoftDW/BI工具集
3.2使用Microsoft工具集的原因
3.3MicrosoftDW/BI系統的體系結構
3.4Microsoft工具概述
3.5小結
第Ⅱ部分開發和填充資料庫
第4章設定和物理設計
4.1系統規模考慮事項
4.2系統配置考慮
4.3軟體安裝和配置
4.4物理數據倉庫資料庫設計
4.5小結
第5章設計ETL系統
5.1SQLServerIntegrationServices簡介
5.2高級計畫
5.3更新AnalysisServices資料庫
5.4ETL系統物理設計
5.5開發詳細的規範
5.6小結
第6章開發ETL系統
6.1起始
6.2維度處理
6.3事實處理
6.4補充介紹
6.5小結
第7章設計AnalysisServicesOLAP資料庫
7.1選擇AnalysisServices的原因
7.2設計OLAP結構
7.3物理設計的考慮因素
7.4小結
第Ⅲ部分商業智慧型應用程式的開發
第8章商業智慧型應用程式
8.1商業智慧型的基本概念
8.2商業智慧型應用程式的價值
8.3交付平台選項
8.4BI應用程式的開發過程
8.5小結
第9章在ReportingServices中構建BI應用程式
9.1報表高層次的體系結構
9.2報表的構建和傳送
9.3小結
第10章數據挖掘的加入
10.1數據挖掘的定義
10.2SQLServer數據挖掘體系結構的概述
10.3Microsoft數據挖掘的算法
10.4數據挖掘的過程
10.5數據挖掘的示例
10.6小結
第Ⅳ部分DW/BI系統的部署和管理
第11章使用現有的數據倉庫進行工作
11.1事情的現狀
11.2從SQLServer2000轉換到SQLServer2005
11.3與非SQLServer2005組件的集成
11.4小結
第12章安全
12.1確定安全管理員
12.2保護硬體
12.3保護作業系統
12.4保護開發環境
12.5保護數據
12.6使用情況的監控
12.7保護隱私
12.8小結
第13章元數據規劃
13.1元數據的基礎
13.2元數據標準
13.3SQLServer2005元數據
13.4實用的元數據方法
13.4小結
第14章部署
14.1系統部署
14.2數據倉庫和BI文檔
14.3用戶的培訓
14.4用戶支持
14.5台式計算機的準備和配置
14.6小結
第15章運行與維護
15.1提供用戶支持
15.2系統管理
15.3小結
第Ⅴ部分DW/BI系統的擴充
第16章成長的管理
16.1生命周期的疊代:成長的DW/BI系統
16.2銷售和期望的管理
16.3系統互連
16.4小結
第17章實時商業智慧型
17.1為(和不為)實時數據創建事例
17.2實時地執行報表
17.3實時地載入DW/BI系統
17.4使用AnalysisServices來傳送實時數據
17.5小結
第18章目前的需要以及未來的展望
18.1DW/BI項目中的很大風險
18.2MicrosoftBI工具集中受歡迎的部分
18.3未來的方向:改進的空間
18.4小結