內容簡介
《DW2.0:下一代數據倉庫的構架》是數據倉庫和商業智慧型領域的又一部經典著作,講述了整個生命周期各個環節的具體工作,從業務需求的視角,引導讀者全面認識下一代數據倉庫系統的構架。《DW2.0:下一代數據倉庫的構架》包含了DW2?0詳細的定義和描述,此外,書中對數據倉庫的結構、內容及其前景進行了介紹。
《DW2.0:下一代數據倉庫的構架》主要面向數據倉庫的業務分析人員、信息構架師、系統開發人員、項目經理、數據倉庫技術人員、資料庫管理員、數據建模人員、數據管理員等。
作者簡介
W.H.Inmon,數據倉庫之父。他一直致力於資料庫和數據倉庫技術方面的研究,在數據管理和數據倉庫技術方面以及數據處理的管理方面撰寫了49本著作,發表過1000多篇學術論文。他創建了世界上第一個ETL軟體公司,最新成立的一個公司是ForestRim。rechnology公司,該公司致力於非結構化數據的存取並將其整合到結構化環境中。
Derek Strauss,Gavroshe公司的創始人.CEO和首席顧問。他擁有28年IT界從業經驗和22年信息資源管理及商業智慧型/數據倉庫領域的從業經驗。
Genia Neushloss, Gavroshe公司的聯合創始人和首席顧問。30多年來,她在保險業、金融業、製造業,採礦業及電信業都擁有相當深厚的管理及技術經驗。
圖書目錄
出版者的話
譯者序
前言
關於作者
第1章 數據倉庫簡史及第一代數據倉庫
1.1 資料庫管理系統
1.2 線上套用
1.3 個人電腦和4GL技術
1.4 蜘蛛網環境
1.5 企業角度的演化
1.6 數據倉庫環境
1.7 什麼是數據倉庫
1.8 整合數據——一個痛苦的經歷
1.9 數據的量
1.10 一種不同的開發方法
1.11 演變到DW2.0環境
1.12 數據倉庫的商業影響
1.13 數據倉庫環境的各種組件
1.13.1 ETL——抽取/轉換/裝載
1.13.2 ODS——運算元據存儲
1.13.3 數據集市
1.13.4 探索倉庫
1.14 數據倉庫的演變——從企業的角度
1.15 關於數據倉庫的其他觀念
1.16 主動數據倉庫
1.17聯合數據倉庫方法
1.18 星狀模式方法
1.19 數據集市數據倉庫
1.20 建立一個“真正的”數據倉庫
1.21 總結
第2章 DW2.0簡介
2.1 DW2.0——一種新的範式
2.2 DW2.0——從企業的角度
2.3 數據的生命周期
2.4 設定不同區的原因
2.5 元數據
2.6 數據訪問
2.7 結構化數據/非結構化數據
2.8 文本分析
2.9 “廢話”
2.10 術語問題
2.11 特定文本/一般文本
2.12 元數據——一個主要組成部分
2.13 本地元數據
2.14 基礎技術
2.15 不斷變化的業務需求
2.16 DW2.0中的數據流
2.17 數據量
2.18 實用應用程式
2.19 DW2.0和參照完整性
2.20 DW2.0的報告
2.21 總結
第3章 DW2.0組成部分——關於不同區
3.1 互動區
3.2 整合區
3.3 近線區
3.4 歸檔區
3.5 非結構化處理
3.6 企業用戶的觀點
3.7 總結
第4章 DW2.0中的元數據
4.1 數據和分析的可復用性
4.2 DW2.0中的元數據
4.3 主動知識庫/被動知識庫
4.4 主動知識庫
4.5 企業元數據
4.6 元數據和記錄系統
4.7 分類
4.8 內部分類/外部分類
4.9 歸檔區元數據
4.10維護元數據
4.11舉例說明如何使用元數據
4.12終端用戶的觀點
4.13總結
第5章 DW2.0技術基礎設施的流動性
5.1 技術基礎設施
5.2 快速的業務改變
5.3 環狀改變
5.4 打破循環
5.5 縮短IT回響時間
5.6 語義暫態、語義常態數據
5.7 語義暫態數據
5.8 語義穩定的數據
5.9 混合語義穩定和不穩定數據
5.10 分離語義穩定和不穩定數據
5.11 減緩業務的改變
5.12 創建數據快照
5.13 歷史記錄
5.14 數據劃分
5.15 終端用戶的觀點
5.16 總結
第6章 DW2.0的方法與途徑
6.1 螺鏇式方法——主要特點綜述
6.2 七流法——總覽
6.3 企業參考模型流
6.4 企業知識協調流
6.5 信息工廠開發流
6.6 數據歸檔定位流
6.7 數據糾正流(舊稱數據清理流)
6.8 基礎設施流
6.9 整體信息質量管理流
6.10 總結
第7章 統計處理和DW2.0
7.1 兩種類型的處理
7.2 使用統計分析
7.3 比較的完整性
7.4 啟發式分析
7.5 凍結的數據
7.6 探索型處理
7.7 分析頻率
7.8 探索工具
7.9 探索型處理數據的來源
7.10 更新探索數據
7.11 基於項目的數據
7.12 數據集市和探索工具
7.13 數據回流
7.14 在內部使用探索數據
7.15 企業分析員的觀點
7.16 總結
第8章 數據模型與DW2.0
8.1 智慧型路線圖
8.2 數據模型和企業
8.3 整合範圍
8.4 區別粒狀型數據和概括型數據
8.5 數據模型的層次
8.6 數據模型和互動區
8.7 企業數據模型
8.8 模型轉化
8.9 數據模型和非結構化數據
8.10 企業用戶的觀點
8.11 總結
第9章 監視DW2.0環境
9.1 監視DW2.0環境
9.2 事務監視
9.3 數據質量監視
9.4 數據倉庫監視
9.5 事務監視——回響時間
9.6 高峰期處理
9.7 ETL數據質量監視
9.8 數據倉庫監視工具
9.9 休眠數據
9.10 企業用戶的觀點
9.11 總結
第10章 DW2.0與安全
10.1 保護訪問數據
10.2 加密技術
10.3 缺點
10.4 防火牆
10.5 使數據脫機
10.6 限制性加密
10.7 直接轉儲
10.8 數據倉庫監視
10.9 檢測攻擊
10.10 近線區數據的安全
10.11 企業用戶的觀點
10.12 總結
第11章 時間相關數據
11.1 DW2.0中的所有數據——與時間相關
11.2 互動區中的時間相關性
11.3 DW2.0其他部分中的數據相關
11.4 整合區中的事務處理
11.5離散數據
11.6 連續時間段數據
11.7 一個記錄序列
11.8 非重疊記錄集
11.9 開始和結束一個記錄序列
11.10 數據的連續性
11.11 時間瓦解數據
11.12 歸檔區中的時間相關變數
11.13 企業用戶的觀點
11.14 總結
第12章 DW2.0的數據流
12.1 貫穿整個構架的數據流
12.2 進入互動區
12.3 ETL的角色
12.4 進入整合區的數據流
12.5 進入近線區的數據流
12.6 進入歸檔區的數據流
12.7 下降的數據訪問機率
12.8 數據的異常流
12.9 企業用戶的觀點
12.10 總結
第13章 ETL處理與DW2.0
13.1 轉換數據狀態
13.2 ETL適用範圍
13.3 套用數據到企業數據的轉換
13.4 ETL工作模式
13.5 源和目標
13.6 ETL映射
13.7 狀態轉換——實例
13.8 更加複雜的轉換
13.9 ETL與吞吐量
13.10 ETL與元數據
13.11 ETL與審核記錄
13.12 ETL與數據質量
13.13 創建ETL
13.14 代碼創建或參數驅動的ETL
13.15 ETL與丟棄
13.16 變化數據的捕獲
13.17 ELT
13.18 企業用戶的觀點
13.19 總結
第14章 DW2.0與粒度管理器
14.1 粒度管理器
14.2 提高粒度級別
14.3 過濾數據
14.4 粒度管理器的功能
14.5 本地與第三方粒度管理器的比較
14.6 粒度管理器的並行化
14.7 作為副產品的元數據
14.8 企業用戶眼中的粒度管理器
14.9 總結
第15章 DW2.0和性能
15.1 好的性能——DW2.0的基石
15.2 線上回響時間
15.3 分析回響時間
15.4 數據的流動
15.5 佇列
15.6 啟發式處理
15.7 分析的生產率和回響時間
15.8 索引
15.9 移除休眠數據
15.10 終端用戶培訓
15.11 監控環境
15.12 容量規劃
15.13 元數據
15.14 批處理的並行
15.15 事務處理的並行
15.16 工作負荷量的管理
15.17 數據集市
15.18 探索工具
15.19 將事務分為不同的類
15.20 服務標準協定
15.21 保護互動區
15.22數據分割
15.23 選擇合適的硬體
15.24 區分“農民”和“探索者”
15.25 數據的物理分組
15.26 檢查自動產生的代碼
15.27 企業用戶的觀點
15.28 總結
第16章 遷移
16.1 房屋和城市
16.2 在一個完美情況中遷移
16.3 完美情況幾乎永遠不會發生
16.4 增量式添加組件
16.5 添加歸檔區
16.6 建立企業元數據
16.7 建立元數據基礎結構
16.8 “吞沒”源系統
16.9 作為緩衝器的ETL
16.10 遷移到非結構化的環境
16.11 企業用戶的觀點
16.12 總結
第17章 成本驗證和DW2.0
17.1 DW2.0的成本值嗎
17.2 巨觀層次的價值驗證
17.3 微觀層次的價值驗證
17.4 公司B擁有DW2.0
17.5 生成新的分析
17.6 按步驟執行
17.7 總成本是多少
17.8 考慮公司B
17.9 考慮DW2.0的成本
17.10 信息的現實情況
17.11 DW2.0真正的經濟效益
17.12 信息的時間價值
17.13 整合的價值
17.14 歷史信息
17.15 第一代DW和DW2.0——在經濟效益上的比較
17.16 企業用戶的觀點
17.17 總結
第18章 DW2.0中的數據質量
18.1 DW2.0中的數據質量工具集
18.2 數據分析工具和逆向工程數據模型
18.3 數據模型種類
18.4 數據分析不一致對自上而下建模的挑戰
18.5 總結
第19章 DW2.0和非結構化數據
19.1 DW2.0和非結構化數據
19.2 文本讀取
19.3 在哪裡進行文本分析處理
19.4 文本整合
19.5 簡單編輯
19.6 無用詞
19.7 同義詞替換
19.8 同義詞串聯
19.9 同形異義解析
19.10 建立主題
19.11 外部術語表/分類法
19.12 分詞
19.13 替換拼寫
19.14 跨語言的文本
19.15 直接搜尋
19.16 間接搜尋
19.17 術語
19.18半結構化數據/值=名稱數據
19.19 準備數據所需的技術
……
第20章 DW2.0與記錄系統
第21章 多方面的話題
第22章 DW2.0環境中的處理
第23章 管理DW2.0環境