圖書簡介
本書由兩部分組成。第一部分包括分散式數據管理的基礎原理,由第1~14章組成。這部分的第2章包含一些背景知識,如果學生已經掌握了關係資料庫以及計算機網路技術的概念,可以跳過這一章。但這一章十分重要的是例2.3,因為它介紹了本書大部分內容都會涉及的用例。第二部分包含第15~18章,是更為高級的主題。一門課程應當覆蓋哪些內容依賴於講課的時間以及目標要求。如果課程的目標是基礎技術,那么就應該覆蓋第1、3、5~8章,以及第10~12章。作為這種選擇的一個擴充,可以再覆蓋第4、9和13章。如果課程的時間更長,則可以從第二部分的第15~18章里選擇一章或多章。
圖書目錄
第1章引言1
1.1分散式數據處理2
1.2什麼是分散式資料庫系統2
1.3數據傳送的不同選擇4
1.4DDBS的承諾5
1.4.1分布及複製數據的透明管理5
1.4.2分散式事務提供的可靠性9
1.4.3改進的性能10
1.4.4更為容易的系統擴展11
1.5分布所帶來的複雜性11
1.6設計問題12
1.6.1分散式資料庫設計12
1.6.2分散式目錄管理12
1.6.3分散式查詢處理12
1.6.4分散式並發控制13
1.6.5分散式死鎖管理13
1.6.6分散式資料庫的可靠性13
1.6.7複製13
1.6.8問題之間的相互關係13
1.6.9其他方面的問題14
1.7分散式DBMS體系架構15
1.7.1ANSI/SPARC體系架構15
1.7.2集中式DBMS的通用體系架構16
1.7.3分散式DBMS體系架構的模型18
1.7.4自治性18
1.7.5分布19
1.7.6異構性20
1.7.7體系架構的不同選擇20
1.7.8客戶/伺服器系統20
1.7.9P2P系統22
1.7.10多資料庫體系架構25
1.8參考文獻說明28第2章背景知識30
2.1關係DBMS概述30
2.1.1關係資料庫概念30
2.1.2規範化32
2.1.3關係語言33
2.2計算機網路概述41
2.2.1不同類型的網路42
2.2.2通信方式45
2.2.3數據通信的基本概念46
2.2.4通信協定47
2.3參考文獻說明50第3章分散式資料庫設計51
3.1自頂向下的設計過程52
3.2分布設計的研究問題54
3.2.1為什麼要分片54
3.2.2不同的分片方法55
3.2.3劃分程度56
3.2.4分片的正確性規則56
3.2.5不同的分配方法57
3.2.6信息需求57
3.3分片58
3.3.1水平分片58
3.3.2垂直分片70
3.3.3混合分片79
3.4分配80
3.4.1分配問題的定義80
3.4.2信息需求82
3.4.3分配模型83
3.4.4解決辦法85
3.5數據目錄85
3.6本章小結86
3.7參考文獻說明87
練習88第4章資料庫集成91
4.1自底向上的設計方法92
4.2模式匹配95
4.2.1模式異構性97
4.2.2語言匹配方法98
4.2.3基於限制的匹配方法100
4.2.4基於學習的匹配方法101
4.2.5組合匹配方法101
4.3模式集成102
4.4模式映像103
4.4.1映像建立104
4.4.2映像維護108
4.5數據清洗109
4.6本章小結110
4.7參考文獻說明111
練習112第5章數據與訪問控制120
5.1視圖管理120
5.1.1集中式DBMS中的視圖121
5.1.2分散式DBMS中的視圖123
5.1.3物化視圖的維護124
5.2數據安全126
5.2.1裁決式訪問控制127
5.2.2多級訪問控制128
5.2.3分散式訪問控制130
5.3語義完整性控制132
5.3.1集中式語義完整性控制133
5.3.2分散式語義完整性控制136
5.4本章小結140
5.5參考文獻說明141
練習142第6章查詢處理概述144
6.1查詢處理問題144
6.2查詢處理的目標147
6.3關係代數運算的複雜度148
6.4查詢處理程式的刻畫148
6.4.1語言149
6.4.2最佳化類型149
6.4.3最佳化時機149
6.4.4統計150
6.4.5決策站點150
6.4.6網路拓撲的利用150
6.4.7利用複製的片段151
6.4.8使用半連結151
6.5查詢處理的層次151
6.5.1查詢分解152
6.5.2數據本地化153
6.5.3全局查詢最佳化153
6.5.4分散式查詢執行154
6.6本章小結154
6.7參考文獻說明154第7章查詢分解與數據本地化156
7.1查詢分解156
7.1.1規範化156
7.1.2分析157
7.1.3去除冗餘159
7.1.4重寫160
7.2分布數據的本地化164
7.2.1主水平劃分的歸約164
7.2.2垂直分片的歸約166
7.2.3誘導分片的歸約167
7.2.4混合分片的歸約169
7.3本章小結170
7.4參考文獻說明171
練習171第8章分散式查詢的最佳化174
8.1查詢最佳化174
8.1.1搜尋空間175
8.1.2搜尋策略176
8.1.3分散式代價模型177
8.2集中式查詢最佳化182
8.2.1動態查詢最佳化182
8.2.2靜態查詢最佳化185
8.2.3混合查詢最佳化188
8.3分布查詢的連結排序189
8.3.1連結排序189
8.3.2基於半連結的算法191
8.3.3連結與半連結的對比193
8.4分散式查詢最佳化194
8.4.1動態方法194
8.4.2靜態方法197
8.4.3基於半連結的方法200
8.4.4混合方法204
8.5本章小結207
8.6參考文獻說明208
練習209第9章多資料庫查詢處理211
9.1多資料庫查詢處理的關鍵問題211
9.2多資料庫查詢處理體系架構212
9.3使用視圖進行查詢重寫214
9.3.1Datalog術語214
9.3.2使用GAV的查詢重寫技術215
9.3.3使用LAV的查詢重寫技術216
9.4查詢最佳化和執行218
9.4.1異構代價模型218
9.4.2異構查詢最佳化223
9.4.3自適應的查詢處理227
9.5查詢翻譯和執行232
9.6本章小結234
9.7參考文獻說明234
練習235第10章事務管理介紹238
10.1事務的定義239
10.1.1事務的終結條件241
10.1.2事務的特性242
10.1.3事務的形式化定義243
10.2事務的性質245
10.2.1原子性245
10.2.2一致性245
10.2.3隔離性246
10.2.4持久性249
10.3事務的類型249
10.3.1平面事務250
10.3.2嵌套事務250
10.3.3工作流252
10.4再論體系架構模型254
10.5本章小結255
10.6參考文獻說明256第11章分散式並發控制257
11.1可串列化理論257
11.2並發控制機制的分類261
11.3基於加鎖的並發控制算法262
11.3.1集中式2PL265
11.3.2分散式2PL268
11.4基於時間戳的並發控制算法269
11.4.1基本TO算法269
11.4.2保守TO算法272
11.4.3多版本TO算法273
11.5樂觀並發控制算法274
11.6死鎖管理276
11.6.1死鎖預防277
11.6.2死鎖迴避278
11.6.3死鎖檢測與解決279
11.7“放鬆”的並發控制281
11.7.1非串列化歷史281
11.7.2嵌套分散式事務282
11.8本章小結284
11.9參考文獻說明285
練習286第12章分散式DBMS的可靠性288
12.1可靠性的概念和度量288
12.1.1系統、狀態與故障288
12.1.2可靠性與可用性289
12.1.3平均無故障時間/平均修復時間291
12.2分散式DBMS的故障292
12.2.1事務故障292
12.2.2站點(系統)故障292
12.2.3介質故障293
12.2.4通信故障293
12.3局部可靠性協定294
12.3.1體系結構的考慮294
12.3.2恢覆信息296
12.3.3LRM命令的執行299
12.3.4建立檢查點302
12.3.5處理介質故障303
12.4分散式可靠性協定304
12.4.1分散式可靠性協定的組件304
12.4.2兩階段提交協定305
12.4.32PC的變型版本310
12.5處理站點故障311
12.5.12PC的終結和恢復協定311
12.5.2三階段提交協定315
12.6網路劃分319
12.6.1集中式協定320
12.6.2基於投票的協定320
12.7體系架構方面的考慮322
12.8本章小結323
12.9參考文獻說明324
練習325第13章數據複製327
13.1複製資料庫的一致性328
13.1.1相互一致性328
13.1.2相互一致性與事務一致性330
13.2更新管理策略331
13.2.1積極更新傳播331
13.2.2懶惰更新傳播332
13.2.3集中式技術332
13.2.4分散式技術333
13.3複製協定333
13.3.1積極集中式協定333
13.3.2積極分散式協定338
13.3.3懶惰集中式協定338
13.3.4懶惰分散式協定343
13.4分組通信344
13.5複製與故障346
13.5.1故障和懶惰複製346
13.5.2故障和積極複製346
13.6複製中介程式服務349
13.7本章小結351
13.8參考文獻說明351
練習352第14章並行資料庫系統354
14.1並行資料庫系統架構354
14.1.1目標355
14.1.2功能架構356
14.1.3並行DBMS架構357
14.2並行數據布局361
14.3並行查詢處理365
14.3.1查詢並行性365
14.3.2數據處理的並行算法366
14.3.3並行查詢最佳化371
14.4負載均衡374
14.4.1並行執行問題374
14.4.2運算元內負載均衡375
14.4.3運算元間負載均衡377
14.4.4查詢內負載均衡377
14.5資料庫集群381
14.5.1資料庫集群架構381
14.5.2複製382
14.5.3負載均衡384
14.5.4查詢處理386
14.5.5容錯性388
14.6本章小結389
14.7參考文獻注釋390
練習391第15章分散式對象資料庫管理393
15.1基礎對象概念和對象模型394
15.1.1對象394
15.1.2類型和類396
15.1.3組合(聚合)398
15.1.4子類劃分和繼承398
15.2對象的分布設計400
15.2.1類的水平分片400
15.2.2類的垂直分片402
15.2.3路徑劃分402
15.2.4類的分片算法402
15.2.5分配403
15.2.6複製404
15.3架構問題404
15.3.1可選的客戶/伺服器架構404
15.3.2快取一致性408
15.4對象管理410
15.4.1對象標識管理410
15.4.2指針轉換411
15.4.3對象遷移412
15.5分散式對象存儲413
15.6對象查詢處理416
15.6.1對象查詢處理器架構417
15.6.2查詢處理問題417
15.6.3查詢執行421
15.7事務管理424
15.7.1關於正確性的判據424
15.7.2事務模型和對象結構426
15.7.3對象DBMS中的事務管理426
15.7.4將事務看作對象432
15.8本章小結433
15.9參考文獻注釋433
練習434第16章P2P數據管理436
16.1基礎設施438
16.1.1非結構P2P網路438
16.1.2結構化的P2P網路441
16.1.3超級節點P2P網路444
16.1.4P2P網路的比較446
16.2P2P系統中的模式映射446
16.2.1成對模式映射446
16.2.2基於機器學習技術的映射447
16.2.3共同協定映射447
16.2.4使用IR技術的模式映射448
16.3在P2P系統中查詢449
16.3.1前k名查詢449
16.3.2連結查詢458
16.3.3範圍查詢459
16.4副本一致性462
16.4.1在DHT中的基本支持462
16.4.2在DHT中的數據當前性464
16.4.3副本協調465
16.5本章小結468
16.6參考文獻注釋468
練習469第17章全球資訊網數據管理471
17.1全球資訊網圖管理472
17.1.1全球資訊網圖結構的壓縮473
17.1.2採用S節點的全球資訊網圖存儲474
17.2全球資訊網搜尋475
17.2.1全球資訊網爬取476
17.2.2索引478
17.2.3排序與連結分析479
17.2.4關鍵字搜尋的評價479
17.3全球資訊網查詢480
17.3.1半結構化數據方法481
17.3.2全球資訊網查詢語言方法485
17.3.3問答系統489
17.3.4隱藏全球資訊網搜尋與查詢492
17.4分散式XML處理495
17.4.1XML概覽496
17.4.2XML查詢處理技術502
17.4.3XML數據的分片505
17.4.4分散式XML處理的最佳化511
17.5本章小結517
17.6參考文獻說明518
練習518第18章前沿研究: 流數據和雲計算520
18.1數據流管理520
18.1.1流數據模型521
18.1.2流查詢語言523
18.1.3流運算元和它們的實現526
18.1.4查詢處理528
18.1.5DSMS查詢最佳化531
18.1.6負載削減和近似532
18.1.7多查詢最佳化533
18.1.8流挖掘533
18.2雲數據管理536
18.2.1雲的分類536
18.2.2格線計算538
18.2.3雲架構541
18.2.4雲中的數據管理542
18.3本章小結548
18.4參考文獻注釋549參考文獻551