圖像處理、分析與機器視覺

圖像處理、分析與機器視覺

《圖像處理、分析與機器視覺》，作者是Milan Sonka、艾海舟，定價為69.5元。

基本信息

作者：Milan Sonka、艾海舟

ISBN：9787302236863

定價：69.5元

印次：1-1

裝幀：平裝

印刷日期：2010-12-24

內容簡介

本書針對圖像處理、圖像分析和機器視覺領域的有關原理與技術展開了廣泛而深入的討論，包括圖像預處理、圖像分割、形狀表示與描述、物體識別與圖像理解、三維視覺、數學形態學圖像處理技術、離散圖像變換、圖像壓縮、紋理描述、運動分析等。本書力圖將複雜的概念通過具體示例用易於理解的算法來描述，提供了大量包含圖示和處理結果的插圖，特別有助於讀者的學習和理解。此外，本書還提供了豐富的參考文獻，既列出了那些經過時間考驗的經典論文，也列出了能反映未來發展方向的最新進展，適於讀者進一步深入探索。

本書是為計算機專業圖像處理、圖像分析和機器視覺課程編寫的教材。

本書覆蓋了十分廣泛的領域，包括人工智慧、信號處理、人工神經網路、模式識別、機器學習、模糊數學等一系列相關學科。讀者通過學習本書，可以學到很多具有普遍價值的知識和具體的套用方法。

本書可作為各高等院校計算機專業高年級本科生和研究生相應課程的教材，可以結合實際教學情況選用相應的章節。

本書也特別適合有一定基礎的讀者自學。本書對從事相關科學技術領域的研究和工程技術人員也有很高的參考價值。此外，對於本領域的專業人士也可以作為技術手冊使用。

目錄

第1章引言 1

1.1 動機 1

1.2 計算機視覺為什麼是困難的 2

1.3 圖像表達與圖像分析的任務 4

1.4 總結 7

1.5 參考文獻 7

第2章圖像及其表達與性質 8

2.1 圖像表達若干概念 8

連續圖像函式 8

2.2 圖像數位化 10

2.2.1 採樣 10

2.2.2 量化 11

2.3 數字圖像性質 12

2.3.1 數字圖像的度量和

拓撲性質 12

2.3.2 直方圖 16

2.3.3 熵 17

2.3.4 圖像的視覺感知 18

2.3.5 圖像品質 20

2.3.6 圖像中的噪聲 20

2.4 彩色圖像 22

2.4.1 色彩物理學 22

2.4.2 人所感知的色彩 23

2.4.3 彩色空間 26

2.4.4 調色板圖像 28

2.4.5 顏色恆常性 28

2.5 攝像機概述 29

2.5.1 光敏感測器 29

2.5.2 黑白攝像機 30

2.5.3 彩色攝像機 32

2.6 總結 33

2.7 參考文獻 34

第3章圖像及其數學與物理背景 35

3.1 概述 35

3.1.1 線性 35

3.1.2 狄拉克（Dirac）分布和

卷積 35

3.2 積分線性變換 37

3.2.1 作為線性系統的圖像 37

3.2.2 積分線性變換引言 37

3.2.3 1D傅立葉變換 38

3.2.4 2 D傅立葉變換 41

3.2.5 採樣與香農約束 43

3.2.6 離散餘弦變換 46

3.2.7 小波變換 47

3.2.8 本徵分析 51

3.2.9 奇異值分解 52

3.2.10 主分量分析 53

3.2.11 其他正交圖像變換 54

3.3 作為隨機過程的圖像 55

3.4 圖像形成物理 57

3.4.1 作為輻射測量的圖像 57

3.4.2 圖像獲取與幾何光學 57

3.4.3 鏡頭像差和徑向畸變 60

3.4.4 從輻射學角度看圖像獲取 62

3.4.5 表面反射 64

3.5 總結 67

3.6 參考文獻 67

第4章圖像分析的數據結構 69

4.1 圖像數據表示的層次 69

4.2 傳統圖像數據結構 70

4.2.1 矩陣 70

4.2.2 鏈 72

4.2.3 拓撲數據結構 73

4.2.4 關係結構 73

4.3 分層數據結構 74

4.3.1 金字塔 74

4.3.2 四叉樹 75

4.3.3 其他金字塔結構 76

4.4 總結 77

4.5 參考文獻 78

第5章圖像預處理 79

5.1 像素亮度變換 79

5.1.1 位置相關的亮度校正 80

5.1.2 灰度級變換 80

5.2 幾何變換 82

5.2.1 像素坐標變換 83

5.2.2 亮度插值 84

5.3 局部預處理 86

5.3.1 圖像平滑 86

5.3.2 邊緣檢測運算元 92

5.3.3 二階導數過零點 96

5.3.4 圖像處理中的尺度 98

5.3.5 Canny邊緣提取 100

5.3.6 參數化邊緣模型 102

5.3.7 多光譜圖像中的邊緣 103

5.3.8 頻域的局部預處理 103

5.3.9 用局部預處理運算元

作線檢測 108

5.3.10 角點（興趣點）檢測 109

5.3.11 最大穩定極值區域檢測 112

5.4 圖像復原 114

5.4.1 容易復原的退化 114

5.4.2 逆濾波 115

5.4.3 維納濾波 115

5.5 總結 117

5.6 參考文獻 118

第6章分割 I 124

6.1 閾值化 124

6.1.1 閾值檢測方法 126

6.1.2 最優閾值化 127

6.1.3 多光譜閾值化 129

6.2 基於邊緣的分割 130

6.2.1 邊緣圖像閾值化 131

6.2.2 邊緣鬆弛法 133

6.2.3 邊界跟蹤 135

6.2.4 作為圖搜尋的邊緣跟蹤 139

6.2.5 作為動態規劃的邊緣跟蹤 146

6.2.6 Hough變換 149

6.2.7 使用邊界位置信息的

邊界檢測 155

6.2.8 從邊界構造區域 156

6.3 基於區域的分割 157

6.3.1 區域歸併 158

6.3.2 區域分裂 160

6.3.3 分裂與歸併 161

6.3.4 分水嶺分割 163

6.3.5 區域增長後處理 166

6.4 匹配 166

6.4.1 匹配標準 167

6.4.2 匹配的控制策略 168

6.5 分割的評測問題 169

6.5.1 監督式評測 169

6.5.2 非監督式評測 172

6.6 總結 172

6.7 參考文獻 175

第7章分割II 182

7.1 均值移位分割 182

7.2 活動輪廓模型——蛇行 187

7.2.1 經典蛇行和氣球 188

7.2.2 擴展 191

7.2.3 梯度矢量流蛇 191

7.3 幾何變形模型——水平集和

測地活動輪廓 194

7.4 模糊連線性 200

7.5 面向基於3D圖的圖像分割 204

7.5.1 邊界對的同時檢測 205

7.5.2 次優的表面檢測 208

7.6 圖割分割 209

7.7 最優單和多表面分割 214

7.8 總結 223

7.9 參考文獻 224

第8章形狀表示與描述 232

8.1 區域標識 234

8.2 基於輪廓的形狀表示與描述 236

8.2.1 鏈碼 237

8.2.2 簡單幾何邊界表示 237

8.2.3 邊界的傅立葉變換 239

8.2.4 使用片段序列的邊界描述 241

8.2.5 B樣條表示 243

8.2.6 其他基於輪廓的形狀

描述方法 245

8.2.7 形狀不變數 245

8.3 基於區域的形狀表示與描述 248

8.3.1 簡單的標量區域描述 248

8.3.2 矩 251

8.3.3 凸包 253

8.3.4 基於區域骨架的圖表示 257

8.3.5 區域分解 259

8.3.6 區域鄰近圖 260

8.4 形狀類別 261

8.5 總結 261

8.6 參考文獻 263

第9章物體識別 270

9.1 知識表示 270

9.2 統計模式識別 274

9.2.1 分類原理 275

9.2.2 分類器設定 276

9.2.3 分類器學習 278

9.2.4 支持向量機 280

9.2.5 聚類分析 284

9.3 神經元網路 286

9.3.1 前饋網路 287

9.3.2 非監督學習 288

9.3.3 Hopfield神經元網路 289

9.4 句法模式識別 290

9.4.1 語法與語言 291

9.4.2 句法分析與句法分類器 293

9.4.3 句法分類器學習與

語法推導 294

9.5 作為圖匹配的識別 295

9.5.1 圖和子圖的同構 296

9.5.2 圖的相似度 298

9.6 識別中的最佳化技術 299

9.6.1 遺傳算法 300

9.6.2 模擬退火 302

9.7 模糊系統 303

9.7.1 模糊集和模糊隸屬函式 304

9.7.2 模糊集運算 305

9.7.3 模糊推理 306

9.7.4 模糊系統設計與訓練 308

9.8 模式識別中的Boosting方法 309

9.9 總結 311

9.10 參考文獻 314

第10章圖像理解 319

10.1 圖像理解控制策略 320

10.1.1 並行和串列處理控制 320

10.1.2 分層控制 321

10.1.3 自底向上的控制 321

10.1.4 基於模型的控制 321

10.1.5 混合的控制策略 322

10.1.6 非分層控制 325

10.2 RANSAC：通過隨機抽樣一致

來擬合 326

10.3 點分布模型 329

10.4 活動表觀模型 337

10.5 圖像理解中的模式識別方法 344

10.5.1 基於分類的分割 344

10.5.2 上下文圖像分類 346

10.6 Boosted層疊分類器用於快速

物體檢測 349

10.7 場景標註和約束傳播 352

10.7.1 離散鬆弛法 353

10.7.2 機率鬆弛法 355

10.7.3 搜尋解釋樹 357

10.8 語義圖像分割和理解 357

10.8.1 語義區域增長 358

10.8.2 遺傳圖像解釋 360

10.9 隱馬爾可夫模型 365

10.9.1 套用 369

10.9.2 耦合的HMM 370

10.9.3 貝葉斯信念網路 371

10.10 高斯混合模型和期望最大化 372

10.11 總結 378

10.12 參考文獻 380

第11章 3D視覺和幾何 389

11.1 3D視覺任務 389

11.1.1 Marr理論 391

11.1.2 其他視覺範疇：主動和

有目的的視覺 392

11.2 射影幾何學基礎 393

11.2.1 射影空間中的點和超平面 394

11.2.2 單應性 395

11.2.3 根據對應點估計單應性 397

11.3 單透視攝像機 400

11.3.1 攝像機模型 400

11.3.2 齊次坐標系中的投影和

反投影 402

11.3.3 從已知場景標定一個

攝像機 403

11.4 從多視圖重建場景 403

11.4.1 三角測量 403

11.4.2 射影重建 404

11.4.3 匹配約束 405

11.4.4 光束平差法 406

11.4.5 升級射影重建和

自標定 407

11.5 雙攝像機和立體感知 408

11.5.1 極線幾何學——基本

矩陣 408

11.5.2 攝像機的相對運動

——本質矩陣 410

11.5.3 分解基本矩陣到

攝像機矩陣 411

11.5.4 從對應點估計基本矩陣 411

11.5.5 雙攝像機矯正結構 412

11.5.6 矯正計算 414

11.6 三攝像機和三視張量 415

11.6.1 立體對應點算法 417

11.6.2 距離圖像的主動獲取 421

11.7 由輻射測量到3D信息 423

11.7.1 由陰影到形狀 423

11.7.2 光度測量立體視覺 426

11.8 總結 427

11.9 參考文獻 428

第12章 3D視覺的套用 433

12.1 由X到形狀 433

12.1.1 由運動到形狀 433

12.1.2 由紋理到形狀 437

12.1.3 其他由X到形狀

的技術 439

12.2 完全的3D物體 440

12.2.1 3D物體、模型以及

相關問題 440

12.2.2 線條標註 441

12.2.3 體積表示和直接測量 443

12.2.4 體積建模策略 444

12.2.5 表面建模策略 446

12.2.6 為獲取完整3D模型的

面元標註與融合 447

12.3 基於3D模型的視覺 451

12.3.1 一般考慮 451

12.3.2 Goad算法 452

12.3.3 基於模型的亮度圖像

曲面物體識別 455

12.3.4 基於模型的距離

圖像識別 456

12.4 3D場景的2D視圖表達 456

12.4.1 觀察空間 456

12.4.2 多視圖表達和示象圖 457

12.4.3 作為2D視圖結構化

表達的幾何基元 457

12.4.4 利用存儲的2D視圖顯示

3D真實世界場景 458

12.5 實例研究——由未組織的2D

視圖集重建3D 460

12.6 總結 463

12.7 參考文獻 464

第13章數學形態學 470

13.1 形態學基本概念 470

13.2 形態學四原則 471

13.3 二值膨脹和腐蝕 472

13.3.1 膨脹 472

13.3.2 腐蝕 474

13.3.3 擊中擊不中變換 476

13.3.4 開運算和閉運算 476

13.4 灰度級膨脹和腐蝕 477

13.4.1 頂面、本影、灰度級

膨脹和腐蝕 477

13.4.2 本影同胚定理和膨脹、

腐蝕及開、閉運算的

性質 479

13.4.3 頂帽變換 480

13.5 骨架和物體標記 481

13.5.1 同倫變換 481

13.5.2 骨架和最大球 481

13.5.3 細化、粗化和同倫骨架 482

13.5.4 熄滅函式和最終腐蝕 485

13.5.5 最終腐蝕和距離函式 486

13.5.6 測地變換 487

13.5.7 形態學重構 488

13.6 粒度測定法 489

13.7 形態學分割與分水嶺 491

13.7.1 粒子分割、標記和

分水嶺 491

13.7.2 二值形態學分割 491

13.7.3 灰度級分割和分水嶺 493

13.8 總結 494

13.9 參考文獻 495

第14章圖像數據壓縮 497

14.1 圖像數據性質 498

14.2 圖像數據壓縮中的離散

圖像變換 498

14.3 預測壓縮方法 500

14.4 矢量量化 502

14.5 分層的和漸進的壓縮方法 502

14.6 壓縮方法比較 503

14.7 其他技術 504

14.8 編碼 504

14.9 JPEG和MPEG圖像壓縮 505

14.9.1 JPEG——靜態圖像

壓縮 505

14.9.2 JPEG-2000壓縮 506

14.9.3 MPEG——全運動的

視頻壓縮 508

14.10 總結 509

14.11 參考文獻 511

第15章紋理 514

15.1 統計紋理描述 516

15.1.1 基於空間頻率的方法 516

15.1.2 共生矩陣 517

15.1.3 邊緣頻率 519

15.1.4 基元長度（行程） 520

15.1.5 Laws紋理能量度量 521

15.1.6 分形紋理描述 521

15.1.7 多尺度紋理描述

——小波域方法 522

15.1.8 其他紋理描述的

統計方法 525

15.2 句法紋理描述方法 526

15.2.1 形狀鏈語法 526

15.2.2 圖語法 527

15.2.3 分層紋理中的

基元分組 528

15.3 混合的紋理描述方法 530

15.4 紋理識別方法的套用 531

15.5 總結 531

15.6 參考文獻 532

第16章運動分析 537

16.1 差分運動分析方法 539

16.2 光流 542

16.2.1 光流計算 542

16.2.2 全局和局部光流估計 544

16.2.3 局部和全局相結合的

光流估計 546

16.2.4 運動分析中的光流 546

16.3 基於興趣點對應關係的分析 549

16.3.1 興趣點的檢測 549

16.3.2 興趣點的對應關係 549

16.4 特定運動模式的檢測 551

16.5 視頻跟蹤 554

16.5.1 背景建模 554

16.5.2 基於核函式的跟蹤 558

16.5.3 目標路徑分析 562

16.6 輔助跟蹤的運動模型 566

16.6.1 卡爾曼濾波器 567

16.6.2 粒子濾波器 570

16.7 總結 573

16.8 參考文獻 575

辭彙 581

相關詞條

熱門詞條

聯絡我們