內容簡介
本書取材精選,內容新穎,條理清晰,通俗易懂,重點突出,注重實用。在強調基本概念、基本原理的同時,注重理論與實際套用相結合,介紹了相關領域的最新研究成果及發展新動向。
本書既可作為高等院校電子信息工程、通信工程、電子科學與技術、計算機套用、廣播電視工程等專業的高年級本科生或研究生的教材或教學參考書,也可供從事多媒體信息處理技術領域工作的研究與開發人員參考。
目錄
第1章 多媒體信息處理基礎
1.1 多媒體的基本概念
1.1.1 媒體的概念
1.1.2 多媒體與多媒體技術
1.2 音頻信息處理基礎
1.2.1 聲音的基本特性
1.2.2 聲音的主觀感覺
1.2.3 音頻信號的數位化
1.3 圖像信息處理基礎
1.3.1 光的顏色與彩色三要素
1.3.2 三基色原理
1.3.3 幾種典型的顏色空間模型及轉換關係
1.3.4 圖像信號的數位化
1.4 視頻信號的數位化
1.5 MATLAB在圖像處理中的套用
1.5.1 MATLAB簡介
1.5.2 MATLAB中圖像檔案的基本操作
1.5.3 MATLAB編程實例
1.6 小結
習題
第2章 圖像增強
2.1 引言
2.2 圖像的灰度變換
2.2.1 灰度的線性變換
2.2.2 灰度的非線性變換
2.2.3 直方圖修正
2.2.4 直方圖規定化
2.3 圖像平滑
2.3.1 模板操作和卷積運算
2.3.2 鄰域平均法
2.3.3 中值濾波
2.3.4 頻率域低通濾波
2.4 圖像銳化
2.4.1 梯度運算(運算元)
2.4.2 索貝爾(Sobel)運算元
2.4.3 拉普拉斯(Laplacian)運算元
2.4.4 頻率域高通濾波
2.5 圖像的同態濾波
2.6 彩色增強
2.6.1 偽彩色增強
2.6.2 假彩色增強
2.7 MATLAB編程實例
2.8 小結
習題
第3章 形態學圖像處理
3.1 引言
3.1.1 數學形態學的發展簡史和基本思想
3.1.2 集合論基礎
3.1.3 數學形態學中的幾個基本概念
3.2 二值形態學基本運算
3.2.1 腐蝕
3.2.2 膨脹
3.2.3 腐蝕運算與膨脹運算的對偶性
3.2.4 開運算
3.2.5 閉運算
3.3 二值圖像的形態學處理
3.3.1 邊緣提取
3.3.2 區域填充
3.3.3 骨架抽取
3.3.4 細化
3.3.5 粗化
3.3.6 形態濾波
3.4 灰度形態學基本運算
3.4.1 灰度腐蝕
3.4.2 灰度膨脹
3.4.3 灰度開運算與閉運算
3.5 灰度圖像的形態學處理
3.5.1 形態學梯度
3.5.2 形態學平滑濾波
3.5.3 高帽(Top-hat)變換
3.6 MATLAB編程實例
3.6.1 MATLAB中形態學基本運算函式
3.6.2 MATLAB編程實例
3.7 小結
習題
第4章 圖像分割
4.1 圖像分割的概念及分類
4.1.1 圖像分割的概念
4.1.2 圖像分割的依據和方法分類
4.2 基於灰度閾值化的圖像分割
4.2.1 閾值化分割的原理
4.2.2 全局閾值化分割法
4.2.3 局部閾值化分割法
4.3 基於邊緣檢測的圖像分割
4.3.1 邊緣檢測的基本原理和步驟
4.3.2 梯度運算元
4.3.3 Laplacian運算元和LoG運算元
4.3.4 Canny運算元
4.3.5 邊緣跟蹤
4.4 基於區域的圖像分割
4.4.1 區域生長法
4.4.2 區域分裂與合併法
4.5 MATLAB編程實例
4.6 小結
習題
第5章 數字圖像與視頻壓縮編碼原理
5.1 數字圖像與視頻壓縮編碼概述
5.1.1 數字圖像與視頻壓縮的必要性和可能性
5.1.2 數字圖像與視頻壓縮編碼的主要方法及其分類
5.2 無失真編碼
5.2.1 遊程編碼
5.2.2 霍夫曼編碼
5.2.3 算術編碼
5.3 預測編碼
5.3.1 圖像差值信號的統計特性
5.3.2 幀內預測編碼
5.3.3 幀間預測編碼
5.4 變換編碼
5.4.1 圖像的頻率域統計特性
5.4.2 變換編碼的基本原理
5.4.3 正交變換基的選擇
5.4.4 DCT圖像編碼
5.5 MATLAB編程實例
5.6 小結
習題
第6章 數字圖像與視頻壓縮編碼標準
6.1 靜止圖像編碼標準
6.1.1 JPEG標準概述
6.1.2 JPEG基本編碼系統
6.1.3 基於DCT的漸進編碼
6.1.4 分級編碼
6.1.5 JPEG 2000標準概述
6.1.6 JPEG 2000標準的基本框架
6.1.7 JPEG 2000的主要特點
6.2 數字視頻編碼的標準化進程
6.3 MPEG-1/MPEG-2視頻編碼標準
6.3.1 I幀、P幀和B幀
6.3.2 視頻碼流的分層結構
6.3.3 MPEG-1/MPEG-2視頻編解碼原理
6.3.4 MPEG-2的功能擴展
6.4 MPEG-4視頻編碼標準
6.4.1 概述
6.4.2 MPEG-4視頻編碼功能與特點
6.4.3 MPEG-4基於內容的視頻編碼
6.5 H.263視頻編碼標準
6.5.1 視頻信源圖像格式
6.5.2 H.263視頻編解碼原理
6.5.3 H.263可選模式
6.5.4 H.263+的可選模式
6.5.5 H.263++的可選模式
6.6 H.264/AVC視頻編碼標準
6.6.1 H.264/AVC編碼器的分層結構
6.6.2 H.264/AVC中的預測編碼
6.6.3 整數變換與量化
6.6.4 基於上下文的自適應熵編碼
6.7 AVS視頻編碼標準
6.7.1 AVS-P2
6.7.2 AVS-P2與H.264的比較
6.8 小結
習題
第7章 數字音頻編碼技術及標準
7.1 數字音頻壓縮編碼概述
7.1.1 數字音頻壓縮編碼的機理
7.1.2 音頻編/解碼器的性能指標
7.1.3 數字音頻編碼技術的分類
7.1.4 數字音頻編碼標準概述
7.2 常用數字音頻編碼技術
7.2.1 線性預測編碼
7.2.2 矢量量化
7.2.3 CELP編碼
7.2.4 子帶編碼
7.3 MPEG-1音頻編碼標準
7.3.1 MPEG-1音頻編碼算法的特點
7.3.2 MPEG-1音頻編碼的基本原理
7.4 MPEG-2 AAC音頻編碼標準
7.4.1 概述
7.4.2 MPEG-2 AAC編碼算法和特點
7.4.3 MPEG-2 AAC的檔次
7.5 中國制定的音頻編碼標準
7.5.1 AVS音頻立體聲編碼標準
7.5.2 DRA多聲道數字音頻編解碼標準
7.6 小結
習題
第8章 數字媒體檔案格式
8.1 資源交換檔案格式(RIFF)
8.2 數字圖像檔案格式
8.2.1 點陣圖和調色板的概念
8.2.2 圖像檔案的一般結構
8.2.3 BMP檔案格式
8.2.4 GIF檔案格式
8.2.5 JPEG檔案交換格式
8.2.6 其他圖像檔案格式
8.3 常見的動畫檔案格式
8.3.1 FLI/FLC檔案格式
8.3.2 SWF檔案格式
8.4 數字視頻檔案格式
8.4.1 AVI檔案格式
8.4.2 MPEG/MPG/DAT/DivX/XviD
8.5 數字音頻檔案格式
8.5.1 WAV檔案格式
8.5.2 MPEG音頻(MP1/MP2/MP3/AAC)檔案格式
8.5.3 其他音頻檔案格式
8.6 流媒體檔案格式
8.6.1 Real Media檔案格式
8.6.2 ASF檔案格式
8.6.3 QuickTime檔案格式
8.6.4 FLV檔案格式
8.6.5 其他流媒體檔案格式
8.7 小結
習題
第9章 數字水印技術
9.1 數字水印概述
9.1.1 數字水印技術的產生背景和套用
9.1.2 數字水印的基本特徵
9.1.3 數字水印系統的組成
9.1.4 數字水印的分類
9.2 數字圖像水印算法
9.2.1 最低有效位方法
9.2.2 基於DCT域的方法
9.3 數字視頻水印的嵌入和提取方案
9.3.1 基於未壓縮的原始視頻的水印方案
9.3.2 基於視頻編碼的水印方案
9.3.3 基於壓縮視頻碼流的水印方案
9.4 數字音頻水印算法
9.4.1 最低有效位方法
9.4.2 回聲隱藏方法
9.4.3 相位編碼方法
9.4.4 變換域方法
9.4.5 基於壓縮音頻方法
9.5 MATLAB編程實例
9.6 小結
習題
第10章 基於內容的多媒體信息檢索
10.1 基於內容檢索技術概述
10.1.1 多媒體信息的內容
10.1.2 內容處理技術
10.1.3 基於內容檢索的查詢方式
10.1.4 基於內容檢索系統的一般結構
10.1.5 基於內容的檢索過程
10.1.6 基於內容檢索的特點
10.2 基於內容的圖像檢索
10.2.1 基於內容的圖像檢索概述
10.2.2 圖像顏色特徵的提取與表示
10.2.3 圖像紋理特徵的提取與表示
10.2.4 圖像形狀特徵的提取與表示
10.2.5 圖像空間關係特徵的提取與表示
10.2.6 圖像的相似性度量
10.2.7 圖像檢索中的相關反饋機制
10.3 基於內容的視頻檢索
10.3.1 基於內容的視頻檢索概述
10.3.2 視頻內容的結構化
10.3.3 基於內容的視頻檢索工作流程
10.3.4 基於內容的視頻檢索系統結構
10.3.5 鏡頭切換的基本概念
10.3.6 鏡頭邊界檢測
10.3.7 關鍵幀的提取
10.3.8 鏡頭聚類(場景檢測)
10.4 基於內容的音頻檢索
10.4.1 音頻內容的特徵表示
10.4.2 基於內容的音頻檢索概述
10.4.3 基於內容的語音檢索
10.4.4 基於內容的音樂檢索
10.5 小結
習題
參考文獻