矢量量化

矢量量化

矢量量化是70年代後期發展起來的一種數據壓縮技術基本思想:將若干個標量數據組構成一個矢量,然後在矢量空間給以整體量化,從而壓縮了數據而不損失多少信息。它是一種數據壓縮技=術,指從N維實空間RN到RN中L個離散矢量的映射,也可稱為分組量化,標量量化是矢量量化在維數為1時的特例。

基本概念

矢量量化編碼也是在圖像、語音信號編碼技術中研究得較多的新型量化編碼方法,它的出現並不僅僅是作為量化器設計而提出的,更多的是將它作為壓縮編碼方法來研究的。在傳統的預測和變換編碼中,首先將信號經某種映射變換變成一個數的序列,然後對其一個一個地進行標量量化編碼。而在矢量量化編碼中,則是把輸入數據幾個一組地分成許多組,成組地量化編碼,即將這些數看成一個k維矢量,然後以矢量為單位逐個矢量進行量化。矢量量化是一種限失真編碼,其原理仍可用資訊理論中的率失真函式理論來分析。而率失真理論指出,即使對無記憶信源,矢量量化編碼也總是優於標量量化。

矢量量化 矢量量化

基本特徵

矢量量化可以充分利用各分量間的統計依賴性,包括線性的和非線性的依賴關係,並可以充分利用信號機率分布密度函式形狀中存在的剩餘度。它還可以充分利用信號空間維數增加所帶來的好處。在維數足夠高時,可以任意接近率失真理論所給出的極限,而這在標量量化時是做不到的。

碼本的生成算法

矢量量化 矢量量化

在矢量量化編碼中,關鍵是碼本的建立和碼字搜尋算法。

碼本的生成算法有兩種類型,一種是已知信源分布特性的設計算法;另一種是未知信源分布,但已知信源的一列具有代表性且足夠長的樣點集合(即訓練序列)的設計算法。可以證明,當信源是矢量平衡且遍歷時,若訓練序列充分長則兩種算法是等價的。

碼字搜尋是矢量量化中的一個最基本問題,矢量量化過程本身實際上就是一個搜尋過程,即搜尋出與輸入最為匹配的碼矢。矢量量化中最常用的搜尋方法是全搜尋算法和樹搜尋算法。全搜尋算法與碼本生成算法是基本相同的,在給定速率下其複雜度隨矢量維數K以指數形式增長,全搜尋矢量量化器性能好但設備較複雜。樹搜尋算法又有二叉樹和多叉樹之分,它們的原理是相同的,但後者的計算量和存儲量都比前者大,性能比前者好。樹搜尋的過程是逐步求近似的過程,中間的碼字是起指引路線的作用,其複雜度比全搜尋算法顯著減少,搜尋速度較快。由於樹搜尋並不是從整個碼本中尋找最小失真的碼字,因此它的量化器並不是最佳的,其量化信噪比低於全搜尋。

碼本與最佳量化

對空間的毎一矢量x來說,矢量量化就是把x映射為L個離散矢量yi(1≤i≤L)中的一個。yi稱為碼矢,其集合稱為碼本。這一過程有時也被分為編碼和解碼兩個過程。在編碼時,空間中每一矢量都得到一個特定的地址γ(x),解碼時由地址轉換成碼矢yi=β[γ(x)]=f(x)。γ和β分別表示編碼和解碼完成的運算。量化帶來的失真稱為量化失真。對這一失真的量度可以有多種方法,如歐氏距、漢明距等。失真量度的選擇原則是:實用中有意義,數學上好處理、實現時便於計算。在一定約束條件下能使平均失真達到最小的量化稱為最詿t化,相應的量化器稱為最佳量化器。在矢量量化中初始碼本的選擇是一個重要問題。產生初始碼本的方法通常有兩種:第一種方法的碼本,指一開始就對其大小有要求的碼本,這種方法如隨機碼方法、乘積碼方法;第二種方法的碼本,在開始時只有很少幾個碼矢,在疊代訓練中逐步增加到所要求的大小,這種方法如碼分裂法等。特別是人工神經網路,為量化器的設計提供了新途徑,如自組織特徵映射法和模擬退火法,都是設計碼本的有效方法。象模擬退火法,它可以有效地避免局部最優解。

矢量量化器

非全搜尋的矢量量化器:基本的矢量量化器在量化時要對碼本中的碼矢進行全面搜尋,被稱為全搜尋式量化器。這種量化器在實現時需要很大的計算量和存儲量。所以在實用中有多種減少複雜性的量化器,它們的共同特點是使碼本具有某種結構。這樣,碼本的存儲和搜尋就都可能結構化,從而減少計算量和存儲量。這種非全搜尋的量化器主要有:樹狀搜尋量化器或分層量化器;乘積碼本量化器或分類量化器;格子狀量化器。

有記憶的矢量量化器:矢量量化在原理上可以用很高的維數,但因複雜性的限制,維數又不能很高。這時,有記憶的量化器是解決矢量維數有限而信號有很長記憶這一矛盾的有效方法。有記憶的矢量量化器有多種具體的形式,如有限狀態量化器、矢量預測量化器、反饋式矢量量化器、自適量矢量預測器等。

套用

矢量量化已得到廣泛套用。例如在語音編碼和圖像編碼以及各種模式識別中都有重要的套用。而且它在如何適應複雜的失真量度,如何適應信號的統計特性以及如何減少實現時的複雜性等幾個主要方面,也有很大的發展。

相關詞條

相關搜尋

熱門詞條

聯絡我們