哈夫曼秒編碼:哈夫曼秒編碼是以哈夫曼樹即最優二叉樹來用於數據的無損耗壓縮 -百科知識中文網

概述

哈夫曼編碼(Huffman Coding)是一種編碼方式，以哈夫曼樹─即最優二叉樹，帶權路徑長度最小的二叉樹，經常套用於數據壓縮。在計算機信息處理中，“哈夫曼編碼”是一種一致性編碼法（又稱"熵編碼法"），用於數據的無損耗壓縮。這一術語是指使用一張特殊的編碼表將源字元（例如某檔案中的一個符號）進行編碼。這張編碼表的特殊之處在於，它是根據每一個源字元出現的估算機率而建立起來的（出現機率高的字元使用較短的編碼，反之出現機率低的則使用較長的編碼，這便使編碼之後的字元串的平均期望長度降低，從而達到無損壓縮數據的目的）。這種方法是由David.A.Huffman發展起來的。

舉例

例如，在英文中，e的出現機率很高，而z的出現機率則最低。當利用哈夫曼編碼對一篇英文進行壓縮時，e極有可能用一個位(bit)來表示，而z則可能花去25個位（不是26）。用普通的表示方法時，每個英文字母均占用一個位元組（byte），即8個位。二者相比，e使用了一般編碼的1/8的長度，z則使用了3倍多。倘若我們能實現對於英文中各個字母出現機率的較準確的估算，就可以大幅度提高無損壓縮的比例。

哈夫曼秒編碼

概述

舉例

相關詞條

編碼理論

視頻編碼

異類 Outliers

異類 Outliers, The Story Of Success

視頻壓縮

《上帝擲骰子嗎》

管理海量數據——壓縮、索引和查詢（第2版）（經典再現全新修訂版）

深入搜尋引擎

圖像格式

相關搜尋

熱門詞條