定義
AAC,全稱Advanced Audio Coding,是一種專為聲音數據設計的檔案壓縮格式。與MP3不同,它採用了全新的算法進行編碼,更加高效,具有更高的“性價比”。利用AAC格式,可使人感覺聲音質量沒有明顯降低的前提下,更加小巧。蘋果ipod、諾基亞手機支持AAC格式的音頻檔案。
優點:相對於mp3,AAC格式的音質更佳,檔案更小。
不足:AAC屬於 有損壓縮的格式,與時下流行的APE、FLAC等 無損格式相比音質存在“本質上”的差距。加之,傳輸速度更快的USB3.0和16G以上大容量MP3正在加速普及,也使得AAC頭上“小巧”的光環不復存在。
特點
①提升的壓縮率:可以以更小的檔案大小獲得更高的音質;
②支持多聲道:可提供最多48個全音域聲道;
③更高的解析度:最高支持96KHz的採樣頻率;
④提升的解碼效率:解碼播放所占的資源更少;
杜比實驗室的結論
①128Kbps的AAC立體聲音樂被專家認為不易察覺到與原來未壓縮音源的區別;
②AAC格式在96Kbps碼率的表現超過了128Kbps的MP3格式;
③同樣是128Kbps,AAC格式的音質明顯好於MP3;
④AAC是唯一一個,能夠在所有的EBU試聽測試項目的獲得“優秀”的網路廣播格式。
總的來講,AAC可以說是極為全面的編碼方式,一方面,多聲道和高採樣率的特點使得它非常適合未來的DVD-Audio;另一方面,低碼率下的高音質則使它也適合移動通訊、網路電話、線上廣播等領域,真是全能的編碼方式。
背景
早在1987年,Fraunhofer IIS就開始了“EUREKA project EU147, Digital Audio Broadcasting(DAB)”的研發,而這就是MP3的前身。通過和Dieter Seitzer教授的合作,他們開發出了著名的ISO-MPEG Audio Layer-3壓縮算法。1993年這個算法被整合到MPEG-1標準中,從此MP3被投入使用。1996年底Fraunhofer IIS在美國獲得MP3的專利,並在1998年對外聲明將收取MP3的專利使用費。而從1999年初開始,MP3格式廣泛流行起來。特別是出現了很多免費提供MP3的音樂網站,MP3隨身聽也像洪水般湧進市場,種種因素促使MP3成為了極其主流的音頻格式。儘管之後有VQF、WMA等挑戰者,但MP3牢固的根基使它至今仍穩穩地坐在老大的位置上。
隨著時間的推移,MP3越來越不能滿足需要了,比如壓縮率落後於Ogg、WMA、VQF等格式,音質也不夠理想(尤其是低碼率下),僅有兩個聲道……於是FraunhoferIIS與AT&T、索尼、杜比、諾基亞等公司展開合作,共同開發出了被譽為“21世紀的數據壓縮方式”的Advanced Audio Coding(簡稱AAC)音頻格式,以取代MP3的位置。其實AAC的算法在1997年就完成了,當時被稱為MPEG-2 AAC,因為還是把它作為MPEG-2(MP2)標準的延伸。但是隨著MPEG-4(MP4)音頻標準在2000年成型,MPEG-2AAC也被作為它的編碼技術核心,同時追加了一些新的編碼特性,所以我們又叫MPEG-4 AAC(M4A)。
設備支持
蘋果
蘋果公司重量級的iPod和iPod mini全都能播放16-320Kbps的AAC檔案,加上蘋果傾力打造的iTunes音樂播放器,為製作播放AAC檔案鋪好了一條捷徑。
諾基亞
諾基亞則在手機領域推廣AAC格式,包括主打音樂的Xpress Music系列如5320XM、萬眾矚目的N-Gage、3G網路的7600、媒體手機7700、時尚娛樂的3300、新登場的6230和可作手機附屬檔案的音樂播放器HDR-1,它們都可以播放儲存在MMC卡上的AAC檔案。
其他產品
此外還有一些廠商的產品支持AAC,像音視頻開發的Anychat、Daisy Multimedia的快閃記憶體隨身聽DIVA GEM,康柏支持SM卡擴展的iPAQ PA-1,東芝的SD卡隨身聽MEA210,愛華的MM-EX300快閃記憶體隨身聽,索尼的Walkman和PSP,松下的e-wear SD Audio Players還有採用DataPlay為存儲介質的艾利和IDP-100等等。
Apple和Real公司還開設了網上音樂商店,將最新的唱片壓縮成AAC格式提供下載。
特性
與MP3的關鍵不同
AAC是在MP3基礎上開發出來的,所以兩者的編碼系統有一些相同之處。但是對比一下兩者的編碼流程圖,會發現AAC的編碼工序更為複雜。
①濾波器組(Filter bank):主要完成信號的時頻轉換。從而得到頻域的頻譜係數。
②時域噪音修整(Temporal Noise Shaping,TNS):這項神奇的技術可以通過在頻率域上的預測,來修整時域上的量化噪音的分布。在一些特殊的語音和劇烈變化信號的量化上,TNS技術對音質的提高貢獻巨大!
③預測(Prediction):對音頻信號進行預測可以減少重複冗餘信號的處理,提高效率。
④量化(Quantization):AAC的量化過程是使用兩個巢狀循環進行反覆運算。通過對量化分析的良好控制,比特率能夠被更高效地利用。
⑤比特流格式(Bit-stream format):在AAC中,信息的傳輸都要經過熵編碼,以保證冗餘儘可能少。此外AAC擁有一個彈性的比特流結構,使得編碼效率進一步提高。
⑥長時期預測(Long Term Prediction,LTP):這是一個MPEG-4 AAC中才有的工具,它用來減少連續兩個編碼音框之間的信號冗餘,對於處理低碼率的語音非常有效。
⑦知覺噪音代替(Perceptual Noise Substitution,PNS):這也是MPEG-4 AAC中才有的工具,當編碼器發現類似噪音的信號時,並不對其進行量化,而是作個標記就忽略過去,當解碼時再還原出來,這樣就提高了效率。
編碼
壓縮算法
作為一種高壓縮比的音頻壓縮算法,AAC通常壓縮比為18:1,也有資料說為20:1,遠勝mp3,而音質由於採用多聲道,和使用低複雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。不過直到2006年,使用這一格式儲存音頻的並不多,可以播放該格式的mp3播放器更是少之又少,前所知僅有蘋果iPod,而手機支持AAC的相對要多一些,此外電腦上很多音頻播放軟體都支持AAC格式,如蘋果iTunes。
運算法則
AAC所採用的運算法則與MP3的運算法則有所不同,AAC通過結合其他的功能來提高編碼效率。AAC的音頻算法在壓縮能力上遠遠超過了以前的一些壓縮算法(比如MP3等)。它還同時支持多達48個音軌、15個低頻音軌、更多種採樣率和比特率、多種語言的兼容能力、更高的解碼效率。號稱「最大能容納48通道的音軌,採樣率達96 KHz,並且在320Kbps的數據速率下能為5.1聲道音樂節目提供相當於ITU-R廣播的品質」。
總之,AAC可以在比MP3檔案節省大約30%的儲存空間與頻寬的前提下提供更好的音質。但是在空間上和結構上AAC和mp3編碼出來後的風格不太一樣,喜歡與否屬於仁者見仁智者見智的事情。
AAC+
AAC+也稱之為HE-AAC。
HE意思是 "high efficiency"(高效性)。HE-AAC混合了AAC與SBR技術。SBR代表的是Spectral Band Replication(頻段複製)。SBR的關鍵是在低碼流下提供全頻寬的編碼而不會產生多餘的信號。傳統認為音頻編碼在低碼流下意味著減少頻寬和降低採樣率(見MP3 FAQ #7)或產生令人不快的噪音信號。SBR解決問題的方法是讓核心編碼去編碼低頻信號,而SBR解碼器通過分析低頻信號產生高頻信號和一些保留在比特流中的指導信號(通常碼流極低,~2 kbps)。 這就是採用無SBR解碼器的原因,這樣你的頻寬(frequency response)(頻率回響)會被嚴重浪費。這也是為什麼被叫做Spectral Band Replication的原因,它只是增加音頻的頻寬,而非重建。