通過計算機或其它媒介存儲、傳輸、播放的音頻、視頻檔案,一般存儲於磁碟、磁帶、光碟中。
P>
概述
視頻和音頻檔案的合集叫做影音檔案,一般意義上的視頻檔案是包含音頻檔案的,其特點是存儲在光碟、磁碟、磁帶等存儲介質上面。檔案(Document)是對於計算機的專有名詞,不同於一般意義上的檔案。所以影音檔案是計算機——更確切的說是多媒體計算機的多種檔案格式的集合。格式
1、音頻檔案的格式
(1)音頻處理技術
影音檔案涉及到多方面的音頻處理技術,如:音頻採集、語音編碼/解碼、文一-語轉換、音樂合成、語音識別與理解、音頻數據傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數字音頻是個關鍵的概念,它指的是一個用來表示聲音強弱的數據序列,它是由模擬聲音經抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數據寫成計算機的數據格式)後得到的。計算機數字CD、數字磁帶(DAT)中存儲的都是數字聲音。模擬一-數字轉換器把模擬聲音變成數字聲音;數字一-模擬轉換器可以恢復出模擬來的聲音。
一般來講,實現計算機語音輸出有兩種方法:一是錄音/重放,二是文一-語轉換。第二種方法是基於聲音合成技術的一種聲音產生技術,它可用於語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產生了套用調頻(FM)音樂合成技術和波形表(Wavetable)音樂合成技術。
(2)樂器數字接口MIDI的概念
現在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為“樂器數字接口”的縮寫出現的,並用它來泛指數字音樂的國際標準。由於它定義了計算機音樂程式、合成器及其他電子設備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標準的多媒體PC平台能夠通過內部合成器或連線到計算機MIDI連線埠的外部合成器播放MIDI檔案,利用MIDI檔案演奏音樂,所需的存儲量最少。
至於MIDI檔案,是指存放MIDI信息的標準檔案格式。MIDI檔案中包含音符、定時和多達16個通道的演奏定義。檔案包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由於mddi檔案是一系列指令,而不是波形,它需要的磁碟空間非常少;並且現裝載MIDI檔案比波形檔案容易的多。這樣,在設計影音檔案節目時,我們可以指定什麼時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI檔案比使用波形音頻更合適:需要播放長時間高質量音樂,如想在硬碟上存儲的音樂大於4分鐘,而硬碟又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數據,如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或實現文一語轉換,以實現音樂和語音的同時輸出。
(3)常見的聲音檔案格式
再接下來我們介紹七種目前最為流行的聲音檔案:
★ WAVE,擴展名為WAV:該格式記錄聲音的波形,故只要採樣率高、採樣位元組長、機器速度快,利用該格式記錄的聲音檔案能夠和原聲基本一致,質量非常高,但這樣做的代價就是檔案太大。
★ MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的檔案里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優點。但它也有一些致命弱點,以至於現在已經逐漸淘汰,目前只有MOD迷及一些遊戲程式中尚在使用。
★MPEG1-layer3,擴展名MP3:現在最流行的聲音檔案格式,因其壓縮率大,在網路可視電話通信方面套用廣泛,但和CD唱片相比,音質不能令人非常滿意。
★ Real Audio,擴展名RA:這種格式真可謂是網路的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網路傳輸頻寬資源而設計的,因此主要目標是壓縮比和容錯性,其次才是音質。
★ Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用於FM音效卡,但其兼容性也很差。
★ CD Audio音樂CD,擴展名CDA:唱片採用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,檔案長度太大。
★ MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經成為一種產業標準,其科學性、兼容性、複雜程度等各方面當然遠遠超過本文前面介紹的所有標準(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI製作出來的),它的General MIDI就是最常見的通行標準。作為音樂工業的數據通信標準,MIDI能指揮各音樂設備的運轉,而且具有統一的標準格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且檔案的長度非常小。
總之,如果有專業的音源設備,那么要聽同一首曲子的HIFI程度依次是:
原聲樂器演奏 〉 MIDI 〉 CD唱片 〉 MOD 〉 所謂音效卡上的MIDI 〉 CMF,而MP3及RA要看它的節目源是採用MIDI、CD還是MOD了。
另外,存儲聲音信息的檔案格式也是需要認識的,共有:
WAV檔案、VOC檔案、MIDI檔案、RMI檔案、PCM檔案以及AIF檔案等若干種。
★ WAV檔案:Microsoft公司的音頻檔案格式,它來源於對聲音模擬波形的採樣。用不同的採樣頻率對聲音的模擬波形進行採樣可以得到一系列離散的採樣點,以不同的量化位數(8位或16位)把這些採樣點的值轉換成二進制數,然後存入磁碟,這就產生了聲音的WAV檔案,即波形檔案。Microsoft Sound System軟體Sound Finder可以轉換AIF SND和VOD檔案到WAV格式。
★ VOC檔案:Creative公司波形音頻檔案格式,也是聲霸卡(sound blaster)使用的音頻檔案格式。每個VOC檔案由檔案頭塊(header block)和音頻數據塊(data block)組成。檔案頭包含一個標識版本號和一個指向數據塊起始的指針。數據塊分成各種類型的子塊。如聲音數據靜音標識ASCII碼檔案重複的結果重複以及終止標誌,擴展塊等。
★ MIDI檔案:Musical Instrument Digital Interface(樂器數字接口)的縮寫。它是由世界上主要電子樂器製造廠商建立起來的一個通信標準,以規定計算機音樂程式 電子合成器和其它電子設備之間交換信息與控制信號的方法。MIDI檔案中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續時間音量和力度等信息。所以MIDI檔案記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。
★ RMI檔案:Microsoft公司的MIDI檔案格式,它可以包括圖片標記和文本。
★ PCM檔案:模擬音頻信號經模數轉換(A/D變換)直接形成的二進制序列,該檔案沒有附加的檔案頭和檔案結束標誌。在聲霸卡提供的軟體中,可以利用VOC-HDR程式,為PCM格式的音頻檔案加上檔案頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的檔案轉換成Microsoft的WAV格式的檔案。
★ AIF檔案:Apple計算機的音頻檔案格式。Windows的Convert工具同樣可以把AIF格式的檔案換成Microsoft的WAV格式的檔案。
2、視頻檔案的格式
(1)編碼方式
視頻檔案的編碼方式制定者主要有國際化標註組織(ISO)和國際電報聯盟電信標準化部門(ITU-T)。
MPEG的全名為[Moving Pictures Experts Group],中文譯名是動態圖像專家組。
MPEG的締造者們原先打算開發四個版本:MPEG1-MPEG4,以適用於不同頻寬和數字影像質量的要求。後由於MPEG3被放棄,所以現存只有三個版本的MPEG:MPEG-1,MPEG-2,MPEG-4。總體來說,MPEG在三方面優於其他壓縮/解壓縮方案。首先,由於在一開始它就是做為一個國際化的標準來研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能夠比其他算法提供更好的壓縮比,最高可達200:1。更重要的是,MPEG在提供高壓縮比的同時,對數據的損失很小。
★MPEG-1制定於1992年,為工業級標準而設計,可適用於不同頻寬的設備,如CD-ROM、Video-CD、CD-i。它可針對SIF標準解析度(對於NTSC制為352X240;對於PAL制為352X288)的圖象進行壓縮,傳輸速率為1.5Mbits/sec,每秒播放30幀,具有CD(指雷射唱盤)音質,質量級別基本與VHS相當。MPEG的編碼速率最高可達4-5Mbits/sec,但隨著速率的提高,其解碼後的圖象質量有所降低。
MPEG-1也被用於數字電話網路上的視頻傳輸,如非對稱數字用戶線路(ADSL),視頻點播(VOD),以及教育網路等。同時,MPEG-1也可被用做記錄媒體或是在INTERNET上傳輸音頻。
★MPEG-2制定於1994年,設計目標是高級工業標準的圖象質量以及更高的傳輸率。MPEG-2所能提供的傳輸率在3-10Mbits/sec間,其在NTSC制式下的解析度可達720X486,MPEG-2也可提供並能夠提供廣播級的視像和CD級的音質。MPEG-2的音頻編碼可提供左右中及兩個環繞聲道,以及一個加重低音聲道,和多達7個伴音聲道(DVD可有8種語言配音的原因)。由於MPEG-2在設計時的巧妙處理,使得大多數MPEG-2解碼器也可播放MPEG-1格式的數據,如VCD。
同時,由於MPEG-2的出色性能表現,已能適用於HDTV,使得原打算為HDTV設計的MPEG-3,還沒出世就被拋棄了。(MPEG-3要求傳輸速率在20Mbits/sev-40Mbits/sec間,但這將使畫面有輕度扭曲)。除了做為DVD的指定標準外,MPEG-2還可用於為廣播,有線電視網,電纜網路以及衛星直播(DirectBroadcastSatellite)提供廣播級的數字視頻。
MPEG-2的另一特點是,其可提供一個較廣的範圍改變壓縮比,以適應不同畫面質量,存儲容量,以及頻寬的要求。
對於最終用戶來說,由於現存電視機解析度限制,MPEG-2所帶來的高清晰度畫面質量(如DVD畫面)在電視上效果並不明顯,到是其音頻特性(如加重低音,多伴音聲道等)更引人注目。
★MPEG專家組的專家們正在為MPEG-4的制定努力工作。MPEG-4標準主要套用於視像電話(videophone),視像電子郵件(VideoEmail)和電子新聞(Electronicnews)等,其傳輸速率要求較低,在4800-64000bits/sec之間,解析度176X144。
MPEG-4利用很窄的頻寬,通過幀重建技術,壓縮和傳輸數據,以求以最少的數據獲得最佳的圖象質量。
與MPEG-1和MPEG-2相比,MPEG-4的特點是其更適於互動AV服務以及遠程監控。MPEG-4是第一個使你由被動變為主動(不再只是觀看,允許你加入其中,即有互動性)的動態圖象標準;它的另一個特點是其綜合性;從根源上說,MPEG-4試圖將自然物體與人造物體相溶合(視覺效果意義上的)。MPEG-4的設計目標還有更廣的適應性和可擴展性。
MPEG問世數年來,給計算機和家電產業帶來的衝擊是巨大的。各種基於MPEG標準的產品如雨後春筍般不斷湧現,VCD的出現已經使在家電市場上風光多年的錄影機看到了生命之路的盡頭(想想看,自從VCD出現後,電視,報刊雜誌上還有錄影機的廣告嗎?);而以生產MPEG解碼晶片著稱的C-CUBE,卻賺得碗滿缽溢。市場的競爭是慘烈的,擁有先進的技術,找準市場的方向,才是企業興旺的出路。面對MPEG技術的不斷發展,企業是否能跟得上潮流的變化,能否利用更新的技術,開拓出更廣闊的市場,這都是值得認真思考的;就象原英特爾公司總裁安德魯.葛洛夫先生的一本書名所述:“只有偏執狂才能生存。
ITU-T的H.261、H.263、H.264
★ H.261是最早的視頻編碼標準,是ITU-T為在綜合業務數字網(ISDN)上開展雙向聲像業務(可視電話、視頻會議)而制定的,和ISDN信道相匹配,其輸出碼率是p×64kbit/s,因此H.261又稱為px64標準,其中p是1到30的可變參數。p取值較小時,只能傳清晰度不太高的圖像,如P=1或2,支持四分之一中間格式QCIF(Quarlity Common Interfmedia Format)的幀率較低的視頻電話;p取值較大時,如 p>6,支持通用中間格式CIF(Common Interfmedia Format)的幀率較高的清晰度較好的會議電視圖像。要說明的是:H.261隻對CIF和QCIF兩種圖像格式進行處理。(CIF和QCIF格式如表2-2所示。註:CIF和QCIF幀頻是每秒30幀).
H.261採用的算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法,特點是壓縮比高、算法複雜度低。H.261詳細制定了視頻編碼的各個部分,包括運動補償的幀間預測、DCT變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。H.261實際的編碼算法類似於MPEG算法,但不能與後者兼容,在實時編碼時比MPEG所占用的CPU運算量少得多,此算法為了最佳化頻寬占用量,引進了在圖像質量與運動幅度之間的平衡折中機制,也就是說,劇烈運動的圖像比相對靜止的圖像質量要差。因此這種方法是屬於恆定碼流可變質量編碼而非恆定質量可變碼流編碼。
★ H.263是ITU-T為低碼流通信而設計的,實質上H.263以及後來的H.263 和H.263 已發展成支持全碼率套用的建議,從它支持眾多的圖像格式這一點就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。H.263核心技術是基於塊的DCT變換和運動估計與預測技術,其編碼算法與H.261一樣,將編碼過程分為幀內編碼和幀間編碼兩個部分,但做了一些改進以提高性能和糾錯能力,如在I幀內用改進的DCT 變換並量化,在幀間採用半象素運動矢量預測補償技術,使運動補償更加精確,量化後適用改進的變長編碼表。目前H.263基本取代了H.261。
與H.261相比,H.263的碼率可以更低,單位碼率可以小於64K,在低碼率下能夠提供比H.261更好的圖像效果,且支持的原始圖像格式更多。H.263的編碼速度快,其設計編碼延時不超過150ms;碼率低,在512 K 乃至 384K 頻寬下仍可得到相當滿意的圖像效果,十分適用於需要雙向編解碼並傳輸的場合(如:可視電話)和網路條件不是很好的場合(如:遠程監控)。
H.263與H.261的區別還有:(1)H.263的運動補償使用半象素精度,而H.261則用全象素精度和循環濾波;(2)數據流層次結構的某些部分在H.263中是可選的,使得編解碼可以配置成更低的數據率或更好的糾錯能力;(3)H.263包含四個可協商的選項以改善性能;(4)H.263採用無限制的運動向量以及基於語法的算術編碼;(5)採用事先預測和與MPEG中的P-B幀一樣的幀預測方法;(6)H.263支持5種解析度,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF、4CIF和16CIF,SQCIF相當於QCIF一半的解析度,而4CIF和16CIF分別為CIF的4倍和16倍。
★ 1998年IUT-T推出的H.263+是H.263建議的第2版,它在保證H.263標準核心句法和語義不變的基礎上,提供了12個新的可協商模式和其他特徵,以提高壓縮效率或改善某方面的功能,增強套用的靈活性。如H.263隻有5種視頻源格式,H.263+允許使用更多的視頻源格式,允許自定義圖像的尺寸,從而拓寬了標準使用的範圍,使之可以處理基於視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。另一重要的改進是可擴展性,它允許多顯示率、多速率及多解析度,增強了視頻信息在易誤碼、易丟包異構網路環境下的傳輸。
為提高壓縮效率,H.263 採用先進的幀內編碼模式;增強的PB-幀模式改進了H.263的不足,增強了幀間預測的效果;去塊效應濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀質量。為適應網路傳輸,H.263 增加了時間分級、信噪比和空間分級,對在噪聲信道和存在大量包丟失的網路中傳送視頻信號很有意義;另外,片結構模式、參考幀選擇模式增強了視頻傳輸的抗誤碼能力。
★ H263 在H263 基礎上增加了3個選項,主要是為了增強碼流在惡劣信道上的抗誤碼性能,同時為了提高編碼效率。這3個選項為:選項U——稱為增強型參考幀選擇,它能夠提供增強的編碼效率和信道錯誤再生能力(特別是在包丟失的情形下),需要設計多緩衝區用於存貯多參考幀圖像。選項V——稱為數據分片,它能夠提供增強型的抗誤碼能力(特別是在傳輸過程中本地數據被破壞的情況下),通過分離視頻碼流中DCT的係數頭和運動矢量數據,採用可逆編碼方式保護運動矢量。選項W——在H263 的碼流中增加補充信息,保證增強型的反向兼容性,附加信息包括:指示採用的定點IDCT、圖像信息和信息類型、任意的二進制數據、文本、重複的圖像頭、交替的場指示、稀疏的參考幀識別。
★ H.264/AVC是ITU-T和ISO/IEC聯合制定的最新編碼標準,它最先由ITU-T的視頻編碼專家組(VCEG)於1997年提出,目標是提出一種更高性能(相對於當時的H.263)的視頻編碼標準。1996年制定H.263標準後,ITU-T的VCEG開始了兩個方面的研究:一個是短期研究計畫,在H.263基礎上增加選項(之後產生了H.263 與H.263 );另一個是長期研究計畫,制定一種新標準以支持低碼率的視頻通信。長期研究計畫產生了H.26L標準草案,在壓縮效率方面與先期的ITU-T視頻壓縮標準相比,具有明顯的優越性。2001年,ISO的MPEG組織認識到H.26L潛在的優勢,隨後ISO與ITU開始組建包括來自ISO/IEC MPEG與ITU-T VCEG的聯合視頻組(JVT),JVT的主要任務就是將H.26L草案發展為一個國際性標準。於是,在ISO/IEC中該標準命名為AVC(Advanced Video Coding),作為MPEG-4標準的第10個選項;在ITU-T中正式命名為H.264標準。
H.264的主要優點
1)在相同的重建圖像質量下,H.264比H.263和MPEG-4(SP)減小50%碼率。2)對信道時延的適應性較強,既可工作於低時延模式以滿足實時業務,如會議電視等;又可工作於無時延限制的場合,如視頻存儲等。3)提高網路適應性,採用“網路友好”的結構和語法,加強對誤碼和丟包的處理,提高解碼器的差錯恢復能力。4)在編/解碼器中採用複雜度可分級設計,在圖像質量和編碼處理之間可分級,以適應不同複雜度的套用。
H.264標準具有算法簡單易於實現、運算精度高且不溢出、運算速度快、占用記憶體小、消弱塊效應等優點,與以往的視頻編碼標準相比,H.264建議在其系統結構、運動估計和運動補償、宏塊的變換和量化以及熵編碼等各方面都有明顯的提高,具有更高的編碼效率和更強的網路適應性。它是一種更為實用有效的圖像編碼標準。
(2)常見的視頻格式
★ AVI---AVI檔案
AVI是音頻視頻交錯(Audio Video Interleaved)的英文縮寫,它是Microsoft公司開發的一種符合RIFF檔案規範的數字音頻與視頻檔案格式,原先用於Microsoft Video for Windows (簡稱VFW)環境,現在已被Windows 95/98、OS/2等多數作業系統直接支持。AVI格式允許視頻和音頻交錯在一起同步播放,支持256色和RLE壓縮,但AVI檔案並未限定壓縮標準,因此,AVI檔案格式只是作為控制界面上的標準,不具有兼容性,用不同壓縮算法生成的AVI檔案,必須使用相應的解壓縮算法才能播放出來。常用的AVI播放驅動程式,主要是Microsoft Video for Windows或Windows 95/98中的Video 1,以及Intel公司的indeo video。AVI檔案目前主要套用在多媒體光碟上,用來保存電影、電視等各種影像信息,有時也出現在Internet上,供用戶下載、欣賞新影片的精彩片斷。
★ .MPEG/.MPG/.DAT---MPEG檔案
MPEG檔案格式是運動圖像壓縮算法的國際標準,它採用有損壓縮方法減少運動圖像中的冗餘信息,同時保證每秒30幀的圖像動態刷新率,已被幾乎所有的計算機平台共同支持。MPEG標準包括MPEG視頻、MPEG音頻和MPEG系統(視頻、音頻同步)三個部分,而Video CD (VCD)、Super VCD (SVCD)、DVD (Digital Versatile Disk)則是全面採用MPEG技術所產生出來的新型消費類電子產品。MPEG壓縮標準是針對運動圖像而設計的,其基本方法是:在單位時間內採集並保存第一幀信息,然後只存儲其餘幀相對第一幀發生變化的部分,從而達到壓縮的目的,它主要採用兩個基本壓縮技術:運動補償技術(預測編碼和插補碼)實現時間上的壓縮,變換域(離散餘弦變換DCT)壓縮技術實現空間上的壓縮。MPEG的平均壓縮比為50∶1,最高可達200∶1,壓縮效率非常高,同時圖像和音響的質量也非常好,並且在微機上有統一的標準格式,兼容性相當好。
這裡值得注意的是DIVX。DIVX 視頻編碼技術可以說是一種對 DVD 造成威脅的新生視頻壓縮格式,也有人說它是 DVD 殺手,它由 Microsoft mpeg4 v3 修改而來,使用了MPEG4的壓縮算法。同時它也可以說是為了打破 ASF 的種種協定而發展出來的。而使用這種據說是美國禁止出口的編碼技術MPEG4 壓縮一部 DVD 只需要 2 張 CDROM。這樣就意味著讀者不需要額外購買DVD光碟機也可以得到和它差不多的視頻質量。而且播放這種編碼,對機器的要求也不高,CPU的最低額度只要求在300MHZ 以上,而且在CPU類型的選擇方面,不論你的芯是PII、CELERON還是PIII、AMDK6/2、AMDK6III、ATHALON,就是CYRIXx86也可以統吃拿下。在配置上64 兆記憶體和一個 8兆顯存的顯示卡上,DIVX便可以流暢的播放了。
★ .RA/.RM/.RMVB---RealVideo檔案
RealVideo檔案是RealNetworks公司開發的一種新型流式視頻檔案格式,它包含在RealNetworks公司所制定的音頻視頻壓縮規範RealMedia中,主要用來在低速率的廣域網上實時傳輸活動視頻影像,可以根據網路數據傳輸速率的不同而採用不同的壓縮比率,從而實現影像數據的實時傳送和實時播放。RealVideo除了可以以普通的視頻檔案形式播放之外,還可以與RealServer伺服器相配合,在數據傳輸過程中邊下載邊播放視頻影像,而不必像大多數視頻檔案那樣,必須先下載然後才能播放。目前,Internet上已有不少網站利用RealVideo技術進行重大事件的實況轉播。
RMVB影片格式比原先的RM多了VB兩字,在這裡VB是VBR(Variable Bit Rate--可變比特率)的縮寫。在保證了平均採樣率的基礎上,設定了一般為平均採樣率兩倍的最大採樣率值,在處理較複雜的動態影像時也能得到比較良好的效果,處理一般靜止畫面時則靈活的轉換至較低的採樣率,有效的縮減了檔案的大小!
★ .MOV/.QT---QuickTime檔案
QuickTime是Apple計算機公司開發的一種音頻、視頻檔案格式,用於保存音頻和視頻信息,具有先進的視頻和音頻功能,被包括Apple Mac OS、Microsoft Windows 95/98/NT在內的所有主流電腦平台支持。QuickTime檔案格式支持25位彩色,支持RLE、JPEG等領先的集成壓縮技術,提供150多種視頻效果,並配有提供了200多種MIDI兼容音響和設備的聲音裝置。新版的QuickTime進一步擴展了原有功能,包含了基於Internet套用的關鍵特性,能夠通過Internet提供實時的數位化信息流、工作流與檔案回放功能,此外,QuickTime還採用了一種稱為QuickTime VR (簡作QTVR)技術的虛擬現實(Virtual Reality, VR)技術,用戶通過滑鼠或鍵盤的互動式控制,可以觀察某一地點周圍360度的景像,或者從空間任何角度觀察某一物體。QuickTime以其領先的多媒體技術和跨平台特性、較小的存儲空間要求、技術細節的獨立性以及系統的高度開放性,得到業界的廣泛認可,目前已成為數字媒體軟體技術領域的事實上的工業標準。國際標準化組織(ISO)最近選擇QuickTime檔案格式作為開發MPEG4規範的統一數字媒體存儲格式。
★ .ASF/.WMV----MICROSOFT流媒體檔案
Microsoft公司推出的Advanced Streaming Format (ASF,高級流格式),也是一個在Internet上實時傳播多媒體的技術標準,Microsoft公司的野心很大,希圖用ASF取代QuickTime之類的技術標準。ASF的主要優點包括:本地或網路回放、可擴充的媒體類型、部件下載、以及擴展性等。ASF套用的主要部件是NetShow伺服器和NetShow播放器。有獨立的編碼器將媒體信息編譯成ASF流,然後傳送到NetShow伺服器,再由NetShow伺服器將ASF流傳送給網路上的所有NetShow播放器,從而實現單路廣播或多路廣播。這和Real系統的實時轉播則是大同小異。
WMV又是一種獨立於編碼方式的在Internet上實時傳播多媒體的技術標準,Microsoft公司希望用其取代QuickTime之類的技術標準以及WAV、AVI之類的檔案擴展名。wmv的主要優點包括:本地或網路回放、可擴充的媒體類型、部件下載、可伸縮的媒體類型、流的優先權化、多語言支持、環境獨立性、豐富的流間關係以及擴展性等。
★ .AVI(n AVI)
如果你發現原來的播放器突然打不開這種格式的avi檔案了,那你就要考慮是不是碰到了n AVI。n AVI是 newAVI 的縮寫,是一個名為 ShadowRealm 的地下組織發展起來的一種新視頻格式。它是由 Microsoft ASF 壓縮算法的修改而來的(並不是想像中的 AVI),視頻格式追求的無非是壓縮率和圖象質量,所以 NAVI 為了追求這個目標,改善了原始的 ASF 格式的一些不足,讓 NAVI 可以擁有更高的幀率(frame rate)。當然,這是犧牲 ASF 的視頻流特性作為代價的。概括來說, NAVI 就是一種去掉視頻流特性的改良型 ASF 格式,也可以被視為是非網路版本的 ASF 。
播放器
目前主流的播放器:RealPlayer、暴風影音、超級解霸、KMPlayer、QuickTime、Windows Media Player 等RealPlayer是有RealNetworks公司出品,目前最新版本是realplayer 11。支持播放在各種線上媒體視頻,包括Flash, FLV格式或者MOV格式等等,並且在播放過程中能夠錄製視頻。同時還加入了線上視頻的一鍵下載功能到瀏覽器中,支持IE和Firefox,這樣便能夠下載YouTube, MSN,Google Video等等線上視頻到本地硬碟來離線觀看。而且還加入了DVD/VCD視頻刻錄的功能。另外官方聲明中便指出RealPlayer 11將對Windows Vista支持不佳,會影響Aero效果等等。
2、暴風影音
暴風影音是由北京暴風網際科技有限公司出品,目前最新版本暴風影音3.6 智慧型高清版 (3.08.05.15),幾乎支持任何流行影音、流媒體檔案格式的播放器。
3、超級解霸
超級解霸目前最新版本是超級解霸3500.2.1全新Vsita 增強版,具有全編碼格式以及影音互動的全面解決方案
支持格式眾多,新增50多種格式支持,超強糾錯,高清影視——獨門DIRECTDVD CD/CD技術,HDFT增益濾波高清影像技術。
4、KMPlayer
KMPlayer是來自韓國的一套將網路上所有能見得到的解碼程式(Codec)全部收集於一身的影音全能播放器。幾乎可以播放系統上所有的影音檔案。 通過各種外掛程式擴展KMPlayer可以支持層出不窮的新格式。直接從Winamp繼承的外掛程式功能,能夠直接使用Winamp的音頻,輸入,視覺效果外掛程式, 而通過獨有的擴展能力,可以選擇使用不同解碼器對各種格式進行解碼。
Apple QuickTime 視頻檔案播放程式,包含 QuickTime Plug-in 和 QuickTime VR 。現在用QuickTime來做影音播放的少,但是很多遊戲的視頻解碼部分需要QuickTime解碼支持,所以QuickTime的套用還有很大的潛力。
Windows Media Player 微軟出品,目前最新版本Windows Media Player 11 。
綜合以上幾款主流的播放器,各有優缺點。這幾種播放器(除了QuickTime)幾乎都在宣稱自己是萬能的播放器,可以播放任何格式,但是這種支持是要安裝更多的外掛程式,以對任何一種視頻格式提供支持。這樣做的優點是只安裝一個播放器就可以播放所有的影音檔案。但缺點也很明顯,安裝再多的外掛程式,只能提供最基本的播放,犧牲了一些專有播放器的功能,有時難免出現錯誤;不能對所有的格式提供最佳化,占用大量的系統資源;另外也是播放器的體積變得越來越臃腫。RealPlayer是RM、RMVB格式的專用播放器,網路上流行的影音檔案很多是RM、RMVB格式。這種格式的優點在於清晰度高,體積小,便於網路傳輸,這也是它流行的原因所在。暴風影音確實可以稱作萬能播放器,幾乎可以播放所有流行的影音檔案,但是對RM、RMVB格式的影音檔案支持不是很好,這可能是因為RM、RMVB格式的封裝太過嚴密。超級解霸特別適合播放VCD、DVD,但對於網路檔案沒有優勢。KMPlayer和暴風影音相仿。QuickTime是MOV、QT格式的專有播放器,但是這兩種格式的影音檔案不利於網路傳輸,所以很少用到QuickTime,但是又不能忽略QuickTime,因為很多遊戲的視頻解碼部分,需要QuickTime解碼器。Windows Media Player微軟自家的產品,對微軟指定的格式有很好的支持,如AVI、ASF、WMV等格式。
壓制方法
影音檔案為了便於網路傳輸和存貯,一般會把VCD、DVD視頻源壓製成其它在損失很少畫質的前提下體積更小的視頻格式。目前網路上流行的高清晰影音檔案。主要分為DVDRip、RMVB、MKV等三大類、它們以高清晰的畫質.接近原汁原味的音效.讓許多人通過網路欣賞到了高品質的電影.所謂DVDRip.就是用DivX壓縮技術對DVD碟片的視頻圖像進行高質量的壓縮.用MP3或AC3對音頻進行壓縮.然後將視頻.音頻部分合併成一個AVI檔案(AVI即Audio Video lnterleaved.音頻視頻交錯).最後再加上外掛的字幕檔案數分之一.注意.當DVD轉成DVDRip後.損失掉一些如選單導航.音軌選擇.分段選擇等DVD特性.不過相對於它的優點和從便於收藏交流等方面考慮.這些損失都是微不足道的.
2.RMVB
該格式由RM影片格式升級延伸而來.VB即VBR.是Variable Bit Rate(可改變之比特率)的英文縮寫.它打破了以前RM格式平均壓縮採樣的方式.在保證平均壓縮比的基礎上.合理利用了比特率資源.使RMVB在犧牲少部分影片質量的情況下.最大限度地壓縮了影片的大小.最終擁有了近乎完美的接近於DVD品質的視聽效果.
相比DVDRip.RMVB的優勢不言而喻.首先在保證影片整體視聽效果的前提下.RMVB的個頭只有300MB-450MB左右(以90分鐘標準電影計算).而DVDRip卻需要700MB甚至更多.此外.它還擁有內置字幕.無需外掛外掛程式支持.播放時系統占用率低等優點.這些優勢使它已成為當前網路電影的真正主流格式.
3.MKV
被很多朋友認為是顛覆DVDRip的未來主流媒體格式.它實際上是一種新型多媒體封裝格式.也稱多媒體容器(Multimedia Container).它不同於DivX.XviD等視頻編碼格式.也不同於MP3.Ogg等音頻編碼格式.MKV只是為這些音.視頻提供外殼的"組合"和"封裝"格式.換句話說就是一種容器格式.常見的AVI.VOB.MPEG.RM格式其實也都屬於這種類型.但它們要么結構陳舊.要么不夠開放.這才促成了MKV這類新型多媒體封裝格式的誕生.
MKV最大的特點就是能容納多種不同類型編碼的視頻.音頻及字幕流.甚至連非常封閉的RealMediae及QuickTime這類流媒體也被它囊括進去.可以說是對傳統媒體格式的一次大顛覆.幾乎變成了一個萬能的媒體容器.
音頻檔案
音頻檔案是一種特殊的影音檔案,沒有視頻,只有聲音。平時我們所聽的歌曲、音樂都是音頻檔案。目前網路上主流的音頻格式有MP3、WAV、FLAC、APE等。1、MP3
MP3的全稱是Moving Picture Experts Group Audio Layer III。簡單的說,MP3就是一種音頻壓縮技術,由於這種壓縮方式的全稱叫MPEG Audio Layer3,所以人們把它簡稱為MP3。MP3是利用 MPEG Audio Layer 3 的技術,將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的file,換句話說,能夠在音質丟失很小的情況下把檔案壓縮到更小的程度。而且還非常好的保持了原來的音質。正是因為MP3體積小,音質高的特點使得MP3格式幾乎成為網上音樂的代名詞。每分鐘音樂的MP3格式只有1MB左右大小,這樣每首歌的大小只有3-4兆位元組。使用MP3播放器對MP3檔案進行實時的解壓縮(解碼),這樣,高品質的MP3音樂就播放出來了。
2、WAV
WAV格式是微軟公司開發的一種聲音檔案格式,也叫波形聲音檔案,是最早的數字音頻格式,被Windows平台及其應用程式廣泛支持。WAV格式支持許多壓縮算法,支持多種音頻位數、採樣頻率和聲道,採用44.1kHz的採樣頻率,16位量化位數,因此WAV的音質與CD相差無幾,但WAV格式對存儲空間需求太大不便於交流和傳播。
3、FLAC
FLAC代表 Free Lossless Audio Codec - 免費的無損音頻壓縮。簡而言之,FLAC與MP3相仿,但是是無損壓縮的,也就是說音頻以FLAC方式壓縮不會丟失任何信息。這種壓縮與Zip的方式類似,但是FLAC將給你更大的壓縮比率,因為FLAC是專門針對音頻的特點設計的壓縮方式,並且你可以使用播放器播放FLAC壓縮的檔案,就象通常播放你的MP3檔案一樣(現在已經有許多汽車播放器和家用音響設備支持FLAC,在FLAC的網站上你可以找到這些設備廠家的連線)。
FLAC是免費的並且支持大多數的作業系統,包括Windows, " unix" (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, 和Amiga。並且FLAC提供了在開發工具autotools, MSVC, Watcom C, 和Project Builder上的build系統。
FLAC項目包括以下幾個方面:數據流的格式以庫的形式提供的參考編碼器和解碼器 flac, 一個以命令行方式工作的可以編解碼FLAC檔案的程式(譯註:有些象Lame吧?) metaflac, 以命令行方式工作的FLAC檔案的metadata編輯器不同音頻播放器的輸入外掛程式.
我們所說的“FLAC是免費的”不僅僅意味著你可以不花錢而得到它。更重要的是FLAC的檔案格式是對公眾完全開放的,你可以以任何目的使用它(FLAC 項目只保留維護 FLAC 格式規格和確認兼容特性的權利),FLAC的檔案格式和編碼/解碼的實現方式都不受任何已知專利的限制。還有,所有的原始碼都在開放原始碼的授權方式下可以得到。 FLAC是世界上第一個完全開放和免費的無損音頻壓縮格式。
FLAC的特性:
無損失壓縮:被編碼的音頻(PCM)數據沒有任何信息損失,解碼輸出的音頻與編碼器的輸入的每一個位元組都是一樣的。每個數據幀都有一個當前幀的 16-bit CRC 校驗碼,用於監測數據傳輸錯誤。對整段音頻數據,在檔案頭中還保存有一個針對原始未壓縮音頻數據的MD5標記,用於在解碼和測試時對數據進行校驗。
快速:FLAC更看重解碼的速度。解碼只需要整數運算,並且相對於大多數編碼方式而言,對計算速度要求很低。在很普通的硬體上就可以輕鬆實現實時解碼。
硬體支持:由於FLAC提供了免費的解碼範例,而且解碼的複雜程度低,所以FLAC是目前唯一獲得硬體支持的無損壓縮編碼。
可以流化:FLAC的每個數據幀都包含了解碼所需的全部信息。解碼當前幀無需參照它前面或後面的數據幀。FLAC使用了同步代碼和CRC(類似於MPEG等編碼格式),這樣解碼器在數據流中跳躍定位時可以有最小的時間延遲。
可以定位:FLAC支持快速採樣精確定位。這不僅對於播放有益,更使得FLAC檔案便於編輯。
富於彈性的metadata:可以定義和實現新類型的metadata數據塊,而不會影響舊的數據流和解碼器的使用。目前已有的metadata類型包括tag,cue表,和定位表。 已經註冊的應用程式可以定義自己專用的metadata類型(譯註:這一點與MIDI標準相似)。
非常適合於存檔套用:FLAC是一個開放的編碼格式,並且沒有任何數據的損失,你可以將它轉換為你需要的任何其他格式。除了每個數據幀的CRC和MD5標記對數據完整性的保障,flac(譯註:FLAC項目提供的命令行方式編碼工具)還提供了一個verify(校驗)選項,當使用該選項進行編碼的時候,編碼的同時就會立即對已編碼數據進行解碼並與原始輸入數據進行比較,一旦發現不同就會退出並且報警提示。
便於對CD進行備份:FLAC有一個“cue表”metadata數據塊用於保存CD的內容列表和所有音軌的索引點。你可以將一張CD保存到一個單一檔案,並導入CD的cue表格,這樣一個FLAC檔案就可以完整地記錄整張CD的全部信息。當你的原來的CD損壞的時候,你就可以用這個檔案恢復出與原來一模一樣的CD副本。
抗損傷:由於FLAC的幀結構,使得一旦發生數據流的損壞,損失會被限制在受損傷的數據幀之內。一般只是會丟失很短的一個片段。而很多其他無損音頻壓縮格式在遇到損傷的時候,一個損傷就會造成後面所有數據的丟失。
FLAC不具有的特性:
數據縮水。FLAC是專門並且僅僅為無損壓縮而設計的,您可以選用許多其他優秀的有損壓縮方式如Vorbis, MPC, 和MP3(LAME提供了一個優秀的開放原始碼的實現)。
sdmi(例如cetera)兼容。FLAC不準備支持任何複製保護方法,實際上這些手段最終都是在浪費數據。(從另一個角度看,由於所有這些手段最終都被證明是無效的,所以也可以說FLAC把這些無用數據壓縮到了零!)當然我們不能阻止某些人利用專用的metablock進行複製保護,但是他們的保護只會在他們自己解碼產品上有效,其他解碼器會跳過這些專門的metablock的。
4、APE
APE格式對於普通的用戶來說肯定都不太了解,但是對於音樂發燒友來說,是再熟悉不過的了。而目前在網路相對發展的今天,無損壓縮的APE音頻檔案已經成為人們追求的新對象,並逐步流行起來。音樂發燒友們以往不願意使用MP3播放器而堅持使用CD,是因為覺得MP3是一種有損的音頻壓縮格式,在音質上無法滿足發燒友們的需求。而隨著炬力CTW500方案對APE格式的支持,這就讓CD僅有的優勢也淡然無存,使音樂發燒友有了充分的理由淘汰CD機而選擇更為方便的MP3。
APE是目前流行的、由Monkey's Audio出品的一種數字音樂檔案格式,與MP3、OGG這類有損壓縮方式不同,APE是目前世界上惟一得到公認的音頻無損壓縮格式,也就是說當您將從音頻CD上讀取的音頻數據檔案壓縮成APE格式後,您還可以再將APE格式的檔案還原,而還原後的音樂檔案與壓縮前一模一樣,沒有任何損失。而現在越來越多的人將它在網路傳播,因為被壓縮後的APE檔案容量要比WAV源檔案小一半多,可以節約傳輸所用的時間,也更方便傳播!由於APE的採樣率高達800kbps~1400kbps,接近於音樂CD的1411.2kbps,遠遠高於MP3的128kbps,因此它在壓縮後的音質和源檔案音質幾乎毫無差異,其音質之佳已經過了嚴格的盲聽測試,得到了全世界發燒友的公認。APE的這些特點,都是其他無損壓縮格式所爭相效仿的。
在APE出現之前,音樂迷們都認為以CD或者WAV來保存自己喜歡的音樂素材是最好的方法了,但APE的出現,足以使他們改變這種看法,因為APE既可以保持音樂信號的無損,又可以以比WAV高得多的壓縮率(接近2:1)壓縮WAV檔案,而且可以無須解壓而直接播放。由於壓縮後的APE檔案只有原檔案一半左右大小,APE格式受到了許多音樂愛好者的喜愛,特別是對於希望通過網路傳輸音頻CD的朋友來說,APE可以幫助他們節約大量的資源。APE如此流行,在網上也比較容易能下載到APE格式的檔案。
主流的音頻播放器:foobar2000、千千靜聽、Winamp
1、foobar2000Foobar2000 是一個 Windows 平台下的高級音頻播放器.包含了一些播放增益支持、低記憶體占用等基本特色以及內置支持一些流行的音頻格式.包括MP/mp3PRO、AAC/AAC+、M4A/MP4、WMA、APE、MPC、OGG、WAVE、CD、FLAC、RM、TTA、AIFF、AU等音頻格式以及多種MOD和MIDI音樂,以及AVI、VCD、DVD等多種視頻檔案中的音頻流,還支持CUE音軌索引檔案。
通過簡單便捷的操作,可以在多種音頻格式之間進行輕鬆轉換,包括上述所有格式(以及CD或DVD中的音頻流)到WAVE、MP3、APE、WMA等格式的轉換;通過基於COM接口的AddIn外掛程式或第三方提供的命令行編碼器還能支持更多格式的播放和轉換。
2、千千靜聽千千靜聽是一款完全免費的音樂播放軟體,集播放、音效、轉換、歌詞等眾多功能於一身。其小巧精緻、操作簡捷、功能強大。
千千靜聽擁有自主研發的全新音頻引擎,支持DirectSound、Kernel Streaming和ASIO等高級音頻流輸出方式、64比特混音、AddIn外掛程式擴展技術,具有資源占用低、運行效率高,擴展能力強等特點。
3、WinampWinamp 是一個非常著名的高保真的音樂播放軟體, 支持 MP3、MP2、MOD、S3M、MTM、ULT、XM、IT、669、CD-Audio、Line-In、WAV、VOC、AVI、OGG、WMV、MPG 等多種音頻和視頻格式。可以定製界面 Skins, 支持增強音頻視覺和音頻效果的 Plug-ins, 通過一些非常實用的擴展外掛程式來增強其功能。
內涵與外延
一般來講,我們平時所說的影音檔案包括電影、電視節目、歌曲等,但是隨著技術的發展與成熟,現在越來越多的3D動畫、flash流行於網路。它們也具有影音檔案的特徵,可以觀看,可以收聽,所以這些也是影音檔案。隨著科技的發展,一定還會出現更多格式的影音檔案。