視音頻信息

視音頻信息

音頻信息:是指自然界中各種音源發出的可聞聲和由計算機通過專門設備合成的語音或音樂。按用途分為三類:語音、音樂和效果聲。視頻信息:活動或連續的圖像信息,它由一系列連續呈現的圖像畫面所組成,每幅畫面成為一幀,幀是構成視頻信息的基本單元。

聽覺特性與音頻信號

聲音是一種物理現象,人耳聽到則是一種心理現象。人耳具有分辨聲音的強度音調音色的能力,還能夠分辨出聲音的方向和深度,並感受到空間感和縱深感。通常將人耳對聲音的主觀感受,即響度、音調和音色稱之為聲音的三要素。

響度

響度是聽覺的基礎,為人耳對聲音強弱的感覺程度,主要取決於聲波振幅的大小,正常人聽覺的強度範圍是0dB~140dB(也有些資料人為是–5dB~130dB)。超出人耳可聽頻範圍的聲音,即使響度在再大,也聽不見。

視音頻信息

人耳對不同

頻率的敏感程度

差別很大對

2kHz-4kHz的

信號最敏感

聽闕-頻率曲線

(1)頻率回響聲壓級越高,人耳的聽覺頻響曲線就越趨近於平直,聲壓級越低人耳的聽覺頻響就越差;高於20KHz的和低於20Hz的聲音,人耳基本上聽不見;而對於3KHz到5KHz的聲音感覺最靈敏,響度與聲壓級有一定的關係,但大小並不完全一致,聲壓級大,人耳的感覺不一定響,因為聽到的聲音響度還與聲音的頻率密切相關。

(2)等響曲線描述響度、聲壓級和聲源頻率之間的關係曲線稱之為等響曲線,其基本規律是每條曲線上所代表的與聲壓級、頻率相對應的聲音,人耳聽來都是同樣的響。例如將1KHz時以dB表示的聲壓級定義為響度級,單位為phon(方)。可以看出,高於或低於1KHz聲音的響度級與聲壓級就有了偏差。

0方(phon)以下的聲音,人耳是聽不見的,所以該曲線可稱為可聞閾;120phon以上的聲音會使人耳感到疼痛,該曲線可稱為痛閾。

100Hz的聲音,必須具有40dB聲壓級,人耳才能聽到,而1KHz聲音大於0dB聲壓級,人耳就能聽到,因此,當改變一個放音裝置的音量時,聲音信號中各頻率的響度就會改變,使聽音人會感到音色的變化。即使是一個高級的放音裝置,在低聲壓級音量時,也會感到放音頻帶變窄,聲音變弱。所以調音人員在使用調音台調整聲音的過程中,作為標準的監聽,其聲壓級應在80dB~90dB之間。由曲線可以看出聲壓級在80dB~90dB時,不同頻率引起的響度不平衡差別相對減少,聲音的主觀聽覺偏差較小,才能使聲音的頻率均衡調整得比較正確,才能聽到頻響平直的聲音。

音高

音調是人耳對聲音高低的感覺,主要與聲音的振動頻率有關,但不是正比關係,也與頻率的倍數值有關,通常,我們用頻率的倍數或對數關係表示因調,頻率越高,人耳的感覺因調也就越高,在音樂上稱之為音高。

視音頻信息

人耳可以聽到的

最低頻率約為2Hz

最高頻率約為20kHz

音高-頻率曲線

頻率增加一倍,稱之為一個倍頻程,也叫做提高了一個八度。音調的單位是mel(美),以頻率1KHz,聲壓級60dB的純音產生的音調,定義為1000mel。
音調還與聲壓級有一定的關係,對於1KHz~2KHz以上的聲音,當聲壓級增大聽起來會比原來的音調有所抬高;而對於500Hz以下的聲音,頻率越低,聲壓級增大聽起來就越低沉,因此我們說,音調還在一定程度上與聲壓級有關。

音色

由於各種發聲體的結構和材料不同,即使發出相同音調、相同響度的聲音,人耳也能聽出它們之間的差別,這就是由於音色不同。例如:兩個人講同一句話,聽話人能判斷他們各自的聲音,是因為每個人的發音器官(聲帶、口腔、舌、齒等)有差別,使得講話的音色不同。根據研究分析,相同音調的聲音,其基頻是相同的,如果,所發出聲音的諧波次數和幅度不同,頻譜結構也就不同,音色也就不同。

音色由聲音波形的諧波頻譜和包絡決定,其基頻所產生的聽得最清楚的稱為基音,各次諧波微小振動所產生的聲音稱泛音,單一頻率的音稱為純音,具有諧波的音稱為複音,每個基音都有固有的頻率和不同響度的泛音,藉此可以區別具有相同響度很音調的聲音。聲音波形各次諧波的比例和隨時間的衰減大小決定了各種聲源的音色特徵,其包絡是每個周期波峰間的連線,包絡的陡緩影響聲音強度的瞬態特性。聲音的音色色彩紛呈,變化萬千。聲音高保真的目標就是要儘可能準確地傳輸、還原重建原始聲場的一切特徵,使人們真實的感受到諸如聲源定位感、空間包圍感、層次感、厚度感各種臨場聽感的立體聲環繞效果。

聲源發出的聲音含有許多複雜的頻率。頻譜是把時間函式的分量按幅值或相位表示為頻率函式的分布圖形。根據聲音的不同,它的頻譜可能是線譜、連續譜或者是二者之和,即混合譜。實際聲音是由許多不同頻率、不同強度的純音組合而成的。對一個聲源發出的聲音的頻率成份和強度的分析,叫頻譜分析,並且可用頻譜圖表示,其縱軸為幅度,橫軸為頻率。將聲音的基頻和各次諧波按頻率分別用一豎線畫在橫軸上,它的長短表示幅度的大小。
音色是一個主觀量,所以音色無法進行量化,其又與頻譜的關係很密切,與聲音的瞬態情況如發聲體振動的起振、穩定和衰減時間過程有關,通常用一些數語來表示,例如:柔和、刺耳、低沉、力度不足等等。

掩蔽效應

在日常生活中,可以發現在安靜的環境中能夠分辨出輕弱的聲音,但在嘈雜的環境中,輕微的聲音就會被嘈雜的聲音掩蔽而不能聽到。在聆聽一個聲音時,被另一個較強的聲音所掩蓋,而出現聽不見的顯現稱為掩蔽效應。其基本類型有兩種,其規律特性是:
(1)頻域掩蔽是指掩蔽聲與被掩蔽聲同時作用的效應,又叫同時掩蔽,掩蔽聲在掩蔽效應發生期間一直起作用。通常,領域中的強音會掩蔽與之同時發聲在附近的弱音,弱音頻率離強音頻率越近,就越容易被掩蔽;反之,離強音頻率越遠的弱音,就不容易被掩蔽。

視音頻信息不同純音的掩蔽效應

例:一個1KHz的聲音比另一個900Hz的聲音高18dB,後者便很容易被前者所掩蔽;若一個1KHz的聲音頻率比另一個較遠的1.8KHz的聲音高18dB,則這兩個聲音將同時被人耳聽到;若要使1.8KHz的聲音聽不到,則1KHz的聲音要比1.8KHz的聲音高45dB。一般來說,低頻率的聲音容易掩蔽高頻率的聲音。

(2)時域掩蔽是指掩蔽聲與被掩蔽聲不同時出現時的掩蔽效應,又稱異時掩蔽,其又分為兩種。掩蔽聲音出現前一段時間內發生稱為導前掩蔽;否則叫滯後掩蔽。產生時域掩蔽是因為人的大腦處理信息需要花費一定的時間,隨著時間的推移它很快會衰減,是一種弱掩蔽效應。一般情況下,導前掩蔽只有3ms~20ms,而後滯掩蔽卻可以持續50ms~100ms。

視音頻信息時域掩蔽

(3)掩蔽規律掩蔽效應遵循的基本規律是低頻聲音可以掩蔽高頻聲音,高頻聲音較難掩蔽低頻聲音;提高掩蔽聲的聲壓級,掩蔽的範圍將擴大。被掩蔽聲的頻率越接近掩蔽聲,掩蔽的效應就越顯著。

(4)套用實例在管弦樂隊中安置數量較多的小提琴,可增大小提琴的聲壓級,並將傳聲器裝置在合適的位置上,才不至於被打擊樂或發音強的銅管樂所掩蓋;在使用調音台合成男女二重唱時,需提高女聲通道的輸出音量,方能使女聲在合唱中不被男聲所掩蓋。

優先效應

假設有兩個相同的聲音先後到達人耳,如果時間差在50ms以內,並且後到達的聲音較弱於第一個到達的聲音,則人耳只會感覺到第一個聲音的存在,這種效應叫優先效應,也稱哈斯效應。如果時間差大於50ms,則人耳就能先後聽到兩個聲音。

視頻技術基礎

視音頻信息視頻技術

動態圖像傳輸在電信領域被稱為視頻業務或視訊業務,在計算機界常常稱為多媒體通信、流媒體(下載像流水)通信等。視頻通信技術是實現和完成視頻業務的主要技術。

視頻信號與圖像掃描

(1)視頻信號

視頻信號是一種模擬信號,由視頻模擬數據和視頻同步數據構成,用於接收端正確地顯示圖像。信號的細節取決於套用的視頻標準或者“制式”--NTSC(美國全國電視標準委員會,NationalTelevisionStandardsCommittee)、PAL(逐行倒相,PhaseAlternateLine)以及SECAM(順序傳送與存儲彩色電視系統,法國採用的一種電視制式,SEquentialCouleurAvecMemoire)。在PC領域,由於使用的制式不同,存在不兼容的情況。就拿解析度來說,有的制式每幀有625線(50Hz),有的則每幀只有525線(60Hz)。後者是北美和日本採用的標準,統稱為NTSC。通常,一個視頻信號是由一個視頻源生成的,比如攝像機、VCR或者電視調諧器等。為傳輸圖像,視頻源首先要生成—個垂直同步信號(VSYNC)。這個信號會重設接收端設備(PC顯示器),保征新圖像從螢幕的頂部開始顯示。發出VSYNC信號之後,視頻源接著掃描圖像的第一行。完成後,視頻源又生成一個水平同步信號,重設接收端,以便從螢幕左側開始顯示下一行。並針對圖像的每一行,都要發出一條掃描線,以及一個水平同步脈衝信號。

另外,NTSC標準還規定視頻源每秒鐘需要傳送30幅完整的圖像(幀)。假如不作其它處理,閃爍現象會非常嚴重。為解決這個問題,每幀又被均分為兩部分,每部分262.5行。一部分全是奇數行,另一部分則全是偶數行。顯示的時候,先掃描奇數行,再掃描偶數行,就可以有效地改善圖像顯示的穩定性,減少閃爍。目前世界上彩色電視主要有三種制式,即NTSC、PAL和SECAM制式,三種制式目前尚無法統一。我國採用的是PAL-D制式。一般等離子都兼容以上的電視制式。

(2)圖像掃描

視音頻信息圖像掃描

為得到連續的沒有跳躍感的重建活動圖像;圖像幀頻〉20Hz(決定於物體的一般運動速度);為得到沒有閃爍感的重建圖像:圖像刷新速率〉46Hz(決定於人眼的臨界閃爍頻率);為解決圖像連續感、閃爍感和電視信號頻寬的矛盾:
掃描方式:隔行掃描和逐行掃描
隔行掃描:奇數場+偶數場=1幀
現有各種制式的電視系統均採用了隔行掃描的方式。

彩色電視系統

視音頻信息彩色電視系統

基礎:三原色原理

視音頻信息三原色原理

原色,又稱為基色,即用以調配其他色彩的基本色。原色的色純度最高,最純淨、最鮮艷。可以調配出絕大多數色彩,而其他顏色不能調配出三原色。
三原色分為兩類,一類是色光三原色,另一類是顏料三原色。
配圖中左圖是光的三原色,右圖是顏料的三原色。

色光三原色——加色法原理

人的眼睛是根據所看見的光的波長來識別顏色的。可見光譜中的大部分顏色可以由三種基本色光按不同的比例混合而成,這三種基本色光的顏色就是紅(Red)、綠(Green)、藍(Blue)三原色光。這三種光以相同的比例混合、且達到一定的強度,就呈現白色(白光);若三種光的強度均為零,就是黑色(黑暗)。這就是加色法原理,加色法原理被廣泛套用於電視機、監視器等主動發光的產品中。

顏料三原色——減色法原理

而在列印、印刷、油漆、繪畫等靠介質表面的反射被動發光的場合,物體所呈現的顏色是光源中被顏料吸收後所剩餘的部分,所以其成色的原理叫做減色法原理。減色法原理被廣泛套用於各種被動發光的場合。在減色法原理中的三原色顏料分別是青(Cyan)、品紅(Magenta)和黃(Yellow)。

綜上所述,無論是從原色的定義出發,還是以實際套用的結果驗證都足以說明,美術教材仍把紅、黃、藍稱為三原色已經明顯過時了。

視頻信號頻譜特點

活動圖像頻譜

視音頻信息活動圖像頻譜

頻譜交錯原理
視音頻信息頻譜交錯原理

廣播電視信號頻譜結構示意圖
視音頻信息廣播電視信號頻譜結構示意圖

參考書目

《音頻信息處理技術》 韓紀慶 清華大學出版社 2007

《現代通信技術》記越峰等 北京郵電大學出版社

相關詞條

相關搜尋

熱門詞條

聯絡我們