英文
Voice sense of hearing簡介
由於人耳聽覺系統非常複雜,迄今為止人類對它的生理結構和聽覺特性還不能從生理解剖角度完全解釋清楚。所以,對人耳聽覺特性的研究目前僅限於在心理聲學和語言聲學。人耳對不同強度、不同頻率聲音的聽覺範圍稱為聲域。在人耳的聲域範圍內,聲音聽覺心理的主觀感受主要有響度、音高、音色等特徵和掩蔽效應、高頻定位等特性。其中響度、音高、音色可以在主觀上用來描述具有振幅、頻率和相位三個物理量的任何複雜的聲音,故又稱為聲音“三要素”;而在多種音源場合,人耳掩蔽效應等特性更重要,它是心理聲學的基礎。下面簡單介紹一下以上問題。
一、聲音三要素
1.響度
響度,又稱聲強或音量,它表示的是聲音能量的強弱程度,主要取決於聲波振幅的大小。聲音的響度一般用聲壓(達因/平方厘米)或聲強(瓦特/平方厘米)來計量,聲壓的單位為帕(Pa),它與基準聲壓比值的對數值稱為聲壓級,單位是分貝(dB)。對於響度的心理感受,一般用單位宋(Sone)來度量,並定義 lkHz、40dB的純音的響度為1宋。響度的相對量稱為響度級,它表示的是某響度與基準響度比值的對數值,單位為口方(phon),即當人耳感到某聲音與1kHz單一頻率的純音同樣響時,該聲音聲壓級的分貝數即為其響度級。可見,無論在客觀和主觀上,這 兩個單位的概念是完全不同的,除1kHz純音外,聲壓級的值一般不等於響度級的值,使用中要注意。
響度是聽覺的基礎。正常人聽覺的強度範圍為0dB—140dB(也有人認為是-5dB— 130dB)。固然,超出人耳的可聽頻率範圍(即頻域)的聲音,即使響度再大,人耳也聽不出來(即響度為零)。但在人耳的可聽頻域內,若聲音弱到或強到一定程度,人耳同樣是聽不到的。當聲音減弱到人耳剛剛可以聽見時,此時的聲音強度稱為“聽閾”。一般以1kHz純音為準進行測量,人耳剛能聽到的聲壓為 0dB(通常大於0.3dB即有感受)、聲強為10-16W/cm2 時的響度級定為0口方。而當聲音增強到使人耳感到疼痛時,這個閾值稱為“痛閾”。仍以1kHz純音為準來進行測量,使 人耳感到疼痛時的聲壓級約達到 140dB左右。
實驗表明,聞閾和痛閾是隨聲壓、頻率變化的。聞閾和痛閾隨頻率變化的等響度曲線(弗萊徹—芒森曲線)之間的區域就是人耳的聽覺範圍。通常認為,對於 1kHz純音,0dB—20dB為寧靜聲,30dB--40dB為微弱聲,50dB—70dB為正常聲,80dB—100dB為響音聲,110dB— 130dB為極響聲。而對於1kHz以外的可聽聲,在同一級等響度曲線上有無數個等效的聲壓—頻率值,例如,200Hz的30dB的聲音和1kHz的 10dB的聲音在人耳聽起來具有相同的響度,這就是所謂的“等響”。小於0dB聞閾和大於140dB痛閾時為不可聽聲,即使是人耳最敏感頻率範圍的聲音,人耳也覺察不到。人耳對不同頻率的聲音聞閾和痛閾不一樣,靈敏度也不一樣。人耳的痛閾受頻率的影響不大,而聞閾隨頻率變化相當劇烈。人耳對3kHz— 5kHz聲音最敏感,幅度很小的聲音信號都能被人耳聽到,而在低頻區(如小於800Hz)和高頻區(如大於5kHz)人耳對聲音的靈敏度要低得多。響度級較小時,高、低頻聲音靈敏度降低較明顯,而低頻段比高頻段靈敏度降低更加劇烈,一般應特別重視加強低頻音量。通常200Hz--3kHz語音聲壓級以 60dB—70dB為宜,頻率範圍較寬的音樂聲壓以80dB—90dB最佳。
2.音高
音高也稱音調,表示人耳對聲音調子高低的主觀感受。客觀上音高大小主要取決於聲波基頻的高低,頻率高則音調高,反之則低,單位用赫茲(Hz)表示。主觀感覺的音高單位是“美”,通常定義響度為40方的 1kHz純音的音高為1000美。赫茲與“美”同樣是表示音高的兩個不同概念而又有聯繫的單位。
人耳對響度的感覺有一個從聞閾到痛閾的範圍。人耳對頻率的感覺同樣有一個從最低可聽頻率20Hz到最高可聽頻率別20kHz的範圍。響度的測量是以 1kHz純音為基準,同樣,音高的測量是以40dB聲強的純音為基準。實驗證明,音高與頻率之間的變化並非線性關係,除了頻率之外,音高還與聲音的響度及波形有關。音高的變化與兩個頻率相對變化的對數成正比。不管原來頻率多少,只要兩個40dB的純音頻率都增加1個倍頻程(即1倍),人耳感受到的音高變化則相同。在音樂聲學中,音高的連續變化稱為滑音,1個倍頻程相當于樂音提高了一個八度音階。根據人耳對音高的實際感受,人的語音頻率範圍可放寬到80Hz --12kHz,樂音較寬,效果音則更寬。
3.音色
音色又稱音品,由聲音波形的諧波頻譜和包絡決定。聲音波形的基頻所產生的聽得最清楚的音稱為基音,各次諧波的微小振動所產生的聲音稱泛音。單一頻率的音稱為純音,具有諧波的音稱為複音。每個基音都有固有的頻率和不同響度的泛音,藉此可以區別其它具有相同響度和音調的聲音。聲音波形各次諧波的比例和隨時間的衰減大小決定了各種聲源的音色特徵,其包絡是每個周期波峰間的連線,包絡的陡緩影響聲音強度的瞬態特性。聲音的音色色彩紛呈,變化萬千,高保真(Hi— Fi)音響的目標就是要儘可能準確地傳輸、還原重建原始聲場的一切特徵,使人們其實地感受到諸如聲源定位感、空間包圍感、層次厚度感等各種臨場聽感的立體環繞聲效果。
另外,表征聲音的其它物理特性還有:音值,又稱音長,是由振動持續時間的長短決定的。持續的時間長,音則長;反之則短。從以上主觀描述聲音的三個主要特徵看,人耳的聽覺特性並非完全線性。聲音傳到人的耳內經處理後,除了基音外,還會產生各種諧音及它們的和音和差音,並不是所有這些成分都能被感覺。人耳對聲音具有接收、選擇、分析、判斷響度、音高和音品的功能,例如,人耳對高頻聲音信號只能感受到對聲音定位有決定性影響的時域波形的包絡(特別是變化快的包絡在內耳的延時),而感覺不出單個周期的波形和判斷不出頻率非常接近的高頻信號的方向;以及對聲音幅度解析度低,對相位失真不敏感等。這些涉及心理聲學和生理聲學方面的複雜問題。
二、人耳的掩蔽效應
一個較弱的聲音(被掩蔽音)的聽覺感受被另一個較強的聲音(掩蔽音)影響的現象稱為人耳的“掩蔽效應”。被掩蔽音單獨存在時的聽閾分貝值,或者說在安靜環境中能被人耳聽到的純音的最小值稱為絕對聞閾。實驗表明,3kHz—5kHz絕對聞閾值最小,即人耳對它的微弱聲音最敏感;而在低頻和高頻區絕對聞閾值要大得多。在 800Hz--1500Hz範圍內聞閾隨頻率變化最不顯著,即在這個範圍內語言可儲度最高。在掩蔽情況下,提高被掩蔽弱音的強度,使人耳能夠聽見時的聞閾稱為掩蔽聞閾(或稱掩蔽門限),被掩蔽弱音必須提高的分貝值稱為掩蔽量(或稱閾移)。
1.掩蔽效應
已有實驗表明,純音對純音、噪音對純音的掩蔽效應結論如下:
A.純音間的掩蔽
①對處於中等強度時的純音最有效的掩蔽是出現在它的頻率附近。
②低頻的純音可以有效地掩蔽高頻的純音,而反過來則作用很小。
B.噪音對純音的掩蔽噪音是由多種純音組成,具有無限寬的頻譜
若掩蔽聲為寬頻噪聲,被掩蔽聲為純音,則它產生的掩蔽門限在低頻段一般高於噪聲功率譜密度17dB,且較平坦;超過500Hz時大約每十倍頻程增大 10dB。若掩蔽聲為窄帶噪聲,被掩蔽聲為純音,則情況較複雜。其中位於被掩蔽音附近的由純音分量組成的窄帶噪聲即臨界頻帶的掩蔽作用最明顯。所謂臨界頻帶是指當某個純音被以它為中心頻率,且具有一定頻寬的連續噪聲所掩蔽時,如果該純音剛好能被聽到時的功率等於這一頻帶內噪聲的功率,那么這一頻寬稱為臨界頻頻寬度。臨界頻帶的單位叫巴克(Bark),1Bark=一個臨界頻頻寬度。頻率小於500Hz時,1Bark約等於freq/100;頻率大於 500Hz時,1Bark約等於9+41og(freq/1000),即約為某個純音中心頻率的20%。通常認為,20Hz--16kHz範圍內有24個子臨界頻帶。而當某個純音位於掩蔽聲的臨界頻帶之外時,掩蔽效應仍然存在。
2.掩蔽類型
(1)頻域掩蔽
所謂頻域掩蔽是指掩蔽聲與被掩蔽聲同時作用時發生掩蔽效應,又稱同時掩蔽。這時,掩蔽聲在掩蔽效應發生期間一直起作用,是一種較強的掩蔽效應。通常,頻域中的一個強音會掩蔽與之同時發聲的附近的弱音,弱音離強音越近,一般越容易被掩蔽;反之,離強音較遠的弱音不容易被掩蔽。例如,—個1000Hz的音比另一個900Hz的音高 18dB,則900Hz的音將被1000Hz的音掩蔽。而若1000Hz的音比離它較遠的另一個1800Hz的音高18dB,則這兩個音將同時被人耳聽到。若要讓1800Hz的音聽不到,則1000Hz的音要比1800Hz的音高45dB。一般來說,低頻的音容易掩蔽高頻的音;在距離強音較遠處,絕對聞閾比該強音所引起的掩蔽閾值高,這時,噪聲的掩蔽閾值應取絕對聞閾。
(2)時域掩蔽
所謂時域掩蔽是指掩蔽效應發生在掩蔽聲與被掩蔽聲不同時出現時,又稱異時掩蔽。異時掩蔽又分為導前掩蔽和滯後掩蔽。若掩蔽聲音出現之前的一段時間內發生掩蔽效應,則稱為導前掩蔽;否則稱為滯後掩蔽。產生時域掩蔽的主要原因是人的大腦處理信息需要花費一定的時間,異時掩蔽也隨著時間的推移很快會衰減,是一種弱掩蔽效應。一般情況下,導前掩蔽只有3ms— 20ms,而滯後掩蔽卻可以持續50ms—100ms。