語音增強概述
一、語音增強的定義語音增強是指當語音信號被各種各樣的噪聲干擾、甚至淹沒後,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術。一句話,從含噪語音中提取儘可能純淨的原始語音。
二、語音增強的意義1. 日常生活中,經常會遇到在噪聲干擾下進行語音通信的問題。例如在汽車、火車上使用行動電話,旁人的喧鬧聲,馬路旁和市場裡的公用電話等。
2. 軍事通信中,指揮員的作戰命令和戰鬥員的戰情匯報都需要用語音來表達,由於戰鬥環境中的聲環境惡劣,特別是炸彈產生的衝擊性噪聲,使有用信號完全淹沒在噪聲中。
(3)竊聽技術中需要語音增強
(4)語音識別技術需要語音增強
在實際生活中,語音信號無時無地不受各種噪聲干擾。人們正常的生活環境就是一個聲級為60dB左右的噪聲環境。被強噪聲污染的場合,噪聲達120dB以上。
語音增強的目的
語音增強的一個主要目標是從帶噪語音信號中提取儘可能純淨的原始語音。然而,由於干擾通常都是隨機的,從帶噪語音中提取完全純淨的語音幾乎不可能。在這種情況下,語音增強的目的主要有兩個:一是改進語音質量,消除背景噪音,使聽者樂於接受,不感覺疲勞,這是一種主觀度量;二是提高語音可懂度,這是一種客觀度量。這兩個目的往往不能兼得。目前有一些對低信噪比帶噪語音進行語音增強的方法,可以顯著地降低背景噪聲,改進語音質量,但並不能提高語音的可懂度,甚至略有下降。
語音增強方法分類
目前常用的語音增強算法分為如下幾類:基於譜相減的語音增強算法、基於小波分析的語音增強算法、基於卡爾曼濾波的語音增強算法、基於信號子空間的增強方法、基於聽覺掩蔽效應的語音增強方法、基於獨立分量分析的語音增強方法、基於神經網路的語音增強方法。這裡只是介紹一下各種語音增強方法流程,待確定方向之後再深入研究。
語音增強不但與語音信號數字處理理論有關,而且涉及到人的聽覺感知和語音學範疇。再者,噪聲的來源眾多,因套用場合而異,它們的特性也各不相同。所以必須針對不同噪聲,採用不同的語音增強對策。目前,某些語音增強算法在實際套用中己經證明是有效的,它們大體上可分為四類:噪聲對消法、諧波增強法、基於參數估計的語音再合成法和基於語音短時譜估計的增強算法。