VAD[語音檢測]

語音活動檢測(Voice Activity Detection,VAD)又稱語音端點檢測,語音邊界檢,是指在噪聲環境中檢測語音的存在與否,通常用於語音編碼、語音增強等語音處理系統中,起到降低語音編碼速率、節省通信頻寬、減少移動設備能耗、提高識別率等作用。早先具有代表性的VAD方法有ITU-T的G.729 Annex B。

簡介

語音活動檢測

語音活動檢測(Voice Activity Detection,VAD)又稱語音端點檢測,語音邊界檢,是指在噪聲環境中檢測語音的存在與否,通常用於語音編碼、語音增強等語音處理系統中,起到降低語音編碼速率、節省通信頻寬、減少移動設備能耗、提高識別率等作用。早先具有代表性的VAD方法有ITU-T的G.729 Annex B。

語音活動檢測器

語音活動檢測器(Voice Activity Detector)被配置為在接收到的輸入信號中檢測語音活動,語音活動檢測器包括:輸入部,被配置為接收來自所述VAD的初級語音檢測器的指示初級VAD判決的信號以及來自至少一個外部VAD的指示來自所述至少一個外部VAD的語音活動判決的至少一個信號;處理器,被配置為將接收到的信號中指示的語音活動判決進行組合,以產生修改後的初級VAD判決;以及輸出部,被配置為將修改後的初級VAD判決傳送至所述VAD的尾響添加單元。

注意事項

在進行語音活動檢測時有兩個問題需要注意:一是背景噪聲問題,即如何在較大的背景噪聲中檢測靜音;二是前後沿剪下問題。所謂前後沿剪下就是還原語音時,由於從實際講話開始到檢測到語音之間有一定的判斷門限和時延,有時語音波形的開始和結束部分會作為靜音被丟掉,還原的語音會出現變化,因此需要在突發語音分組前面或後面增加一個語音分組進行平滑以解決這一問題。

相關詞條

熱門詞條

聯絡我們