語音活性檢測

speech speech speech

語音活性檢測(Voiceactivitydetection,VAD),也稱為speechactivitydetectionorspeechdetection,是一項用於語音處理的技術,目的是檢測語音信號是否存在。[1]VAD技術主要用於語音編碼和語音識別。它可以簡化語音處理,也可用於在音頻會話期間去除非語音片段:可以在IP電話套用中避免對靜音數據包的編碼和傳輸,節省計算時間和頻寬。
VAD技術使得一些列基於語音的應用程式稱為現實。因此,有一系列的VAD算法,具有不同的特性和延遲時間、靈敏度、精度和計算成本。有些VAD算法也提供了進一步的分析,例如講話是否濁音、清音或持續。語音活動檢測通常是與語言無關的。
VAD技術首先被用於time-assignmentspeechinterpolation(TASI)系統.[來源請求]

相關詞條

熱門詞條

聯絡我們