
長期從事人機界面(特別是語音語言的處理和識別)的研究工作。是OGI語音工具包(CSLUSPEECHTOOLKIT)語音識別部分的主要作者。在基於神經網路的語音系統框架(HMM和NEURALNET的結合及訓練),建模和訓練算法有所創新(用em算法和自相關係數訓練非0或1的目標值)。提出多識別器前端,多特徵套用和後端信息融合算法,在語種識別研究領域取得較大影響並得到同行的廣泛引用。在美國國防部和標準局舉辦的年度比賽中於1995年和1996年兩度奪魁。領導了英特爾集成性能庫(Intel Integrated Performance Primitives(IPPs))語音部份的開發。自1986年起展開大詞表非特定人連續語音識別的研究,在建模、自適應及搜尋方面均有創新,多次取得863語音識別評測的第一。目前有40多個專利(含已授權和已提交專利局的),發表論文100餘篇。實驗室自2002年成立以來,多次奪得國家組織的語音系統評測的第一。
目前從事的研究領域:大詞表非特定人連續語音識別、語音信號前端處理、多媒體數據檢索、音頻水印、多模口語系統、嵌入式系統、系統自適應和快速搜尋算法。