NeoSpeech語音合成引擎簡介
語音合成(Speech synthesis,或是Text To Speech),簡稱TTS技術。它涉及聲學、語言學、數位訊號處理技術、多媒體技術等多個學科技術,是信息處理領域的一項前沿技術。解決的主要問題就是如何將文本狀態的文字信息轉化為可聽的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來聽。通俗地說,就是讓電腦開口說話的技術。
NeoSpeech的合成語音可以說是當前最好的合成語音,幾可亂真,比其它任何引擎都清楚,適合於對語音要求特別高的,基本上達到了專業級的效果。“能說會道 XP”和“中英文朗讀專家”都可以用這個引擎。同時安裝中文、英文引擎,再配合“能說會道 XP”所特有的中英文雙語核心,能夠將NeoSpeech語音引擎的效果發揮到極致,配合的相當完美。
安裝方法:
解壓後直接安裝,安裝完成後用附帶的特別檔案覆蓋原檔案。(否則會有語音提示)
以“[NeoSpeech.TTS][男聲].NeoSpeech.English.Paul_v3.9.3.0.rar”為例:
解壓後點擊“Setup.exe”即可安裝,安裝完畢後,紅線所劃的檔案“Crack_vt_eng_paul16.zip”解壓後得到的“vt_eng_paul16.dll”即為特別檔案,把該檔案放到安裝目錄的下的lib檔案夾,覆蓋同名檔案即可。見圖。
使用方法:
安裝完成後,重新打開“能說會道 XP”,打開設定界面,選擇“中文語音屬性”或者“英文語音屬性”(具體看你下載的是中文引擎還是英文引擎),在“朗讀者”中選擇“VW Hui”等即可。見圖。
如果你想朗讀日語或者韓語,只要把上述的中文朗讀者選擇為你安裝的日語或者韓語朗讀角色就可以了。製作語音資料的訣竅:
有了專業級的語音引擎,製作出來的語音資料也基本上是專業級的,相當於有了私人播音員供你錄音,真是爽歪了。但是有一個注意點,NeoSpeech的這幾個語音引擎都是16kHz 16Bit的,盲目的提高音頻採樣率不一定能真的提高效果,甚至由於與本徵解析度不一致,而降低了實際效果,所以在使用“能說會道 XP”製作MP3資料時,務必將音頻格式選擇為“16kHz 16Bit Mono”或者“16kHz 16Bit Stereo”,這時具備最好的製作效果。當然,在使用其他語音引擎時,需要選回“22kHz 16Bit”,象微軟等提供的語音引擎基本上都是22kHz的。具體設定的地方是設定視窗的“音頻編碼”頁面,然後選擇“音頻格式”,見圖。