IBMViaVoice語音識別系統

IBM ViaVoice是IBM公司開發的高性能的語音識別系統。它由語音板、口音適應程式、IBM ViaVoice屬性、麥克風設定嚮導程式、辭彙管理器及在線上參考手冊等6個部分組成。 ViaVoice的基本用法雖然不是太難,但是在安裝之後還不能立即使用,因為這時計算機還不“認識”你,只有在通過口音適應程式建立針對你個人口音特點的模型後,才能有效地使用。 IBM ViaVoice在標稱功能上有以下幾個主要特點:連續語音識別、具有強大的學習功能、每分鐘平均150個字、輸入最高識別率達95%,平均識別率達85%

使用技巧

設定麥克風

在你開始使用ViaVoice之前,必須使麥克風能正常工作。ViaVoice的麥克風設定嚮導程式將引導你正確設定麥克風。步驟如下:
1.啟動麥克風設定。如果運行過麥克風設定嚮導程式,你可以單擊“調節音量”,直接進行麥克風音量調節和語音識別測試。如沒有運行過設定嚮導程式,則單擊“設定頭戴式麥克風”,單擊“下一步”;
2.麥克風設定嚮導程式將檢測計算機並顯示出它找到的混音器設備。如果它不認識這個混音器設備,將顯示“末知”。如果有外部揚聲器,並且所處的環境下放出的音響不會干擾他人,你可以選擇外部揚聲器。單擊“下一步”;
3.單擊“測試”按鈕,如果音頻設定正確,你將聽到音樂,並可以用滑鼠拖動“音量”按鈕調節至最佳聽覺效果。如果聽不到聲音,可以單擊“幫助”按鈕獲得解決辦法。單擊“下一步”;
4.如果使用頭戴式麥克風,請按視窗中圖片所示配戴,定位麥克風使其從臉部伸出大約2厘米左右,稍偏嘴邊,以防呼吸影響。單擊“下一步”;
5.在前面正確安裝並測試耳機或外部揚聲器之後,此時就可以安裝和設定麥克風了。首先,將麥克風插頭插到音效卡上的麥克風插孔中,確定其被正確地插到麥克風插孔中。其次,如果你的麥克風有“on/off”開關,確定其置於“on”。最後,單擊“測試”(或“重測”)按鈕,並朗讀句子“正在測試麥克風設定”來測試麥克風。如果計算機測到麥克風已經連線正確,嚮導程式將告訴你的麥克風已設定成功並被正確地連線到計算機上,單擊“下一步”;
6.嚮導程式將提示你麥克風已設定成功。單擊“下一步”以調節音量並測試使用此麥克風的識別效果。至此,麥克風的安裝設定已經完成。
注意:如果你沒有選擇麥克風使用的每一個適配器,麥克風設定嚮導程式可能不會正確設定好你的麥克風。如果要選擇其他適配器,單擊“上一步”直到進入信息收集視窗。選擇麥克風使用的每一個適配器。

語音設定

在對麥克風進行正確的安裝和配置後,還必須耐心地進行語音設定,否則麥克風不能工作。
系統提供一組詞組要求我們朗讀,語音識別核心根據我們的讀音,自動調節麥克風音量和識別核心,以適應我們的聲音。這不僅是使用語音系統必須要進行的一個設定過程,而且在語音系統的使用過程中,可能還會經常用到。如果對音量的調整不恰當,對ViaVoice的識別率將有很大的影響,所以我們儘量調節音量到一個合適程度。當系統配置發生變化時,還需要重新調整。
進行音量調節時,首先進入音量調節視窗,單擊開始按鈕後,隨著指示框(藍框)的移動讀出當前高亮顯示的詞。用正常語音,請勿高聲、低語,或逐詞變換語調,詞與詞之間要保持一定間隔。每讀一個詞不能多於3秒鐘。讀完一個詞後,請保持安靜,直到指示框移到下一詞。當藍色框長時間停止不動時,會出現提示信息,說明麥克風檢測不到聲音,請重新檢查麥克風設定。麥克風檢測不到聲音的原因可能是:1.如果你的麥克風有on/off或on/mute開關,確定其置於on(開);2.確定你對著麥克風念所指示的詞;3.如果你的麥克風使用電池適配器,檢查電池是否有電;4.確定頭戴式麥克風設定正確。如果不能確定,請運行麥克風設定嚮導程式;
當音量調節完成後,就進入語音識別測試階段,單擊“開始”按鈕進行麥克風測試。在某些時候,當讀完一個詞後,它變為紅色顯示時,表示這個詞的讀音未被識別,可能原因是:1.麥克風未置於正確位置;2.在詞間沒有停頓;3.你對某些詞的發音不符合ViaVoice要求;4.你念錯了某詞;5.你的音量必須處於綠色區域;6.環境噪音過大。
單擊“停止”按鈕,重新開始測試,直到正確讀出每一個詞後,語音測試完畢。

口音適應

ViaVoice的軟硬體都已經裝配好後,計算機還不能立即聽懂或者完全理解你的話,你必須象教小孩子說話一樣培養它。這項工作是由語音適應來完成的。
口音適應分為兩部分:1.用戶對一組給定的句子進行錄音;2.ViaVoice進行口音訓練生成語音檔案。
首先讓我們打開語音適應視窗。當你第一次進入口音適應視窗時,單擊“新建”按鈕創建一個“第一次適應”的新口音適應模板,系統會彈出一個口音適應描述對話框,請輸入口音適應描述字元串,它將標誌以後生成的語音模型檔案。然後單擊“開始”按鈕就可以開始錄音了。
如果你在此前已經進行過口音適應,口音適應視窗將列出你“已訓練”、“已錄音”、 “待錄音”的語句數目,你可以選擇上次的訓練繼續進行。
在進行口音適應之前,通過設定口音適應屬性,可以簡化操作,單擊口音適應視窗左下角的“選項”按鈕,系統將彈出圖9所示的視窗,複選“自動切換到下一句”後,如果錄完當前語句且該句子沒有變紅(表示錄音通過),口音適應視窗將自動顯示出下一條語句。“顯示拒識信息”指示打開或關閉一個報告視窗。當完成一條語句的錄音且該句子變紅時,會出現一個視窗報告拒識信息,如果沒有複選此框,則不會出現此視窗。複選“自動開始對下一句錄音”後,完成一條語句的錄音時,下一句的錄音將自動進行,如果這個複選框沒有被選中,你必須單擊“開始”以切換到下一句。滑動“詞/音匹配”按鈕。可以改變對所念的詞的識別匹配度。
當設定好口音適應選項後,單擊“確定”,再直接單擊“開始”進行口音錄入,如果是首次錄音,系統將彈出提示至少訓練50句,單擊“確定”進入訓練視窗。
在進入口音適應訓練視窗後單擊“開始”,我們就正式開始口音適應了。對其顯示出的句子以樣例所示方式進行錄音,標點符號也要讀出,儘量使你的音量處於音量條的綠色區域內,當此語句變綠被識別通過時,繼續下一句的錄音,如果此語句未被識別時,該語句將變紅,你需要重新錄入,直到通過。
某詞變紅未被識別的原因主要有:1.麥克風未置於正確位置;2.在詞間沒有停頓;3.某些詞發音不符合ViaVoice要求或你念錯了某詞;4.你的音量必須處於綠色區域裡。

在WORD中聽寫

啟動WORD聽寫可謂相當方便。我們可以對準麥克風念“聽寫到WORD”或從螢幕右下角的圖示中啟動程式。在WORD里,我們會發現在工具列上多了一個“聽寫”選單。在聽寫時,發音要清楚,語速要正常,並且念出所有的標點和排版符號。
限於各方面的原因,ViaVoice還不能100%識別你的口音,所以完成一段文字的錄入後,往往需要校對,可按如下步驟進行:1.對準麥克風念“停止聽寫”,然後人工校對文本;2.當找到一個錯誤的詞語或短語時,用滑鼠加亮後雙擊,會出現糾錯選單;3.在糾錯視窗雙擊要修改的詞,會出現一個可供選擇的下拉式選單,從中選擇正確的即可;4.糾錯完成後將正文保存。

ViaVoice辭彙管理器

ViaVoice辭彙管理器是對在個人進行聽寫、錄入產生錯誤辭彙時添加到個人辭彙表中的辭彙進行管理的工具。當你下次碰到同樣的詞時,計算機能自動識別,這將大大減少你的工作量。經常對辭彙表進行維護,是一個良好的習慣,你還可以用你的方言添加辭彙,讓你的計算機成為你親切的“老鄉”。
通過辭彙表管理器,你可以查看加入到辭彙表中的所有辭彙,並對其進行編輯。

獲得獎項

2000年在美國舉行的蘋果全球開發商會議(Apple'sWorldwideDevelopersConference)上,蘋果設計大獎賽主辦者祝賀開發商們創建出簡單而易用的Mac作業系統的輝煌業績。IBMViaVoice世紀1.0版被紐約時報選為2000年最受歡迎的十大頂尖商務軟體之一,並兩次被該報列入傑出商務軟體的推薦名單之中。

相關詞條

相關搜尋

熱門詞條

聯絡我們