公司信息
公司簡介
Scansoft完成對Nuance的合併後,於2005年10月18日宣布正式更名為Nuance Communications,Inc。新公司僅在家庭圖像套用領域繼續延用Scansoft的名稱。Nuance是著名的語音和圖像解決方案提供商,解決方案包括撥打查號服務、查詢賬戶信息,醫療診斷記錄聽寫、製作能夠共享和檢索的數字文檔等工作。
Nuance公司(Nuance Communications, Inc. (NASDAQ: NUAN)) 是最大的專門從事語音識別軟體、圖像處理軟體及輸入法軟體研發、銷售的公司。目前世界上最先進的電腦語音識別軟體Naturally Speaking就出自於Nuance公司。用戶對著麥克風說話,螢幕上就會顯示出說話的內容。T9智慧型文字輸入法作為旗艦產品,最大優勢支持超過70種語言,超過30億部移動設備內置T9輸入法。已成為業內認同的標準輸入法,被眾多OEM廠商內置,包括諾基亞、索愛、三星、LG、夏普、海爾、華為等等。T9全球市場占有率超70%,中國超50%。自電腦問世以來,科學家們就一直致力於讓電腦能夠理解人們的講話。幾年前,除了實驗室內的演示之外,這方面還沒有什麼進展。不過2010年來電腦的語音識別功能已經有了質的飛躍,隨著語音識別技術慢慢走向成熟,駕駛員可以“告訴”全球定位系統(GPS)他們的目的地;手機用戶不必按鍵,只需要對著手機發布命令即可;醫生可以口述患者的病歷,而旁邊的設備就能自動記錄下來,這一切通過口頭指令來控制操作的套用已經不僅僅出現在科幻小說中了,而是真正成為了現實。
Nuance的產品提供人性化、高效率的電話口語或語言辨識功能,消費者可透過傳統的電話系統或行動電話以自然口語交談的方式完成資料查詢及商業貿易,使用輕鬆。在類似的產品中擁有最高的語音辨識率,英文可達99%。其英文語音產品Dragon NaturallySpeaking9在法律和醫院臨床記錄占據很大市場。
特色產品
Nuance Verifier提供聲紋比對的功能,與Speech Recognition結合可提供更安全的語音商務服務,其所提供的聲紋比對的精確度較使用指紋辨識驗證還高。
產品與服務
語音識別技術ASR
要想了解Nuance公司的核心技術,首先就要知道什麼是語音識別技術。語音識別技術即Automatic Speech Recognition(簡稱ASR),是指將人說話的語音信號轉換為可被電腦程式所識別的信息,從而識別說話人的語音指令及文字內容的技術。用戶可以通過ASR利用口述指令來完成對服務終端的控制。語言識別軟體是利用非常複雜的統計方法將人們的講話與單詞對應起來。通過Nuance系統可以開發自然語言理解系統,它以句子為輸入,並且返回句子意義的解釋性表達。應用程式可以根據用戶的請求採取相應的動作。系統也提供基於檔次的置信評分,它能更加接近地判別可能準確(或不準確)識別的短語各部分,然後可更加自然和有效地修改應用程式,處理錯誤檢查或重新提示。
聲紋鑑別技術
在以ASR技術為基礎的情況下,Nuance公司又實現了聲紋鑑別技術,該技術屬於“生物因子”認證範疇。同指紋一樣,聲紋同樣是不可複製的,每個人的指紋都是唯一的,數百萬人之間才會發現有兩個人有相同的指紋;與此類似,聲紋也是人的個性特徵,很難找到兩個聲紋完全一樣的人。說話人識別,也稱聲紋鑑別,就是根據人的聲音特徵,鑑別出某段語音是誰說的。
NVP平台
Nuance Voice Platform (NVP)是Nuance公司推出的語音網際網路平台。Nuance公司的NVP平台由三個功能塊組成:Nuance Conversation Server對話伺服器,Nuance Application Environment (NAE)套用環境及Nuance Management Station管理站。Nuance Conversation Server對話伺服器包括了與Nuance語音識別模組集成在一起的VoiceXML解釋器,文語轉換器(TTS)以及聲紋鑑別軟體。NAE套用環境包括繪圖式的開發工具,使得語音套用的設計變得和套用框架的設計一樣便利。Nuance Management Station管理站提供了非常強大的系統管理和分析能力,它們是為了滿足語音服務的獨特需要而設計的。
公司發展
發展史
過去,Nuance公司的股價曾創出18.85美元的歷史新高,儘管其間出現了回潮,許多投資者預計Nuance公司的股價將會繼續上漲。紐約投資機構J&W Seligman & Co.的董事總經理Michael Alpert表示,Nuance公司在7月10日的收盤價16.45美元依然偏低,他表示,“他們的策略是圍繞著在市場上的主導地位制定的,我認為其收益預期過低。”據悉,J&W管理著200億美元資金,持有960000股Nuance公司的股票。
據透露,Nuance公司同目錄服務公司達成了更多的交易,可以從中獲得經常性收入,而不是一次性款項。這些客戶包括美國電話電報公司(AT&T),Sprint Nextel Corp.和Jingle Networks Inc.。另外,Nuance公司還與LG電子、諾基亞、摩托羅拉和福特汽車等公司簽有協定,其中手機公司生產的每部採用其軟體的手機都需支付0.2美元的使用費,而採用Nuance語音識別導航的每部車載裝置需支付3-5美元的使用費。Nuance公司聲稱,2013年約有1億部智慧型手機、車載導航系統等裝置採用Nuance的軟體,而2014年預計將達到2.5億部。
語言識別技術已經被廣泛套用於呼叫中心領域,大部分的電腦查詢服務都會採用Nuance公司的ASR技術,該技術用來處理客戶的各種需求,無需人工服務從而節約了人力資源。另外,許多相對比較複雜的銷售工作也開始使用ASR技術。例如,用戶只需向航空公司的電腦服務終端發出口頭指令就可以購買或者查詢機票。此外,出遊預定、股票交易,以及與其他通訊媒體、企業和網際網路系統進行交往等活動都有著ASR技術的身影在閃現,可以說,ASR技術越來越廣泛地套用於商業之中。
據相關人士預測,語音識別技術還將被套用於網路搜尋,將來用戶只需一個口令,就可以在Google和Yahoo上得到電腦的自動回復。另外,已經研製出了自動翻譯外語的軟體,該軟體通過ASR記錄下說話者的話,然後通過翻譯軟體將外語翻譯成英語。我們可以看到,ASR技術有著廣闊的套用範圍,而基於此技術的套用軟體還在不斷地開發與研製中,也許就在不遠的將來,實用化將離我們越來越近。
國際情況
世界語音技術市場,有超過8%的語音識別是採用Nuance識別引擎技術,其名下有超過1000個專利技術,公司研發的語音產品可以支持超過50種語言,在全球擁有超過20億用戶。在金融領域,超過500家客戶;電信行業,前15大公司有超過10家為Nuance用戶。語音識別套用領域廣泛,如呼叫客服中心、GPS語音定位搜尋、電子詞典發音,說話譯成不同語言的文字。
國內情況
08年3月,億訊成為大中華區的專業總代理。在中國有9%的語音識別套用是採用Nuance的核心技術。在中國,占據大部分客服呼叫中心的份額,尤其在電信、金融行業廣泛套用。和電信、移動、聯通、網通都有合作,cctv春晚的呼叫中心也套用此技術。
重點關注產品
桌面產品包括Dragon NatuallySpeaking 10,PDF Converter Professional 5,OmniPage 16,PaperPort 11。
中國市場D 10沒出,只是D9版本,價格1880元。對電腦講話,文字可以出現在基於windows所有套用里。可以創建語音命令,電腦完成多步操作。英文版準確率99%,用口述方式寫電子郵件,法律醫療用途廣。
PDF 5,單價1100元。唯一一個為商業用戶專門設計的解決方案,可以傳輸任何創建、轉換和編輯的PDF檔案,保存線上PDF文檔,安全創建比同類PDF產品快300%,轉換準確度高。
O 16 價格4700元。最精確的OCR軟體(光學字元識別),迅速把辦公檔案和表格轉換到30多種不同的PC電腦套用里進行編輯、檢索、共享。把文本轉成有聲書,檔案解決方案無縫集成,唯一支持Microsoft office 2007本地格式的OCR套用。
PP 11已出,國內只看到PP 9簡體中文版,價格1880元。識別寫在紙上的文字信息,並將文字掃描成可編輯、複製、貼上的文本文檔,或直接掃描為新的文字處理檔案,目前最精確的PaperPort 軟體。