上海靈聲信息科技有限公司,成立於2013年2月。上海靈聲信息科技有限公司是一家專注於智慧型語音技術、自然語言處理技術相關的研究、套用及開發的網際網路創業公司。公司核心成員均來自國內外知名企業、高校和研究所,長期從事語音識別、語音合成、自然語言處理方面的研發,有深厚的技術積累和豐富的研發經驗。公司目前擁有60多項有自主智慧財產權的智慧型語音範疇的專利。
公司歷程
上海靈聲信息科技有限公司由盛大創新院語音院成功孵化,公司語音核心團隊成員均來自盛大創新院語音院,語音團隊建立自2009年7月。歷經4年的技術積累及研發,靈聲科技已擁有世界領先級的語音核心技術,並推出了語音開放平台,與多家知名套用進行合作,提供語音技術服務。2012年2月,推出“聽聽中心”語音合成播報平台,成為第一款移動端開放、免費的語音合成平台,並且創造了新的語音合成平台模式。
2012年2月,推出“語音雲中文轉寫平台”,成為國內除了訊飛語音雲之外首個推出語音雲服務的開放平台。
公司語音核心技術及產品
1.語音識別技術
2.語音合成技術
語音合成,又稱為文語轉換(Text-To-Speech:TTS)技術,概括地講就是讓計算機象人一樣將要表達的信息以普通人可以聽懂的語音播放出來的技術,它涉及到自然語言處理、韻律分析、數位訊號處理、機器學習和統計建模等多種技術。語音合成通過轉換信息傳播的方式,給用戶提供更多的信息獲取渠道,幫助用戶通過“耳朵”來獲取大量有益的信息。語音合成技術主要套用於語音閱讀、信息播報、自動語音問答系統、娛樂領域等,為用戶提供個性化的、豐富多彩的語音。我們的語音合成系統採用了新一代的基於參數化統計模型的技術,它與傳統的語音波形拼接技術相比,它可以在不需要人工干預的情況下,自動快速的構建合成系統,而且對於不同發音人和發音風格依賴比較小,具有更高的靈活性,在合成多樣化風格語音方面具有特別的優勢。我們開發的語音合成系統資源消耗低,提供不同性別和多風格的高質量的合成語音。
3.語義理解技術
語義理解,也稱為自然語言理解(Natural Language Understanding:NLU),是對輸入的自然語言文本,讓計算機能理解用戶的意圖並作出回應,使得任何計算機能夠用自然的,人習慣使用的語言互動。 我們的語義理解系統包含詞法分析、句法分析、和語義分析等幾個層次,將自然語言的輸入文本解析並表述為機器可以理解和執行的結構化語義表示,採用了領先的規則加上統計學習方法相互協作的技術,對語音識別的偶發錯誤有強大的容錯和糾錯能力。目前我們的語義理解模組支持數十個常見領域的分類和理解,還具備強大可擴展性,能否非常方便高效的定製新領域。我們為語義理解功能提供了嵌入式和線上調用兩種平台。語義理解可以套用的場景包括:安裝在手機上實現語音打電話發簡訊系統設定等操作的語音助手,在汽車裡方便使用語音互動的車載系統,以及無需人工的自動訂票等客服系統。
4.聲紋認證技術
聲紋識別,生物識別技術的一種。也稱為說話人識別,有兩類,即說話人辨認和說話人確認。不同的任務和套用會使用不同的聲紋識別技術,如縮小刑偵範圍時可能需要辨認技術,而銀行交易時則需要確認技術。我們的語音合成系統採用了新一代的基於參數化統計模型的技術,它與傳統的語音波形拼接技術相比,它可以在不需要人工干預的情況下,自動快速的構建合成系統,而且對於不同發音人和發音風格依賴比較小,具有更高的靈活性,在合成多樣化風格語音方面具有特別的優勢。