樂樂語音

樂樂語音

樂樂語音隸屬的樂樂創新智慧型科技(北京)有限公司是國內首家充分利用網際網路思維,直接面向用戶,精準把握用戶需求,不斷進行產品深挖和拓展的公司。利用雲平台開發技術,樂樂語音能夠實現語音識別、語義理解、語音合成、語音信號處理等專業語音服務,為客戶提供全方位的語音服務和用戶運營。

樂樂語音套用終端

1、電視

樂樂語音在樂視超級電視產品上的成功套用,使得電視變得更個性,更聰明,電視操控更便捷,通過語音命令可以實現視頻搜尋,視頻點播,音樂播放,股票,天氣,節目單查詢,基本電視操控如換台,聲音調節,快進快退等。
樂樂語音的電視語音解決方案可以很方便地套用到其他廠商或品牌的電視中,只需要電視套用合作方對接樂樂語音的語音SDK就能夠快速支持語音操控,對於有特殊要求的電視套用方,樂樂語音也為其提供定製服務和功能。

2、車載

樂樂語音在樂視汽車上也獲得了成功套用,通過語音可以實現多路語音檢測,語音導航,音樂播放,路況查詢,天氣查詢,汽車狀態監測和報警,輔助駕駛,前後排多路說話人語音檢測和定位等功能。
對於車載環境,樂樂語音的車載語音方案進行了大量的真車環境實驗和調優,對車載環境下的噪聲消除進行了大量細緻的工作,取得了很好的效果。和電視語音方案一樣,第三方汽車也只需要對接樂樂語音的語音SDK就能夠實現汽車上的語音操控。

3、移動端

樂樂語音不僅在電視、車載領域成功套用,在移動端也已具備商用能力。由於手機終端的使用場景較為多變,環境噪音複雜不一,因此為了實現高準確度的語音喚醒,樂樂語音採用了深度學習的技術,能夠在技術上實現對環境噪音的極強的適應能力,即無論外部環境安靜或喧囂,用戶都能輕鬆、準確、即時地喚醒設備或服務。此外,為了節省流量,離線上結合技術將常用場景和複雜場景進行區分,提高了識別效率,為用戶節省了更多的本地資源。

定製服務

樂樂創新的語音服務整體架構層次和結構非常清晰,各個模組的接口功能定義也很清楚,整個系統的構建就像搭積木一樣,能夠快速適應各種套用的特殊需求和定製功能。

六大核心技術

1、察言觀色系統

察言觀色系統是一種基於大屏語音互動的信息展現系統。察言觀色系統可以真正實現在諸如樂視智慧型電視這樣的大屏終端中,以語音的形式進行信息的無縫對接。與此同時,對於終端用戶的個人信息進行深度的分析,從而為大屏用戶提供更加智慧型的語音服務。

2、主動智慧型

更主動:樂樂創新的主動智慧型,則是將智慧型提升到一個相對高緯度的級別,降低了智慧型服務的門檻,使得更多的研發者通過樂樂的主動智慧型接口,更好的進行汽車智慧型操作。
更智慧型:智慧型的前提是數據。樂視產品矩陣中數據模型的累計,加之樂樂語音數據的挖掘,其目的是為了從各方面認識用戶,了解用戶,服務用戶。

3、自然韻律的語音合成研究

目前合成系統大多存在韻律預測、表現能力等各方面的問題。合成語音和自然語音除了在音質上存在一定的差距以外,在韻律表達上也存在著很大差距,而韻律表現得好壞是影響合成語音自然度和表現力的關鍵,其具體表現在對節奏、輕重音、語調等的處理上。另外,合成語音缺少變化,如說話人對不同情感的表達不夠恰當,也是合成語音聽起來缺乏人情味的主要原因。
樂樂語音在自然韻律領域,加大研究。在文本特徵方面,因淺層特徵對層次劃分不夠準確,所以樂樂語音對語言深層特徵進行了研究分析。同時樂樂語音兼顧長短停頓,達到自然的合成韻律目的,並綜合利用聲學參數和語言學參數,建立基於RNN-LSTM的多重自動預測模型,而且利用聲音轉換技術,使合成音年輕化。

4、基於深度學習的本地語音識別

基於主流語音識別技術架構,樂樂語音把深度神經網路技術融合到語音喚醒和本地識別中,大幅度提高喚醒和本地識別的性能。

5、語音生物特徵識別

語音生物特徵識別功能包括說話人識別和驗證,年齡段識別,性別識別。主要套用於用戶行為分析,節目訪問和操作許可權控制中。

6、可計算的語音互動系統

基於事件決策圖,樂樂語音互動系統能夠管理人機互動流程,包括問題產生,領域標註,多輪互動,推薦決策。可以使用用戶數據進行訓練,疊代;其次和其他計算模組進行早期聯合,比如語音識別,做出全局最優結果;除此之外樂樂語音互動系統還可以用在汽車互動,電視節目中的互動廣告等產品中。

相關詞條

相關搜尋

熱門詞條

聯絡我們