InterPhonic

InterPhonic

InterPhonic 系列產品是業界頂尖級的語音合成軟體產品。語音合成(Text To Speech,TTS)技術能夠自動將任意文字實時轉換為連續的自然語音,是一種能夠在任何時間、任何地點,向任何人提供語音信息服務的高效便捷手段,非常符合資訊時代海量數據、動態更新和個性化查詢的需求。科大訊飛語音技術歷經20年不懈創新,自90年代中期以來,在歷次的國內國外評測中,各項關鍵指標均名列第一。

系列

InterPhonic 產品基於深厚的研究積累,經過長期廣泛深入的套用實踐,在多項關鍵技術上有重大創新突破,作為科大訊飛引領語音技術與市場發展的新一代主流語音合成產品,可為自助語音服務提供源源不斷的核心動力。

效果

◆ 多語種,適應不斷發展的業務需求

提供國語、廣東話、英語、法語、德語、葡萄牙語、義大利語、荷蘭語、西班牙語、瑞典語、挪威語、丹麥語、俄語、希臘語、朝鮮語、日本語等幾十個語種,包含業界創新的國語與英語同音混讀、廣東話與英語同音混讀,適應不同語音套用業務的需求。多引擎管理接口可對不同語種的系統提供一致化的訪問界面,套用層可以靈活透明的選擇所需的語音合成語種,並支持實時語種切換。

◆ 多音色,滿足不同環境的個性化套用

主導個性化語音服務新潮流,提供豐富、風格多樣化的音色選擇,如渾厚淳正的男聲,成熟穩重、輕快活潑、或溫柔甜美的女聲,標準地道的英語女聲,甚至童聲、少男、少女、老年人等等,所有音色庫均繼承科大訊飛語音合成技術一貫的優良品質。可供用戶根據不同套用業務需要,選擇最適合套用場景的語音風格,並支持實時動態的音色切換。

◆ 增強表現力,語音合成效果更自然

InterPhonic產品擁有高智慧型的自然語言理解能力,自動進行文本分析和韻律描述,可以表現出典型的語氣,如疑問和感嘆等,合成效果更富表現力。語音合成效果對於語氣的表現能力,是科大訊飛語音技術又一項重要的創新性突破,將幫助自動語音服務以更加人性化的語音用戶界面提升客戶體驗。

◆ 高準確度的智慧型文本分析與預處理

InterPhonic語音合成產品所擁有的高準確度智慧型文本分析與預處理技術,有效保障語音合成準確、流暢、自然。得益於科大訊飛在語言學上的深厚積累、與相關權威科研機構的緊密合作,以及通過寬廣的套用實踐平台所積累的海量專業知識庫,通過不斷訓練和最佳化,InterPhonic即使在面對針對語言分析處理的難點,如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準確的自動處理結果。

◆ 數字、短語文本合成效果顯著提升

針對主流套用環境的普遍需求,科大訊飛廣泛收集實際套用的語料,並進行細緻分析和專業的最佳化,InterPhonic產品在數字數值、短語短句等最常見套用下效果提升顯著,合成效果更加清晰準確、節奏感更強。

全面完善的功能特性

◆ 合理的架構

採用基於TCP/IP的高效網路語音合成服務和集中式的資源管理機制,形成客戶端-資源管理器-伺服器有機結合的體系架構,構建可靈活伸縮的方案,其高可用性歷經眾多重點行業大規模關鍵業務的套用檢驗,確保提供值得信賴的7×24小時不間斷自動化語音服務。

◆ 靈活高效的開發接口

InterPhonic SDK針對不同開發工具,不同集成要求和方案,提供多種形式的開發接口,包括:標準開發接口(DLL)、簡單開發接口、COM組件、SAPI開發接口及Java開發接口,開發者可以根據實際需要靈活選擇。提供豐富的開發例程和文檔,幫助加速語音套用開發過程。

◆ 豐富的參數設定與調節功能

豐富完善的參數設定與調節功能和工具,幫助用戶對語音合成效果進行靈活高效的控制與管理。提供對全局參數(如音量、語速、音高等)、用戶詞典、用戶規則、定製資源包統一進行配置和管理的工具;數字、標點符號、英文發音方式的設定;中英文加詞功能,可以指定每個字詞的拼音或音標等等;提供統一的簡單易用圖形化用戶界面進行操作設定,並可通過API參數進行動態設定和調整,還支持以CSSML(中文語音合成標記語言)進行標記、描述和控制。

◆ 高效便捷的增強工具集

InterPhonic的增強工具集套件包括了使用便捷的高效組件,如離線語音套用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉換工具等。

◆ 智慧型Email預處理功能

能夠解析普通文本格式、MIME格式和html格式的Email,合成郵件主題、發件人、收件人、信件內容和文本附屬檔案,根據語境自動判斷讀法。

◆ 實用的URI合成功能

增加了URI合成功能。自動獲取用戶指定的網路URI文本,方便使用網路上的信息資源。

◆ 字元集、語音數據格式支持

全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字元集,自動識別UNICODE文本;支持直接輸出多種採樣率的語音數據格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語音數據。

◆ 作業系統支持

伺服器端支持Windows等主流作業系統,客戶端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE Linux、HP TRUE64 UNIX、IBM AIX UNIX、VxWork等作業系統。

◆ 平台支持

與業內知名的相關平台和設備商均有過成功的集成案例。通過與眾多平台和設備提供商、系統集成商及軟體開發商的緊密合作,能夠保證向用戶提供圍繞語音套用全程的專業服務。

細緻周到的最佳化方案

◆ 最佳化定製,高效的套用效果方案

提供以定製資源包(載入於合成引擎之上,有效提升既定套用領域語音效果的資源集合)、CSSML、虛擬不定長和語音合成模板等工具為代表的主流套用環境進行效果最佳化的高效解決方案,顯著提升實際套用效果。科大訊飛專業服務體系提供高效的定製與最佳化方案,提升客戶體驗,幫助客戶獲得語音自助服務的持續成功。

◆ CSSML,效果提升更自如

CSSML(Chinese Speech Synthesis Markup Language)是由科大訊飛提出並牽頭制訂的中文語音數據描述規範。該標準得到了國家863專家組、國家信標委和國家技術監督局的大力關注與支持,2005年正式通過國家標準化組織的評審,成為中文語音合成技術標準與規範的重要內容。CSSML針對中文語音套用設計和擴展,可以對多種特性進行靈活標註與控制,並與SSML兼容。

◆ 預錄語音,銜接流暢套用簡便

InterPhonic提供業界創新的預錄音統一管理功能,將預錄音作為語音合成系統的資源,並通過提示音智慧型匹配和合成模板等方式使預錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化套用流程的複雜程度,進一步提高服務效果與質量。

◆ 背景音樂,快捷提升用戶體檢

InterPhonic提供業界首創的背景音功能,通過系統提供的簡單易用工具,可以便捷高效的添加背景音樂,調整背景音樂和合成語音的音量對比,並可直接試聽實際效果,使語音服務更加親切自然。

作為語音市場的強大動力引擎,InterPhonic產品會為您帶來如下收益:

降低成本:高質量的效果、靈活的套用、經過套用驗證的穩定性,可使您放心自如地套用自助語音服務來取代傳統的人工服務。更高的自動化程度,意味著您將以更低的成本提供更高質量的服務。

提高效率:有利於改變原有的語音信息製作方式,在規模語音套用系統中,多路並發的實時語音合成服務,將顯著提高信息更新的時效性,並且提供的語音信息內容與範圍將得以大大拓展。

靈活擴展:標準Client/Server架構以及完善的系統設計,充分考慮了大規模語音套用的需求,具備良好的伸縮性。擴容時只需增加新的語音合成服務節點,無需對原有系統進行其它改動。

實力保障:科大訊飛堅實的綜合實力、高效的專業研發和技術支持服務團隊、業界公認的領導者地位以及所獲得的廣泛讚譽,都是您得到穩定支持服務的有力保障。

相關詞條

相關搜尋

熱門詞條

聯絡我們