基本內容
ViviVoice系列簡介:ViviVoice提供最豐富的音庫,且根據客戶需求不斷擴展,適應多樣化的語音套用業務需要;能夠自動準確的進行智慧型化文本分析和預處理;合成的語音清晰、流暢、自然,使用戶獲得最佳效果體驗;強大的參數設定和調整能力,容易對語音效果進行各種靈活的調節。ViviVoice作為個性化語音服務的全新動力引擎,將為豐富多彩的語音套用增添獨特的魅力。豐富音色主導個性化語音服務潮流ViviVoice主導個性化語音服務新潮流,採用業界領先的可訓練語音合成技術,能夠快速提供適應語音套用需要的豐富語言和多樣化音色選擇,並秉承科大訊飛語音技術一貫的最高質量效果表現,為用戶提供個性化語音服務體驗。在ViviVoice 產品中,提供了以下音庫:編 號 名 稱 音 色 語 言1 Xiao Yan 小妍 青年 女聲 國語2 Xiao Feng 小峰 青年 男聲 國語3 Xiao Qin 小芹 青年 女聲 國語4 Xiao Jia 小佳 少年 女聲 國語5 Xiao Chang 小暢 青年 女聲 國語6 Nan Nan 楠楠 兒童 女聲 國語7 Lao Sun 老孫 老年 男聲 國語8 Xiao Rong 小蓉 青年 女聲 四川話9 Xiao Yun 小芸 青年 女聲 東北話10 XiaoYing 小瑩 青年 女聲 陝西話11 Xiao Qiang 小強 青年 男聲 湖南話12 Xiao Kun 小坤 青年 男聲 河南話13 Xiao Li 小莉 青年 女聲 台灣國語14 Xiao Mei 小梅 青年 女聲 粵語15 Terry 青年 女聲 純英文由於ViviVoice採用最先進的中文文本、韻律分析算法和基於訓練的參數合成方法,合成效果可達真人朗讀的水平,並且構建一個高質量音庫的周期相比以往可大幅度縮短,這就使得科大訊飛能夠更加快速的回響個性化語音套用的新需求,不斷提供更多更好的音庫。如需獲得ViviVoice當前支持的最新音庫列表,請訪問科大訊飛網站。ViviVoice提供豐富多樣、效果自然的音庫,在實際套用中,可根據業務需要靈活進行實時音庫切換。高表現力的合成引擎ViviVoice語音合成軟體支持疑問和感嘆語氣,支持高興和悲傷情感,充分體現產品的個性化和娛樂功能的特點,給您帶來不同的聽覺感受。高準確度的智慧型文本分析與預處理ViviVoice語音合成軟體具有高準確度智慧型文本分析與預處理技術,有效保障最終合成語音準確、清晰、流暢。得益於科大訊飛在語言學研究和實踐上的深厚積累,通過與中國社會科學院語言所等相關權威科研機構的緊密合作,以及基於寬廣的套用實踐平台所積累的海量專業知識庫,經過不斷訓練和最佳化,即使在面對針對語言分析處理的難點,如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準確的自動處理結果。流暢的效果與強大的音效調整能力採用參數合成的方法,使ViviVoice產品可以非常方便的對各項影響合成效果的參數進行控制,能夠更好的消除傳統語音拼接方式的頓挫等不連貫現象,合成語音更加流暢、自然。針對主流套用環境的普遍需求,科大訊飛廣泛收集實際套用的語料, 並用特定的模型對數字數值、短語短句等進行最佳化,從而使得合成更加清晰、準確、飽滿、節奏感更強。在保證高質量語音合成效果的前提,能夠對音量、音高、語速等眾多參數進行調節,配合豐富的特色音效,使語音服務更加生動活潑,充滿趣味。全面完善的功能特性合理的體系架構,滿足高穩定性套用要求ViviVoice採用基於TCP/IP的高效網路語音合成服務和集中式的資源管理機制,形成客戶端-資源管理器-伺服器有機結合的體系架構,構建可靈活伸縮的方案,科大訊飛這一業界領先的體系架構,其高可用性歷經眾多重點行業大規模關鍵業務的套用檢驗,確保提供值得信賴的7×24小時不間斷自動化語音服務。豐富的參數設定與調節功能,適應各種複雜套用環境在ViviVoice產品中提供了豐富完善的參數設定與調節功能和工具,幫助用戶對語音合成效果進行靈活高效的控制與管理。提供對全局參數(如音量、語速、音高等)、用戶詞典、用戶規則、定製資源包統一進行配置和管理的工具;數字、標點符號、英文發音方式的設定;中英文加詞功能,可以指定每個字詞的拼音或音標等等;提供統一的簡單易用圖形化用戶界面進行操作設定,並可通過API參數進行動態設定和調整,還支持以CSSML(中文語音合成標記語言)進行標記、描述和控制。靈活高效的開發接口,加速集成與套用發布進程ViviVoice DK針對不同開發工具,不同集成要求和方案,提供多種形式的開發接口,包括:標準開發接口(動態程式庫DLL),Quick TTS接口、COM組件、Microsoft SAPI開發接口和Java開發接口,新增了預錄音背景音開發接口,開發者可以根據實際需要靈活選擇。提供了豐富的開發例程和文檔,幫助加速語音套用開發過程。高效便捷的增強工具集科大訊飛在長期集成開發和套用實踐的支持過程中,總結了客戶使用語音合成的方式和套用的特點,逐步開發了一系列便於用戶在不同環境中合理運用語音合成功能的工具。ViviVoice的增強工具集套件包括了各種使用便捷的高效組件,如離線語音套用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉換工具等等。用戶通過使用這些工具可以簡化開發工作、最佳化合成效果、方便系統維護和技術支持。全面的字元集、語音數據格式支持全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字元集,自動識別UNICODE文本;支持直接輸出多種採樣率的語音數據格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語音數據。桌面套用級的系統尺寸高質量的語音合成效果,加上超小的系統尺寸,降低了資源占用,進一步降低特殊需求及桌面套用門檻,更加符合各類語音套用業務的需要。平台支持科大訊飛的語音合成軟體具有最全面的平台支持。幾乎所有主流的互動式語音應答(IVR)平台都支持科大訊飛的語音合成產品。如需了解進一步信息,請與IVR提供商或科大訊飛聯繫。ViViVoice支持主流的作業系統。在各種套用環境下都很容易找到可供客戶借鑑的成功實施案例。細緻周到的最佳化方案最佳化定製,高效的套用效果方案提供以定製資源包(載入於合成引擎之上,有效提升既定套用領域語音效果的資源集合)和CSSML和虛擬不定長工具為代表的主流套用環境進行效果最佳化的高效解決方案,顯著提升實際套用效果。科大訊飛專業服務體系提供高效的定製與最佳化方案,提升客戶體驗,幫助客戶獲得語音自助服務的持續成功。CSSML,效果提升更自如CSSML(Chinese Speech Synthesis Markup Language,中文語音合成標記語言)是由科大訊飛提出並牽頭制訂的中文語音數據描述規範。該標準得到了國家863專家組、國家信標委和國家技術監督局的大力關注與支持,2005年正式通過國家標準化組織的評審,成為中文語音合成技術標準與規範的重要內容。CSSML針對中文語音套用設計和擴展,可以對多種特性進行靈活標註與控制,並與開放式的標準SSML兼容。預錄語音,銜接流暢套用簡便ViviVoice採用了科大訊飛業界首創的預錄音統一管理功能,將預錄音作為語音合成系統的資源,並通過提示音智慧型匹配和合成模板等方式使預錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化套用流程的複雜程度,進一步提高服務效果與質量。背景音樂,快捷提升用戶體檢ViviVoice採用了科大訊飛業界首創的背景音功能,通過系統提供的簡單易用工具,可以便捷高效的添加背景音樂,調整背景音樂和合成語音的音量對比,並可直接試聽實際效果,使語音服務更加親切自然。特色音效,創造更多娛樂色彩ViviVoice採用了科大訊飛業界首創的特色音效功能,系統在合成語音的同時可以加入諸如回升、混響、金屬聲等各具特色的發音效果,非常適合用來製作一些科幻、娛樂、搞笑的聲音效果,可以帶給用戶帶來全新的體驗。