語音可擴展標記語言

語音可擴展標記語言是於互動式語音回應應用程式創建音頻對話的標準,用於開發音頻及聲音回應應用程式,例如銀行系統及自動客戶服務。來自網頁伺服器的超文本標記語言(HTML)被網頁瀏覽器接收後,網頁瀏覽器能對其進行解析並視覺呈現出來,VoiceXML應用程式的開發及部署也類似這方式。VoiceXML文檔由語音瀏覽器解析。於一般的部署架構之下,用戶通常經由公共交換電話網(PSTN)跟語音瀏覽器互動。VoiceXML文檔以XML為基礎,是由全球資訊網聯盟(W3C)開發的標準。

簡介

背景

隨著網際網路技術的迅猛發展!網際網路所存儲的信息和提供的服務與日俱增,改變了人們的生活及工作方式" 然而,網際網路長期以來與擁有眾多用戶的公用電話網脫離,使中國數倍於計算機用戶的電話用戶不能利用電話享受到網際網路提供的豐富多彩的信息和服務。 雖然計算機的擁有量在不斷地增加,但是在相當長的時間內,計算機用戶的數量不會接近電話用戶的數量。如何使如此龐大的電話用戶群也能訪問網際網路,是一個擺在相關行業營運商,內容提供商、以及服務商面前的一個挑戰和商機。VoiceXML語音擴展描述語言的問世,給網際網路與公用電話網的融合帶來希望,使網際網路信息能夠以語音的方式流向電話網,使網際網路服務能夠延伸到電話用戶。

發展

VoiceXML是由VoiceXML論壇制定的通過電話訪問Internet網路的標準。1993年3月,由Motorola、Lucent和IBM等私家公司四家公司聯合發起成立了VoiceXML論壇,其目的在於為電話和移動設備提供一種便捷的訪問 Internet網路,獲取服務和信息手段。2000年3月,VoiceXML論壇發布了VoiceXML1.0標準。5月,W3C接受了VoiceXML1.0。當前國內外共有150多家公司支持VoiceXML,Motorola等公司以開發出了基於VoiceXML的產品。

目的

VoiceXML的主要目標是希望通過互動式語音界面套用Web上已經有的大量信息,同時VoiceXML希望能夠將開發人員從最低級的編程和資源處理工作中解放出來。VoiceXML能夠利用人們已經非常熟悉的客戶機、伺服器方式,將語音服務和數據服務融合起來。

特點

VoiceXML作為一種通過每一檔案里指定的多重的互動作用,最小化客戶機/伺服器之間的互動工作。

實現套用開發者與低層的軟體和系統平台上的軟、硬體細節無關。

將用戶互動作用的代碼(在VoiceXML中)從服務邏輯(CGI腳本)中分離出來。

要使提供的服務能隨處可得,要求這些服務能夠跨越不同的執行平台。對於內容服務商、工具提供商和平台提供商來說VoiceXML是一個公共語言。

使簡單的互動作用非常易於使用,要求所提供的語音界面能支持複雜的對話。

國際網際網路聯盟又於2004年宣布,兩種計算機語音互動規範將被列為國際標準開始實施。VoiceXML是上述標準之一,目的是要提高網路內容面向互動語音應用程式的提供及開發。另外一個是語音識別語法標準(SRGS),是對VoiceXML的補充,用於語音識別,還可以將終端用戶的回應轉換成話音提示。VoiceXML主要用在使用語音指令代替按鍵輸入的過程中,可以自動對商務電話進行回復,不但能夠提高通話質量,還能進行信息蒐集和恢復等。這一標準可以在網上使用,也可離線使用。

套用

VoiceXML主要套用於電話語音系統的開發,其典型的套用可以包括以下三類:信息的獲取與電子交易,如股票信息查詢和股票的交易。股民只需對著電話簡單地說出所要查找的股票代碼,即可獲得所需的信息。股市是隨時動態變化的,對用戶的查詢信息通過網關實時到證券所資料庫取得相關信息,送往TTS檔案轉換模組轉換為語音檔案,通過IVR播放給用戶。電信領域的服務,如用電話發E-mail業務是指用戶通過電話接入系統,用戶打電話告知系統所要發信的目的IP位址。由ASR 自動識別系統內已定義好的IP位址,通過IVR節點錄音的語音檔案以附屬檔案的方式生成E-mail,通過 Internet傳送到對方的E-mail信箱中。語音門戶。它是一個訪問其他語音信息的統一入口,還可以提供一些公共的服務,如新聞、天氣等的信息服務。

使用方法

VoiceXML應用程式於各行業及商業領域廣泛使用,包括訂單查詢、包裹追蹤、駕駛方向、緊急通知、喚醒、航班跟蹤、語音訪問電子郵件、客戶關係管理、還按原方抓藥、音頻新聞雜誌、語音撥號、房地產信息和國家目錄援助等。 VoiceXML的標籤能指示語音瀏覽器提供語音合成、自動語音識別、對話管理和音頻播放。下面是一個VoiceXML文檔的例子:

當一個VoiceXML解析器解析該文檔時,“Hello world”字句將以語音合成方式讀出。

通常情況下,HTTP被用作獲取VoiceXML頁面的傳送協定。一些應用程式可能使用靜態的VoiceXML頁面,而依靠動態的VoiceXML作頁面生成的應用程式則需使用應用程式伺服器,例如Tomcat、WebLogic、IIS或WebSphere。

從歷史上看,VoiceXML的平台供應商以各種不同方式運行其標準,並添加專有產品特點。但是,VoiceXML 2.0標準於2004年3月16日被採納為W3C推薦標準,闡明了大部分的差異之處。VoiceXML論壇為推廣標準用途的產業群,它提供了一個一致性測試過程,以證明供應商的運行方式的一致性。

將來發展

VoiceXML3.0將會是VoiceXML的下一個主要發行版,包含新的主要特點。它包含一個新的XML狀態圖描述語言,名為SCXML。

相關詞條

熱門詞條

聯絡我們