簡介
MPEG-7標準被稱為“多媒體內容描述接口”,為各類多媒體信息提供一種標準化的描述,這種描述將與內容本身有關,允許快速和有效的查詢用戶感興趣的資料。它將擴展現有內容識別專用解決方案的有限的能力,特別是它還包括了更多的數據類型。換而言之,MPEG-7規定一個用於描述各種不同類型多媒體信息的描述符的標準集合。該標準於1998年10月提出。MPEG-7的目標是支持多種音頻和視覺的描述,包括自由文本、N維時空結構、統計信息、客觀屬性、主觀屬性、生產屬性和組合信息。對於視覺信息,描述將包括顏色、視覺對象、紋理、草圖、形狀、體積、空間關係、運動及變形等。
MPEG-7的目標是根據信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對信息的需求。以視覺內容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運動(軌道)和位置的描述。對於音頻的較低抽象層包括音調、調式、音速、音速變化、音響空間位置。最高層將給出語義信息:如“這是一個場景:一個鴨子正躲藏在樹後並有一個汽車正在幕後通過。”抽象層與提取特徵的方式有關:許多低層特徵能以完全自動的方式提取,而高層特徵需要更多人的互動作用。MPEG-7還允許依據視覺描述的查詢去檢索聲音數據,反之也一樣。
MPEG-7的目標是支持數據管理的靈活性、數據資源的全球化和互操作性。
MPEG-7標準化的範圍包括:一系列的描述子(描述子是特徵的表示法,一個描述子就是定義特徵的語法和語義學);一系列的描述結構(詳細說明成員之間的結構和語義);一種詳細說明描述結構的語言、描述定義語言(DDL);一種或多種編碼描述方法。
在我們的日常生活中,日益龐大的可利用音視頻數據需要有效的多媒體系統來存取、互動。這類需求與一些重要的社會和經濟問題相關,並且在許多專業和消費套用方面都是急需的,尤其是在網路高度發展的今天,而MPEG-7的最終目的是把網上的多媒體內容變成象現在的文本內容一樣,具有可搜尋性。這使得大眾可以接觸到大量的多媒體內容,MPEG-7標準可以支持非常廣泛的套用,具體如下:
套用
(1)音視資料庫的存儲和檢索;(2)廣播媒體的選擇(廣播、電視節目);
(3)網際網路上的個性化新聞服務;
(4)智慧型多媒體、多媒體編輯;
(5)教育領域的套用(如數字多媒體圖書館等);
(6)遠程購物;
(7)社會和文化服務(歷史博物館、藝術走廊等);
(8)調查服務(人的特徵的識別、辯論等);
(9)遙感;
(10)監視(交通控制、地面交通等);
(11)生物醫學套用;
(12)建築、不動產及內部設計;
(13)多媒體目錄服務(如,黃頁、旅遊信息、地理信息系統等);
(14)家庭娛樂(個人的多媒體收集管理系統等)。
原則上,任何類型的AV(Audio-Video)材料都可以通過任何類型的查詢材料來檢索,例如,AV材料可以通過視頻、音樂、語言等來查詢,通過搜尋引擎來匹配查詢數據和MPEG-7的音視頻描述。下面給出幾個查詢例子:
音樂:在鍵盤上彈幾個音符就能得到包含(或近似)要求曲調的音樂作品列表,或以某種方式匹配音符的圖象,例如,從情感方面。
圖形:在螢幕上畫幾條線就能得到類似圖形、標識、表意文字(符號)等的一組圖象。
運動:對一組給定的物體,描述在物體之間的運動和關係,就會得到實現所描述的時空關係的動畫列表。
電影拍攝劇本(劇情說明):對給定的內容,描述出動作就會得到發生類似動作的電影拍攝劇本(劇情說明)列表。