mpeg-7

mpeg-7

MPEG-7標準被稱為“多媒體內容描述接口”,為各類多媒體信息提供一種標準化的描述,這種描述將與內容本身有關,允許快速和有效地查詢用戶感興趣的資料。它將擴展現有內容識別專用解決方案的有限能力,特別是它還包括了更多的數據類型。換言之,MPEG-7規定一個用於描述各種不同類型多媒體信息的描述符的標準集合,該標準於1998年10月提出。

簡介

隨著信息爆炸時代的到來,在海量信息中,對基於視聽內容的信息檢索上非常困難的。繼MPEG-4之後,要解決的矛盾就是對日漸龐大的圖像、聲音信息的管理和迅速的搜尋。針對這個矛盾,MPEG提出了解決方案MPEG-7,力求能夠快速且有效的搜尋出用戶所需的不同類型的多媒體資料。該項工作於1998年10月提出,計畫於2001年完成並公布。

mpeg-7 mpeg-7

這個MPEG家族的新成員被稱為“多媒體內容描述接口”(Multimedia Content Description Interface),簡稱為MPEG-7。其目標就是產生一種描述多媒體內容數據的標準,滿足實時、非實時以及推-拉套用的需求。MPEG並不對套用標準化,但可利用套用來理解需求並評價技術,它不針對特定的套用領域,而是支持儘可能廣泛的套用領域。

---- MPEG-7將擴展現有標識內容的專用方案及有限的能力,包含更多的多媒體數據類型。換句話說,它將規範一組“描述子”,用於描述各種多媒體信息,也將對定義其他描述子以及結構(稱為“描述模式”)的方法進行標準化。這些“描述”-元數據(包括描述子和描述模式)與其內容關聯,允許快速有效地搜尋用戶感興趣的資料。 MPEG-7將標準化一種語言來說明描述模式,即“描述定義語言”。帶有MPEG-7數據的 AV資料可以包含靜止圖像、圖形、3D模型、音頻、語音、視頻,以及這些元素如何在多媒體表現中組合的信息。這些通用數據類型的特例可以包含面部表情和個人化特性。

---- MPEG-7的功能與其他MPEG標準互為補充。MPEG-1、 MPEG-2和MPEG-4是內容本身的表示,而MPEG-7是有關內容的信息,是數據的數據(data about data)。

特點

MPEG-7標準的最終目的就是要把網上的多媒體內容變成像文本內容一樣,具有可搜尋性。下面我們具體舉幾個多媒體內容搜尋的例子。

圖形:在螢幕上畫幾條線就能搜尋得到類似圖形、標識、表意文字(符號)等的一組圖像。

音樂:在鍵盤上彈幾個音符就能得到包含要求或者近似要求曲調的音樂作品列表,或者以某種方式匹配音符的圖像。

運動:對一組給定的物體,描述在物體之間的運動和關係,就可以搜尋得到所描述的時空關係的動畫列表。

MPEG-7標準可以獨立於其它MPEG標準使用,但MPEG-4標準中所定義的對音頻、視頻對象的描述也適用於MPEG-7標準。另外我們可以利用MPEG-7標準的描述來增強其它MPEG標準的功能。

MPEG-7標準致力於根據信息的抽象層次,提供一種描述多媒體材料的方法,以便表示不同層次上的用戶對信息的需求。我們來看一些例子。對於可視素材,較低的抽象層可能會用一些像形狀、尺寸、紋理、顏色、運動(軌道)和位置等屬性來描述;對於音頻內容而言,較低抽象層可能會採用音調、調式、音速、音速變化、音響空間位置等屬性來描述。而最高層可能會給出關於語義的信息:如“在這個場景中,一隻小鳥正棲息在樹上鳴叫,樹下有個人在漫步,還有一輛汽車正在幕後通過。”所有這些描述都會以高速方式進行編碼,都能提高搜尋的效率。同時,中間也可能存在過渡的抽象層。抽象層與提取特徵的方式有關:許多低層特徵可以用全自動的方式提取出來,而高層特徵需要更多的人工互動。MPEG-7標準還允許依據視覺描述的查詢去檢索聲音數據,反之也一樣。

套用

MPEG-7標準的套用範圍很廣泛,可以在實時或非實時環境下套用:既可以套用於存儲(線上或離線),也可以用於流式套用(如廣播、將模型加入Internet等)。具體套用主要分為三大類:

索引和檢索類

第一類是索引和檢索類套用,主要包括:數字圖書館(如圖像目錄、音樂字典),視頻資料庫的存儲檢索;向專業生產者提供圖像和視頻;商用音樂;音響效果庫;歷史演講庫;根據聽覺提取影視片段;商標的註冊和檢索。

選擇和過濾類

第二類是選擇和過濾類套用,主要包括:多媒體目錄服務(如旅遊信息、地理信息系統);用戶代理驅動的媒體選擇和過濾;廣播媒體選擇(如廣播、電視節目),個人化電視服務;智慧型化多媒體表達;消費者個人化的瀏覽、過濾和搜尋;向殘疾人提供信息服務。

專業化

第三類是專業化套用,主要包括:遠程購物;生物醫學套用;通用接入;遙感套用;半自動多媒體編輯(如個人電子新聞業務、媒體寫作);教學教育;保全監視;基於視覺的控制。

相關詞條

相關搜尋

熱門詞條

聯絡我們