基本概念
主題地圖類似於傳統的主題索引,是傳統主索引的深化和發展。它套用多領域的成果如傳統引技術,圖書館學科的技術,以及知識表達、計算技術等,以揭示文檔的“主題”,“主體與信息源的系”“主題間的關係”的方式,組織和揭示知識,被為“信息宇宙中的GPS”。
主題地圖,類似於一種WWW資源環境中的電子化的主題索引。它建立在SGML,XML語義標準和DTD定義的基礎之上,將信息源內容所代表的主題及其領域,呈現在同一層級上,把主題與信息源的關係、主體之間的相互關聯以一定的形式進行描述,從多種角度揭示信息源內容之間的聯繫,實現對信息資源的控制和組織。 主題地圖抽取web信息源中描述事物的對象,以抽象的語詞概念———主題對其進行表示,並以一定的方式揭示主題與信息源的聯繫,表達不同主題間的關聯關係,把主題,主體與信息源的聯繫,主題
間的相互關聯以特定的方式顯示,構造“主題地圖”,揭示知識和知識關聯,成為人們在信息世界漫遊的導航圖。
起源
用主題地圖作為知識組織與管理工具的思想起源於20世紀90年代初。1993年,davenportGroup的工作檔案中第一次表達了這種想法。當時,他們正在討論計算機文獻的互換式,面臨的問題是合併不同文獻的索引。最終,達成的共識是索引可以構建一個信息源中的知識結構模型,但這個模型很難建構。一旦建立了這種模型,肯定能指導、方便不同索引的合併和整合。在GCA研究所(後來以IDEAlliance著稱)的文獻中,主題地圖這一思想得到了進一步的發展。此後,歷經幾年的發展、補充,最終在2000年,形成了一個主題地圖的國際標準,ISO/IECl3250:2000。不久,為促進這一標準在WWW信息資源組織與檢索中的套用,主題地圖組織(Top-icmaps.org)成立,而主題地圖在改善信息檢索和知識管理方面的潛力也日益被人們重視。ISO/IECl3250:2000是針對基於SGML語義標準的信息資源主題地圖創建的。隨著XML語言的廣泛套用,主題地圖組織在2001年又推出了基於XML語言的創建標準,作為ISO/IECl3250:2000的補充。我們下面的介紹都是基於XML語言的主題地圖的。
創建和套用
主題地圖的創建方式有人工方法和機器自動創建兩肋。人工方法創建的主題地圖內容豐富,質量較高,但耗費的人力非常人。機器自動創建主題地圖要視信息源的結構而定。一般而言,如信息源結構化較強,自動創建的主題地圖效果會較好;如果結構化不強,則需要多種自然語言處理工具的輔助。在自動創建主題地圖時,通常需要一個文本編輯器。也有一些專門的主題地圖編輯軟體和主題地圖自動生成軟體可以使用。
主題地圖可以存貯在XTM文檔後,也可以採用一定形式的資料庫存貯。實際使用中,後者套用較廣。由於主題地圖是根據主題、呈現和關聯建立起來的語義網路,因而可以用來構建概念知識庫,支持語義級的信息檢索。主題圖組織信息的方式是非線性的,可以通過多種途徑實現對同一個主題的揭示和檢索。用主題地圖用來組織web信息,能夠從不同的信息源中整合信息,揭示信息源描述的對象與對象,對象與信息源之間的關聯,實現給予內容的知識揭示和組織。由於從多個維度揭示信息,因而用戶可以從多個維度進行信息搜尋;此外,由於主題圖揭示了信息對象間的語義關聯,因而可以支持語義層的信息檢索,這種基於主題地圖的查詢也比簡單的全文檢索精確。