語義Web概念:
1998年Web的發明者國際W3C主席Tim Berners-Lee首次提出了語義Web的概念。
2001年9月9日國際W3C“技術與社會領域(Technology and Society Domain)”下的語義Web活動論壇(semantic web Activity)正式宣告成立。語義Web活動論壇在其宣言中指出:“語義Web是當前Web的一個擴展,其中信息具有形式化定義的語義,更有助於計算機之間以及計算機與人之間的協同工作。其思想是使Web上的數據以這樣一種方式來定義與連結,使其能夠在各種不同的套用場景中有效地實現數據的發現、自動化處理、集成與復用。若且唯若Web不僅成為人所共享加工的場所,也成為自動化工具所共享加工的場所時,語義Web方能實現其全部潛力。”
語義Web體系結構:
語義Web的實現依賴於三大關鍵技術:XML、RDF和Ontology。
下圖描述了語義Web的七層體系結構:
第一層:Unicode和URI。
Unicode是一個字元集,這個字元集中所有字元都用兩個位元組表示,可以表示65536個字元,基本上包括了世界上所有語言的字元。數據格式採用Unicode的好處就是它支持世界上所有主要語言的混合,並且可以同時進行檢索。URI(Uniform Resource Identifier),即統一資源定位符,用於唯一標識網路上的一個概念或資源。在語義Web體系結構中,該層是整個語義Web的基礎,其中Unicode負責處理資源的編碼,URI負責資源的標識。
第二層:XML+NS+xmlschema。
XML是一個精簡的SGML,它綜合了SGML的豐富功能與HTML的易用性,它允許用戶在文檔中加入任意的結構,而無需說明這些結構的含意。NS(Name Space)即命名空間,由URI索引確定,目的是為了避免不同的套用使用同樣的字元描述不同的事物。XML Schema是DTD(Document Data Type)的替代品,它本身採用XML語法,但比DTD更加靈活,提供更多的數據類型,能更好地為有效的XML文檔服務並提供數據校驗機制。正是由於XML靈活的結構性、由URI索引的NS而帶來的數據可確定性以及XML Schema所提供的多種數據類型及檢驗機制,使其成為語義Web體系結構的重要組成部分。該層負責從語法上表示數據的內容和結構,通過使用標準的語言將網路信息的表現形式、數據結構和內容分離。
第三層:RDF+rdfschema。
RDF是一種描述WWW上的信息資源的一種語言,其目標是建立一種供多種元數據標準共存的框架。該框架能充分利用各種元數據的優勢,進行基於Web 的數據交換和再利用。RDF解決的是如何採用XML標準語法無二義性地描述資源對象的問題,使得所描述的資源的元數據信息成為機器可理解的信息。如果把XML看作為一種標準化的元數據語法規範的話,那么RDF就可以看作為一種標準化的元數據語義描述規範。Rdfschema使用一種機器可以理解的體系來定義描述資源的辭彙,其目的是提供辭彙嵌入的機制或框架,在該框架下多種辭彙可以集成在一起實現對Web資源的描述。
第四層:Ontology vocabulary。
該層是在RDF(S)基礎上定義的概念及其關係的抽象描述,用於描述套用領域的知識,描述各類資源及資源之間的關係,實現對辭彙表的擴展。在這一層,用戶不僅可以定義概念而且可以定義概念之間豐富的關係。
第五至七層:Logic、Proof、Trust。
Logic負責提供公理和推理規則,而Logic一旦建立,便可以通過邏輯推理對資源、資源之間的關係以及推理結果進行驗證,證明其有效性。通過Proof交換以及數字簽名,建立一定的信任關係,從而證明語義Web輸出的可靠性以及其是否符合用戶的要求。
語義Web的套用:
語義Web提供各種依靠語義的自動化服務,如天氣預報服務、航班信息服務、線上航班預定服務、資料庫查詢服務、目錄查詢服務、數字圖書館查詢服務、搜尋和分類服務、B2C交易服務、B2B交易服務等。
網際網路信息發布與搜尋:通過對內容的標註與分析從而克服了關鍵字查詢的歧義性,提高了查詢的精度。Stanford大學語義web研究組研製的查詢語言DBQ是一個比較有影響的系統,它是基於DAML的。另一個基於DAML的語義web信息檢索系統是美國Maryland設計的HOWLIR系統,它採用DAML-JESSDB-一個基於DAML的推理系統-作為推理引擎。此外,基於語義web的文檔檢索與知識管理也是當前研究的一個熱點。
Web 問題解答:在用ontology對信息源進行標註的基礎上,進一步運用知識庫來解答用戶的提問。Stanford大學研製的Triple 系統是一個基於邏輯程式設計的RDF查詢系統,邏輯子句的問題求解能力使它能夠解答較為複雜的問題。德國Karlsruhe大學等單位研製的SEAL 是一個語義Web入口網站,它具有回答用F-邏輯表示的查詢的能力[]。F-邏輯使得ontology中的概念與問題求解規則融合於一體。