無縫資料庫

無縫資料庫(seamless database)分化有兩個層次的含義:一是GIS 系統內部的數據無縫,二是不同GIS實現互操作時的數據無縫。前者是通常意義的無縫,後者主要通過數據標準化與操作標準化來實現。無縫空間資料庫的最終含義體現在邏輯無縫資料庫。無論是多源還是單源、同構還是異構,跨越數據層呈現在用戶面前的GIS空間資料庫必須是邏輯無縫的。

背景

隨著GIS 套用的範圍和領域的不斷擴大,GIS 系統需要表述越來越大的空間範圍和管理越來越多的空間信息,空間資料庫的縫隙問題逐漸凸現,對於縫隙的全面認識是組織無縫空間資料庫的首要問題,如何在多源異構環境中信息數據共享是無縫空間資料庫的目的和要求。

無縫GIS概念和內涵

地圖是用於描述現實世界的載體,是地球三維橢球面的二維平面表達。地圖學功能的延伸和擴展就是地理信息系統(GIS)。隨著計算機技術的飛速發展,GIS研究不斷深化,在套用推動上,由原來單一的GIS即以圖幅為單位的一小塊不連續的空間上進行數據分析、管理、描述和套用等,到區域性的GIS在大區域多圖幅上連續處理地理信息,人們迫切要求GIS夠處理連續的、無縫隙的空間信息,由此提出了無縫化的GIS從而使人們可以在更廣闊的空間數據基礎上進行分析套用。

無縫化的概念包括了管理和套用的結合。無縫GIS要更豐富的空間數據作為支持,一方面空間數據的獲取是一項耗時耗力的工作,另一方面GIS迅速發展和廣泛套用導致了多源空間數據的產生,這些數據從投影方式到比例尺可能各不相同,如何實現不同源頭的空間數據共享,能被無縫GIS接使用,即多源空間數據的融合,成為無縫GIS展的關鍵。

數據縫隙產生的原因

探討縫隙產生的原因,要考查GIS 數據採集、表達和處理的全過程。在現實世界中,地理空間是由地貌、地物組成的連續的表層空間,地理信息則是有關地理空間的一切有用的知識。在計算機世界中,地理信息通過抽象、建模形成數位化的表示形式,通過空間資料庫來進行表達、存儲、存取和管理。

縫隙的產生主要集中在以下幾個方面和過程:

數據源

由於歷史和現實的原因,地圖是絕大多數GIS 系統直接的數據源。地圖是地球三維橢球面的二維平面表達,本身對真實世界有扭曲;地圖是對連續空間的割裂表達,實體被分割到不同的地圖空間中去;高斯投影是基本比例尺地形圖經常選用的投影,也是絕大多數GIS系統的數學基礎,由於分帶的原因,使得投影后帶有高斯投影平面坐標的地圖無法實現無縫拼接。

數據表達與組織方式

空間地理幾何數據的表示主要有柵格和矢量兩種不同的形式。柵格形式是將地理表層空間劃分為一系列格線,空間目標由這些格線的位置及其量化值來表示,這些格網本身就是連續空間信息的離散表達;矢量形式則是將地理空間的一切事物、概念進行抽象,形成點、線、面,由點、線、面來組成各類空間目標。按點、線、面來分類和按分層的思想來組織空間數據,也割裂了實體之間內在的聯繫。

在空間資料庫組織與管理上,目前主要有檔案型、檔案與關係資料庫混合型、全關係型以及對象關係型。傳統的檔案型空間資料庫、檔案與關係混合型空間資料庫,按圖幅或一定的區域範圍以檔案的形式來組織與存儲空間幾何數據,不同的圖幅或區域之間存在縫隙。在檔案與關係資料庫混合型的空間資料庫中,空間幾何數據貯存在檔案中,屬性數據貯存在關係資料庫中,屬性數據和幾何數據之間通過內部標識來連結,空間幾何數據和屬性數據之間存在縫隙。

數據處理

數據處理的過程中也會引入縫隙,產生這種縫隙的原因有:

•①數據處理過程的順序不一致;

•②選擇的處理參數不一致;

•③數位化的精度不一致。

多源異構數據共享

數據屬性(數學基礎、比例尺、用途、時間、精度等)的不同,導致了數據的差異,這些差異是多層次和多方面的,它們集中體現了數據的異構。數據異構和多源往往是一體的,多源異構是系統內部和系統之間數據裂隙的主要原因。

數據縫隙的類別和表現

數據縫隙基本可以分為物理縫隙和邏輯縫隙兩類。物理縫隙是地理空間的分離存儲,本來連續的實體空間被分離到不同的存儲空間和存儲單元中去,例如空間數據的分幅、分層存儲。邏輯縫隙是指邏輯上本身連續的信息不能以邏輯連續的方式呈現,例如跨越多幅圖的一條河流,在圖幅內查詢河流屬性(例如長度)時只能獲取其在本圖幅內的相關信息而不是實體整體的信息。

顯然,由於空間信息本身的海量特性,要完全意義上的實現物理無縫的空間資料庫目前還是不可能的,也沒有必要。GIS 用戶關心的不是空間數據是物理無縫,因為GIS 呈現給用戶的是數據邏輯層,只需要保證用戶看到的數據是邏輯無縫的。

物理有縫的資料庫向邏輯無縫資料庫的轉換是無縫空間資料庫構建的重要一環。

無縫空間資料庫的含義

“無縫空間資料庫”問題實際上是地理空間的空間數學基礎問題。GIS基本理論問題從根本上消去了“無縫空間資料庫”問題,因而能在技術上妥善解決以下6個全球範圍問題:

①全球連續可視化;

②多解析度信息的系統性、統一性;

③多維、多源信息數據的全球統一定位框架;

④長度、面積、方向和體積等全球的精密量度;

⑤空間分析的正確性;

⑥信息系統工程的最佳化結構,即具有易擴充、組合分解的動態性、統一的規範性、計算的最佳化性。

隨著GIS 數據發布與共享技術的發展,無縫空間資料庫逐漸分化出兩個層次的含義:一是GIS 系統內部的數據無縫,一是不同GIS 實現互操作時的數據無縫。前者是通常意義的無縫,後者主要通過數據標準化與操作標準化來實現。無縫空間資料庫的最終含義體現在邏輯無縫資料庫。無論是多源還是單源、同構還是異構,跨越數據層呈現在用戶面前的GIS空間資料庫必須是邏輯無縫的。

空間數據的無縫連線是一個建立在用戶與資料庫接口基礎上的概念,它是空間資料庫中空間數據集成的結果,即在用戶的接口上實現對空間數據的透明訪問,即對空間數據按空間進行集成,形成地理空間上無縫連線的整體集成信息空間。

無縫資料庫的關鍵技術

數據的無縫連線包含以下幾個問題:投影,坐標系統,比例尺,數據精度等。對不同投影和坐標系統的空間數據在投影和坐標系統上統一採用相同的標淮,當空間數據具有多尺度時,無縫連線尋找數據集之間連續的表達方式,它表現為不同尺度數據之間的集成。建立無縫空間數據的關鍵在於在合適的空間信息框架上實現多源異構空間數據的融合,框架是基礎,融合是手段。

合適的空間框架的選擇

⑴適合多尺度信息表達

地球是一個開放的非常複雜的巨大系統,隨著觀察視角的變化,我們希望空間地理信息比例尺也自動增減。由於地圖的自動綜合受諸多因素的影響,目前比較可行的是採用多尺度空間數據支持來達到目的。所謂多尺度就是指系統內包含幾種不同比例尺(或解析度)的空間數據,其目的是為了適度地反映系統所關心區域的空間地理信息,以避免地物信息的過粗、失真或地物信息的負載量過大而無法使用。無縫空間資料庫也應該符合多尺度空間資料庫要求。

⑵適合大區域表達

各種自然和人文現象的空間分布,有其內在的原因和規律,這些原因和規律的獲得,往往需要研究大區域多因素的綜合作用;另一方面,對於全球範圍的環境變異和氣候變遷的研究需要基於數字地球的空間框架。大區域的表達,還涉及空間尺度問題,不應繼續採用歐氏空間尺度,而應該採用大地線尺度空間。

多源異構空間數據的融合

GIS 的迅速發展和廣泛套用導致了多源空間數據的產生。如何實現不同的GIS 軟體共享並操作不同來源的地理數據,即GIS 多源空間數據的集成,成為GIS 發展的關鍵。目前GIS多源空間數據的集成主要朝著三個方向發展,一是通過建立統一的數據交換標準來約束並規範已有的各類地理信息系統,採用數據交換標準來進行空間數據交換;二是建立開放式地理數據互操作規範,進行地理信息系統互操作;三是GIS 數據中間件技術。

統一數據交換標準存在很多實現上的困難。互操作是一個重要發展趨勢,是在異構分散式資料庫中實現信息共享的途徑,它需要將GIS 技術、分布處理技術、面向對象方法、資料庫設計及實時信息獲取方法更有效地結合起來。所謂GIS 數據中間件技術是指能夠嵌人各類GIS 系統的軟體,GIS 開發者通過中間件開發商提供的接口,訪問和操作特定的數據源。

在多源異構數據集成技術尚未成熟的時候,人們再次把目光投向數據本身,如果可以提供關於數據的詳細描述,是否可以提高融合數據的能力呢?於是,對於“關於數據的數據”的研究,即對於元數據的研究便普遍展開。從Dublin Core 到CSDGM 與OGC,都提出了相應的元數據標準體系,有了完整而完善的元數據描述,必將提高數據的效能,從而最終促進多源異構資料庫向無縫空間資料庫的歸化。

意義

無縫是GIS 系統資料庫的目的和要求。無縫不僅是一個可視化的目標,更是一個數據共享的目的和手段。消除縫隙,要從縫隙產生的地方開始。分離出數據物理層和數據邏輯層,在統一的空間框架之下,將物理層歸化到邏輯層,並消除邏輯層的縫隙,從而實現用戶級的邏輯無縫空間資料庫

MRSID技術介紹

MRSID

MRSID (Multi-Resolution Seamless Image Data base)又稱為多解析度無縫資料庫,它是由美國Los Alamos國家實驗室發明的新一代圖像壓縮、解壓、存儲和提取技術。它利用了離散小波轉換(DWT)技術對圖像進行壓縮,通過局部轉換,使得圖像內部任何一部分都具有一致的解析度和非常好的圖像質量。它內部採用多解析度的金字塔存儲結構,是一個小型的影像資料庫的概念,總結起來有以下優點。

1.有較高的壓縮比。其壓縮比決定於圖像內容和彩色深度,對於灰度圖像壓縮率為15 :1 ~20 :1,對全彩色圖像可以達到30 :1 ~ 50 :1,壓縮後對視覺質量沒有可感知的損失。壓縮比可調,可以把壓縮的圖像設定成完全無損失至適度有損。

2.可以壓縮非常大的圖像,可壓縮的圖像大小決定於計算機可定址的存貯器大小。目前,LizardTech公司提供3種圖像壓縮器,可壓縮檔案分別為100 MB, 500 MB和無限制。可以將多幅圖像壓縮為一個檔案,建立大型的圖像資料庫。

3.以多種解析度顯示影像數據。

4.採用選擇性的解壓技術能夠解壓所需要瀏覽的整個壓縮圖像的一部分,解壓速度快,可以快速地打開和瀏覽大的圖像,記憶體只要2MB。

5.支持多種圖像格式檔案的壓縮。目前,支持TIFF C Tagged Image File Fom}at,包括有和無TIFFWorld File兩種),BIL (Band Interleave),BSQ CBand Se-quential),BIP CBand Interleaf Per Pixel),USGS DOQ(新舊兩種格式)格式。

6.可實現即時、無縫、多解析度的大量圖像瀏覽,無需等待、分塊處理、軟體代理。可通過CD光碟、網路和Internet等媒介快速地傳輸圖像。

影像資料庫中MRSID技術的套用

1.數據處理

經過正射糾正的源影像大部分以TIFF格式存放,由於影像的數據量非常大,而且隨著航片和衛星影像的不斷增加,影像數據量將以幾何級數不斷增長,所以必須要為源影像提供一種高性能的壓縮方式,既使影像有較高的壓縮比,又可以以不同的解析度高效顯示圖像。MRSID憑藉自身的諸多優點成為我院影像壓縮工具的首選。NIRSm GeoSpatial Encoder是一個獨立的壓縮軟體,操作起來非常方便,既可以對單個影像進行壓縮,也可以對多個影像批處理,而且,壓縮工具能自動生成源影像的寬度、高度以及大小等信息,供用戶參照,選擇合適的壓縮倍率。由MRSm GeoSpatial Encoder工具壓縮的結果,影像檔案後綴為sid,記錄了影像的像素信息。值得一提的是,數據處理還包括空間定位檔案的生成,這個以sdw為後綴的文本檔案記錄了像素和空間實際坐標的對應關係,既可以手工生成,又可以編制軟體快速生成。

2.影像元數據生成

元數據是解釋影像數據的數據,它以純文本檔案存放,後綴為mat,存放影像數據源、數據精度、生產情況等方面的信息。影像元數據由上海市測繪院研製的影像元數據生成工具生成,這些檔案和影像sid檔案一一對應,和影像sid檔案存放在客戶機的同一檔案目錄下。

3.影像資料庫維護

每一個影像的sid檔案、元數據mat檔案、空間定位sdw檔案,從不同的方面來描述影像,是一個密不可分的整體。在影像資料庫中,影像的像素信息,空間定位信息以sid檔案、sdw檔案形式存在,而元數據信息和影像的矢量範圍則一起存放在ORACLE資料庫中。影像資料庫維護工具是一個獨立的程式,基於Client/ Server模式,在FTP協定的支持下,負責將前面處理好的sid影像、空間定位sdw檔案傳輸到伺服器檔案系統中,同時將影像的元數據信息和影像的矢量範圍導入到ORACLE資料庫中,檔案和資料庫相互關聯。影像資料庫維護軟體不僅能實現伺服器檔案系統和資料庫屬性的同步和時時更新,還能實現影像和元數據的相互查詢。

4.利用MRSID的解壓接口實現影像數據的提取功能

上海市城市空間地理影像資料庫除了對影像數據進行統一管理和維護,為GIS用戶提供整個圖幅的航空影像或整個飛行區的衛星影像外,還有一個非常重要的功能就是要能按照用戶的需要,對用戶所感興趣的區域進行影像數據提取。影像數據的提取不僅涉及到單幅影像的提取,還涉及到2幅或4幅影像的提取,其最終結果都是要將用戶感興趣範圍的影像數據提取出來,存儲成另外格式的圖像檔案,而且操作對象既可以是衛星影像,又可以是航空影像,所以在進行程式的實現時,既要考慮用戶的操作對象,又要考慮提取操作涉及到幾幅影像,是否在提取影像數據後進行影像的拼接等因素。

5.影像數據發布

結合WebGIS軟體,在網上直接發布sid影像和元數據信息,速度快且圖像效果好,藉助於網路技術,極大地拓寬了用戶獲取影像信息的途徑,更好地滿足了廣大用戶的需要。

相關詞條

熱門詞條

聯絡我們