OAIS

OAIS

OAIS,即開放檔案信息系統(Open (2)OAIS信息模型 (2)合作(Cooperatin

概述

OAIS,即開放檔案信息系統(Open Archival Information System)的簡稱,一項旨在為基於長期保存目的的信息系統建立一個參考模型和基本概念框架,以維護信息系統中數字信息的長期保護和可存取。OAIS是由美國空間數據系統諮詢委員會(CCSDS)制定的標準,2003年最終作為ISO的標準(ISO 14721:2003)頒發。

OAIS簡介

(1)OAIS參考模型的目標和範圍
①為存檔概念的理解提供了一個框架,這些概念需要用於數字信息的長期保存和存取中;
②為非存檔組織有效參與保存工作提供所需概念;
③為描述和比較現存及未來的存檔組織的結構和運作提供了一個包括術語和概念在內的框架;
④為描述和比較不同的長期保存策略及技術提供了一個框架;
⑤為比較數字信息的數據模型,以及討論數據模型及其潛在的信息(這些信息隨時間改變)提供基礎;
⑥為其它長期保存的非數字形式信息擴展提供一個基礎;
⑦為OAIS相關標準的鑑定和產生提供嚮導。
(2)OAIS參考模型的適用性
OAIS參考模型不定義任何實施這些概念的特殊方法。具體實施者參考OAIS參考模型為開發提供特定服務和內容的指導,但模型不假設或局限於任何特定計算機平台、系統環境、系統設計範例、系統開發方法、資料庫管理系統、資料庫設計範例、數據定義語言、命令語言、系統界面、用戶界面、技術、所需媒體。因此,真正對數字資源長期保存系統設計或實施需要根據實際情況將功能組合或者分解。

OAIS的概念

(1)OAIS環境。
OAIS環境反映的是與OAIS系統互動的實體(如圖1所示),包括:

OAIS環境OAIS環境

圖1 OAIS的環境模型
①信息生產者(Producer):提供信息需要保存的個人、機構和系統;
②管理者(Management):制定OAIS總體政策的實體,而這些政策將成為更廣泛背景下政策領域的有機組成部分,它並不涉及日常的檔案管理活動(具體的檔案管理活動由Administration模組來實現);
③信息用戶(Consumer):需要查找和獲取OAIS所保存信息的個人、機構和系統;
(2)OAIS信息模型
①信息對象(Information Object):指由數據對象(Data Object)組成,通過與表徵信息(Representation Information)結合為用戶理解的信息。數據對象(Data Object):指實體數據(Physical Object)或者數字數據(Digital Object)。表徵信息(Representation Information):將數據對象以一種有意義的方式呈現給用戶的信息,包括對ASCII的定義、數字格式等。
數據對象、表徵信息、信息對象的關係如下圖2所示:
數據對象、表徵信息、信息對象的關係數據對象、表徵信息、信息對象的關係

圖2 數據對象、表徵信息、信息對象的關係
②信息包是OAIS信息模型中的核心概念,也是功能模型中各模組之間傳遞的基本對象。從信息包的構成來看,它包括:內容信息和保存描述信息。內容信息、保存描述信息通過打包信息構成一個信息包三者綁定成一個整體,這一整體通過描述信息(描述信息包的特性和屬性並幫助定位和檢索用戶所需信息包的信息)表現。它們之間的關係如圖3所示:
信息包信息包

圖3 信息包

OAIS的責任

(1)與信息生產者協商並接收其提供的適當信息;
(2)能夠擁有對信息的足夠控制以實現長期保存的目標;
(3)確定存檔信息的目標團體並能保證它們能夠理解這些信息;
(4)保證被保存的信息對目標團體是不依賴於信息生產者的幫助可獨立理解的;
(5)遵循規定的政策和程式以保證信息能夠在所有可能的意外情況出現時被保存,保證信息能夠以原始信息的授權副本或者能夠追溯到其原件的形式發布;
(6)確保目標團體能夠獲取被保存的信息。

OAIS具體模型

OAIS參考模型具體可分為:功能模型、信息模型、信息包在各功能模組之間的轉換三部分內容。
(1)功能模型

OAIS功能模型OAIS功能模型
圖4 OAIS 功能模型
OAIS的功能模型如下圖4、圖5所示。OAIS定義了六個功能實體,它們相互作用,共同完成OAIS的保存和服務功能。這六個功能實體是:攝取(Ingest)模組、檔案存儲(Archival Storage)模組、數據管理(Data Management)模組、存取(Access)模組、管理(Administration)模組、保存規劃(preservation Planning)模組。
圖5 OAIS 功能模型
(2)信息模型
參見四、2(2)部分。
(3)信息包轉換
介紹了信息包及其相關對象如何實現從信息生產者經由OAIS到信息用戶這個生命周期過程中在邏輯上或物理上的相互轉換。
①信息生產者實體中的數據轉換:首先當生產者做出將信息存儲在OAIS的決定後,他需要與檔案工作者就SIP的內容、格式、儲存時間等問題達成提交協定。
②攝取功能模組中的數據轉換:OAIS不需要保持SIP中的信息與原來完全一致,SIP在OAIS中的形式和內容都可能發生變化。因此SIP與AIP的映射關係並不是一一對應的。
③長期存儲和數據管理功能模組中的數據轉換:長期存儲功能模組將AIP轉換成長久保存的檔案信息,數據管理功能模組接收由攝取功能模組產生的包描述並且補充現存的集合描述以囊括新接收的包描述信息。
④獲取功能模組中的數據轉換:當信息用戶者需要使用信息時,檢索工具能夠提供給用戶關於OAIS中儲存所有信息的全景,幫助用戶定位查找信息;當用戶確認需要查找OAIS中的信息時,用戶使用請求工具提出獲取數據請求;獲取功能模組在數據管理模組中記錄下用戶的請求並確認是否能夠滿足,並且與長期存儲和數據管理模組聯繫請求AIP和相關的包描述;將AIP和相關的包描述轉換成DIP集合併且將這些DIP存儲在物理上分散的介質上,通過數據發布過程傳遞給用戶,這一轉化過程的複雜性因OAIS和用戶的請求不同而異。

保存的觀點

這部分主要說明了保存數字信息和數字信息服務的各種實踐方法。
(1)數字信息的保存
數字保存是指在OAIS中為了保存數字信息而將其進行轉換。由於介質老化、用戶服務的新需求以及提高成本——效益比的目的,需要通過數字遷移的方法來長期保存數字信息。遷移的具體類型包括更新(refreshment)、複製(Replication)、重新打包(Repacking)和轉換(Transformation)。上述四種不同的遷移方法會對保存的信息產生不同的影響。
(2)獲取服務的保存
在技術變遷的情況下,OAIS可能期望保存信息用戶的獲取服務,可能存在的情況主要有以下兩種:
第一種情景是假設目標團體希望通過使用應用程式界面(API)也就是OAIS的利用軟體來獲取AIP。當OAIS轉移至新的硬體、載體和作業系統,如果OAIS需要保持同一API,則需要給部分新的基礎結構提供“包裝套(wrapper)”,這種方法不會改變用戶群體開發的軟體;第二種情景是假設指定的用戶群體希望通過特定套用技術保持原來AIP信息內容的“外觀和感覺”。在這種情況下,OAIS需要套用仿真技術。

存檔機構互操作性

OAIS存檔機構之間的互動可能有以下四種情形:
(1)獨立(Independent)檔案館:指只服務於一個目標團體的獨立檔案機構。
(2)合作(Cooperating)檔案館:兩個或多個檔案館之間通過標準協定合作,比如一個檔案館可能是另一個檔案館的信息用戶。
(3)聯盟(Federated)檔案館:在概念上以信息用戶為導向,除本地用戶,還存在全球用戶,他們對多個OAIS檔案館的信息感興趣,檔案館間通過一個或多個共同檢索工具來實現信息共享。當然,本地用戶在信息使用上可能優先於全球用戶。
(4)共享(Shared resources)檔案館:指檔案館之間達成協定實現功能共享或整合

國內外套用OAIS參考模型的案例

1、國外基於OAIS的研究項目

(1)美國國會圖書館領導實施“國家數字信息基礎設施和保存計畫”(NDIIPP,National Digital Information Infrastructure and Preservation Program)。
(2)加利福尼亞大學數字保存倉儲(dpr,Digital Preservation repository)是加利福尼亞大學圖書館數字保存計畫的基礎。
(3)荷蘭國家圖書館針對長期存取荷蘭電子出版物的需要而提出的專注於長期存儲和大規模存檔的e-Depot系統。
(4)由歐洲國家圖書館聯合會常設委員會發起的,歐洲的8個國家圖書館(荷蘭、法國、挪威、德國、葡萄牙、瑞士、義大利)和三家主要出版社(Kluwer、Elsevier、Springer-Verlag),一個國家檔案館,兩個ICT組織參加的NEDLIB(Networked European Deposit Library網路化的歐洲存儲圖書館)項目。
(5)英國Cedars的分散式數字檔案原型系統(The Distributed Digital Archiving Prototype)項目
(6)美國的ERA項目
(7)澳大利亞的ADRI項目

2、我國基於OAIS的主要研究成果

(1)深圳市檔案局——電子檔案元數據標準,開始於2000年。
(2)國家圖書館——中文元數據方案(CMDS),開始於2001年。
(3)北京大學數字圖書館研究所、CALIS(China Academic Library& Information System,中國高等教育文獻保障系統)管理中心、北京大學信息科學中心等——中文元數據標準框架,開始於2001年。
(4)清華大學圖書館——保存元數據方案,開始於2001年。
(5)中科院檔案館——中科院檔案館數字檔案館,開始於2002年。
(6)科技部——數字圖書館標準與規範建設,開始於2002年。
(7)深圳市寶安區檔案館——電子檔案管理系統,開始於2003年。
(8)MDLS項目工程組——國內軍隊院校數字圖書館套用軟體系統(Military Academy Digital Library application software System,MDLS),開始於2003年。
(9)浙江大學人文學院信息資源管理研究所——電子檔案管理元數據規範(ERM Metadata Version 1. 0),開始於2004年。
(10)珠海城建部門——數字城建檔案館,開始於2004年。
(11)上海圖書館名人手稿數字圖書館課題組——名人手稿數字圖書館,開始於2004年。
(12)浙江大學人文學院信息資源管理研究所——基於元數據的電子檔案集成管理與服務模型,開始於2005年。
(13)中國科學院文獻中心——數字保存技術體系,開始於2006年。
(14)江西省檔案館——電子檔案元數據標準及相關標準規範體系,開始於2007年。
(15)此外,檔案軟體的開發商量子偉業、東方飛揚等也開發出PDE-OAIS、ES-OAIS等數字檔案管理系統,並在江蘇電信、紹興市檔案館、長江三峽等國家重大工程項目數字檔案中得到套用。

相關詞條

相關搜尋

熱門詞條

聯絡我們