IR理論

IR(institutional Repositories)作為新型的學術交流方式、學術開放存取( Open Access)活動的“綠色通道”以及知識與信息社會的動力引擎日漸成為國內外學術界與高校圖書館、科研院所圖書館關注的焦點。

IR概述

IR概念

IR概念是解釋IR一切問題的基礎,Clifford Lynch立足於大學從突出長期保存視角出發,指出,“IR是高校向其機構成員提供由機構及其社區成員創造的數字材料管理與傳播的一系列服務,這不僅僅是機構對這些數字材料保管的承諾,還包括長期保存以及組織與獲取利用傳播。" SPARC資深顧問 Raym Crow認為“IR是收集並保存單個或多個大學、科研機構知識資源的數位化資源集合。 Richard K Johnson則從廣義與狹義兩個角度對IR進行了內涵界定,指出:“從廣義上說,數字IR是由一個學校無論其目的或來源擁有或拉制的任何數字材料的集合;從狹義上說,數字IR是由機構師生員工產生並可以被機構內外終端用戶所獲取利用的智力成果的數字知識庫,並且幾乎不存在利用障礙。“筆者認為,IR應該是以一個或多個高校機構教育與學術內容為主,這個內涵外延不應超過這一界限,因為對於高校機構來說,檔案館擔負機構行政與管理檔案以及檔案的管理,如果IR將高校機構所有數位化材料都容納在內,將會面臨資源重複建設的危機。基於此,IR應是對機構內成員智力產品收集、存儲、管理並提供開放利用的知識傳播與知識服務系統,不應該包括行政管理性檔案與檔案 。

IR特點與功能

國外學者對IR特點都以“開放與互操作性、積累與永久性、學術性以及機構性”為基點進行闡述,目前學者對IR功能探討最大分歧在於IR對學術交流功能實現的爭議。Raym Crow與王雪茅都強調指出IR作為變革傳統學術交流體系的主要途徑之一,也履行傳統學術交流體系功能實現的任務。而David C·Prosser則從同行評議文獻存儲角度,提出IR實現了傳統期刊即傳統學術交流體系的三個功能,即註冊→利用→存儲功能。

儘管學者對IR功能實現存在著不同理解,但我們看到學者對IR實現傳統期刊註冊→利用→存儲功能具有共同的認識,學者爭論的焦點在於IR是否可以滿足學者要求的認證功能。因為有的IR並沒有設定傳統的同行評議程式,有的IR即使有一定的質量控制,但也不能等同於傳統同行評議,基於此,筆者認為,在有一定質量控制的基礎上,IR事實上是實現了傳統學術交流體系中一個初步簡單的認證功能,可以作為一個參考。同時筆者認為IR目前發展目標應該是以長期存取、推動知識交流與傳播為主。

IR服務模式

IR服務模式具有多樣性,每個機構或每個地區都可以根據本機構或本地區具體情況構建符合個體發展的模式。Alma Swan,Paul Needham,Steve Probets等幾位學者在其合作的研究論文以及研究報告中指出,IR服務模式主要分為:“集中式、分散式與採集式(混合式)。所謂集中式模式是指所有元數據與資源都存儲在一個集中的知識庫中;所謂分散式模式是指所有元數據與資源都保存在源知識庫中,元數據是跨庫搜尋的;所謂採集式模式是指元數據被採集到一個集中可搜尋的知識庫中,但是仍然保存在分散的原始知識庫中,可以從機構與學科知識庫以及個人知識庫與開放獲取期刊中進行數據採集。”這一分類基本上已經包含了IR所有的服務模式,筆者認為IR服務模式的選擇應該是以資源最佳化配置為核心,應以最少投入實現最佳服務 。

IR技術

目前國外IR實踐主體一直採用兩種類型軟體系統,一種是開放源碼軟體,另一種則是商業軟體。出於對成本經濟的考慮,大多數機構套用的都是開放源碼軟體,因此不同軟體系統開發商以及學者對IR套用的開放源碼軟體進行了詳細的介紹與討論。目前IR建設中套用比較廣泛的開放源碼軟體系統有:DSpace, EPrints, Fedora, CDSware, Greenstone, ARNO, iTOR, eDoc等。Open SocietyInstitute在IR軟體指南中對Archimede, ARNO, CDSware, EPrints, Fedora, iTor, MyCoRe, OPUS設計理念、技術規範、系統管理、內容管理、傳播發布、存儲管理以及系統維護等方面進行了詳細的比較,Richard Jones從內容提交過程、存儲與獲取、管理與安全等方面對DSpace和ETD-db在電子論文管理功能方面進行了對比分析,確定本機構套用的軟體系統。Dion HoeLian Goh等立足於數字圖書館套用軟體系統評估的角度,對CDSware, Fedora, EPrints以及Greenstone四個開放源碼軟體從內容管理、用戶界面、用戶管理、系統管理以及其他需求等方面進行了綜合比較,指出Greenstone在其所確定的標準中具有最佳性。每一種軟體系統都有自己的特點,探索不同軟體系統的特點與結構,有助於每個機構選擇適當的軟體建設自己的IR 。

圖書館員角色的重新定位

圖書館作為學術資源的主要集散地與傳播地,主要任務承擔者為圖書館員。事實上,圖書館員才是真正的機構學術資源管理者,是“機構建立知識庫最恰當的參與者”,他們在IR建立發展中起著至關重要的作用。Charles W·Bailey Jr提出,圖書館員在IR發展可以“推動機構制定相應發展政策與程式,並對IR實施提供反饋意見;幫助設計IR界面,便於IR的有效套用;推薦以及代理機構成員進行自存儲,豐富知識庫內容;參與IR內容元數據的創建;促進IR的發展,支持學術出版的變革;培訓用戶進行內容存儲與搜尋;為用戶在IR利用中解決疑問,釋析IR政策與程式等”。Suzie Allard也在綜述相關研究文獻的基礎上,為圖書館員在IR中角色進行了定位,“圖書館員負責了解IR軟體系統;監督本地IR項目管理與規劃;為集合界定提供指南;制定適合每個集合的簡單明確的元數據標準;評價控制提交內容的質量,保證元數據的一致性;培訓作者利用IR。”Diana L·H·Chan等人根據HKUSTIR建設的經驗,重點突出了圖書館員“在IR系統評估、制定與解釋政策、內容收集、與機構成員以及院系進行聯絡以及參考幫助等方面不可或缺的作用”。由此可見,IR的發展使圖書館員在數字信息保存與管理以及新的學術交流體系中發揮了更大的作用 。

IR建設中的問題

IR已經成為當前變革傳統學術交流體系,推動知識交流與傳播的重要途徑,越來越受到機構與學者的關注,但是目前IR建設中還面臨著許多問題。

著作權許可

著作權許可是制約機構成員向IR中提交內容的一個重要障礙,因為機構成員向IR提供的自存儲的教學與研究成果中有一部分是已經在公開發行期刊上正式發表的,這不可避免地涉及到出版商著作權許可問題。在2002-2003年,RoMEO項目對80個學術期刊出版商進行了著作權協定調查,結果顯示,90%的出版商要求著作權轉讓,6%的出版商要求排他性的著作權許可,4%的出版商不要求排他性的著作權許可,55%的出版商正式允許作者進行自存儲(36%只允許預印本的自存儲,2%只允許印後本的存儲,17%的出版商既允許預印本存儲也允許印後本存儲),剩下的45%表示如果有要求也將允許自存儲。

該項目還調查了OAI數據與服務提供方,在某種程度上揭示了其對著作權問題的忽視或不關注。只有25%的數據提供者表示與作者有許可協定,50%的數據提供者或者僅僅信任存儲者,或者僅僅提供常規警告聲明。

項目小組根據調查結果,提出了符合學術研究與元數據的權利管理需求的三條途徑:一是自己制定;二是可以利用現有的Digital Rights ExpressionLanguage(DREL);三是使用開放獲取研究成果權利管理方案。

截止2008年1月8日,SHERPA項目已經對358家出版商進行了自存儲政策調查,根據RoMEO項目顏色標識進行了分類,有69%的出版商支持某種形式的自存儲。上述調查結果說明,出版商對學者自存儲行為並沒有完全實行開放式,仍然有一部分出版商強烈反對在IR中自存儲。目前,隨著IR的發展,一些出版商正在放寬自己的著作權政策,允許作者以非盈利目的進行自存儲,但是這些出版商政策的改變是附加條件的,例如Nature出版集團鼓勵作者在IR中進行自存儲,但是前提條件必須是印刷本出版後6個月,並且必須提供對該期刊網站的超連結。由此可見,IR發展必須突破出版商的瓶頸。

內容建設

IR建設發展中亟需解決的一個問題是IR內容收集,根據調查結果顯示,40%的機構認為內容收集是比較困難的,23%的機構認為非常困難,14%的機構認為不確定,其餘的認為相對容易,換句話說,幾乎三分之二被調查機構都面臨著知識庫內容建設問題。這主要是由於研究者對IR認識不夠、不同學科領域學術交流傳統不同以及IR本身存在問題等諸多原因引致的。Nancy Fried Foster,Susan Gibbons根據Rochester大學DSpaceIR建設的經驗,分析了機構成員需求以及對IR的理解,提出IR內容發展兩大策略:一是與機構成員進行溝通交流,二是簡化成員提交內容的程式,並及時向其展示提交的研究成果。T·B·Rajashekar亦提出了提高作者自存儲意識豐富IR內容的兩種途徑:一是自下而上地讓研究者充分了解自存儲的意義,二是自上而下制定自存儲強制性政策。Morag Mackie指出Glasgow大學從學者或院系網站上採集內容不失為IR建立初始階段內容收集的一個有效方法。

長期保存和可持續發展

IR在學術交流體系以及知識創新中的作用日益凸現,已經有很多機構積極投入到IR發展中,但是我們看到,IR創建並不是一件困難的事情,IR要面臨的一個重要問題就是如何能夠實現內容長期保存與利用的責任以及知識庫可持續發展的目標。Jones與Beagrie指出,“數字保存是指採取一系列必要的措施以保證數字材料永久保存與獲取。” Wheatley, P指出“數字信息長期保存與獲取是數字知識庫發展的重要目標,保存意味著數據存儲在知識庫中不能被損壞、丟失或者惡意改變,可以在知識庫中被檢索與抽取,為用戶提供服務,可以被用戶解釋與理解,並且必須可以長期實現上述三個目標。數字知識庫長期保存的功能與框架主要包括:創造與提取必要元數據的收集過程以保證實現數據保存;提供信息可以被存儲、管理與利用的基本框架;監督技術可靠性與記錄信息的‘技術發展歷程’,並採取措施保證技術過時繼續履行保存責任的過程;提供數字對象檢索的服務過程;記錄變化元數據的過程與相關框架。”“從理想的角度看,學術性數字知識庫將以‘信任式的知識庫’角色發展著,並保證其內容可以長期進行訪問與利用。”[33]目前,歐洲DRIVER項目也對IR數字資源長期保存進行了實踐,已經建成了一個由5個國家知識庫提供者組成的常設網路,形成了一套構建本地知識庫的指導方針,並實現了對歐洲51個IR數據的再利用。

IR標準化

IR標準化問題是IR實現開放獲取與資源共享的關鍵標準。IR標準主要包括兩個方面:一方面是元數據標準,另一方面是互操作性標準。由於IR是以機構成員自存儲為主導,因此,IR運行中,“自存儲所帶來的一個潛在問題就是提交者自己創建的元數據,其中可能包含著一些錯誤的元數據。這些錯誤的元數據包括拼寫錯誤或者日期格式錯誤以及其他不同主題描述符的複雜問題,同時元數據格式對採集元數據的OAI服務提供方是至關重要的,錯誤的元數據將會導致瀏覽索引十分困難”,因此,IR發展必須保證其存儲元數據的標準。IR如果要實踐開放獲取的理念,可以被Google、Yahoo、Baidu等搜尋引擎所爬行,實現資源共享,必須能夠做到互操作性,因此IR建設必須遵循國際通用的開放標準,例如OAIS參考模型(the OpenArchival Information System(OAIS)ReferenceModel)、OAI-PMH(the Open Archives MetadataHarvesting Protocol)以及METS(the MetadataEncoding and Transmission Standard)[36-37]。根據統計數據顯示,在所調查的123個ARL成員中,大概94%已經實踐IR與88%計畫套用IR的機構表明支持OAI-PMH標準。由於知識庫在互操作性標準方面必須具有一致性,因此,未來對標準化的研究將成為IR理論與實踐必須深入的一個重要方面,包括“通用數據模型、通用複雜對象包裝方法、通用計畫、通用資源連結方法等。”

IR評價與政策支持

評價是衡量IR發展的重要方法之一。目前國外只有少數幾個學者關注IR評價問題。在IR實踐套用中,當前影響其發展的最關鍵因素是作者自存儲行為,因為作者自存儲行為直接決定了IR內容的豐富性,所以學者都將研究視角集中在自存儲行為評價上,為了正確了解作者對IR的態度以及自存儲行為的制約因素,Al ma Swan與Sheridan Brown對作者自存儲行為進行了調查,指出在所調查的作者中只有不到一半(49%)的作者曾經自存儲論文,包括在自己的個人網站上自存儲,但是相比較來說,這個數據比2004年的23%有了一定的提高,某些學科諸如化學、計算機科學與物理學領域的學者自存儲意識比較高,結果還發現成果越多的學者,其在IR進行自存儲的可能性也越高。Xia Jingfeng等人從“存儲者信息、存儲數量、全文可獲取性、作者態度以及存儲成本等角度對IR自存儲行為進行了評估”, Jihyun Kim在綜述文獻的基礎上,從社會交換理論(Social Exchange Theory)出發,考慮到成本之間的關係以及內外在利益,個體性格特點以及相關因素,提出了制約作者向知識庫提交內容的影響因素模型,並套用於作者的自存儲調查。這些研究成果都為學者自存儲行為的推進起到了指導作用。這些指標成為評測IR成功的參考性標準。

同時,IR是一個可持續性發展的系統工程,需要相關政策的支持。目前IR建設缺少有關IR實施建設管理的強制性支持政策。許多機構、政府以及研究學會為了豐富IR內容資源,紛紛制定了相關的自存儲強制性政策,目前已經有英國南安普頓電子與計算機學院等16所高校或學院制定了自存儲強制性政策。此外,一些研究資助機構例如the Wellcome Trust都要求其所資助的研究成果存儲在指定的知識庫中。為推進IR成功發展,學者需要研究提出相關建議,促使機構儘快制定相關支持政策。

綜上,我們不難看出,國外學者對IR理論研究的框架,如圖1所示。

圖1.IR理論研究架構 圖1.IR理論研究架構

研究層次主要以高校和科研院所為主;研究對象分為:IR概念;服務模式;實現技術;圖書館員在IR中的定位;影響因素等。雖然國外學者從多個角度對IR進行了探討,但仍未形成一個統一的理論框架。目前IR已經跨越了建設階段的技術困難,IR需要切實解決其面臨的一些挑戰,諸如內容建設、法律保障、長圖1IR理論研究的框架期保存、標準化以及評價等問題,然而目前國外學者形成的IR研究成果主要集中在微觀層面,即對某個IR技術軟體比較等,推進IR發展的巨觀管理運行機制研究成果較少;提出IR發展面臨挑戰的成果多,具體解決IR實踐中問題的研究成果少;總之,研究成果維度廣,但仍需全面深入探索 。

國外IR實踐進展

自從IR成為開放獲取綠色通道以及變革傳統學術交流體系的途徑以來,其發展已經勢不可擋。國外許多政府、學會以及科研資助實體與高校都啟動了IR建設項目,例如加拿大CARL(the CanadianAssociation of Research Libraries)IR試驗項目;荷蘭DARE(Digital Academic Repositories)項目;英國FAIR(Focus on Access to InstitutionalResources)項目;美國加利福尼亞理工學院CODA(Collection of Open Digital Archives)項目;荷蘭ARNO(the Academic Research in the NetherlandsOnline)項目;美國麻省理工學院(MIT)、英國劍橋大學與Andrew w·Mellon共同支持的旨在建立一個多機構合作的DSpace聯盟項目;澳大利亞ARROW(Australian Research Repositories Online to theWorld)項目等。

基於上述眾多項目的實踐與支持,目前許多著名大學如美國麻省理工學院(Massachusetts Institute of Technology)、哈佛大學(University of Harvard)、康奈爾大學(University of Cornell)等都紛紛推出了IR;截止2007年11月6日,在Directory of Open AccessRepositories中註冊的開放獲取知識庫達1023個,其中IR達827個,占81%。

從實踐套用看,國外IR發展趨勢已經成為各大高校機構數字學術信息資源保管的主要基地,而目前我國建立的IR可謂鳳毛麟角,僅僅只有香港科技大學、香港大學、香港中文大學、香港教育學院、香港城市大學、浙江大學、廈門大學、清華大學、台灣逢甲大學、中科院國家科學圖書館中心等,因此,國外IR建設經驗為我國IR建設發展提供了具有可操作性的借鑑與參考 。

相關詞條

相關搜尋

熱門詞條

聯絡我們