機讀目錄通訊格式
正文
圖書館自動化系統之間傳輸和交換機讀目錄數據時共同遵循和使用的標準記錄格式,又稱機讀目錄交換格式。它規定書目數據在機讀介質上的表示和標識方法,包括機讀記錄的構成、各數據欄位在機讀介質上的總體安排及其內容結構。機讀目錄的格式有: 內部處理格式和通訊格式兩種。內部處理格式是按系統本身的軟硬體特點、數據處理和套用要求而設計的,基本功能是提高機器處理效率,滿足系統本身的特殊要求。通訊格式的基本功能則是通訊,即數據交換,它同時要滿足各種用戶和系統的要求,而不是個別系統的處理效率。
發展 20世紀60年代中期,美國國會圖書館研製機讀目錄,於1966年制訂了一種MARCⅠ格式。經過一年多的試驗使用,1968年修訂為MARCⅡ格式,1971年,它被美國國家標準學會批准為《書目信息交換磁帶美國國家標準》 (ANSI Z39.2-1971),為了適應機讀書目數據交換的需要,1973年國際標準化組織(ISO) 又將其修改成為國際標準,即《文獻目錄信息交換用磁帶記錄格式》(iso2709)。 由於它規定了機讀書目錄記錄的基本結構,適用於各種資料類型和語言,具有很大的靈活性,因此在世界圖書館和情報界得到普遍採用,成為制定各種機讀目錄格式的基礎。隨著圖書館自動化的發展,許多國家或地區都按照國際標準所規定的記錄結構,結合各自的書目著錄編目條例和語言等特點,制定了自己的國家或地區的標準機讀目錄通訊格式。為實現機讀目錄國際交換從而達到“國際書目控制”的目標,1972年國際圖書館協會和機構聯合會(IFLA)成立了內容標識符研究小組,在1977年制訂了《國際機讀目錄格式》 (UNIMARC)。聯合國教科文組織(UNESCO)也於1974年組織制訂了國際情報界書目信息交換格式《UNISIST 機讀書目著錄參考手冊》,1983年又組織制訂了《共同通訊格式 》(CCF),以便國際圖書情報界各系統之間交換書目數據。80年代末,中國開始制訂中國機讀目錄通訊格式。
類型 機讀目錄通訊格式,按其使用的地區範圍可以分成3類①國家通訊格式, 在一個國家範圍內各系統交換書目數據時使用的格式。如澳大利亞(ANBIMARC)、加拿大(CANMARC)、法國(MONOCLE)、聯邦德國(MABI)、印度(NISSAT)、日本(Japan MARC)、英國(UKMARC)、美國(USMARC)等國家的機讀目錄。②地區通訊格式,供一個地區範圍內各系統交換書目數據時使用的格式。如經互會國家(MEKOF-2)、 法語國家(INTERMARC)、 拉丁美洲(MARCAL)、歐洲理事會(EUDISED)等。③ 國際通訊格式,國際上各國之間交換書目數據使用的格式。如 UNIMARC、CCF 等。此外,機讀目錄通訊格式還可按照所記錄的出版物類型分成圖書、連續出版物、地圖、檔案和手稿、樂譜、音像文獻等幾種版本。也可按數據類型分為機讀書目記錄格式和機讀規範記錄格式兩類。
構成 機讀目錄通訊格式由記錄結構、內容標識符和記錄內容3 個要素組成。①記錄結構,是指書目記錄在機讀介質上的物理表示方法,記錄的總體安排,基本框架。按國際標準 (ISO2709),這種結構由以下幾部分組成:a.頭標區: 位於記錄之首, 固定為24個字元長,為記錄處理提供某些基本參數。b.目次區:是記錄內各數據欄位的索引或目次,由一系列目次項構成。它是為檢索其後的數據欄位而設定的。c.數據欄位區:分為兩部分,一為控制欄位區,描述著作和記錄本身的特徵,大多為固定長的代碼性數據;二為書目欄位區,包含編目數據的實際內容。由一些可變長的數據欄位組成。d.記錄分隔設定:位於記錄的最後。②內容標識符,這是標識數據元素並為其提供補充信息的一套符號。包括:欄位標識符,這是標識和命名數據欄位主要內容的字元;指示符,它是為書目欄位提供描述信息和處理信息的代碼;子欄位標識符,是標識書目欄位內各數據元素的兩個字元。每個數據欄位的最後都有一個欄位分隔設定。③記錄內容,即編目數據本身。如作者、題名等等。這是按照文獻資料的著錄和編目條例規定所著錄和標引的具體書目數據。
此外,數據編碼用的字元集、各種數據代碼表(如語言代碼表,國家和地區代碼表等)也是機讀目錄通訊格式的重要組成部分。