新聞資料中心
正文
新聞資料中心的任務是收集整理通訊社、報社所播發的新聞以及編寫多類專題背景材料,例如大事記和人物誌等。現代社會信息迅速膨脹,新聞資料中心必須採用現代化手段來收集、整理和處理信息,為用戶從浩如煙海的信息中及時查閱所需的資料和各種信息。新聞資料中心的核心部分是存貯和管理資料的現代化大型資料資料庫 (例如用大、中型計算機作為管理和檢索手段,使用光碟和縮微等存貯手段), 與之配合的是資料分類錄入等項前期工作和資料檢索、傳送、列印等輸出設備。
建立大型新聞資料中心是一項綜合工程,涉及資料編輯、情報管理、計算機套用和通信網路等多種學科。成功地開發這個系統要做好兩件基礎工作:①統一著錄格式、分類體系、新聞主題詞表和信息交換格式等方面的標準化工作。②選擇合適的用於新聞資料中心的檢索語言。檢索語言是一種人工語言,又稱標引語言。檢索語言用於各種人工和計算機情報檢索系統,種類較多,《中國圖書館圖書分類法》、《漢語主題詞表》等等,都是檢索語言的一個語種。檢索語言在檢索過程中有著重要的作用:用戶進行檢索時,查找人員利用檢索語言在檢索系統上查找所需資料。資料標引人員也要利用檢索語言對文獻進行標示,建立資料資料庫。檢索語言是資料標引人員和檢索者的共同界面,能夠使標引者和檢索者取得一致。
從標引角度出發,標引可分為受控標引、半受控標引和自由標引。新聞報導中新的辭彙不斷出現,完全採用受控語言標引是不夠用的。依據新聞特定環境的需要,在新聞資料中心選用半受控標引和自由標引兩種模式比較適宜。半受控標引模式用於新聞二次文獻,使用主題詞和自由詞相結合的標引方法。標引人員依據標引規則,選用主題詞表中的詞語進行受控標引,詞語不夠用時使用自由詞標引。自由標引模式適用於新聞專題資料、背景資料等事實型資料的標引。新聞資料中心的檢索系統要有良好的用戶界面,為用戶提供多途徑檢索、方便的數據錄入和系統維護管理功能。新聞資料中心還要建立完善的通信網路,實現計算機網路化。
隨著科學技術的發展和中文信息處理技術的不斷提高,用於新聞資料中心的檢索語言將逐步接近自然語言,人工標引工作將由計算機自動標引代替,西文資料庫採用的自然語言的自動標引與檢索,將會更快在中國實現。