情報檢索軟體
正文
為完成情報檢索系統的功能而設計,並在特定計算機作業系統支持下工作的計算機應用程式。作為軟體系統,情報檢索軟體由作業系統、資料庫管理系統、在線上控制系統、語言接口和應用程式5大部分組成,但通常所稱的情報檢索軟體大都指應用程式或兼含的資料庫管理和在線上控制功能。要求 情報檢索系統是按照不同領域和不同用途研製和使用的,因而情報檢索軟體的設計和功能也隨之而異。例如,下列因素都可能向情報檢索軟體提出不同的要求:①系統處理的情報是文字型、數值型或圖像型,文字型情報又有不同語言之分;②系統處理方式是在線上的還是批式的;③系統服務範圍是對外公開還是內部利用;④系統存儲的情報容量是大還是小;⑤系統採用的計算機是大型機、小型機還是微型機;⑥系統所要求的實時性如何;⑦系統提供用戶的接口功能如何等等。
綜合上述因素,用戶需求、情報處理加工的複雜性和採用的計算機性能,是設計不同類型情報檢索軟體的主要依據。不同的情報檢索系統,就有不同的情報檢索軟體, 例如有文獻情報檢索軟體、 在線上情報檢索軟體、微機情報檢索軟體、工程情報檢索軟體、科學數據情報檢索軟體、商業情報檢索軟體等。 但是, 各種情報檢索系統的基本功能不外乎為存儲、檢索和利用幾個部分,作為其應用程式,也具有共同和共性的功能。以在線上文獻檢索應用程式為例, 首先, 文獻情報的主要特點是:主要採用自然語言;信息長度大都為可變長;信息項為不特定多數項;信息結構主要採用線性結構和樹型結構,不需要網型結構之類的複雜結構;信息量不斷累積,因此存儲量龐大;用戶提問比較複雜,需要多元次邏輯式展開處理;由於採用自然語言,為了減少誤檢率和漏檢率,需要採用展示標準詞、同義詞、 上位詞、 下位詞、相關詞、 同音異義詞的主題詞表; 由於信息長度可變,需要採用對可變長信息加以比較的技術 (前方一致、後方一致、任意位長一致、指定位一致)等等。
組成 根據上述特點,在線上文獻檢索應用程式通常由下列程式模組組成:
①存儲模組 包括將文獻信息存儲到計算機可讀存儲介質的各種實用程式,如數據結構和文獻正文定義、數據錄入、查錯糾錯、代碼和格式轉換、載體轉儲、數據壓縮等。
②資料庫創建和維護模組 包括將上述已存儲的信息加工處理為資料庫或檔案形式、直接為各檢索和服務模組的過程和指令調用的各種實用程式,如記錄的排序合併、索引(倒排)檔案和文獻檔案的創建、更新和維護等。
③檢索和服務模組 是情報檢索軟體體現功能差異和對用戶友好程度的核心部分,通常採用對話方式接受用戶提問。因此這一模組包括系統處理和分析檢索指令和用戶提問的一系列過程和檢索指令,用戶正是通過這些指令與系統對話,進行檢索和與檢索有關的操作,列印輸出檢索結果,保留檢索策略,系統諮詢服務,與主題詞表對話等。
④主題詞表模組 可用於編制主題詞表,本身是一個獨立的應用程式,同時可與檢索模組和資料庫配合,起到自然語言(檢索者所用語言)、文獻出現語言和系統控制語言之間相互接口的橋樑作用。作為獨立的應用程式,包括詞表編制(輸入、 邏輯查錯、參照關係生成、索引生成、編輯出版、維護統計等) 和檢索接口兩大部分的各種實用程式。
⑤安全和記帳模組 用於保護系統的各種資源和功能不讓非法用戶利用,並對系統的資源和功能的利用情況進行統計,還包括用戶使用資料庫、在線上、列印輸出等涉及收費有關的記帳實用程式等。
⑥管理和支持模組 專為系統管理員提供各種實用程式,視各情報檢索系統不同,有的情報檢索軟體把磁帶格式轉換程式、裝庫程式、更新程式、用戶管理程式、主題詞表建立和管理程式、排版印刷程式、定題檢索服務(SDI)程式等,都收集在這一模組內。
指標 衡量一個情報檢索軟體的綜合指標可包括:空間存儲效率、回響速度、檢索效率、檢索指令的功能和易用性、保密安全性、管理和支持服務的各種實用程式的齊全性等等。
舉例 國外計算機廠商大多同時提供通用的情報檢索軟體。下表為為中國引進的計算機提供的情報檢索軟體。 國外商業化情報檢索系統通常自己開發適合自己需要的、高效率情報檢索軟體。例如美國的DIALOG、ORBIT,歐洲航天局情報檢索系統的 IRS-QUEST、日本科技情報中心的 JOIS-Ⅱ等,都是自己開發的情報檢索軟體。中國已開發並投入實用的在線上情報檢索軟體有北京文獻服務處(BDS)的BDSIRS 情報檢索軟體,機電工業部機械工業情報研究所的MINISIS 漢化情報檢索系統,中國科學技術情報研究所的漢化CDS/ISIS在線上檢索軟體等。