產品概述
1、系統支持遠程和本地多種格式文檔:PDF、DOC、XLS、PPT、HTM等檔案。
2、 支持Oracle 、Sqlserver 、Sybase、Mysql 等異構資料庫統一檢索查詢。
3、該軟體廣泛套用在數字圖書館、檔案館、專業資料庫、行業資料庫檢索。
在當今信息爆炸的時代,每個單位或個人都在為信息的快速增長做出了各種貢獻。信息的種類也在不斷的擴展,越來越多的非結構化信息不斷出現,包括企業的各種報表、帳單、電子文檔、網站的各種元素、圖片、傳真、掃描影像,以及大量的多媒體的音頻、視頻信息等等。
所有的存儲數據中,有85%採用的是非結構化格式的,非結構化信息每三個月增長一倍。 由於信息格式的差異很大,所以基本無法整合為統一的接口供政府工作人員或廣大民眾方便使用。
Goonie全文檢索系統以先進的信息整合處理技術為核心,為政府及企業建設高性能信息檢索平台,能夠將分散的多種信息集中檢索,讓用戶在一個檢索界面即可獲取到所需的各種相關信息,不論是區域網路的網頁、辦公的文檔、行業的資料庫,對於Goonie都能提供完美的檢索解決方案。
產品架構
Goonie全文檢索系統是一個功能強大、高性能、靈活的全文索引和檢索平台,核心功能是實現對結構化、非結構化信息的全文檢索和統一存儲。Goonie全文檢索系統的主要目標是實現文本索引的快速構建(Index Construction),動態文檔集的索引維護(Index Maintenance),短語查詢(Phrase Query),Top-k查詢的快速處理(Top-k Query Process)以及各種檢索模型(IR Model)等。高性能和靈活的架構也使Goonie全文檢索引擎可以套用在內外網檢索、專業系統資料檢索、行業專業資料庫檢索。
Goonie全文檢索系統支持辦公文檔、動靜態網頁、多種資料庫等格式,支持中文(GB2312和GBK)和英文,靈活的架構也可以方便地擴展支持其他語言和編碼;檢索語法豐富,支持多欄位檢索,日期範圍檢索,檢索結果自定義排序等;系統也可以通過外掛程式無限擴展。
功能特點
強大的信息採集能力
Goonie全文檢索系統是以先進的搜尋技術為核心,並針對專業用戶所要求的搜尋深度深、採集精度高和抓取速度快等進行了專門的最佳化,採用了分散式多執行緒並發指令執行體系結構,95%信息分鐘級到達本地。能夠採集多種動態和靜態網頁類型、多種文檔、資料庫類型,同時網頁實時增量採集技術實現分秒監測網站信息變化動態,使網站隨時獲取最新的信息資源。
分秒級的實時檢索
Goonie全文檢索系統採用獨有的增量實時索引技術保證信息即時採集即時檢索,使用戶隨時檢索到行業/地區最新的信息。
快速的檢索回響
Goonie全文檢索系統可實現亞秒級的檢索速度以及每秒上百次的並發檢索支持,保證全面快速的回響用戶檢索需求。
全面的檢索功能
Goonie全文檢索系統可實現全文檢索,完全支持布爾邏輯檢索、支持n階漸進檢索、支持同義詞檢索、支持自定義用戶詞典,模糊檢索,相關檢索等,並可以由系統管理員人工過濾不當網頁,為用戶提供最為適當的檢索結果。
精確的檢索結果
Goonie全文檢索系統採用智慧型中文切詞技術,避免中文檢索的歧義與多義現象,同時採用相關性算法對網頁進行排序,保證檢索相關性最高的頁面放在最前面。
豐富的檢索結果展示
Goonie全文檢索系統為用戶提供豐富的檢索結果展示,能夠根據每個網站的不同風格和要求定製結果顯示模版。檢索結果包括智慧型動態摘要、獨有的網頁快照,以及多種檢索結果排序方式等。能夠極大的方便用戶對檢索結果的瀏覽查看,提高用戶對檢索效果的滿意度。
基於Web的系統管理平台
Goonie全文檢索系統採用標準的B/S架構,系統管理員可以隨時隨地通過瀏覽器登入Web管理界面對整個系統的各項功能進行管理和系統維護,操作簡單易用,無需專業培訓即可迅速上手。
產品優勢
無論是網頁、文檔、資料庫均能實現增量檢索,同步信息的變化。 實時索引技術保證信息索引時檢索。 亞秒級的檢索速度,海量信息瞬間回響。 每秒上百次的並發量支持。 獨有的同義詞、近義詞等檢索功能,滿足多種檢索需求。 如果是網頁信息則可以提供完整的快照效果。 先進的中文切分詞技術,避免中文檢索的歧義與多義現象,確保檢索結果的準確。 豐富的檢索結果顯示方式,人性化的設計可以使用戶以最適合自己使用的方式呈現檢索結果。
運行環境
Microsoft Windows XP/NT/2000/2003/
Linux/Unix/Aix