全文檢索產品

企業搜尋在安全方面的要求遠遠高於網際網路搜尋。企業內部的各種信息內容帶有明顯的安全級別屬性和部門歸屬屬性。幾乎每個企業都嚴格規定了什麼樣的信息可以給什麼樣的人閱讀,某種信息歸屬哪個部門發布與存儲。

“企業級安全”的搜尋引擎

嚴格的信息安全分級體系,保證信息可管理性

起點企業搜尋平台針對企業內部信息系統中,不同的用戶使用許可權不同的這一特點,提供針對用戶、對資源進行許可權分級管理和控制能力,確保企業內部信息系統的安全。各種資源在接入系統時會要求設定安全級別,便於對用戶訪問行為進行控制。

可靠的安全保障手段,實現系統的授權訪問管理

起點企業搜尋平台廣泛採用了用戶帳號許可權控制、IP位址授權和過濾技術,保證對系統的接入安全。通過信息智慧型分析和過濾機制,設定敏感詞表和禁查詞表,對檢索結果中的敏感信息提供安全管理。實現完善的日誌記錄機制,保證信息的訪問和閱讀有據可查,便於及時處理各種信息內容安全隱患。

良好的安全擴展體系,可方便的與內部系統對接

起點企業搜尋平台在數據採集和獲取過程中,通過安全的擴展體系,支持以授權方式訪問內部信息系統、內部文檔目錄,保證安全的基礎上,實現信息的共享服務。支持對內部某些信息系統的許可權統一管理,實現系統間的許可權映射。

多作業系統、多平台、多資料庫支持

本產品支持的作業系統、套用伺服器、資料庫如下:

作業系統 Windows Linux Unix
套用伺服器 Tomcat Weblogic Websphere Resin Apache IIS
資料庫 Mysql Sql Server Oracle DB2 其它……
其它必備環境 JDK1.5 以上版本

支持多數據源採集

通過指定檔案伺服器、數據文檔目錄等方式,靈活管理數據來源,根據不同目錄或來源劃分為後續安全管理提供自動級別信息。根據內容來源,判斷是否需要進行文檔格式化分析,將資料庫直接讀取的結構化信息和半結構化網頁信息通過分析模組和元數據描述進行統一。

除了基於非結構化數據進行採集外,還可對PDF、WORD、HTML、TXT、各種圖片等四十多種檔案格式自動採集。同時根據用戶需要本系統也支持採集其它各類數據源,例如:XML檔案、其它數據池等。

智慧型化的檢索服務

起點產品在全文檢索過程中採用相關智慧型技術以達到迅速、準確、全面定位目標信息。例如採用相關度分析技術,使相關度較高的結果排在結果列表的前面,相關度較低的結果排在後面,並禁止無用和錯誤的信息;構造強大的語義規則庫,使系統能夠正確地判斷與檢索詞相關的同義詞、近似詞、上位詞、下位詞,幫助用戶判斷結果的相關度,並進行進一步的查詢;支持完善的信息分類體系,對檢索結果自動分類或者信息聚類;提供智慧型化的概念擴展查詢等。通過這些技術,能夠滿足大多數智慧型化搜尋需求。

強大的信息海量數據實時索引和管理功能

起點產品不僅提供了快速檢索功能(在千萬級數據下,全文檢索能在1秒鐘之內完成),同時也有著高效的海量數據處理能力。每小時能處理百萬的資料庫數據,或是幾十萬篇的文檔。包括中文的分詞和建立數據索引。我們的產品在多個大型項目中經過了實際的檢驗,成功實施過多個超過5千萬數據規模的項目。

中文語言處理技術

中文語言處理是搜尋引擎必須具備的技術之一,套用中文語言處理技術才能使搜尋結果更加符合用戶習慣,更加接近用戶的期望結果,起點產品集成了中文分詞技術,並有著40萬詞庫的支持,用戶也可以根據自己的需要和行業特色來添加和維護詞庫。中文分詞技術的準確率和召回率都達到96%以上。

健壯可靠的系統,按需擴展

針對大型套用系統和海量數據的環境,提供多機分散式或雙機互備的服務體系結構,通過把企業內部各種內容分布到不同伺服器,可實現用戶的套用層實現透明訪問,支持松耦合自動切換的雙機備份策略,提高系統的運行可靠性。分散式架構允許通過增加硬體的方式增加系統處理能力。8. 支持多種語言開發接口,與其他系統無縫集成 起點產品以標準的WebService和標準XML方式提供多種語言開發接口,支持的語言包括.NET,JAVA,PHP等。可與各類WEB套用進行無縫集成。同時提供完善的二次開發API手冊幫助及套用示例。

操作簡易、維護方便

起點產品提供完整的後台界面,所有配置和操作都可以通過IE訪問產品後台進行,操作簡易,維護方便,同時也不影響伺服器的安全性。

相關詞條

相關搜尋

熱門詞條

聯絡我們