谷歌搜尋伺服器介紹
二十一世紀是信息爆炸的時代,政府、企業、高校的信息化建設取得很大進展,紛紛建成了各自的內部信息網路和各種套用系統,數據量爆炸式增長,海量的數據信息以資料庫、MS-Office、TXT、PDF、HTML等多種形式存在於各台伺服器或其他存儲設備中。結構化信息和非結構化信息並存,信息存儲方式多種多樣,不同的子系統使用不同的資料庫並共同存在於Intranet中,很容易形成信息“孤島”,給信息查找帶來了極大的挑戰。先進的搜尋工具,可以幫助用戶極大的提高搜尋效率,更快更全面地從海量的資料中查找到需要的信息。
Google Search Appliance(以下簡稱GSA)是一套軟硬體集成的整體解決方案,能夠對政府、企業、高校、協會等機構擁有的網頁、文檔、資料庫等相關信息進行高效安全的通用搜尋,它支持的檔案格式達220 余種,可索引的文檔數量高達數十億。
GSA可以查詢您現有系統內的文檔,幫助您在內容管理上的工作,包括:檔案共享、Web伺服器、檔案管理系統和企業套用等。搜尋伺服器充分利用現有設備提供最高質量、最高匹配度的文檔資料,而不用考慮文檔的來源和格式。包括:人員搜尋,即搜尋有關組織中的人員背景信息,能夠立即與他們取得聯繫並開展協作;以及搜尋所有在SharePoint2010的內容,包括HTML、Office、PDF、PostScript,WordPerfect和Lotus Note及其它很多格式。還可以為您提供實時業務數據,例如ERP、CRM或商業智慧型系統中的數據資料等。不僅如此,GSA還能通過入口網站、內容管理系統、檔案共享等方式查詢非Web訪問的內容。
GSA提供全面的搜尋功能,並可使用戶在內部區域網路進行搜尋時達到與谷歌搜尋引擎同樣的搜尋效果。可搜尋區域網路、檔案伺服器、入口網站、已分享檔案、資料庫、目錄管理系統、業務套用系統等數據,為您提供真正的“全面搜尋”。
GSA特點
GSA確保搜尋安全
GSA具有嚴格的安全性,並可以整合企業的安全機制,支持單點登錄以及多種審核機制以確保搜尋安全性。GSA支持早期綁定和後期綁定的選擇,不同級別的用戶只能看到其有權查看的內容資源的搜尋結果。GAS同樣支持大量的身份驗證和個人登入服務機制,包括:Windows完整身份驗證、X.509客戶端證書、Keberos認證、SAML組策略管理、SAML的API認證等。並集成了LDAP、NTLM和Windows身份認證,包括Oracle訪問管理和CA SiteMinder的登錄認證。另外,系統管理員可定義SAML的SPI身份訪問控制,並且在單點登錄域後可查詢多個域中內容。
GSA使用方便快捷
GSA提供便捷的解決方案--“開箱即用”,無需複雜的配置,更節約了定製硬體和作業系統的費用。用戶可以進一步自定義搜尋功能,如源、日期、元數據、收集和節點偏置、全陣列等。此外,GSA還允許用戶自定義用戶界面和安全機制。
無論您使用的是哪種語言,GSA都可以自動檢測,並支持包括中文、英文、法語、德語、西班牙語、日語、芬蘭語、葡萄牙語等在內的27種語言。同時GSA還能進行自動拼寫檢查,包括錯別字和錯誤拼寫都可以反饋給用戶正確的結果。在部分語言中,甚至可以對短語進行拼寫檢查並修正。
GSA將根據您個人的使用習慣和搜尋偏好等方面進行學習,使得您的查詢結果越來越精準。
內容整理:為管理員和用戶提供內容分組和歸類功能,以滿足用戶特定需求。
高級語言段落分類:提供多種語言段落分類,包括中文、日文、韓文、泰文等。
查詢最佳化功能:通過查詢最佳化功能,可鍵入少量信息即可完成查找,幫助用戶快速瀏覽。
定製搜尋:根據不同部門和職能需要,可為不同用戶群調整搜尋結果。
社會性搜尋:自動建議使用者從搜尋查詢中選擇最適合的結果。
網路新聞定製服務:員工可以按照他們設定的日期訂閱關於重要主題和文檔的電子郵件提醒服務。
動態分類 :使用戶通過下拉選單指向特定的主題並更容易的進行搜尋最佳化,並按照標題將搜尋結果進行分類。
使用 HTML 進行搜尋呈現:自動將220多種檔案格式進行重新排列,並以HTML展現,並不需要原來的應用程式。
日期和數字排序:通過日期範圍和年齡、數據範圍和數字等對文檔進行排序。
高級布爾搜尋:使用布爾參數進行複雜查詢。
相關查詢:定義和建議公司特定的專業術語和縮略語。
關鍵字匹配:對應於特定查詢,優先結果顯示在大量搜尋結果的上方。
GSA的優勢
GSA具有可擴展的架構,您可以使用多個GSA,在大量內容中共同搜尋,並且不用改變軟體和硬體以及現有的部署規模。您甚至不必關心具體有多少部GSA在運行,因為無論GSA數量的多少,您的搜尋結果都將保持一致。
在多台GSA同時運行的情況下,Active-Active Mirroring技術將搜尋流量分別引導到GSA的主搜尋設備和副搜尋設備上,有效的提高了自身的可用性,使得系統負載均衡。並基於GSA現有的鏡像架構,能夠將搜尋請求分布開,從而使得所有節點都可以提供服務。該架構允許多台GSA進行實時索引更新,並允許Crawling僅發生一次。而其他GSA則可以用來處理額外的疑問負載或者用作熱備份單元。在一個工作組中分布的Crawling Multiple GSAs可以智慧型地分配任務來加速搜尋速度。
Google還可提供更多的與其他系統的連線內容,包括:
·EMC Documentum
·IBM FileNet
·微軟SharePoint
·OpenText LiveLink
·BEA AquaLogic
·EMC Documentum eRoom
·Hummingbird
·IBM WebSphere
·Domino Lotus Notes
·Oracle內容伺服器(Stellent)
·SAP 知識管理
以及開放式架構平台的任何其他內容
產品型號
GB -7007
GSA包括軟體和硬體,以及兩年的服務。打包購買的模式消除了昂貴的年度維護費,並消除成本超支的威脅。我們對您的整個用戶群所查詢的數量沒有限制,不再增加額外費用。
GB -7007採用的硬體是機架式設備,厚度為2U,可查詢文檔數量為50萬至1000萬。此外,多個GB -7007可以連線在一起,以支持更大的檔案查詢數量。多個GB-7007連線的方式也可用於多個部門、地區或網站搜尋。在RAID架構與冗餘組件的基礎上,GB -7007提供了內置的冗餘。
GB-7007可通過單一平台解決所有企業搜尋內容,用戶可以輕鬆升級,無需更換硬體或軟體許可。
GB -9009
對於多個業務單位或大型網站來說,可能需要查詢更多的文檔,GB -9009應運而生,它可以搜尋多達3000萬檔案。與GB-7007一樣,多個GB -9009設備可以連線在一起,搜尋數億乃至數十億的檔案。GB -9009支持內置冗餘和故障切換,提供最高的容量和可靠性。
GB-9009可通過單一平台解決所有企業搜尋內容,用戶可以輕鬆升級,無需更換硬體或軟體許可。
典型用戶及用戶反饋
典型用戶
目前Google企業搜尋已經有了25000個企業用戶, 其中包括:
阿拉巴馬州國土安全部、美國食品和藥物管理局、國家公園管理處、美國運通、蘋果電腦、波音公司、英國石油公司、英國航空公司、美國康菲石油公司、探索通信、依視路、霍尼韋爾、惠普、金佰利、美敦力公司、摩根史坦利、國家半導體、北方信託公司、路透社、佛羅里達大學、沃達豐、世界銀行、施樂等
我們的客戶說.
“我建議所有機構使用GSA。它驚人地大幅增加了WellStar的能力、知識和效率。”
-Robert Zanin,Systems analyst manager,Wellstar Health System
“即使我們的19,000名員工,在搜尋信息上花費的時間只是節省了一點點,那么我們提高的生產效率所帶來的收益將很快付清GSA的費用。”
-Haroon Suleman,Global IT Enterprise Architect,Mercer
“在我們平均查找信息所花費約12分鐘的時間裡,如果能減少一分半到兩分的時間,那就意味著浪費也減少了10-15%。我們相信,GSA在帶給我們提高的同時,會讓我們省下該節省的錢。 “
—Ray Coyle, Global Workplace Services Manager, HP Enterprise Services