起源
世界上最早的元搜尋是metacrawler,它是infospaceinc.的一部分,初始網上運行時間為1995年,是由華盛頓大學的學生erik和教授oren etzin共同開發研製的。它是全球資訊網搜尋引擎metacrawler的姐妹引擎,是一個並行式的元搜尋引擎。具有同時調用Google、Yahoo、Ask Jeeves About、LookSmart、TeomaOverture、FindWhat等搜尋引擎的功能,然後按相關度給出精確,詳細的結果。它可以對網頁、圖像、音頻、多媒體、新聞、購物等進行選擇檢索,還提供了如下高級檢索功能:
提高你檢索的品質(Qualify Your Search):你可以創建一個特定的檢索,查詢一個精確的欄位,或者排除包含特定詞的頁面。
使用布爾邏輯符檢索(Use Boolean Terms):在關鍵字中使用and,or和not布爾邏輯檢索符,使得檢索結果更精確。
最後更新頁面(Last Page Update):使用After來查詢特定日期後更新的結果,使用Before來查詢在特定日期前更新的結果。同時選擇After和Before,將檢索出兩個日期之間的結果。
域名過濾(Domain Filter):可以排除以.com、.gov、.edu結尾的域名,你也可以包括一個特殊的包含.com的域名。
成人過濾(Adult Filter):可以包含或者過濾掉Web檢索結果中的成人內容。
語言選擇(Language Selection):可以選擇返回結果所用的語言。
結果展示(Results Display):可以選擇檢索結果排序的方式,按與檢索詞的相關性排序或者按搜尋引擎展示結果的順序排序。
相關術語
簡單搜尋(Simple Search)指輸入一個單詞(關鍵字),提交搜尋引擎查詢,這是最基本的搜尋方式。
詞組搜尋(Phrase Search)指輸入兩個單詞以上的詞組(短語),提交搜尋引擎查詢,也叫短語搜尋。現有的搜尋引擎一般都約定把詞組或短語放在引號“”內表示。
語句搜尋(Sentence Search)指輸入一個多詞的任意語句,提交搜尋引擎查詢,這種方式也叫任意查詢。不同搜尋引擎對語句中詞與詞之間的關係的處理方式不同。
目錄搜尋(Catalog Search)指按搜尋引擎提供的分類目錄逐級查詢,用戶一般不需要輸入查詢詞,而是按照查詢系統所給的幾種分類項目,選擇類別進行搜尋,也叫分類搜尋(Classified SearCh)。
高級搜尋(Advance Search)指用布爾邏輯組配方式查詢,也叫定製搜尋。常用的邏輯運算為AND(和)、 OR(或)和NOT(非)。
上述前3種搜尋方式可以合稱為詞語搜尋(Word Search),與高級搜尋和目錄搜尋一起構成3類常見搜尋方式。
在所有搜尋方式中,還可使用通配符,就像DOS檔案系統用“*”作為通配符一樣,通配符用於指代一個串字元,不過,每個搜尋引擎所用的通配符不完全相同,大多用“*”或“?”,少數用“$”。
不少搜尋引擎還支持加(+)、減(-)詞操作。 元搜尋引擎(Meta-search engine) 其英文原意是搜尋引擎之後或之上的搜尋引擎,即可以同時查詢多個搜尋引擎的WWW站點。雖然元搜尋引擎依賴其他獨立搜尋引擎而存在,但它們集成了不同性能和不同獨立的搜尋引擎並發展了一些新的查詢功能,查一個元搜尋引擎就相當於查多個獨立搜尋引擎,可以收到事半功倍的效果,故值得選用。
引擎網站
元搜尋引擎在接受用戶查詢請求時,同時在其他多個引擎上進行搜尋,並將結果返回給用戶。著名的國外元搜尋引擎有InfoSpace、Dogpile、Vivisimo等(元搜尋引擎列表),中文元搜尋引擎中具代表性的有比比貓搜尋引擎、搜星搜尋引擎。在搜尋結果排列方面,有的直接按來源引擎排列搜尋結果,如Dogpile,有的則按自定的規則將結果重新排列組合,如Vivisimo。
國外對元搜尋的開發套用很早,目前在美國使用元搜尋引擎和使用Google一樣普遍,當然Google仍然占據美國絕對市場,但元搜尋引擎也一樣生機勃勃,財源滾滾。相比國內,起步很晚,中國首家元搜尋引擎是比比貓(bbmao),於2005年成立,在2006年獲得Red Herring 亞洲100強獎,從而拉開國內對元搜尋的真正關注和探索。比較優秀的元搜尋引擎有搜魅網(someta),整合了百度、谷歌、雅虎等多家主流搜尋引擎的結果,並且獨創網站查詢。
整體來講,國外元搜尋引擎已自成體系,而國內真正長期堅持致力於開發獨特用戶體驗的元搜尋網站並不多。
主要元搜尋引擎列表
國內:·搜魅網(someta)
集合了百度、google、搜狗、雅虎多家主流搜尋引擎的結果,提供網頁、資訊、網址導航等聚合查詢。另外,搜魅網突破了元搜尋引擎沒有自己的蜘蛛的瓶頸,提供了網站查詢的功能。
·比比貓(Bbmao)
獨創國際領先的聚類和去重技術。搜尋結果匯集各大搜尋引擎結果,搜尋結果智慧型分類整理,去掉重複搜尋結果,並擁有直接搜尋文檔和強大網路收藏夾等多元功能。對於記者、教授、高管等知性、高端且惜時如金的人群比較適用,支持中英文搜尋。
·全博元搜尋(QOOPOO)
聚合搜尋的力量,已經運行多年,2006年格林斯潘曾接觸這家公司,後勁比較強勁。
·Xooda元搜尋引擎
支持本地搜尋,一次輸入,返回多個搜尋引擎結果,並對結果進行重新的最佳化排序。
·佐意綜合搜尋(Chinazss)
集主流搜尋引擎為一體,分類詳細,強大的搜尋功能。讓搜尋變得更方便!國外:Vivisimo:是美國Vivisimo公司最新開發的一個具有對搜尋結果自動進行分類功能的搜尋引擎!它能非常快速地將不同類型的網站進行分類整理並將結果呈現在你眼前! 它在搜尋結果頁面左側增加了一個搜尋結果目錄欄。不足之處在於搜尋結果精準度不是很高。
ProFusionProFusion:是並行式元搜尋引擎,擁有智慧型化的搜尋技術、對查詢的實用提示和非常寶貴的個人化搜尋服務,它是很優秀的元搜尋引擎,可同時調用9個獨立全球資訊網搜尋引擎—AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、Webcrawler和Yahoo。
MetaCrawlerMetaCrawler:是獨立全球資訊網搜尋引擎WebCrawler的姐妹引擎,也是一個並行式元搜尋引擎,它條理清晰,組織結構完美,可以同時調用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6個獨立引擎,是簡單搜尋或中度複雜搜尋的最佳網點。
DogpileDogPile:是性能較好的並行式元搜尋引擎之一,它可以同時調用Web搜尋引擎、Usenet搜尋引擎和FTP搜尋引擎等25個搜尋引擎,其中,Web搜尋引擎14個。
DigisearchDigisearch:是能同時調用獨立搜尋引擎較多的並行式元搜尋引擎,它可以同時調用AltaVista、 Excite、 Infoseek、 Lycos、 WebCrawler、 Yahoo、OpenText和 Magellen等 18個獨立全球資訊網搜尋引擎,DejaNews等3個Usenet搜尋引擎和Fourll等3個個人信息和商界信息搜尋引擎。
Highway61Highway61:是並行式元搜尋引擎,可以同時調用AltaVista、Excite、 Infoseek、 Lycos、WebCrawler和Yahoo等6個獨立引擎,並將它們傳回的結果進行排序,顯示給用戶。
MammaMamma:是並行式元搜尋引擎,它自稱是所有搜尋引擎之母(Mother of all Search Engines),它可以同時調用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo等獨立引擎,並且可以查新聞組、商業黃負和發布新聞。
運行流程
用戶通過統一的查詢界面輸入查詢請求,元搜尋引擎對查詢進行一定的預處理。
元搜尋引擎根據成員搜尋引擎調度機制,選擇若干成員搜尋引擎。
元搜尋引擎根據選擇的成員搜尋引擎的查詢格式,對原始查詢請就進行本地化處理,轉換為成員搜尋引擎要求的查詢格式串。
向各個成員搜尋引擎傳送經過格式化的查詢請求,等待返回結果。
收集各個獨立搜尋引擎的返回結果。
對返回結果進行綜合處理,例如,消除重複連結,死連結等,形成最終結果。
以一定的格式將最終結果返回給用戶。
特點
沒有獨立的網頁資料庫。
能夠根據用戶的需求綜合特定的搜尋引擎的搜尋結果。
能夠索引特定類型的搜尋,例如圖片、文檔、網頁、視頻等等。