多元搜尋工具

多元搜尋工具

多元搜尋引擎(Metasearch Engine),是一種調用其它獨立搜尋引擎的引擎,亦稱“搜尋引擎之母(The mother of searce engines)”。在這裡,“元”(Meta)為“總的”、“超越”之意,元搜尋引擎就是對多個獨立搜尋引擎的整合、調用、控制和最佳化利用。相對元搜尋引擎,可被利用的獨立搜尋引擎稱為“源搜尋引擎”(source Engine),或“搜尋資源”(searcing resources),整合、調用、控制和最佳化利用源搜尋引擎的技術,稱為“元搜尋技術”(Meta-searching technique),元搜尋技術是元搜尋引擎的核心。

多元搜尋引擎分為並行處理式和串列處理式兩大類。並行處理式元搜尋引擎將用戶的查詢請求同時轉送給它調用連結的多個獨立型搜尋引擎進行查詢處理,串列處理式元搜尋引擎將用戶的查詢請求依次轉送給它調用連結的每一個獨立型搜尋引擎進行查詢處理。

元搜尋引擎是用戶同時利用多引擎進行網路搜尋的中介。檢索時,元搜尋引擎根據用戶提交的檢索請求,調用源搜尋引擎進行搜尋,對搜尋結果進行匯集、篩選、刪並等最佳化處理後,以統一的格式在同一界面集中顯示。元搜尋引擎雖沒有網頁搜尋機制,亦無獨立的索引資料庫,但在檢索請求提交、檢索接口代理和檢索結果顯示等方面,均有自己研發的特色元搜尋技術支持。如提交檢索請求時,根據源搜尋引擎的特點和技術參數,指定優先順序,並對檢索時間、檢索結果數量進行控制;作為若干源搜尋引擎的檢索接口代理,元搜尋引擎必須具有較強的字元和語法轉換功能,使用戶的檢索請求為各具語法特點的不同的源搜尋引擎所人知和接受; 而對檢索結果的顯示,不同的元搜尋引擎有不同的處理技術,由於元搜尋引擎設定的檢索結果排序依據、最大返回結果數量、相關度參數及最佳化機制等不同,調用相同的源搜尋引擎的不同元搜尋引擎顯示檢索結果的數量多少、排序先後、結果信息描述選擇亦有較大差異。

一款理想的元搜尋引擎應該具備以下特點和功能:第一,含蓋較多的搜尋資源,可隨意選擇和調用源搜尋引擎;其次,具備儘可能多的可選擇功能,如資源類型(網站、網頁、新聞、軟體、FTP、MP3、圖像等)選擇、返回結果數量控制、結果時段選擇、過濾功能選擇等;第三,強大的檢索請求處理功能(如支持邏輯匹配檢索、短語檢索、自然語言檢索等)和不同搜尋引擎間檢索語法規則、字元的轉換功能(如對不支持“NEAR”算符的搜尋引擎,可自動實現由“NEAR”向“AND”算符的轉換等);第四,詳盡全面的檢索結果信息描述(如網頁名稱、URL、文摘、源搜尋引擎、結果與用戶檢索需求的相關度等);第五,支持多種語言檢索。

目前運營的元搜尋引擎各具特色,功能各有側重,完全“理想”的尚不多見。一些元搜尋引擎在某些方面較為優秀,而其它功能則欠缺或需改進:如大多元搜尋引擎不支持多語種,尤其是漢語檢索;一些元搜尋引擎實現檢索語法轉換的能力有限,不支持指定欄位檢索,不能充分發揮各個獨立搜尋引擎的高級檢索功能;部分元搜尋引擎無源搜尋引擎列表,用戶不能自主選擇和調用源搜尋引擎;大部分元搜尋引擎僅支持調用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜尋引擎,一些大型搜尋引擎如NorthernLight、HotBot等被排除在外,人為地限制了搜尋資源的利用;在檢索結果上,元搜尋引擎只能返回十幾、數十條“相關度”較高的結果,大量可能有價值的源搜尋引擎的檢索結果被忽視,影響檢索結果的全面性。元搜尋引擎的功能受著源搜尋引擎和元搜尋技術的雙重製約:一方面,源搜尋引擎的各具特色的強大功能在元搜尋引擎中受到限制而不能充分體現,而另一方面,任何一種元搜尋技術都不能發掘和利用源搜尋引擎的全部功能。

1995年華盛頓大學碩士生 Eric Selberg 和 Oren Etzioni 推出第一個元搜尋引擎---Metacrawler以來,這一新型的網路檢索工具異軍突起,發展迅速,目前可用的元搜尋引擎已近百種。儘管元搜尋引擎存在著這樣那樣的功能局限,但其以含蓋較多的搜尋資源,能夠在儘可能短的時間內提供相對全面、準確的檢索結果等諸多優異功能受到用戶的青睞,已漸成為一種不可或缺的極具潛力的網路檢索工具。

相關詞條

熱門詞條

聯絡我們