全文搜尋

全文搜尋

全文檢索是指計算機索引程式通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置,當用戶查詢時,檢索程式就根據事先建立的索引進行查找,並將查找的結果反饋給用戶的檢索方式。這個過程類似於通過字典中的檢索字表查字的過程。全文搜尋搜尋引擎資料庫中的數據。

基本信息

方法

全文搜尋全文搜尋
主要分為按字檢索和按詞檢索兩種。按字檢索是指對於文章中的每一個字都建立索引,檢索時將詞分解為字的組合。對於各種不同的語言而言,字有不同的含義,比如英文中字與詞實際上是合一的,而中文中字與詞有很大分別。按詞檢索指對文章中的詞,即語義單位建立索引,檢索時按詞檢索,並且可以處理同義項等。英文等西方文字由於按照空白切分詞,因此實現上與按字處理類似,添加同義處理也很容易。中文等東方文字則需要切分字詞,以達到按詞索引的目的,關於這方面的問題,是當前全文檢索技術尤其是中文全文檢索技術中的難點。

系統

全文搜尋全文搜尋
全文檢索系統是按照全文檢索理論建立起來的用於提供全文檢索服務的軟體系統。一般來說,全文檢索需要具備建立索引和提供查詢的基本功能,此外現代的全文檢索系統還需要具有方便的用戶接口、面向WWW的開發接口、二次套用開發接口等等。功能上,全文檢索系統核心具有建立索引、處理查詢返回結果集、增加索引、最佳化索引結構等等功能,外圍則由各種不同套用具有的功能組成。結構上,全文檢索系統核心具有索引引擎、查詢引擎、文本分析引擎、對外接口等等,加上各種外圍套用系統等等共同構成了全文檢索系統。

常用

最常用的全文搜尋引擎有百度、谷歌(Google)等。與之相對應的是目錄索引類搜尋引擎。

搜尋引擎分類

全文搜尋;目錄搜尋;元搜尋;垂直搜尋。

相關詞條

相關搜尋

熱門詞條

聯絡我們