全文檢索:全文檢索是一種將檔案中所有文本與檢索項匹配的文字資料檢索方法。 -百科知識中文網

基本介紹

全文檢索是將存儲於資料庫中整本書、整篇文章中的任意內容信息查找出來的檢索。它可以根據需要獲得全文中有關章、節、段、句、詞等信息，也就是說類似於給整本書的每個字詞添加一個標籤，也可以進行各種統計和分析。例如，它可以很快的回答“《紅樓夢》一書中“林黛玉”一共出現多少次？”的問題。

與之相關議題

語根處理(stemming)
符素解析器(tokenparser)1-gram,2-gram,n-gram
斷詞/分詞wordsegmentation
倒排索引invertedindex
算法、搜尋策略之模型
布林式boolean
統計模型Probabilisticmodel
向量空間模型vectorbasemodel
隱性語義模型Latentsemanticmodel

系統檢索

評量之準則
判斷檢索效果的兩個指標：
查全率=被檢出相關信息量/相關信息總量（%）
查準率=被檢出相關信息量/被檢出信息總量（%）

開放原始碼

ApacheSolr
BaseX
ClusterpointServer(freewarelicenceforasingle-server)
DataparkSearch
Ferret
Ht-//Dig
HyperEstraier
KinoSearch
Lemur/Indri
Lucene
mnoGoSearch
Sphinx
Swish-e
Xapian
ElasticSearch

議題最佳化

和中文有關的議題
斷詞（分詞）
語法解析
古籍議題
多語言混合
最佳化
剔除字(Stopwords)
詞性標註
權威檔(authorityfile)
知識體系，本體論(ontology)
超連結分析(pagerank)技術
歷史及未來之趨勢
自由語句搜尋
基於自然語言的分詞

全文檢索

基本信息

基本介紹

與之相關議題

系統檢索

開放原始碼

議題最佳化

相關詞條

全文檢索系統軟體

全文檢索技術

說文解字全文檢索

全文檢索產品

全文檢索器

雅風全文檢索器V4.0

XML文檔全文檢索的理論與方法

全文資料庫

相關搜尋

熱門詞條