基本介紹

與之相關議題
語根處理(stemming)符素解析器(tokenparser)1-gram,2-gram,n-gram
斷詞/分詞wordsegmentation
倒排索引invertedindex
算法、搜尋策略之模型
布林式boolean
統計模型Probabilisticmodel
向量空間模型vectorbasemodel
隱性語義模型Latentsemanticmodel
系統檢索
評量之準則判斷檢索效果的兩個指標:
查全率=被檢出相關信息量/相關信息總量(%)
查準率=被檢出相關信息量/被檢出信息總量(%)
開放原始碼
ApacheSolrBaseX
ClusterpointServer(freewarelicenceforasingle-server)
DataparkSearch
Ferret
Ht-//Dig
HyperEstraier
KinoSearch
Lemur/Indri
Lucene
mnoGoSearch
Sphinx
Swish-e
Xapian
ElasticSearch
議題最佳化
和中文有關的議題斷詞(分詞)
語法解析
古籍議題
多語言混合
最佳化
剔除字(Stopwords)
詞性標註
權威檔(authorityfile)
知識體系,本體論(ontology)
超連結分析(pagerank)技術
歷史及未來之趨勢
自由語句搜尋
基於自然語言的分詞