Sphinx[一種全文檢索引擎]

Sphinx是一種全文檢索引擎。

簡介

Sphinx是一個基於SQL的全文檢索引擎,可以結合MySQL,PostgreSQL做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。Sphinx特別為一些腳本語言設計搜尋API接口,如PHP,Python,Perl,Ruby等,同時為MySQL也設計了一個存儲引擎外掛程式。

Sphinx單一索引最大可包含1億條記錄,在1千萬條記錄情況下的查詢速度為0.x秒(毫秒級)。Sphinx創建索引的速度為:創建100萬條記錄的索引只需 3~4分鐘,創建1000萬條記錄的索引可以在50分鐘內完成,而只包含最新10萬條記錄的增量索引,重建一次只需幾十秒。

特性

sphinx sphinx

Sphinx的主要特性包括:

高速索引 (在新款CPU上,近10 MB/秒);

高速搜尋 (2-4G的文本量中平均查詢速度不到0.1秒);

高可用性 (單CPU上最大可支持100 GB的文本,100M文檔);

提供良好的相關性排名

支持分散式搜尋;

提供文檔摘要生成;

提供從MySQL內部的外掛程式式存儲引擎上搜尋

支持布爾,短語, 和近義詞查詢;

支持每個文檔多個全文檢索域(默認最大32個);

支持每個文檔多屬性;

支持斷詞;

支持單位元組編碼與UTF-8編碼。

相關詞條

熱門詞條

聯絡我們