橫瓜全文搜尋引擎

橫瓜全文搜尋引擎是一款套用軟體,適用於pc平台。

運行環境

支持Win7/XP/2000/2003/Vista

軟體介紹

橫瓜全文搜尋引擎,是基於Windows平台的全文搜尋引擎(不提供網路蜘蛛和網路爬蟲),最大容量150萬網頁.對於150萬網頁規模的數據,可在30分鐘內完成所有架構工作.橫瓜全文搜尋引擎分詞速度約為2500萬字/分鐘,約占99.984%的關鍵字檢索時間小於0.001秒.橫瓜全文搜尋引擎的PC硬體配置,僅需要700M記憶體、空閒硬碟10G、檔案系統NTFS.橫瓜全文搜尋引擎,主要採用橫瓜分散式Map資料庫技術、分詞索引技術、最大左匹配切詞技術、倒排技術、MD5摘要信息抽取技術、新詞智慧型識別技術、硬碟整理加速技術、疑似垂直搜尋技術、中文海量詞典技術、橫瓜HTTP檢索伺服器web-search快取技術、HTM轉換TXT技術等.安裝說明:1、第一次使用軟體前,先執行Setup.exe.程式add.exe、body.exe、title.exe為系統核心,勿動!2、架構搜尋步驟:須依次單擊websearch.exe程式中的按鈕"數據清零"導入記錄"標題分詞"正文分詞"WWW查詢"3、數據清零.建立新的搜尋之前,須單擊"數據清零"按鈕來清除舊數據和舊索引.4、websearch.exe可管理記錄、索引、分詞等,若要執行HTTP檢索查詢服務,websearch.exe須掛機.5、數據導入.在web目錄下,有Access格式的輸入接口檔案web.mdb(欄位id取值越小排名越靠前).將待處理數據輸入到web.mdb後,單擊"導入記錄"按鈕,web.mdb中的記錄被導入到web.dat.在檢索時直接從web.dat取記錄,web.mdb僅起接口作用,導入完成後可自願刪留.對於增量記錄,可允許從web.mdb中多次導入新記錄,但新增量的記錄,檢索排名靠後,增量導入後,須再依次單擊按鈕"標題分詞"正文分詞"後,才能被檢索到.6、websearch.exe掛機後,從IE中輸入"http:IP位址或域名:7777"可檢索查詢.在www目錄下,存有搜尋引擎的主頁和LOGO,客戶可以根據個性需要自行修改.7、使用本軟體,必須開放連線埠:7000、7001、70002、70003、70004、7777、77788、本軟體使用的基礎詞典已經用MD5加密封裝,用戶可以在dic.txt中自由添加新詞,新詞被添加到dic.txt後,被檢索的幾率變大.若不添加新詞,也可以被檢索到,只是幾率稍小些.9、web目錄中web.mdb的記錄是贈送測試用的,可以將待處理數據輸入"模板web.mdb"替換該檔案.10、不得將本軟體用於贏利目的、銷售他人、非法用途等,否則將會被追究法律責任.

熱門詞條

聯絡我們