主要功能
海聚網路信息採集軟體除了可以處理遠程網頁外,還可以處理本地網頁,遠程或本地的文本檔案。
海聚網路信息採集軟體主要用於:入口網站新聞採集,行業資訊採集,競爭情報獲取,資料庫行銷等領域。
軟體優點
最大的優點是:採集方法的靈活性與採集數據的準確性
靈活性:任何複雜的查詢與頁面布局都可以靈活處理
準確性:結果數據高度準確
軟體功能
♦ 支持海量數據採集
♦ 增量採集與自動更新
♦ 支持關鍵字採集,直接輸入關鍵字,一步設定
♦ 支持多種編碼:GBK、BIG5、UNICODE、UTF8,軟體會自動轉換
♦ 支持登錄、驗證後採集
♦ 支持HTML頁面內各種數據的採集,如文本信息,URL,數字,日期,圖片等
♦ 用戶對每類信息自定義來源與分類
♦ 支持命令行格式,可以Windows任務計畫器配合,定期抽取目標網站
♦ 支持智慧型替換功能,可以將內容中嵌入的所有的無關部分如廣告去除
♦ 支持多頁面文章內容自動抽取與合併
♦ 支持下一頁自動瀏覽功能
♦ 支持模擬提交表單
♦ 支持從一個頁面中抽取多個數據表
♦ 支持數據的多種後期處理方式
♦ 軟體運行穩定、採集速度快、占用資源少
♦ 保證信息的完整性與準確性,絕不會出現亂
♦ 支持多頁重組
♦ 支持動態代理
♦ 支持所有主流資料庫:MS SQL Server, Oracle, DB2, MySQL, Sybase, Interbase, MS Access等
運行環境
作業系統:Windows XP/NT/2000/2003/2007
CPU: 雙核或四核CPU,2.0 G Hz以上
記憶體: 最低32M記憶體,建議1G或以上(如2G/4G/8G)
硬碟: 最少20M空餘硬碟空間,建議200G或500G