樂思新聞採集系統

運行環境作業系統:Win XP/NT/2000/2003記憶體: 最低32M記憶體,建議128M或以上硬碟:

樂思新聞採集系統:樂思軟體公司推出的專門用於採集網路新聞的網路採集軟體。

一、 主要功能
樂思新聞採集系統的主要功能為:根據用戶自定義的任務配置,批量而精確地抽取目標網路媒體欄目中的新聞或文章,轉化為為結構化的記錄(標題,作者,內容,採集時間,來源,分類,相關圖片等),保存在本地資料庫中,用於內部使用或外網發布,快速實現外部信息的獲取。 功能示意圖如下所示:
 
  二、 系統特點
對目標網站進行信息自動抓取,支持HTML頁面內各種數據的採集,如文本信息,URL,數字,日期,圖片等。
用戶對每類信息自定義來源與分類
可以下載圖片與各類檔案,如PDF,Flash等
支持用戶名與密碼自動登錄
支持命令行格式,可以Windows任務計畫器配合,定期抽取目標網站
支持記錄唯一索引,避免相同信息重複入庫
支持智慧型替換功能,可以將內容中嵌入的所有的無關部分如廣告去除
支持多頁面文章內容自動抽取與合併
支持下一頁自動瀏覽功能
數據直接進入資料庫而不是檔案中,因此與利用這些數據的網站程式或者桌面程式之間沒有任何耦合
支持資料庫表結構完全自定義,充分利用現有系統
支持多個欄目的信息採集可用同一配置一對多處理
保證信息的完整性與準確性,絕不會出現亂碼
支持各種主流資料庫,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等

三、 運行環境
作業系統:Windows XP/NT/2000/2003
記憶體: 最低32M記憶體,建議128M或以上
硬碟: 最少20M空餘硬碟空間

相關詞條

熱門詞條

聯絡我們