數據採集模組:可以令使用者瞬間建立一個擁有龐大內容的網站或論壇,支持遠程圖片、Flas等下載。
有害信息自審自查模組:只需告訴爬爬需要檢測的域名,即可全面檢查網站內容,分析國家嚴令禁止出現的有害信息,讓您輕輕鬆鬆做站長。
網站備案模組:是專為天津市公安局提供的備案功能,凡屬於天津的ISP、IDC、ICP(即網站主辦者)均需使用該系統進行數據備案。
爬爬系統五大特點
易用性:
從安裝到使用,只需點幾下滑鼠,就可以滿足您的要求。
靈活性:
無限層抓取:網站結構有簡單和複雜的兩種,傳統的軟體只能針對簡單的網站結構進行抓取,對於爬爬而言,不管簡
單的還是複雜的網站結構,爬爬能都幫您輕鬆搞定。
跨層存儲:每一層抓取的內容都可以進行自由組合,解決您的數據管理難題。
跟蹤更新:設定成功後,開機無需再進行任何人工操作,程式即能進行自動跟蹤更新內容,可以長時間無人看守的工
作,為用戶節省每一分鐘。
多種編碼格式:系統支持GB2312、UTF-8、Big5等多種編碼格式。
三種備份模式:存在TXT、CSV或HTML檔案,存入Access、MySQL、MsSQL資料庫,存存.SQL檔案。
有害信息自審自查:只需告訴爬爬需要檢測的域名,即可全面檢查網站內容,分析有害信息,並在最短時間告知您。
有害信息白名單:通過白名單您可以根據需要排除非有害信息關鍵字詞。
有害信息黑名單:通過黑名單您可以根據需要添加有害信息關鍵字詞。
通用性:
不管您需要的是網站還是論壇的數據,爬爬都可以做到。
穩定性:
系統占用資源少,程式穩定。
高效性:
多任務+多執行緒:可以同時執行多個採集任務,每個任務又可以使用多個執行緒 。
歷史記錄:支持歷史記錄功能,有效避免重複採集。
相關詞條
-
爬網
爬網:對內容進行爬網是指系統訪問和分析內容及其屬性(有時稱為“元數據”)從而建立可提供搜尋查詢服務的內容索引的過程。
定義 爬網內容 爬網原因 爬網情況 執行方法 -
爬行者[Minecraft常見生物]
爬行者(Creeper)是沙盒遊戲《Minecraft(我的世界)》的一種十分常見的敵對生物,接近玩家後會自爆的攻擊型生物,同時也是Minecraft的...
屬性 生成 掉落物 行為 高壓爬行者 -
爬電
在絕緣材料的性能降低時受天氣等外界因素如空氣濕度大,接連陰天霉雨季節,潮濕環境等使得帶電金屬部位與絕緣材料產生象水紋樣電弧沿著外皮爬的現象。
基本信息 爬電距離 爬電比距 -
爬架
爬架又叫提升架,依照其動力來源可分為液壓式、電動式、人力手拉式等主要幾類。它是近年來開發的新型腳手架體系,主要套用於高層剪力牆式樓盤。它能沿著建築物往上...
爬架簡介 爬架安裝流程: -
爬電比距
電力設備外絕緣的爬電距離與設備最高工作電壓有效值之比,單位為mm/kV。 絕緣子的爬電比距定義為絕緣子的爬電距離與該絕緣子上承載的最高運行電壓的方均根值之比。
爬電 爬電比距簡介 -
爬行者運輸車
"美國航天局的“爬行者”的尺寸比肯塔基州煤礦里的鏟煤機大得多,算得上世界最大的運輸車。 外觀“爬行者”的4個角上各“長”著一隻“大腳”——4輛長12.6...
簡介 動力 -
青蛙爬進了教室
《百年百部中國兒童文學經典書系》的入圍尺度界定在以下幾個方面:一是看其作品的社會效果、藝術質量、受少年兒童歡迎的程度和對少年兒童影響的廣度,是否具有歷久...
圖書簡介 作者簡介 圖書目錄 -
爬三
爬三,是中國廣泛流傳的一種民間紙牌遊戲,有些地區叫片三張、詐金花、三跟。
簡介 遊戲規則 用語解釋 牌型說明 喜錢說明