我們可以分為2種:
那么什麼是深度優先? 什麼是廣度優先?有什麼用? 上海SEO (SWJ) 下面為大家講解 !
本人學知淺薄 只會用 通俗的話與道理與大家分析 如有錯誤請及時聯繫我 所以還請大家多多見諒包含!
一種是 深度優先策略 一種是 廣度優先策略! 以下我們就圍繞這2點進行分析 SWJ 非常歡迎大家一起交流 學習與探討!
深度優先 顧名思義就是 讓 網路蜘蛛 儘量的在抓取網頁時 往網頁更深層次的挖掘進去 講究的是深度!
也泛指: 網路蜘蛛將會從起始頁開始,一個連結一個連結跟蹤下去,處理完這條線路之後再轉入下一個起始頁,繼續跟蹤連結!
以下我發張圖 大家看下: (下面這張是 簡單化的網頁連線模型圖 其中A為起點 也就是蜘蛛索引的起點!)
總共分了5條路徑 供蜘蛛爬行! 講究的是深度!
(下面這張是 經過最佳化的網頁連線模型圖! 也就是改進過的蜘蛛深度爬行策略圖!)
根據以上2個表格 我們可以得出以下結論:
圖1:
路徑1 ==> A --> B --> E --> H
路徑2 ==> A --> B --> E --> i
路徑3 ==> A --> C
路徑4 ==> A --> D --> F --> K --> L
路徑5 ==> A --> D --> G --> K --> L
經過最佳化後
圖2: (圖片已經幫大家標上方向了!)
路徑1 ==> A --> B --> E --> H
路徑2 ==> i
路徑3 ==> C
路徑4 ==> D --> F --> K --> L
路徑5 ==> G
深度爬行的優點是:
網路蜘蛛程式在設計的時候相對比較容易些把 其他我也沒發覺有什麼優點... 還有就是 蜘蛛的這種 "勇往直前"的精神 值得學習下! ^_^
深度爬行的缺點是:
缺點么 多了一點點 呵呵! 每次爬行一層 總要向"蜘蛛老家" 資料庫訪問一下 問問老總有必要還要爬下一層嗎! 爬一層 問一次.... 引用一句高人的話 如果一個蜘蛛不管3721不斷往下爬 很可能迷路 更有可能爬到國外的網站去.. 本來目標是中文網站 因為IP的問題 國外IP做了中文站的話.... 就容易去別人"老家"了..這樣不僅增加了系統數據的複雜度 更是增加的伺服器的負擔 我想沒有一家搜尋公司會願意則樣的把,...除非腦子"秀"了 .. ^_^
相關詞條
-
深度優先搜尋
深度優先搜尋是一種在開發爬蟲早期使用較多的方法。它的目的是要達到被搜尋結構的葉結點(即那些不包含任何超鏈的HTML檔案)。在一個HTML檔案中,當一個超...
解釋 思路 窮舉 系統算法 基本框架 -
dfs[深度優先搜尋]
深度優先搜尋是一種在開發爬蟲早期使用較多的方法。它的目的是要達到被搜尋結構的葉結點(即那些不包含任何超鏈的HTML檔案) 。在一個HTML檔案中,當一個...
詳細解釋 基本思路 窮舉 系統算法 基本框架 -
廣度優先策略
就是一層一層的爬行 廣度爬行的優點是: 廣度爬行的缺點是:
-
廣度優先遍歷
廣度優先遍歷是連通圖的一種遍歷策略。因為它的思想是從一個頂點V0開始,輻射狀地優先遍歷其周圍較廣的區域,故得名。
基本思想 性質 算法 深度比較 報告 -
搜尋策略
搜尋是人工智慧中的一個核心技術,是推理不可分割的一部分,它直接關係到智慧型系統的性能和運行效率。搜尋問題中,主要的工作是找到正確的搜尋策略。搜尋策略反映了...
過程 分類 -
行銷策略
行銷策略是企業以顧客需要為出發點,根據經驗獲得顧客需求量以及購買力的信息、商業界的期望值,有計畫地組織各項經營活動。
背景 行銷目的 行銷策劃 行銷要點 行銷方略 -
算法策略
算法策略是指在問題空間中隨機搜尋所有可能的解決問題的方法,直至選擇一種有效的方法解決問題,在行政規劃,數學驗證及物理檢測等領域有著非常重要的作用。
算法種類 算法策略間的關係 共同點 -
資源管理策略
輔助學生管理可用的環境和資源的策略,對學生的動機有重要的作用。它主要包括時間管理策略、學習環境管理策略、努力管理策略、尋求支持策略等。成功的使用這些策略可以幫助學生適應環境以及調節環境以適應自己的需要...