pagerank

pagerank

pagerank是Google排名運算法則(排名公式)的一部分,是Google用於用來標識網頁的等級/重要性的一種方法,是Google用來衡量一個網站的好壞的唯一標準。在揉合了諸如Title標識和Keywords標識等所有其它因素之後,Google通過PageRank來調整結果,使那些更具“等級/重要性”的網頁在搜尋結果中令網站排名獲得提升,從而提高搜尋結果的相關性和質量。

簡介

(圖)pagerankpagerank
PageRank,簡稱為PR值,又稱網頁級別、Google左側排名或佩奇排名。Pagerank取自Google的創始人LarryPage,它是Google排名運算法則的一部分,Pagerank是Google對網頁重要性的評估,是Google用來衡量一個網站的好壞的唯一標準。Google通過PageRank來調整結果,使那些更具“重要性”的網頁在搜尋結果中另網站排名獲得提升,從而提高搜尋結果的相關性和質量。PR值的級別從1到10級,10級為滿分。PR值越高說明該網頁越受歡迎。

概念原理

PageRank是Google算法的重要內容。2001年9月被授予美國專利,專利人是Google創始人之一拉里•佩奇(LarryPage)。因此,PageRank里的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名的。但是後來人們還是習慣將PageRank稱為網頁等級

Google的PageRank根據網站的外部連結和內部連結的數量和質量倆衡量網站的價值。PageRank背後的概念是,每個到頁面的連結都是對該頁面的一次投票,被連結的越多,就意味著被其他網站投票越多。這個就是所謂的“連結流行度”——衡量多少人願意將他們的網站和你的網站掛鈎。

PageRank這個概念引自學術中一篇論文的被引述的頻度——即被別人引述的次數越多,一般判斷這篇論文的權威性就越高。Google有一套自動化方法來計算這些投票。Google的PageRank分值從0到10;PageRank為10表示最佳,但非常少見,類似芮氏規模(Richterscale),PageRank級別也不是線性的,而是按照一種指數刻度。這是一種奇特的數學術語,意思是PageRank4不是比PageRank3好一級——而可能會好6到7倍。因此,一個PageRank5的網頁和PageRank8的網頁之間的差距會比你可能認為的要大的多。PageRank較高的頁面的排名往往要比PageRank較低的頁面高,而這導致了人們對連結的著魔。在整個SEO社區,人們忙於爭奪、交換甚至銷售連結,它是過去幾年來人們關注的焦點,以至於Google修改了他的系統,並開始放棄某些類型的連結。比如,被人們廣泛接受的一條規定,來自缺乏內容的“linkfarm”(連結工廠)網站的連結將不會提供頁面的PageRank,從PageRank較高的頁面得到連結但是內容不相關(比如說某個流行的漫畫書網站連結到一個叉車規範頁面),也不會提供頁面的PageRank。Google選擇降低了PageRank對更新頻率,以便不鼓勵人們不斷的對其進行監測。

發明經過

在完成網路搜尋並存儲了連結圖之後,還需要找到評定等級的方法。這時佩奇發現,對所有指向某網頁的連結數量的計算對於確定該網頁的等級具有指導意義,這種方法帶來了新的挑戰——困難而複雜的遞歸性數學運算。布林的數學天賦提供了幫助。他們發明了一種新算法,基於重要的來源連結來評價網頁的重要性,這種算法以佩奇的姓(Page)命名,因此叫佩奇排名(PageRank)。

在佩奇和布林發明了PageRank算法後,他們編寫了一個PageRank搜尋工具,然後用PageRank來為結果的相關性排序。他們發現,網路越大,連結越多,這個引擎提供的結果就越準確,於是,他們將新引擎命名為Google,這是googol的變體,Googol是一個數字名詞,表示10的100次方。1996年8月,他們在斯坦福的網站上發布了第一個Google版本。

正確理解

googlepagerank一般一年更新四次,也有2個月就更新一次的例子出現。所以剛上線的新網站不可能獲得PR值。網站很可能在相當長的時間裡面看不到PR值的變化,特別是一些新的網站。
要時刻保持一個整體思路並記住以下幾點:

·Google的排名算法並不是完全基於外部連結的

·高PageRank並不能保證Google高排名

·PageRank值更新的比較慢,看到的PageRank值可能是三個月前的值,決定排名的因素可以有上百種。

如何查看網站PageRank

1、使用站長類工具即可查詢
2、安裝google工具條

算法總結

1.PageRank
基本思想:如果網頁T存在一個指向網頁A的連線,則表明T的所有者認為A比較重要,從而把T的一部分重要性得分賦予A。這個重要性得分值為:PR(T)/C(T)

其中PR(T)為T的PageRank值,C(T)為T的出鏈數,則A的PageRank值為一系列類似於T的頁面重要性得分值的累加。

優點:是一個與查詢無關的靜態算法,所有網頁的PageRank值通過離線計算獲得;有效減少線上查詢時的計算量,極大降低了查詢回響時間。

不足:人們的查詢具有主題特徵,PageRank忽略了主題相關性,導致結果的相關性和主題性降低;另外,PageRank有很嚴重的對新網頁的歧視。

2.Topic-Sensitive PageRank(主題敏感的PageRank)

基本思想:針對PageRank對主題的忽略而提出。核心思想:通過離線計算出一個PageRank向量集合,該集合中的每一個向量與某一主題相關,即計算某個頁面關於不同主題的得分。主要分為兩個階段:主題相關的PageRank向量集合的計算和線上查詢時主題的確定。

優點:根據用戶的查詢請求和相關上下文判斷用戶查詢相關的主題(用戶的興趣)返回查詢結果準確性高。

不足:沒有利用主題的相關性來提高連結得分的準確性。

3.Hilltop

基本思想:與PageRank的不同之處:僅考慮專家頁面的連結。主要包括兩個步驟:專家頁面搜尋和目標頁面排序。

優點:相關性強,結果準確。

不足:專家頁面的搜尋和確定對算法起關鍵作用,專家頁面的質量決定了算法的準確性,而專家頁面的質量和公平性難以保證;忽略了大量非專家頁面的影響,不能反應整個Internet的民意;當沒有足夠的專家頁面存在時,返回空,所以Hilltop適合對於查詢排序進行求精。

影響因素

1與pr高的網站做連結

2內容質量高的網站連結

3加入搜尋引擎分類目錄

4加入免費開源目錄

5你的連結出現在流量大、知名度高、頻繁更新的重要網站上

6google對PDF格式的檔案比較看重

7安裝Google工具條

8域名和tilte標題出現關鍵字與meta標籤等

9反向連線數量和反向連線的等級

10Google抓取您網站的頁面數量

11導出連結數量

缺點局限

從1998年起,PageRank經過多年運轉,取得了巨大成功,同時它的缺點也暴露出來。因為它對網頁的排序是靜態的,只考慮頁面在整個網際網路中的拓撲結構,所以,有人可以作弊,通過多做一些超級連結來顯示頁面的重要性,因此有這樣的公司,自己找個伺服器,讓許多頁面互相連結,如果對方給錢,公司就將你的頁面連結上去,從而惡意提高頁面排序。誰能控制超級鏈,誰就能控制頁面的重要性。

相關詞條

相關搜尋

熱門詞條

聯絡我們