PR值
PR是Google排名運算法則(排名公式)的一部分,是Google用於用來標識網頁的等級、重要性的一種方法,是Google用來衡量一個網站的好壞的重要標準之一。在揉合了諸如Title標識和Keywords標識等所有其它因素之後,Google通過PageRank來調整結果,使那些更具“等級/重要性”的網頁在搜尋結果中令網站排名獲得提升,從而提高搜尋結果的相關性和質量。級別從0到10,10級為滿分。PR值越高說明該網頁越受歡迎(越重要)。例如:一個PR值為1的網站表明這個網站不太具有流行度,而PR值為7到10則表明這個網站非常受歡迎(或者說極其重要)。一般PR值達到4,就算是一個不錯的網站了。Google把自己的網站的PR值定到9,這說明Google這個網站是非常受歡迎的,也可以說這個網站非常重要。
注意事項
PR也有真假之分。假PR即PR劫持。很多站長為了短時期內獲得高PR,他們將自己的網站做301跳轉到一個高PR的網站。注意google在更新PR的時候,會賦予這個網站與跳轉後的網站相同的PR值。但是這樣的PR是假的,沒有任何用處。如果站長取消301後,PR會重新評估,回到最初的PR值。而且劫持過來的PR不會給友情連結帶來PR分值的。所以Anzone說,大家換友情連結的時候,不要和PR劫持的網站交換連結。
算法介紹
PageRank
基本思想:如果網頁T存在一個指向網頁A的連線,則表明T的所有者認為A比較重要,從而把T的一部分重要性得分賦予A。這個重要性得分值為:PR(T)/C(T)
其中PR(T)為T的PageRank值,C(T)為T的出鏈數,則A的PageRank值為一系列類似於T的頁面重要性得分值的累加。
PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn))
A代表頁面A
PR(A)則代表頁面A的PR值
d為阻尼指數。通常認為d=0.85
t1…tn代表連結向頁面A的頁面t1到tn
C代表頁面上的外連結數目。C(t1)即為頁面t1上的外連結數目
從計算公式可以看到,計算PR值必須使用疊代計算才能得到。
優點:是一個與查詢無關的靜態算法,所有網頁的PageRank值通過離線計算獲得;有效減少線上查詢時的計算量,極大降低了查詢回響時間。
不足:人們的查詢具有主題特徵,PageRank忽略了主題相關性,導致結果的相關性和主題性降低;另外,PageRank有很嚴重的對新網頁的歧視。
Topic-Sensitive
(主題敏感的PageRank)
基本思想:針對PageRank對主題的忽略而提出。核心思想:通過離線計算出一個PageRank向量集合,該集合中的每一個向量與某一主題相關,即計算某個頁面關於不同主題的得分。主要分為兩個階段:主題相關的PageRank向量集合的計算和線上查詢時主題的確定。
優點:根據用戶的查詢請求和相關上下文判斷用戶查詢相關的主題(用戶的興趣)返回查詢結果準確性高。
不足:沒有利用主題的相關性來提高連結得分的準確性。
Hilltop
基本思想:與PageRank的不同之處:僅考慮專家頁面的連結。主要包括兩個步驟:專家頁面搜尋和目標頁面排序。 優點:相關性強,結果準確。 不足:專家頁面的搜尋和確定對算法起關鍵作用,專家頁面的質量決定了算法的準確性,而專家頁面的質量和公平性難以保證;忽略了大量非專家頁面的影響,不能反映整個Internet的民意;當沒有足夠的專家頁面存在時,返回空,所以Hilltop適合對於查詢排序進行求精。
影響因素
站外連結數量和質量
在計算網站排名時,Pagerank會將網站的外部連結數考慮進去。並不能說一個網站的外部連結數越多其PR值就越高,如果這樣的話,一個網站儘可能獲得最多的外部連結就OK了,有這種想法是錯誤的。Google對一個網站上的外部連結數的重視程度並不意味著你因此可以不求策略地與任何網站建立連線。這是因為Google並不是簡單地由計算網站的外部連結數來決定其等級。Google的Pagerank系統不單考慮一個網站的外部連結數量,也會考慮其質量。這個問題看起來很複雜。首先讓我們來解釋一下什麼是阻尼因數(dampingfactor)。阻尼因數就是當你投票或連結到另外一個站點時所獲得的實際PR分值。阻尼因數一般是0.85。當然比起你網站的實際PR值,它就顯得微不足道了。
PR分值的計算公式:PR(A)=(1-d)+d【PR(t1)/C(t1)+...+PR(tn)/C(tn)】公式解釋:其中PR(A)表示的是從一個外部連結站點t1上,依據Pagerank系統給你的網站所增加的PR分值;PR(t1)表示該外部連結網站本身的PR分值;C(t1)則表示該外部連結站點所擁有的外部連結數量。大家要謹記:一個網站的投票權值只有該網站PR分值的85%,而且這個0.85的權值平均分配給其連結的每個外部網站。
那么,是不是說對一個網站而言,它所擁有的較高網站質量和較高PR分值的外部連結數量越多就越好呢?錯,因為-Google的Pagerank系統不單考慮一個網站的外部連結質量,也會考慮其數量。比方說,對一個有一定PR值的網站X來說,如果你的網站Y是它的唯一一個外部連結,那么Google就相信網站X將你的網站Y視做它最好的一個外部連結,從而會給你的網站Y更多的分值。可是,如果網站X上已經有49個外部連結,那么Google就相信網站X只是將你的網站視做它第50個好的網站。因而你的外部連結站點上的外部連結數越多,你所能夠得到的PR分值反而會越低,它們呈反比關係。
但是在一般情況下,一個PR分值大於等於6的外部連結站點,可顯著提升你的PR分值。但如果這個外部連結站點已經有100個其它的外部連結時,那你能夠得到的PR分值就幾乎為零了。同樣,如果一個外部連結站點的PR值僅為2,但你卻是它的唯一一個外部連結,那么你所獲得的PR值要遠遠大於從那個PR值為6,外部連結數為100的網站獲得的PR值。
Google抓取的頁面數
Google在你的網站抓取的頁面數,數目越多,Pagerank值越高。但通常Google並不會主動抓取你的網站的所有頁面,尤其是網址裡帶有“?”的動態連結,Google不主動,那就要我們主動了,最笨的辦法是把網站所有的頁面都提交給Google,但我想沒有誰真會這么做,但頁面不多的話可以試試。更好的辦法是製作一個靜態Html頁面,通常被稱作“網站地圖”或“網站導航”,它裡面包含你要添加的所有網址,然後把這個靜態頁面提交給Google。
被知名網站收錄
網站被世界三大知名網站DMOZ,Yahoo和Looksmart收錄
眾所周知,Google的Pagerank系統對那些門戶網路目錄如DMOZ,Yahoo和Looksmart尤為器重,特別是對DMOZ。一個網站上的DMOZ連結對Google的Pagerank來說,就好像一塊金子一樣珍貴。如果你的網站為ODP收錄,則可有效提升你的頁面等級。向ODP提交你的站點並為它收錄,其實並不是一件難事,只是要多花點時間而已。只要確保你的網站提供了良好的內容,然後在ODP合適的目錄下點擊“增加站點”,按照提示一步步來就OK了。至少要保證你的索引頁(INDEXPAGE)被收錄進去。所以,如果你的網站內容涉及完全不同的幾塊內容,你可以把每個內容的網頁分別向ODP提交——不過請記住“欲速則不達”。等到Google對其目錄更新後,你就能看到你的PR值會有什麼變化了。如果你的網站為Yahoo和Looksmart所收錄,那么你的PR值會得到顯著提升。如果你的網站是非商業性質的或幾乎完全是非商業性質的內容,那么你可以通過使你的網站為著名的網路目錄Looksmart所收錄。Looksmart也是從Zeal網路目錄獲得非商業搜尋列表。
網站的內部結構,一個合理的網站內部結構對搜尋引擎蜘蛛的抓取是有很重要意義的,不僅表現在抓取的快捷方便,還表現在抓取的安全性!
高質量的內容頁面,不僅表現在原創、可讀性,還體現在文章的新穎度,搜尋引擎對這類高質量的內容都表現得很友好,經常發表高質量新穎度高的文章,搜尋引擎會認為你的網站有特色,也會十分願意光臨並收錄你的原創文章,自然收錄多了,pr值也會很快提高的!
影響GooglePR的因素
1與PR高的網站做連結
2內容質量高的網站連結
3加入搜尋引擎分類目錄
4加入免費開源目錄
5你的連結出現在流量大、知名度高、頻繁更新的重要網站上
6Google對PDF格式的檔案比較看重
提升方法
網站外部
友情連結
友情連結應該算是提升網站PR值的一大法寶了。從Google公布的PR值計算方法中我們百科之家工程師發現,PR值的計算是網站間權重的相互傳遞。也就是說,通過權重的疊加,可以使網站的PR值得到提升。這就是為什麼老站的PR值一般要高於新站的原因了。
外鏈數量
外鏈數量可以具體體現出一個網站在整個網路環境中的受歡迎程度。網站的外鏈越多,在搜尋引擎看來,這個網站的受歡迎度就越高,搜尋引擎也就自然而然有理由為這樣受歡迎的網站提升PR值了。
高權重外鏈
高權重外鏈是指搜尋引擎認識中的權威網站,比如重點的新聞源網站、行業權威或領先的網站。另外我們百科之家還要提醒大家一種高質量外鏈資源,那就是我們熟知的百度百科。百度百科在搜尋中的排名結果就可以看出他的權重了。作為百度旗下的產品,百度百科的權威性也毋庸置疑。在百科詞條中添加連結的種種好處可以表明,百科外鏈是一種難得的外鏈資源。
網站內部
內部程式結構
網站的內部結構對於搜尋引擎的抓取有著很重要的意義,同樣對於網站的PR值計算也是有著一定的影響。這裡我們鼓勵大家使用常見的建站系統進行搭建,相比較其他而言,這樣的系統無論從系統安全性還是搜尋引擎的認知度上都是比較不錯的。
穩定更新
網站的穩定更新是搜尋引擎判斷一個網站是否經營良好的標準之一,保持網站內容的穩定更新,可以幫助搜尋引擎判斷你網站的活躍程度,活躍程度越高的網站自然他的PR值也就會越高。
文章內容新穎度
網站中我們需要穩定更新的就是網站內部的文章,網站文章如果是原創內容會為你的網站加分,如果再有其他的網站對你網站內容的轉載,那么你的網站文章的權威性就更加得到了認可。對於這樣提供高質量的網站內容的網站,PR值自然不會低。
避免垃圾連結
隨著發展,出售友情連結、軟文連結、廣告連結的現象在越來越多的網站上出現。百度在最新的SEO指南中也提出,要嚴厲打擊出售網站友情連結的行為,那么Google在這方面是不是也有行動呢?答案是肯定的。Google早在百度前就發出了降低出售連結網站的PR值的信號。另外對於網站上存在有大量垃圾連結、廣告連結的網站,指望提升PR值已經是不現實了!
發展歷程
美國時間2009年10月15日,Google員工SusanMoskwa在Google網站管理員幫助論壇中發表關於Google取消PR的訊息.而此前,Google在推出實驗室版網站管理員工具的同時,已經悄然去除了其爬蟲統計中的PageRank功能,新版的網站管理員工具里已經無法查看PR值。
PageRank是一種由搜尋引擎根據網頁之間相互的超連結計算的網頁排名技術,以谷歌創始人拉里·佩奇(LarryPage)之姓來命名。此技術通常和搜尋引擎最佳化有關,Google用它來體現網頁的相關性和重要性。Google的創始人拉里·佩奇和謝爾蓋·布林於1998年在史丹福大學發明了這項技術。
長期以來,PageRank值反映一個網頁在網際網路中的重要程度,其值也成為評價網頁價值的最重要指標。而基於PR值的連結交換,出售高PR值連結成為不少中小站長重要的收入來源。
2010年4月初,谷歌最後一次全面更新PageRank值。
2010年6月8日,谷歌宣布已經正式推出了新版網頁索引系統,可以為用戶提供更多的實時搜尋結果。
谷歌表示,這款名為“咖啡因”(Caffeine)的系統將比以前的系統更具實效性。在此之前,谷歌每天晚上只會索引一小部分網頁,並在搜尋結果中更新內容。而利用咖啡因,谷歌則可以立刻索引網路並尋找到最新信息。
更新歷史
更新日期 | 更新比例 | 上升比例 | 下降比例 | 新增比例 | 清空比例 |
2013-02-05 | 21.46% | 14.80% | 6.66% | 0.39% | 0.19% |
2012-11-08 | 19.50% | 13.42% | 6.08% | 0.74% | 0.41% |
2012-08-03 | 20.30% | 14.58% | 5.72% | 0.18% | 0.10% |
2012-05-27 | 3.76% | 2.73% | 1.03% | 2.52% | 0.72% |
2012-05-06 | 9.08% | 6.80% | 2.28% | 0.34% | 0.14% |
2012-05-05 | 3.50% | 1.81% | 1.69% | 0.04% | 0.09% |
2012-05-04 | 11.76% | 8.61% | 3.15% | 0.10% | 0.20% |
2012-11-08 | 19.50% | 13.42% | 6.08% | 0.74% | 0.41% |
2012-08-03 | 20.30% | 14.58% | 5.72% | 0.18% | 0.10% |
2012-05-27 | 3.76% | 2.73% | 1.03% | 2.52% | 0.72% |
2012-05-06 | 9.08% | 6.80% | 2.28% | 0.34% | 0.14% |
2012-05-05 | 3.50% | 1.81% | 1.69% | 0.04% | 0.09% |
2012-05-04 | 11.76% | 8.61% | 3.15% | 0.10% | 0.20% |
2012-02-07 | 23.17% | 16.92% | 6.25% | 0.39% | 0.26% |
更新周期
一般情況下PR值更新的周期是2.5~3個月。2008年更新了6次,2009年更新了5次,2010年更新了2次。更新另解
2011年pr更新日期:2011年6月28日,7月19日,8月5日短時間頻繁發生3次pr更新。有一種說法認為從6月28日開始至8月5日的三次更新應該算作一次更新,只不過更新周期很長從6月28日開始一直持續到8月5日。中間很多網站的pr不太穩定,有一些起伏的變化。所以可以理解為一次更新中的調整。而不應該算作多次更新。特別指出的是8月5日的更新全部針對新站。6月28日,7月19日兩次是一些老站點的調整過程。是否可以理解為以後的pr更新可能是分為老站和新站兩種情況分別處理。另有網友推測說未來pr更新可能是每月甚至是10幾天一次。而不是像以往3個月或者6個月這樣長時間的更新周期。不過本人更傾向於谷歌pr更新會針對老站跟新站分別處理。而大的周期應該還是6個月。只不過每次大更新的周期不是在幾天內完成而是持續超過一個月。更新影響
2011年10月6日,谷歌(google)突然更改PR值查詢接口,而事先並未作出任何公告,致使眾多網站的PR查詢值為0或空。但用IE系列瀏覽器安裝了Google官方的工具條後,出現意外結果,能查到真實的GooglePageRank。看來,GooglePR還沒憑空消失,只是一些非官方的查詢PR的工具無法使用。PR沒死:谷歌員工澄清PR值查詢指令變更,於2011年10月8日開放。網際網路瘋傳谷歌於10月6日正式取消PR值的訊息,經初步確認實屬誤傳。由谷歌員工出面澄清PR值並未消失,並且依如往日存在。
2011年10月8日,google值重新開放。
2012年,PR更新兩次。
2013年,PR更新時間為1月5日,以及12月6日。
算法思路
在大學生上學時,需要寫各種各樣的論文,關於一篇論文,如何來評定它的價值呢?就是引用。寫一篇論文,我們大多數並不能完全創新出新內容來,我們需要“站在巨人的肩膀上”,通過引用別人的文章,或者觀點,來幫助說明自己的觀點,當你引用別人的觀點時,從一定意義上面來說,你是認為他的文章或者觀點是有價值的。一個人說它有價值,兩個人說它有價值,隨著說它有價值的人越來越多,他的論文也顯得越來越重要了。從這個PR產生的背景上我們可以大致猜想到PR值的大致算法,如果將論文比作頁面,引用別人的文章代表連結的話,PR值產生的大致思路便出現了:
A、B、C三個頁面,B頁面創建時,連結了A頁面,C頁面創建時也連結了A頁面,那么A頁面的PR值就是最高的了。
算法新套用
美國南加州大學、斯克利普斯研究所以及加州大學聖地亞哥分校的研究人員利用一個類似於GooglePageRank的運算方法,分析了肺癌的傳播模式,這種模式能預測肺癌如何在人體內擴散。研究人員採用了一種稱為馬爾可夫鏈模型(MarkovChainModel)的複雜系統,發現轉移性肺癌並不是沿著原發腫瘤部位單一方向擴散的,而是同一時間沿著不同方向擴散。而且癌細胞擴散的第一個站點對於疾病的進程具有重要意義,這項研究表明,身體的某些部分就像是休眠區,相對不太可能會進一步擴散癌細胞到機體其它部位上去,而其它一些區域則具有擴散性,能進一步擴散,這項研究也找到了這些區域。
監控癌症在機體中的移動,對於病患護理來說至關重要,雖然原發性腫瘤(未擴散)往往並不是致命的,但是如果癌細胞轉移,患者的預後就會惡化。這項研究在腫瘤學研究領域套用了數學科學,這種數學機率模型能用於解釋來自特定患者人群的數據,為依賴於臨床的方法提出了一種新的替代選擇,能更有效的預測癌症如何,在哪裡會擴散。