SEO之robots的寫作語法
首先我們來看一個robots範例:
#robots.txtfilefromhttp://www.lzshiwei.com
#Allrobotswillspiderthedomain
User-agent:*
Disallow:
以上文本表達的意思是允許所有的蜘蛛訪問www.lzshiwei.com站點下的所有檔案。具體語法分析如下:
#後面文字為說明信息;User-agent後面為蜘蛛的名稱,如果是“*”則泛指所有的蜘蛛;Disallow後面是不允許訪問的檔案目錄,如目錄為空則不起任何禁止作用。
下面例舉一些robots.txt的具體用法。
允許所有的robot訪問,格式如下:
User-agent:*
Disallow:
或者也可以建一個空robots.txt檔案。
禁止所有蜘蛛訪問網站的任何部分,格式如下:
User-agent:*
Disallow:/
禁止所有蜘蛛訪問網站的某幾個部分,比如下例中禁止訪問001、002、003目錄:
User-agent:*
Disallow:/001/
Disallow:/002/
Disallow:/003/
禁止某個搜尋引擎蜘蛛的訪問,比如下例中的百度蜘蛛:
User-agent:BadBot
Disallow:/
只允許某個蜘蛛的訪問,再例舉百度蜘蛛:
User-agent:BadBot
Disallow:
User-agent:*
Disallow:/
另外有必要進行拓展說明,對robotsmeta進行一些介紹:
tobotsmeta標籤主要是針對一個個具體的頁面。和其他的META標籤(如使用的語言、頁面的描述、關鍵字等)一樣,robotsmeta標籤也是放著頁面的<head><head>中,專門用來告訴蜘蛛如何抓取該頁的內容。
robotsmeta標籤的寫法
robotsmeta標籤中沒有大小寫之分,name="robots"表示所有的搜尋引擎,可以針對某個搜尋引擎寫為name="baiduspider"。content部分有四個指令選項:index、noindex、follow、nofollow,指令間以“、”分隔。
index指令告訴搜尋引擎蜘蛛抓取該頁面;
follow指令表示蜘蛛可以沿著該頁面上的連結繼續抓取下去;
robotsmeta標籤的預設值是index和follow。
一共有下面四種組合:
<metaname="robots"content="index,follow">
<metaname="robots"content="noindex,follow">
<metaname="robots"content="index,follow">
<metaname="robots"content="noindex,follow">
其中<metaname="robots"content="index,follow">可以寫成<metaname="robots"content="all">,而<metaname="robots"content="noindex,follow">可以寫成<metaname="robots"content="none">
目前看來,絕大多數的蜘蛛都遵循robots.txt的規則,而對於robotsmeta標籤,目前支持的並不多,但是正在逐漸增加,如Google就完全支持,而且Google還增加了一個指令“archive”,可以限制Google是否保留網頁快照。例如:<metaname="googlebot"content="index,follow,noarchive">
相關詞條
-
Robots協定
Robots協定(也稱為爬蟲協定、機器人協定等)的全稱是“網路爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robots...
簡介 原則 功能 位置 產生 -
robots語法
SEO之robots的寫作語法 首先我們來看一個robots範例: # robots.txt... # All robots will spider...
-
機器人歷險記
。"*" 匹配0或多個任意字元。robots.txt語法教程用幾個最常見...robots簡介搜尋引擎通過一種程式robot(又稱spider...robots.txt,在這個檔案中聲明該網站中不想被robot訪問的部分...
robots簡介 使用誤區 使用技巧 robots.txt檔案的格式 -
機器人歷險記[同名電腦遊戲]
中文名稱: 機器人歷險記地區: 美國平台:PC類型:動作簡介:這款機器人遊戲將會組契約名電影的一些特點,包括人物、圖像及動畫,維...
robots簡介 使用誤區 使用技巧 robots.txt檔案的格式 -
robots.txt
Robots協定(也稱為爬蟲協定、機器人協定等)的全稱是“網路爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robo...
簡介 歷史沿革 語法規則 使用技巧 原則 -
meta
of science,education,culture." C、robots(機器人嚮導)說明:robots用來告訴搜尋機器人哪些頁面需要索引,哪些... name="robots" content="none" D...
介紹 提示和注釋 動畫效果 其他用法 使用方法 -
搜尋引擎收錄
是,在Google的robots中,的確存在著相當部分專門為真正的索引收錄頁準備“素材”的robots——在這裡我們姑且仍稱之為FreshBot吧。——它們...的多個robots可能在某個很短的時間周期,比如說一天甚至一小時,訪問...
基本概述 收錄原理 影響收錄 百度特點 提高收錄 -
百度網
公司介紹 1999年底,身在美國矽谷的李彥宏看到了中國網際網路及中文搜尋引擎服務的巨大發展潛力,抱著技術改變世界的夢想,他毅然辭掉...
公司介紹 管理團隊 公司理念 人事變更 企業合作 -
百度
發展簡史從創立之初,百度便將“讓人們最平等便捷地獲取信息,找到所求”作為自己的使命,成立以來,公司秉承“用戶至上”的理念,不斷堅...
發展簡史 公司簡介 主要產品 公司理念 多語言化