robots.txt是搜尋引擎中訪問網站的時候要查看的第一個檔案。Robots.txt檔案告訴蜘蛛程式在伺服器上什麼檔案是可以被查看的。
robots.txt必須放置在一個站點的根目錄下,而且檔案名稱必須全部小寫。
語法:最簡單的 robots.txt 檔案使用兩條規則:
• User-Agent: 適用下列規則的漫遊器
• Disallow: 要攔截的網頁
使用事例:
User-agent: *
Disallow: /admin/ 後台管理檔案
Disallow: /require/ 程式檔案
Disallow: /attachment/ 附屬檔案
Disallow: /images/ 圖片
Disallow: /data/ 資料庫檔案
Disallow: /template/ 模板檔案
Disallow: /css/ 樣式表檔案
Disallow: /lang/ 編碼檔案
Disallow: /script/ 腳本檔案
相關詞條
-
蜘蛛協定
隨著搜尋經濟的崛起,人們開始愈加關注全球各大搜尋引擎的性能、技術和日流量。作為企業,會根據搜尋引擎的知名度以及日流量來選擇是否要投放廣告等;作為普通網民...
概述 搜尋引擎體驗 網路蜘蛛 網路蜘蛛基本原理 網站與網路蜘蛛 -
網路蜘蛛
網路蜘蛛即Web Spider,是一個很形象的名字。把網際網路比喻成一個蜘蛛網,那么Spider就是在網上爬來爬去的蜘蛛。網路蜘蛛是通過網頁的連結地址來尋...
網路蜘蛛 網站與網路蜘蛛 內容提取 更新周期 網路蜘蛛的評價指標 -
Robots協定
Robots協定(也稱為爬蟲協定、機器人協定等)的全稱是“網路爬蟲排除標準”(Robots Exclusion Protocol),網站通過Robots...
簡介 原則 功能 位置 產生 -
大漩渦蜘蛛海賊團
大漩渦蜘蛛海賊團是白鬍子旗下的海賊團之一,白鬍子海賊團手下新世界船長。隨白鬍子一起參與了為了營救艾斯而攻打海軍本部的頂上戰爭。年齡40多歲的樣子,長發,...
簡介 個人檔案 關係人物 -
爬蟲協定
行業標準,國內使用Robots協定最典型的案例,就是淘寶網拒絕百度搜尋... robots協定(也稱為爬蟲協定、爬蟲規則、機器人協定等)也就是robots.txt,網站通過robots協定告訴搜尋引擎哪些頁面可以抓取...
-
愛回家
返家同住,方便看顧。馬虎心知兩子孝順,未加拒絕,惟獨居多年又“大屋搬細屋...不便拒絕,遂將舊居出售,將錢給予馬強買新鋪之用。馬虎與馬壯同一屋檐下...
劇情簡介 角色介紹 職員表 演員表 分集劇情 -
愛·回家[2012年香港TVB處境喜劇]
。馬虎心知兩子孝順,未加拒絕,惟獨居多年又“大屋搬細屋”,自有一段適應...。兄弟二人商議下,決定讓虎遷入馬壯家,方便照顧。家人好意,馬虎不便拒絕,遂將舊居...
劇情簡介 角色介紹 職員表 演員表 分集劇情 -
愛回家[2012 TVB電視劇]
返家同住,方便看顧。馬虎心知兩子孝順,未加拒絕,惟獨居多年又“大屋搬細屋...不便拒絕,遂將舊居出售,將錢給予馬強買新鋪之用。馬虎與馬壯同一屋檐下...
劇情簡介 角色介紹 職員表 演員表 分集劇情 -
搜尋引擎機器人
網路蜘蛛網路蜘蛛通過網頁的連結地址來尋找網頁,從網站某一個頁面(通常是...整個網際網路當做一個網站,那么網路蜘蛛就可以用這個原理把網際網路上所有的網頁都抓取下來。什麼是網路蜘蛛呢?網路蜘蛛即Web Spider,是一個...
網路蜘蛛 起源 工作原理 吸引搜尋方法