網際網路論壇收錄開放協定

《網際網路論壇收錄開放協定》是百度網頁搜尋制定的論壇內容收錄標準,論壇網站可將論壇內發布的帖子製作成遵循此開放協定的XML格式的網頁供搜尋引擎索引,將論壇發布的帖子主動、及時地告知百度搜尋引擎。

概述

使用此開放協定,將會為您的網站帶去更多流量!
、採用了《網際網路論壇收錄開放協定》,就相當於論壇中的帖子被搜尋引擎訂閱,通過百度--全球最大的中文搜尋引擎這個平台,網民將有可能在更大範圍內更高頻率地訪問到您網站論壇中的帖子,進而為您的網站帶來潛在的流量。

開放協定內容

下圖為遵照《網際網路論壇收錄開放協定》製作的xml格式的網頁,網頁上按照標準格式列出了網站論壇發布的帖子的相關信息。

XML網頁示例:XML網頁示例:
XML網頁示例:
XML標籤說明:其中帶星號標記的為必選項,未帶星號標記為可選項。
*<document>——標記整個XML檔案內容的開始和結束。後面的是該xml檔案遵守百度《網際網路論壇收錄開放協定》的聲明,如沒有該段聲明,xml檔案不支持下面的<bbs:reply>等語法。
*<webSite>——站點地址。
*<webMaster>——負責人員的Email。當有必要時,我們通過這個地址與您聯繫。
*<updatePeri>——sitemap 更新周期,以小時為單位。搜尋引擎將遵照此周期訪問該頁面,使頁面上的內容更及時地被百度 spider 發現。
*<updatetime>——該 xml 檔案最近一次的更新時間 。
*<version>——論壇所使用程式的版本。
*<item>——標記每個帖子信息的開始和結束,標記內為單個帖子信息。
*<link>——帖子的 url 地址,即帖子第一頁的地址,請儘量去除url中不必要的參數。
<title>——帖子標題。
<pubDate>——帖子主貼的發布時間 。
<bbs:lastDate>——帖子最後一條回復的發布時間 。
<bbs:reply>——帖子總的回覆數,不包括主貼。
<bbs:hit>——帖子總的查看次數。
<bbs:mainLen>——帖子主貼的長度,單位位元組 。
<bbs:boardid>——帖子所在版面,提供版面的 id 。
<bbs:pick>——是否設為精華,精華標為 1 ,非精華標為 0 。
推薦時間格式:年月日小時分鐘秒
如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 |
2005年11月09日10時37分00秒 | Fri, 09 Nov 2005 10:37:00 GMT

開放協定使用

第一步:創建XML檔案
請按照上面公布的開放協定內容製作XML檔案。
其它說明:
支持的編碼格式有GB18030、UTF-8、GB2312、BIG5等,推薦使用GB2312和UTF-8。注意:XML檔案頭部的encoding值必須與XML檔案的實際編碼類型一致。 請保持每個XML檔案處於按更新周期持續自動更新的狀態。 XML標籤內容中的一些特殊字元需要轉換為XML定義的轉義字元,否則將發生錯誤導致搜尋引擎不能獲取頁面上的帖子,具體參見下表。

字元 轉義後的字元
HTML字元 字元編碼
和(and) & & &
單引號 &#39; &apos; &#39;
雙引號 " " "
大於號 > > >
小於號 < < <

轉義字元中的"&"無需再轉。
第二步:驗證XML檔案
下面的地址提供了幫助您驗證XML檔案結構的多種工具:
通過驗證的XML檔案能夠使您提供的信息更加標準,確保您發布的視頻信息不被搜尋引擎遺漏。
第三步:使用XML檔案
請將XML檔案命名為sitemap_baidu.xml上傳到您網站根目錄下,並保證檔案所在的url地址能夠被百度spider正常訪問。當百度spider發現了xml檔案後,會根據上面提供的參數自動對xml檔案進行更新,並抓取高質量的內容。
注意: 百度spider不保證一定能收錄您提交的全部內容。

相關詞條

相關搜尋

熱門詞條

聯絡我們