介紹
大家都知道,Google的搜尋結果會將類似的網頁搜尋結果合併在一起,以節省使用者需要瀏覽的項目。然而,那種所謂「四處抓別人內容拼湊」而成的垃圾網頁到處都是,若你的網頁夠熱門,甚至可能有上百個垃圾網頁都會直接抄襲你的文章,那麼Google很有可能會誤判,將本尊誤判為分身,反而讓那些抄襲他人文章的垃圾網頁名列在本尊之上。
不過或許是語言障礙的關係,雖然Copyscape可以搜尋中文資料,但在比對中文網頁方面似乎成效不彰,可能Copyscape對於「抄襲」的定義很嚴格吧。
使用方法
目前Copyscape對中文支持不夠理想。使用方法非常簡單:你只需輸入你想查詢的文章的url地址,Copyscape就可以搜尋到誰Copy或引用了你的文章,以搜尋結果的形式顯示在頁面上,這時你就可以點擊連結查看細節:那些文章是Copy了你的Blog /BLOG文章。總的來說,Copyscape是個不錯的網路維護智慧財產權的有用工具,尤其實在美國市場,市場前景廣闊
Copyscape 可以從網路查詢複製你網站內容的其他網頁,再也不用擔心網站成為別人偷窺的對象!Copyscape 還提供了banner貼紙服務,也就是您可以將 Page Protected by Copyscape DO NOT COPY 字樣放置在您的網頁里,以勸告有心人士不要輕易的複製網站內容。
Copyscape在進行檢測文章時,如果發現你的文章中有4個或更多的單詞是完全匹配的,那么這篇文章就會被判為有重複。比如下面這兩句:
The quick brown fox jumped over the lazy dog.
The quick brown fox leaped over the lazy dog.
兩句話里都包含“The quick brown fox”和“over the lazy dog”這樣的連續的4位詞段。這時,Copyscape便會視其為重複的。然後,下面的情況下則不會:
The quick brown fox jumped over the lazy dog.
The quick brown creature jumped over the languid dog.
注意看現在這兩句話里完全重複的是“The quick brown”和“jumped over the”,都是少於4個單詞連續重複。當連續重複的單詞數少於4個時,copyscape便不會將其判斷為重複內容,因此,上面這兩句話會通過copyscape的unique檢測。
Copyscape將連續出現4個同樣的單詞作為判斷重複的標準。因為不同的文章中很大可能都會出現連續兩三個單詞相同的情況出現,但是實際上又不是重複的。然而,連續4個單詞重複的情況從統計上來看是應該是很少發生的。
這也意味著你需要每4個單詞便進行下修改好讓你的文章通過copyscape。如果你的文章能通過copyscape檢測,那么Google也很有可能將其視為unique的內容。