錕斤拷

錕斤拷

錕斤拷,是一串經常在搜尋引擎頁面和其他網站上看到的亂碼字元。亂碼源於GBK字元集和Unicode字元集之間的轉換問題。

基本信息

示例

“錕屆瀿錕斤拷雮傡錕斤拷直錕斤拷錕”、“錕斤拷錕斤拷之錕斤拷錕窖э拷錕 ”……

上面這些字句是毫無實際意義的,但它們卻形象地表達出了一些莫名其妙的問題。這是一個很經典的亂碼,最容易出現的地方就是搜尋引擎。

例如這個招聘就非常經典:

單位性質:外商獨資企業

所屬行業:線纜

單位規模:100 - 499人

註冊資金:1299萬

聯繫人:錕斤拷錕斤拷

聯繫人職位:錕斤拷錕斤拷

傳真:xxx-xxxxxxxx

聯繫電話:

電子信箱:[email protected]

通信地址:

郵編:

單位網址:

單位介紹:台錕斤拷錕斤拷業錕斤拷台錕斤拷錕斤拷錕僥碉拷f錕斤拷錕斤拷錕斤拷錕?錕斤拷錕斤拷/錕斤拷錕斤拷

招聘職位:錕斤拷錕斤拷

人數:20人

發布日期:2007-07-17

聯繫人:錕斤拷錕斤拷

原因

我們上網的時候不用去關心網站採用了什麼編碼格式,但是頁面中不時出現的亂碼還是會讓我們頭疼。在這點上,Firefox的用戶更是深有體會,用Firefox瀏覽網頁看到亂碼的機會要比Internet Explorer多得多。 亂碼主要與字元編碼系統有關。例如一個網頁中常出現的亂碼“錕斤拷”(百度,Google),它就是新老編碼系統轉換中出現的。網友est專門寫了一篇文章來考證問題來源:

Unicode和老編碼體系的轉化過程中,肯定有一些字,用Unicode是沒法表示的,Unicode官方用了一個占位符來表示這些文字,這就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8編碼出來,恰好是“\xef\xbf\xbd”。如果這個“\xef\xbf\xbd”,重複多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然後放到GBK/CP936/GB2312/GB18030的環境中顯示的話,一個漢字2個位元組,最終的結果就是:錕斤拷——錕(0xEFBF),斤(0xBDEF),拷(0xBFBD) 。

錕斤拷 錕斤拷

Python代碼:

輸出結果:'\xef\xbf\xbd\xef\xbf\xbd'

輸出結果:“錕斤拷”。

輸出結果:“錕斤拷”。

出現

2011年2月2日零時出現,百度推出搜“紅包”,每一次搜尋都有驚喜活動,錕斤拷亂碼就出現了。

2012年8月31日又出現。通過IE核心的瀏覽器搜尋網頁,無論點開什麼貼吧的超連結都會進入錕斤拷錕斤拷錕斤拷吧。抓包查看發現原因可能是百度bug。

2012年12月27日,神一樣的錕斤拷再度出現。在百度新聞首頁的太原市地陷新聞圖片中錕斤拷重複出現。

2013年6月11日零時11分,百度新聞:神舟十號11日17時38分發射 三位航天員公布連結指向神奇的“錕斤拷錕斤拷錕”,零時51分,恢復正常。

2014年2月13日,使用Google Chrome、Firefox等搜尋“李毅”、“dota2”等詞條,點擊貼吧相關連結,會自動跳轉到錕斤拷吧

2014年8月,打開百度瀏覽器的貼吧助手,貼吧名字顯示亂碼,無論點開什麼貼吧,都會直接跳轉到錕斤拷吧。

相關詞條

熱門詞條

聯絡我們