引言
為了讓人類更加平等地認知世界,百度百科正在向更可讀、更可信的方向發展,對已有的內容進行整理,提高詞條質量,故而百科提出了“百科化”的概念,招募並培養掌握了一定百科編輯技巧的用戶,在已有詞條內容的基礎上,按照百科化的標準,整理出更加可讀可信的百科詞條,做更好的百科。定義
百科化是通過對低質量詞條的邏輯、語言等的整理、修改和補充,提升詞條的質量。低質量主要包括但不限於以下幾個方面:缺乏參考資料、內容重複、含有時效性語言、含有主觀性描述等。標準
一個百科化完畢的詞條,應至少符合以下幾點:可讀、可信、客觀、準確。可讀是指:詞條邏輯清晰,無冗餘,無歧義,語句通順,無錯別字或錯誤標點;
可信是指:詞條有充足的權威、專業的參考資料,詞條內容具有公信力,有據可查;
客觀是指:詞條內容和描述不依賴編輯者的主觀意識,而是客觀存在的事實、規律,與個人情感、偏見或意見都無關;
準確是指:詞條內容嚴格符合事實、標準,用詞無歧義。
方法說明
百科化的方法和典型舉例如下,並不斷補充完善中。內容重複
名片與正文內容大量重複:百科化方法:對比名片(概述、基本信息欄)和詞條正文,刪除正文中已經存在於名片裡的內容,常見情況比如人物類詞條的基本信息(姓名、國籍、出生地、出生日期、職業、畢業院校等)既存在於名片裡的基本信息欄部分,也存在於詞條正文部分。
正文中的內容大量重複:
百科化方法:整合重複段落,刪除多餘內容(包括文字、圖片等詞條正文中的任何部分)。
時效性描述
例如:“去年,中國人均GDP已達到4000美元。”如果瀏覽者是2009年查看詞條,那么實際理解的信息是:“2008年,中國人均GDP已達到4000美元。”;
如果瀏覽者是2012年查看詞條,那么實際理解的信息會是:“2011年,中國人均GDP已達到4000美元。”
隨著時間的推移,同樣一句話,傳達的信息是完全不同的。
類似的措辭還有“今年”、“明年”、“近幾年”、“上個月”、“下周”、“目前”、“現在”……等等。這類描述使得瀏覽者對信息發生時間的認識必須基於閱讀的時刻進行計算,因此在表達信息的過程中,會存在歧義。
百科化方法:需要將時效性詞語處理為歷史描述或事實描述。
歷史描述:截止2008年統計,中國人均GDP已達到4000美元。
事實描述:據XXX(參考資料來源)表明,中國人均GDP曾達到4000美元。
主觀性描述
詞條本質上是一種說明性質的文章,所使用的語言也應該是說明性的。以第一人稱對事物做不必要的描述和評價。
1、第一人稱:在詞條中出現的立場性措辭是一種模糊的表述,如:
本人/我/我們、我國、本市、本公司、我校……
修正方法:XXX(人名等)、XX國、XX市、XX公司、XX校……
2、不必要的描述和評價,如:
某籃球運動員“百投不進”,這樣的表述模糊不清,高低的標準因人而異,並且容易造成口水戰。
百科化方法:去掉這樣的描述,直接把賽事數據列出。
專家判斷
百科化方法:根據百科學術委員會的專家判斷,將正確的內容整理到詞條中,並添加相應的參考資料。參考資料
百科化方法:1、為詞條添加有公信力且可供查證的參考資料,一般包括書籍、論文、雜誌、網路資源等。
參考資料應是第一手來源,儘量不使用轉載等二手來源。如果參考資料來源是內容可靠的部落格、論壇,則要求:1)部落格內容應為長期、持續的對某一領域的關注,並且內容不能剽竊或者抄襲其他文獻;2)參考資料對應論壇應是某一類愛好者的集散地,論壇討論主題也應專注某一領域,並且不能有剽竊和抄襲。
2、檢查詞條原有參考資料,網址若失效應刪除;相關信息如網站名稱等填寫應完整。
目錄邏輯
百科化方法:參考編輯器右側的“目錄模板”,理順詞條邏輯,讓瀏覽者最有效率地獲取詞條每一個部分的內容;目錄需能準確概括段落內容,並且控制目錄字數,以邏輯清晰、整齊美觀為最佳。一級目錄最多不要超過7個漢字。圖片/圖冊
百科化方法:1、詞條原有圖片如果尺寸過小,應予以刪除,並儘量補充正確的較大尺寸圖片。
2、詞條圖片應能直接說明詞條內容,並準確分布於相關段落中,排版整齊美觀。
3、圖注應能簡潔準確地描述圖片內容,反映圖片與詞條名的關係。圖冊內圖片應與圖冊主題吻合。