產生歷程
第一個利用數據進行的新聞報導可追溯到1821年5月5日。衛報歷史上第一份報紙的頭版新聞:曼徹斯特在校小學生人數及其平均消費統計。這份數據現在可以從衛報的網站上下載到原版的PDF數據。
數據新聞不是一夜之間就有的。它的萌芽是從計算機輔助報導(computer assisted reporting)開始的。20世紀50年代,美國就有媒體記者利用大型計算機對政府提供的資料庫中的信息進行分析,以調查和發現新聞事實。記者在政府機構、企業等所發布的有限數據中,發現新聞選題或者將這些數據作為佐證發現、拓展深度的重要資料。而在如今大數據的背景之下,記者能夠獲取和利用的數據量相較而言是那時的無數倍。
數據新聞有別於精確新聞和數字新聞。精確新聞由美國學者、新聞記者菲利普·邁耶在20世紀60年代提出,指記者在採訪新聞時運用調查、實驗和內容分析等社會科學研究方法來收集資料、查證事實,從而報導新聞。這類新聞報導20世紀70年代風行於美國新聞界。80年代,中國新聞界開始運用這種新聞報導方法。它的特點是用精確的具體數據分析新聞事件,以避免主觀的、人為的錯誤。它側重於微觀的具體調查、實驗和內容分析。而數字新聞,則指以數字、公式、字母等靜態形式來輔助文字報導。現在所說大數據新聞,顯現的是對大數據的挖掘與處理的結果,可以通過複雜的互動式、動態化的圖片和視頻來呈現這類新聞。
功能與優勢
目前,在大數據新聞製作上已經積累了經驗的國際媒體有《衛報》《紐約時報》《華盛頓郵報》等,但它們也處於探索階段。通過對國內外代表性媒體的大數據新聞實踐進行研究,可以總結出大數據新聞的四個功能,即描述、判斷、預測、信息定製。
新聞敘事
《衛報》網頁2012年1月5日發布了一個有關“阿拉伯之春”的大數據新聞報導。報導利用動態圖表,以時間軸為主線描述了自2010年12月一突尼西亞男子自焚至2011年12月的一年間,17個阿拉伯國家發生的一場政治運動。網民可以通過這個四維動態的報導,清楚地從巨觀到微觀,全面了解阿拉伯之春在不同國家的不同表現形式。圖表上方設定了時間的推拉按鈕,網民推拉到自己想觀看的時間點,可以清楚地看到相同時間點上不同國家發生的相關事件。畫面的下方是各個國家的標籤,網民也可以通過國家標記,來關注某個具體國家在縱向時間軸上的政治演變進程。不同的政治事件用不同顏色來標示:綠色為民眾性抗議活動,淺藍色為國際上的相關反應,黃色為政治事件,紅色為政權更替。如果網民想了解某個事件的具體內容,點擊不同顏色的標示,隨即獲取深度報導的連結。這種新聞報導方式,將涉及十幾個國家、時間跨度長達一年的複雜的“阿拉伯之春”,以明晰的動態方式呈現出來,純文字報導難以達到這樣的傳播效果。
大數據新聞還能夠描述那些看不見的短期過程,比如流言如何在社交網路上傳播。《衛報》通過追蹤分析260萬份推特內容,利用可視化動態圖表描述了從流言開始傳播到闢謠結束的整個過程。它也是以時間為軸,利用圓圈大小、顏色變化來描述整個過程,綠色的圈代表散布流言的推文,紅色的圈代表更正這個流言的推文,灰色的是中立的評價推文,黃色的是對流言持懷疑態度的推文。圈的大小代表了推文的影響程度,圈越大影響程度越大。如果想了解具體的內容,點到哪個圈,螢幕旁邊即刻呈現這個圈所代表的推文的發布者、發布日期、轉推人數等等信息。通過這個動態的演進過程,人們可以清楚地看到,社交網路並不像一般想像的那樣,是一味擴散虛假訊息的場所。其實在假訊息出現不久,社交網路上各種闢謠的訊息就已經出現了。
從這兩個例子可以看出,大數據新聞的報導方式能夠在巨觀上對某個事件看得更加清楚與全面,事件複雜的演進過程以及這個過程中的各個方面,都能描述得直觀且有趣。
事實判斷
2011年8月,一個黑人穆斯林男子乘計程車在倫敦街頭遭到警方攔截,雙方發生槍戰,該男子當街死亡。兩天后,約300人聚集在倫敦市中心的警察局進行抗議,後來演變成持續多天的騷亂事件,抗議者引燃了汽車、商店和公車。當天夜裡,倫敦其他地區也發生了類似襲警、搶劫、縱火等事件。一些媒體評論指出,這與貧富差距有關。英國首相卡梅倫接受採訪時,聲稱騷亂事件與貧富差距無關。
英國《衛報》記者利用大數據的分析結果,做了關於這一事件的系列報導,其中的一個報導主題,便是騷亂與貧困有沒有關聯。記者利用谷歌融合圖表,在倫敦地區地圖上標記出騷亂分子的居住地信息(黃色點)、實際發生騷亂的地點(灰色點),以及貧困地區分布(越偏紅色表示越貧窮)。根據這張倫敦市中心的圖,網民可以將圖擴展到整個大倫敦地區來看,也可以聚焦到具體的街區放大來看,觀察每個被標記的騷亂點的人流從哪裡來,到哪兒去,從而清楚地看到貧苦與騷亂之間存在的某種關聯。這種關係的表達,比起單純的文字報導來,表現清晰,說服力強。
預測走向
2013年“十一”長假期間,九寨溝發生遊客大量滯留現象並引發群體性事件。如果新聞媒體或旅遊當局能夠在此前運用中國的局部大數據進行預測性報導,完全可以避免這樣的群體性事件發生。因為傳媒可以根據這方面的大數據,提前報導在哪個具體時間段內,有多少人從哪些地方前往九寨溝,其中男人、女人、老人、兒童各有多少等等。
這只是一個小例子,大數據能夠預測社會和人們日常生活中的各個方面。通過挖掘大數據,傳媒在技術上可以製作出可視化、互動式的圖表,告知很多事項。微觀的如流行疾病來襲、交通擁堵情況;巨觀的如經濟指數變動、某種社會危機的來臨等等。百度開闢了“百度預測”網頁,以“大數據,知天下”的口號推出,預測的產品有高考、世界盃、電影票房等等。它們後期準備上線的產品擴展到了更廣的領域,比如金融預測、房地產預測等等。
信息定製
利用大數據的分析結果,滿足網民的信息個性化要求,是國外媒體的最新嘗試。例如Five thirty eight數據部落格,在2014年5月23日新辟讀者來信專欄“親愛的莫娜”。其第一期開篇語闡釋的目的是:“我開這個專欄是為了幫助讀者回答一些生活中重要的或者嚴肅的問題,比如我是不是很正常、我處在世界的哪個地位層面等等,目的不是為了給讀者答疑解惑,不是告訴讀者應該做什麼和不應該做什麼。恰恰相反,我提供數據來解釋、描述你的經歷。”
綜觀這個專欄,讀者的提問五花八門,比較嚴肅的如:“美國有多少人從來沒有喝過一滴酒?”“美國有多少男性空乘人員?”也有比較私人的如:“我該多久換一次襪子?”“婚前同居會不會導致離婚”等等。專欄作者利用美國範圍內的大數據,即刻將分析結果告知當事人,但避免給出指導性意見,僅告知各種數據的分析結果,讓網民自己依照分析結果來處理自己面臨的問題。這個專欄與傳統的紙媒讀者來信專欄不同,不是通過星座、血型、生辰八字或偽裝成閱歷豐富的專家,來提供些心靈雞湯式的回答,只用數據來說話。
這種嘗試在媒體中並不少見。2011年,BBC廣播公司曾根據2012年政府的財政預算聯合畢馬威會計師事務所做了一個預算計算器,用戶只需要輸入一些日常信息,例如買多少啤酒,用多少汽油等,就能夠算出新的預算會讓你付多少稅,明年生活會不會更好。
根據用戶需求提供個性化的大數據服務,是未來的發展趨勢。這些報導有一個共性,媒體都致力於以用戶的需求為中心,利用大數據詮釋巨觀社會現象對用戶的影響,或者回答用戶困惑的問題。媒體可以精準定位,經過後台計算,按照用戶的接收習慣、工作習慣和生活習慣將服務推送到用戶眼前。
解決對策
海量數據收集與整合
媒體工作者需多渠道的收集數據。從公開的資料庫或者是政府部門、企業、機構中獲取數據,從這些海量信息中判斷和選擇有表現力的數據。當媒體工作者獲取數據之後,便開始處理和整合數據。將與新聞報導無關的數據篩選、過濾後,剩下有用的數據進行整合彙編,形成新的報導內容。以“百度人口遷徙”為例,百度利用軟體,將人們購票的時間、地點、性別、年齡以及出發站、終點站進行統計,形成資料庫,不僅可供新聞工作者使用,政府和企業等也可利用這些數據,創造出不同的價值。 由此可見,海量數據的收集與整合對於數據新聞來說是一大挑戰。新聞工作者通過數據的挖掘和分析,尋找出有價值的相關性,繼而增加對相關事件發展趨勢的預測性,新聞和數據相結合創作出精確和深度報導,成為大數據時代的新聞業務發展方向。
凸顯把關人的重要性
截止2014年中國的網民規模高達6.52億,在信息碎片化的時代,相當多的網民在網上瀏覽新聞,因此數據新聞的把關尤為重要。數據新聞需要大量的數據、數據分析處理,不僅僅是要有技術水平,更需要一雙慧眼,分得清“真數據”和“假數據”,而且還要選擇重要的數據和信息進行報導,為客群提供更細緻、精確的新聞,又快又準的報導新聞,數據新聞的把關在數據時代更為重要。
提高新聞工作者媒體素養
數據新聞學是一門交叉的學科,數據新聞的產生給傳統的新聞工作者提出了挑戰,傳統的新聞創作理念和方式,要求新聞工作者具備采寫編評等基本專業技能,但目前已無法滿足大數據時代下數據新聞的創作。因此,對於當前的新聞工作者應具備以下媒體素養:
a.熟練運用計算機能力。在如今信息爆炸的時代,網際網路的地位不容忽視。網際網路時代,尤其是社交網路、電子商務與移動通信把人類社會帶入了一個以“PB”(1024TB)為單位的結構與非結構數據信息的新時代。大量的數據和信息擺在新聞工作者面前,傳統的計算機無法處理大量的、無規律的數據,需要雲計算進行分析、處理、統計,因此,對於當今的新聞工作者提出了更高的要求,必須熟練運用計算機,以便處理大量的數據和信息。
b.分析處理數據能力。數據新聞與傳統的文字圖片新聞不一樣,數據新聞需要大量的數據,新聞工作者可以通過數據發現問題、提出問題,也可以先有了問題之後,再去收集相關的數據。而擁有大量數據後,必須對其進行分析和處理,將不需要或不相關的數據過濾掉,剩下有價值的數據加以分析整合,供新聞編輯使用。德勤在美國華盛頓特區的研發創新團隊招聘數據記者,其中最重要的要求就是要具備分析數據的能力,由此可見,數據新聞記者必須具備較強的數據分析和處理的能力,才能勝任此工作。
c.可視化平面設計能力。數據新聞的可視化表達為新聞行業注入了一股新鮮的血液,讓數據新聞充滿希望與活力。數據新聞的可視化圖片將不同的時間和空間聯繫在一起,將繁雜的數據簡單化,便於客群理解,更有利於客群參與其中,滿足不同客群的各方面需求。數據新聞的可視化是其一大特點,因此對於新聞工作者來說,應熟練掌握可視化技術,學會識圖製圖以及各種表格的製作。
數據新聞特徵
以服務公眾利益為目的;
以公開的數據為基礎;
依靠特殊的軟體程式對數據進行處理,開掘隱藏在巨觀、抽象數據背後的新聞故事;
以形象互動的可視化的方式呈現新聞。
1.以服務公眾利益為目的;
2.以公開的數據為基礎;
3.依靠特殊的軟體程式對數據進行處理,開掘隱藏在巨觀、抽象數據背後的新聞故事;
4.以形象互動的可視化的方式呈現新聞。