報告簡介
本報告由百度數據中心出品。 近幾年中國飲料年產量以超過20%的年均增長率遞增,飲料市場已成為中國食品行業中發展最快的市場之一。網民的搜尋行為體現了他們對於飲料產品乃至行業的直接認識,對於各飲料品牌,網民的認知如何?他們關注某品牌的潛在原因是什麼?搜尋行為本身又預示了飲料行業怎樣的未來發展趨勢?《2007百度風雲榜——飲料行業報告》從權威角度出發,通過對飲料行業全方位的專業診斷分析,發現和研究網民對飲料行業的真實認知規律,為飲料廠商的經營宣傳提供決策支持。
研究方法
本次對行業搜尋行為的調查採用了定性和定量研究結合、線上與線下調研相結合的方式。初始數據來源於2007年7月在百度各頻道所作的飲料行業線上調研,並按所取的5,757個樣本同期定距抽樣擴大,最終獲得1,632,845個Cookie的搜尋日誌,通過專業統計分析平台進行數據清理和分析,找出數據間的相關性,並做出相應的判斷和推測。所有榜單數據來源於2007年7月全月最新的網頁搜尋資料庫。參考的第三方數據取自各大專業機構公開發布的資料。
本報告中N=5,757指的是線上調研的樣本量,N= 1,632,845指的是cookie搜尋日誌調研的樣本量。
研究原理
搜尋引擎能採集用戶主動需求的文字表達(即關鍵字查詢),因此對用戶真實需求的把握較之入口網站更占優勢。通過Cookie跟蹤,能把關鍵字與具體的需求掛上鉤。我們假設每一個Cookie代表一個潛在消費者,那么該Cookie在一定時間內的關鍵字集合能全面反映他(她)關注的信息。我們對這些信息進行系統編碼、清理和分析,把不同Cookie檢索的關鍵字進行交叉分析,發現網民搜尋的群體行為,最後整合成行業報告。
通過“關鍵字組合”判斷各個Cookie代表的個人信息,我們對各種需求有一個“群”的把握。但百度不以具體用戶的個人信息作為分析對象,我們關注的是“虛擬的人”的真實需求。 數據採集好以後,藉助統計軟體,對用戶進行“群體”判斷和分析,整合成報告形式。
研究假設
我們假設,關注飲料的一部分網民會用百度來搜尋信息,他們會根據自己的興趣和關注點發出搜尋請求,輸入關鍵字。一旦他們有這些行為,百度會立即記錄下具體用戶的Cookie,並跟蹤他(她)的搜尋行為。
我們還假設,如果一個用戶在30天之內,只搜尋過一次飲料行業關鍵字,那么這個Cookie是無效的,不進入我們的研究範疇。因為這樣的搜尋行為具有很大的偶然性,很難說明這個用戶真正關注飲料。我們最關注的是對某個飲料話題有對話檢索行為的Cookie。
為了研究的時效性,我們也同時假設,如果以前用戶多次搜尋飲料信息,而最近60天內沒有再關注,該Cookie仍然被認為無效。因為很有可能用戶只是一時的興趣或者已經產生消費行為,對網際網路上的飲料信息的關注會減弱。對有歧義的關鍵字,我們會通過前期數據清理和後期交叉分析進行嚴格篩選,保證數據質量。
本報告中涉及到的一些定義說明:
碳酸飲料: 在一定條件下充入二氧化碳氣的製品,成品中二氧化碳含量(20℃時體積倍數)不低於2.0倍,分為果汁型碳酸飲料、果味型碳酸飲料、可樂型碳酸飲料、低熱量型碳酸飲料和其他型碳酸飲料。
水飲料:指瓶裝飲用水,即密封於塑膠瓶、玻璃瓶或其他容器中不含任何添加劑可直接飲用的水,包括飲用天然礦泉水、飲用純淨水和其他飲用水等。
乳飲料:指含乳飲料,即以鮮乳或乳製品為原料(經發酵或未經發酵),經加工製成的製品,包括配製型含乳飲料和發酵型含乳飲料。
果汁飲料:指用新鮮或冷藏水果為原料,經加工製成的製品,包括果汁、果漿、濃縮果漿、果肉飲料、果汁飲料、果粒果汁飲料、水果飲料濃漿和水果飲料。
茶飲料:指即開型瓶裝茶飲料,即用水浸泡茶葉,經抽提、過濾、澄清等工藝製成的茶湯或在茶湯中加入水、糖液、酸葉劑、食用香精、果汁或植(谷)物抽提液等調製加工而成的製品,包括茶湯飲料、果汁茶飲料、果味茶飲料、其他茶飲料。
特別說明:本次排行榜中的比例數據,指的是該品牌或產品相關的辭彙整體的Query搜尋數據與上榜的所有品牌/產品相關辭彙的整體Query數據的比例。所謂“該品牌/產品辭彙”指的是包括該品牌/產品名稱以及有關的所有簡寫、英文等表達方式的Query搜尋,籠統搜尋與精確搜尋都包括在內。本報告中所有排行榜都遵循此規範。
飲料行業指數
百度對於飲料行業相關所有辭彙的檢索量數據進行整理並匯總,得出該行業的綜合指數,以全面反映行業整體動態,以及網民對該行業各方面信息的整體檢索情況。數據來源於2006年7月-2007年7月的檢索資料庫。
從整體來看,網民對於飲料行業的熱情只增不減,尤其是在進入春夏季節後,對於飲料行業相關辭彙的檢索比之前有明顯增加。2007年2月下旬春節時間,整體檢索量有明顯的下降,表現在圖中為持續較長時間的凹形曲線。