提出背景
2008年,第十九屆ACM-SIAM學術討論會上,雅虎研究院資深研究員Andrei Broder首次提出了計算廣告學(ComputationalAdvertising)的概念,他認為,計算廣告學是一門由信息科學、統計學、計算機科學以及個體經濟學等學科交叉融合的新興分支學科。Andrei Broder只是提出了計算廣告學的研究目標——實現語境、廣告和客群三者的最佳匹配,並沒有從學術的角度給計算廣告學一個嚴謹的界定。 計算廣告學作為一門新興學科,在繼承傳統廣告學核心理論的同時,為了應對科學技術發展帶來的新問題和新觀念,將計算主義理論和方法套用到廣告學研究。計算主義認為,“整個世界都是由算法控制,並按算法所規定的規則演化的。宇宙是一部巨型的計算裝置,任何自然事件都是在自然規律作用下的計算過程。現實世界事物的多樣性只不過是算法的複雜程度不同的外部表現。”正如伽利略所言:“自然界這本大書是用數學語言所寫”。如今,計算的方法已經滲透到宇宙學、物理學、生物學、經濟學乃至社會科學等諸多領域。計算已經成為人們認識自然、生命、思維和社會的一種普適的觀念和方法。而 計算廣告學其實質就是研究如何利用計算的方法求解廣告活動中各類問題的一門學科。
計算廣告學是一門廣告行銷科學,以追求廣告投放的綜合收益最大化為目標,重點解決用戶與廣告匹配的相關性和廣告的競價模型的問題。計算廣告學涉及到自然語言處理、數據挖掘以及競價行銷、創意設計等諸多學科的融合。對於用戶而言存在商務搜尋廣告、瀏覽頁面投放廣告、社區人群廣告等多種形式。
計算廣告學從網際網路線上廣告的實踐當中產生,尤其是從搜尋行銷廣告投放的實踐中,吸取了大量的營養。我們回顧一下搜尋行銷中,用戶、廣告主、廣告投放平台是一個什麼樣的關係,與傳統廣告模式有什麼不同: 在傳統媒體的廣告投放平台中,用戶是被動的:一旦用戶接觸到媒體,只要廣告展現出來,“廣告消費[1]”即已完成。在效果行銷的廣告模式中,用戶具有選擇“接受”(Click)與否的權利,且只有在用戶接受的前提下,廣告消費才得以完成。
因此在這個平台中,廣告投放平台需要為用戶提供最易於接受的廣告,對於廣告主的效果負責。廣告投放平台需要綜合用戶、廣告主及自身(廣告投放平台)的利益,追求綜合利益最大化[2]。
但作為商業行銷平台,線上廣告投放商業模式中,尤其是搜尋行銷中,廣告主之間存在一個競價過程——這是一個博弈過程,行銷平台以此逼近媒體流量價值的最大值。廣告主在競價過程中,逐漸追逐這個市場的均衡點。除了要提供給用戶最符合其需求的廣告外,這一商業競價過程也是廣告投放的一個核心內容。
作為在這樣一個背景下產生的學科,我們定義計算廣告學的概念如下:
計算廣告學是一門廣告行銷科學,以追求廣告投放的綜合收益最大化為目標,重點解決用戶與廣告匹配的相關性和廣告的競價模型的問題。計算廣告學涉及到自然語言處理、數據挖掘以及競價行銷、創意設計等諸多學科的融合。對於用戶而言存在商務搜尋廣告、瀏覽頁面投放廣告、社區人群廣告等多種形式。
在這樣一個定義下,我們尤其要關註:
■ 計算廣告學是一門科學。之所以成為科學,“計算”本身就是很好的說明。無論是用戶需求的描述和刻畫,還是廣告投放相關性的保證,以及商業競價過程,都是以相關科學計算為基礎的。雖然,在行銷與創意最佳化等相關內容中,仍存在藝術的成分,但計算廣告學首先是一門科學。
■ 計算廣告學要解決的問題是廣告投放的綜合收益的最大化,是用戶與廣告匹配的相關性和廣告競價模型。在這個過程中,諸多學科融合在一起,尤其是自然語言處理、數據挖掘以及競價行銷、創意設計等相關學科。
■ 計算廣告學的主要實踐場景是網際網路線上廣告,對於用戶而言有商務搜尋廣告、瀏覽頁面投放廣告、社區人群廣告等多種形式。目前比較成熟的是商務搜尋廣告、瀏覽頁面投放廣告;對於新型社區(如SNS、遊戲社區等)的線上廣告還在發展當中。
廣告形式
計算廣告的運作系統主要包括廣告算法、廣告、語境、客群(用戶)四個方面,針對這四個方面當下的廣告形式可歸納為三類:基於文本分析、基於用戶分析和基於用戶參與。
基於文本分析的計算廣告
近年來,文本分析成為自然語言處理學科的一個熱點研究問題,該學科一些套用研究學者相繼將網頁分析、文本傾向性分析、文本相似性分析、機器翻譯等研究成果套用到網路廣告實踐中,其突出代表為百度競價排名、Google AdSense、DoubleClick Contextual Ad。這三者雖然都是基於文本分析,而且它們有著相同的前提假設——用戶喜歡與自身信息需求相關的廣告,但是這三者的系統原理卻截然不同。百度競價排名通過對用戶搜尋關鍵字與廣告主競拍關鍵字進行相似性計算,實現在搜尋結果的最前面插入與用戶搜尋相關的廣告。顯然,百度競價排名人為干預搜尋結果有一定的誤導用戶之嫌。Google為了保證搜尋結果的公平性,較早放棄了競價排名廣告,轉向以站長加盟的形式實現在搜尋目標頁面投放與搜尋詞相似的廣告,即Google AdSense。而Contextual Ad基於對用戶所瀏覽網頁的主題分析,從廣告庫中檢索與主題相似的廣告插入到網頁指定位置,實現廣告與語境的匹配。
基於用戶分析的計算廣告
如果基於內容分析的廣告與語境向匹配是間接實現廣告與用戶相匹配的話,基於用戶分析的計算廣告便是直接尋找廣告與用戶的一致性。當前用戶分析主要從IP、註冊資料、伺服器日誌、Cookie、歷史數據、瀏覽器行為等方面切入,其代表性的廣告形式為電子商務個性化推薦廣告和MediaV。個性化推薦廣告可以看作是POP廣告的一種智慧型化改進,根據用戶的興趣特點和購買行為,向用戶推薦其感興趣的商品。此定位過程是IP地位、信息檢索、協同過濾、數據挖掘等多種算法組合計算的過程。而MediaV則是根據Cookie跟蹤用戶瀏覽歷史,分析用戶的興趣取向,在用戶登錄某網頁時,通過MediaV平台識別用戶,投放與之興趣相符的廣告。
基於用戶參與的計算廣告
文本和用戶行為都可以通過相關算法進行興趣相似性分析,然而圖像、視頻這種多媒體數據在現有的圖像識別技術下,尚不能進行主題分析,因此需要藉助人工參與。基於用戶參與的計算廣告系統其主要目的在於搭建一個用戶、廣告主、站長的聯盟平台,如Pixazza圖片廣告聯盟和QiYi視頻廣告聯盟。聯盟廣告系統以利益分成的方法吸引網民作為志願專家參與廣告創作活動中,專家瀏覽圖片或者視頻時發現商品信息,則在相應位置插入廣告興趣點,並連結到之相對應的商品購買廣告。與傳統的視頻插播廣告不同的是,這種廣告系統只有在用戶指向廣告興趣點時才會顯示廣告,一定程度上減輕了對用戶瀏覽圖片、視頻的打擾。
全景觀
計算廣告學產生的行業背景是網際網路廣告行銷,我們從一個全局角度進行介紹。
在這個全景圖中,我們先介紹角色概念:
■ 用戶:網際網路用戶;用戶在網際網路上獲取內容或服務,也是廣告的客群。
■ Publisher:網際網路內容或服務提供商,是網際網路廣告投放的媒介。用戶在瀏覽其內容或使用其服務的時候,相應的在該媒體上完成廣告信息的接收和操作。
■ Ad Network:廣告聯盟網路,是一個連線廣告主advertiser和網際網路媒體publisher的廣告系統平台,一方面廣告主提供市場行銷工具甚至廣告投放服務,另一方面為網際網路媒體兌現部分廣告的價值。
■ Advertiser:廣告主,是行銷的主體,他具有投放廣告到用戶的商業需求並期望用戶通過廣告的影響成為其產品或服務的消費者。
■ Ad Exchange:是一個在不同Ad Network之間實現廣告與流量交換交易的平台;該平台能夠在不同商業模式之間實現市場互通,進而完成廣告市場的整合與利益最大化。
通常,一個廣告主如果需要投放網際網路線上廣告,他需要選擇一個Ad Network,並依據相關行銷工具進行廣告創意製作、投放計畫管理和投放過程及效果監控。而事情的起點就是,把廣告計畫建立起來,並付款——付款購買的是什麼?是Ad Network為他帶來的潛在消費者——而體現就是Publisher的流量。所以,這個環節只有廣告主的意願還是不夠的。Ad Network需要獲取大量的流量位置用來投放廣告——並在行銷工具中告訴廣告主,你的廣告可以通過什麼方式選定廣告位置——其實也就是選定你的潛在客戶。這些潛在客戶的廣告觸受行為,才是廣告主真正要花錢購買的東西。另外一個視角,就是AdNetwork去建立一個廣告行銷市場,它需要有強大的銷售力量,找到所有它需要的廣告主進行廣告行銷,並能夠獲取並梳理Publisher流量位置,告訴廣告主它們的行銷價值值得他付款。
到此處,對應於我們全景圖的右邊部分,可以看作一個階段。
然後,AdNetwork將選擇合適的廣告投放平台,對廣告主的廣告進行分析並添加到廣告投放系統中。現在一個用戶在訪問某個Publisher,通過其內容或服務獲取相關信息。如果當前Publisher參與了該Ad Network的廣告投放活動,用戶的一次PV將觸發一次廣告投放操作——系統自動將用戶的部分信息(一般是有利於廣告投放的信息)作為輸入傳送到廣告投放平台,並經過一個複雜的決策過程,優選出一批廣告回傳Publisher,以事先設計的樣式進行廣告展現。此時用戶就看到了網際網路線上廣告。
這又是一個階段。
這個時候依據線上廣告不同的商業模式,廣告主對於“用戶”的“行銷消費過程”還在不同程度的延續。如果是CPM——千次展現付費——則廣告瀏覽本身已經形成費用;系統需要將這個瀏覽信息記錄,並啟動後續廣告費用及報表相關的操作。如果是CPC——點擊付費——則還需要看用戶是否進一步點擊了廣告;如果用戶沒有點擊,則廣告展現分文不取,如果用戶點擊了,則需要將點擊信息記錄,並啟動後續廣告費用及報表相關操作。當然,還有其他更為複雜的商業模式,我們後面再詳細展開。此時廣告主的費用已經被扣減了,Publisher也應該拿到了自己應得的廣告費用分成部分。
這是另外一個階段。
從這樣一個角度,我們看到的是這樣三個方面:
■ 廣告行銷管理:涉及到Advertiser、Ad Network。
■ 廣告投放:涉及到用戶、Publisher、Ad Network。
■ 廣告商業價值結算:涉及到用戶、Publisher、Ad Network及Advertiser全部角色。
這三個方面是廣告投放的核心過程。而且每一個方面中,都有極具挑戰的內容——且對於廣告市場和廣告價值實現而言具有不可忽視的影響。
我們可以說一些例子來啟發你思考。比如,在廣告行銷管理方面,一個廣告主需要投放廣告——我們假設是競價詞廣告,那么你應該選擇什麼樣的競價詞來最佳化你的效果和成本?在廣告投放方面,廣告投放平台如何把握用戶潛在的需求?在廣告商業價值結算方面,如何有效判定一次廣告消費不是作弊行為?
在一個更大場景上,也就是我們全景圖中Ad Exchange參與的部分,這個廣告投放活動將更為複雜,後續再進行介紹。但到此處,我們就計算廣告學的全景做了一個概要性介紹。
相關論文
《計算廣告學:大數據時代的廣告傳播變革——以“網際網路+”技術經濟範式的視角》
載於《現代經濟探討》2016年第2期,作者:劉慶振,北京信息科技大學公共管理與傳媒學院
摘要:計算廣告學作為一門新興的交叉學科,是在當前新舊技術經濟範式轉換的背景下產生的,它符合媒介融合時代的精準定製傳播需求。計算廣告學的核心精髓是實現廣告、語境和消費者的精準匹配,大數據技術和雙向互動平台是實現這一目標的兩大基礎支柱。現階段,計算廣告引發了定製化推薦、融合化傳播、智慧型化調整、程式化購買等與傳統廣告傳播業態截然不同的新模式。未來,計算廣告學將會帶來整個廣告產業鏈的巨大變革,它也提出了對複合型計算廣告人才的強烈需求。
《“網際網路+”背景下計算廣告技術體系的創新與套用》
載於《新聞界》2016年第2期,作者:劉慶振,北京信息科技大學公共管理與傳媒學院
摘要:廣告產業的進化與廣告技術的創新有著十分密切的關係,每一次廣告技術創新都會帶來廣告產業的新發展,計算廣告新業態的產生也是技術創新的必然結果。而計算廣告技術體系主要由當前“網際網路+”背景下的通用技術體系和計算廣告的具體技術體系兩部分構成,通用技術體系使得具體技術體系具備了產生的條件,具體技術體系則滿足了計算廣告特定的需求從而使之成為一種產業現實。當然,計算廣告的技術體系在定量研究方面推動了廣告產業的進步,但是這並不意味著定性研究不再重要,二者的完美結合才是廣告產業良性健康發展的保障。
相關書籍
《計算廣告學》
主要內容
本書主要包括計算廣告學的理論構建和前沿問題兩大主體部分,理論創新指導產業前沿不斷發展,套用創新不斷歸納升華為基本理論。在這一整體框架下,每一主體部分又由數個關鍵主題構成。
廣告學研究面臨的本質問題是理論框架的不完整、不清晰、不成熟。為了使計算廣告理念和技術的套用更廣泛,我們需要總結、抽象、提煉一套有關計算廣告的假設、思維、理念、共識、方法、路徑,進而搭建一個完整的理論框架,形成一門關於計算廣告的“學”。這將為整個廣告學的研究和實踐帶來全新思想,並豐富廣告學原有的學術體系。
作者
劉慶振 北京信息科技大學網路與新媒體系講師。
趙 磊 昌榮傳媒集團程式化行銷中心執行副總經理。
《計算廣告學實踐》
筆者(一元之權)在規劃的一本書,從中可以初窺計算廣告學的細節內容,把規劃中的目錄分享給大家,後續將逐漸在百科或文庫中開放。
《計算廣告學實踐》目錄:
計算廣告學實踐
寫在前面的話
第一部分 定義與套用
1 緒論
2 計算廣告學全景
3 線上廣告商務模式
4 市場行銷工具
第二部分 廣告競價理論
5 拍賣理論
6 廣告競價過程
7 廣告競價與博弈
第三部分 廣告投放系統
8 搜尋廣告行銷系統
9 聯盟廣告行銷系統
10 其他廣告行銷系統
11 市場行銷工具
12 廣告投放系統中的挑戰
第四部分 計算廣告學技術
13 廣告分析技術
14 Query分析技術
15 文本分析技術
16 人群分析技術
17 廣告排序技術
18 行銷工具技術
第五部分 計算廣告學未來
19 新媒體與新的用戶群
20 新的博弈
腳註
[1]即表示廣告主通過廣告,購買了媒體流量——其實購買的是在媒體上活動的潛在客戶。
[2]廣告投放平台以綜合利益最大化為追求目標,是產品和平台設計的基本理念。如果一味追求投放平台的收益,必然會損失市場的健康發展。
新聞資訊
計算廣告學將成為數字商業的奠基學科
計算廣告學是一個新興的學科,由工業界驅動,逐步形成一個學科體系。近期網際網路巨頭在大學開設這樣的課程,進一步推動了計算廣告學的逐步完善,比如Yahoo在斯坦福開設了計算廣告學的課程。國內百度在清華、北郵、南大等學校講授了類似課程。
計算廣告學,顧名思義是計算驅動廣告的學科,這是相對傳統的廣告而言的。在傳統廣告中如電視廣告,廣告主不清楚客群是誰,什麼年齡層,看完廣告之後什麼感受。甚至是電視的收視率都無法精確統計,就更談不上廣告的投放效果了。而計算廣告就表現出更多的智慧型:廣告主可以了解目標客戶在哪,誰看了廣告,廣告的效果等等,這些都可以粗略計算出來。針對計算廣告學目前還沒有一個相對官方的定義。我們看到史丹福大學對它的描述是:“計算廣告學是一個綜合學科,涉及大規模搜尋、文本分析、信息檢索、統計建模、機器學習、分類、最佳化和個體經濟學。計算廣告的核心問題是要找到在給定的環境下,用戶與廣告的最佳匹配。”這裡的環境可以指代用戶在搜尋引擎中輸入一個查詢語句,或者用戶閱讀網頁,或者是用戶在攜帶型設備上觀看電影。
總體而言,計算廣告學要最佳化整個廣告系統,平衡廣告主、服務提供商(可以是搜尋引擎,或者新聞門戶)以及用戶的利益,使其達到最大化。因此針對廣告的效果而言,是需要可以計算的。比如網路廣告裡面的點擊率、轉換率等等,廣告主可以通過計算廣告學看到直接量化的廣告投放效果,計算準確ROI。
對用戶而言,他們大多數情況下只希望看到自己感興趣的地廣告。那么網路服務商首先要知道用戶是誰,這個要通過用戶的使用行為,日誌數據挖掘,構建用戶特徵以及興趣模型。當然這往往是一個很粗略的挖掘,並且用戶的興趣還會出現動態變化。所以有時候會需要對用戶的網路使用行為進行實時計算,並即時調整,比如用戶的搜尋點擊行為,就可以作為一個參考數據。如果用戶對搜尋第一頁呈現的廣告沒有點擊,就說明可能廣告匹配沒有做好;那么在翻到第二頁的時候就可以根據之前的行為調整廣告。當然這種技術對實時計算要求比較高。
其次是廣告主與服務提供商之間的合作,這裡面有博弈論、拍賣機制等相關科學問題。畢竟從產業生態系統的角度來看,每個角色獲得足夠的利益才可以使整個產業鏈繁榮,每個角色如果獲得過多的利益而損害了合作夥伴,最終都會影響到整個產業,也包括自己。比如搜尋引擎的競價排名,對競價的機制要進行科學的設計,根據博弈論的理論來說,沒有機制約束的選擇肯定不是最優的。在搜尋競價排名中,假設沒有機制約束,排名第二的廣告主希望略高於第三名的競價,可以減少預算,同時也不會改變其展示的名次。以此類推第一名希望略高於第二名,第三名希望率高於第四名,那最終的結果就是大家的競價趨近於0,這實際上就破壞了競價排名的商業模式,對整個產業造成傷害。因此,競價排名的機制設計至關重要,要充分平衡雙方的利益。
此外,計算廣告學還要涉及自然語言處理、機器學習等相關學科。比如利用自然語言處理,才可以更好地識別網頁的內容,理解上下文,這樣才可以結合用戶特徵展示“最匹配“的廣告。而機器學習更多的時候是在幫助完善這一匹配,不斷調優系統。
從根本上來說,計算廣告學之所以能夠興起,主要原因也來自於網際網路公司的大數據能力。大數據解決了幾個計算廣告學相關的關鍵問題:
海量用戶數據的挖掘
實時大數據計算(流計算)
用戶與廣告特徵提取與匹配
語義網路的構建
百度之所以在國內開展計算廣告學相關課程,一方面百度搜尋引擎每天幾十億的搜尋,強大的“鳳巢”推廣系統;另一方面百度網盟聯合了24個行業、30萬家網站,每天都要將大量的客戶推廣信息以文字、圖片、動畫等多種形式展現在目標人群瀏覽的網頁上。一方面積累的大量的商業推廣經驗,同時也積累了以大數據挖掘、自然語言處理、機器學習等相關技術。如果將這些技術匯聚形成計算廣告學,並向高校傳播,這將是一個造福整個數字時代的事情:讓有需求的客戶找到商家,商家也可以更準確、更節約投放廣告。並讓更多的科技工作者加入這一領域,完善這個複雜的過程。計算廣告將逐步取代傳統廣告粗放式的廣播模式,減少信息的不平衡性並減少視覺污染,將成為未來數字商業的基石。