線上社交網路情感分析

線上社交網路情感分析,屬於觀點挖掘的範疇,是依據用戶在社交網路中的行為(如評論、口碑等),以邏輯學、語言學、心理學理論為基礎,採用自然語言處理等方法,分析用戶對實體(如產品、服務、個人、事件等)表達的觀點、情緒、態度。

目錄:

1. 定義

2. 線上社交網路情感分析的套用

3. 線上社交網路情感分析的技術

一.定義

線上社交網路情感分析,屬於觀點挖掘的範疇,是依據用戶在社交網路中的行為(如評論、口碑等),以邏輯學、語言學、心理學理論為基礎,採用自然語言處理等方法,分析用戶對實體(如產品、服務、個人、事件等)表達的觀點、情緒、態度。雖然自然語言處理方法已有多年的研究,但情感分析仍然是一個熱點研究。其原因有:(1)線上社交網路情感分析,有著廣泛的套用,尤其是在工業界。(2)隨著網路社交媒體的發展,線上社交網路的情感分析面臨一些新的挑戰和新的視角,如數據的海量性對情感分析算法的影響。

二.線上社交網路情感分析的套用

情感分析最常見的套用是分析線上評論中消費者對產品及服務的觀點。Twitter 和Facebook是許多情感分析套用的焦點,最普遍的套用利用Twitter 和Facebook數據檢測特定品牌的聲譽。同時,情感分析也可以被套用到政治領域,如追蹤社交網路上用戶對選民對候選人演講和行為的看法。另外,在金融市場上,社交網路情感分析也有普遍的套用,如情緒分析系統利用從多個線上平台收集的討論企業的文章,分析總體情感分值,並將該分值套用到交易系統中。

三.線上社交網路情感分析的技術

線上社交網路的新特點給傳統情感分析帶來了一些新的研究問題,進而也催生了一些新的線上社交網路情感分析技術。例如,專門處理短小文本的情感分析技術、利用社交網路中群體間的相互作用的情感分析技術,以及應對社交網路中的垃圾用戶、垃圾意見可能對真實情感分析帶來的影響的一系列垃圾數據處理技術等。

3.1 面向短文本的情感分析技術

隨著Twitter 、Facebook、新浪微博等社交網路的迅速發展,人們可以隨時隨地地在網路上發表自己的觀點及意見。不同於傳統新聞、報導等長文本,社交網路中文本短小、語法不規則性,並含有大量的噪聲,針對社交網路中的短文本的情感分析技術具有十分重要的意義。

Go Alec等人在2009年測試了監督學習算法在Twitter短文本上的情感分類效果,如多項式貝葉斯分類、最大熵模型及支持向量機模型。不同於在長文本中依靠人工標註獲得的訓練集,Go Alec等人採用Twitter中的表情符號獲取正面評論和負面評論,從而省去了大量的人工標註成本,同時提升了訓練集的規模。

隨著微博的興起,針對短文本的情緒分析成為社交網路分析的一個重點。目前,很多注重於情感分析的評測會議,如自然語言處理與中文計算會議(NLP&CC)、全國信息檢索會議(CODE)等,都將情緒分析作為一個重要的部分。Zhang Lumin(張魯民)等人採用情感向量模型對社交網路中用戶的多元化情感進行表示,並基於聚類構造情感向量的層次化結構。

針對短文本話題的情感識別方面,Wang xiaolong(王曉龍)等人針對Twitter中的話題標籤(hashtag),通過構造hashtag-graph模型在話題層次上進行情感分析。

3.2 基於群體智慧型的情感分析技術

在社交網路中,用戶不僅僅能隨意表達自己的觀點意見,同時基於社交網路中連線結構,使得用戶的情感不自覺受到社交網路總其他節點的影響。社交網路提供的互動功能更加增強了用戶情感的互動,使得情感信息沿著社交網路結構進行擴散。

Thelwall Mike針對MySpace上的朋友關係網路進行情感分析,發現相連線的用戶往往具有相同的情感傾向。Bollen Johan等人在2011年基於Twitter上的大規模的海量數據,研究了社交網路中幸福感的同質現象,表明用戶更傾向於選擇具有相同幸福感指數的人進行互動。

3.3 社交網路的垃圾意見挖掘技術

社交網路中的垃圾用戶、網路推手等為推搞產品銷售量或推高某個時間而發布大量的虛假信息,檢測分析社交網路中的垃圾意見對於抽取真實的信息再要具有十分重要的意義。Jindal Nitin和Liu Bing在情感分析的基礎上,首次提出了針對產品垃圾意見檢測的概念。其將垃圾意見檢測看做二元分類問題,基於亞馬遜580萬產品評論,根據評論的重合度,採用Logistic回歸方式將用戶意見分為垃圾意見和非垃圾意見兩類。

相關詞條

熱門詞條

聯絡我們