目錄:
1.定義
2.線上社交網路情感強度分析技術
一 . 定義
線上社交網路情感強度分析,指在社交網路環境下,分析社交網路內容情感傾向的強度或褒貶情感的強弱的分析。情感極性分析只是對用來判斷社交網路內容是正面的還是負面的,而情感強度分析是用來分析社交網路內容正面或者負面的強度。情感強度分析有助於理解用戶的消費習慣、捕獲熱點事件的輿情,為企業和政府的決策提供依據。
二 . 線上社交網路情感強度分析技術
目前,針對線上社交網路情感強度分析的研究,主要採用等級分類方法,將情感強度劃分為不同的級別,在判斷情感強度屬於哪個級別。情感強度分析方法主要分為兩大類:辭彙情感強度的計算方法和句子或篇章情感強度的計算方法。
辭彙情感強度的計算方法主要包括:基於情感詞典的方法、基於詞頻統計的方法以及基於不同詞性組合的方法。基於情感詞典的方法主要是利用已有的情感詞典,判斷情感詞的強度,如朱嫣嵐等人使用WordNet定義辭彙的關聯關係來計算情感詞與一組情感傾向已有的詞的距離,從而分析情感強度。基於詞頻統計的方法就是統計情感詞在文本中出現的頻率來判斷詞的情感極性及其強度。LW Ku等人假設漢語辭彙的情感傾向是由組成辭彙的字組成)通過計算單字在特定的情感數據集中出現的頻率表征單字的情感強度,而辭彙的情感強度則由單字合成,等於各字情感度的平均值。基於不同詞性組合的方法主要利用的是不同的詞性組合在表達情感時會表征出不同的程度。例如,“手機功能強大”,與“手機功能非常強大”,顯然,副詞修飾的形容詞比單個形容詞表達的情感強烈。
句子或篇章情感強度的計算方法包括多分類方法以及計算情感得分方法。多分類方法將強度分成幾個等級,每個強度等級當作一個類別,構造分類器對其分類。WH Lin等人在研究語料的觀點類型時,將強度類別分為5類,通過改進樸素貝葉斯模型,構建分析句子情感強度的LSPM模型,該模型在判別句子的情感強度類別時,準確率達到75.29%,略低於篇章級別的準確率。計算情感得分方法,情感強度的變化是連續的,多分類方法忽略了這種連續性,造成訓練模型不夠準確,影響了情感強度的判斷。為此,不少研究通過計算情感得分的方法計算句子或篇章的情感強度。王洪偉等人認為情感句子權重應考慮情感句子在段落中出現的位置,出現在段首或段末的情感句子權重應當大於段中的情感句子權重,基於這一假設,分別對酒店評論和手機評論進行情感強度分析,取得了較好的效果。