數據與信息

有一句話是這么說的“數據是爆炸了,信息卻很貧乏”,那么數據與信息之間到底有什麼關係呢?

聯繫

數據和信息之間是相互聯繫的。數據是反映客觀事物屬性的記錄,是信息的具體表現形式。數據經過加工處理之後,就成為信息;而信息需要經過數位化轉變成數據才能存儲和傳輸。

區別

那么,數據是否就是指可以存儲和傳輸的信息呢?未必!數據和信息是有區別的。從資訊理論的觀點來看,描述信源的數據是信息和數據冗餘之和,即:數據=信息+數據冗餘。

數據是數據採集時提供的,信息是從採集的數據中獲取的有用信息。

圖1 數據與信息的關係 圖1 數據與信息的關係

由此可見,信息可以簡單地理解為數據中包含的有用的內容。不嚴格的說,“不知道的東西,你知道了,就獲得了一個信息”。

定量分析

上面定性分析了數據和信息之間的區別和聯繫,下面對數據和信息進行定量分析。數據量和信息量之間會有什麼聯繫呢?是不是數據量越大,其中包含的信息量就越多呢?不一定。比如,有人說“人的嘴巴上方有鼻子,鼻子上方有眼睛”,因為這是預料中的事,所以你從這個訊息中得到的信息量很少。但如果有人說“人的鼻子上方有嘴巴,嘴巴上方有眼睛”,就會讓人很震驚,因為這是預料之外的,這樣的信息量就很大。這說明了:一個訊息越不可預測,它所含的信息量就越大。

事實上,信息的基本作用就是消除人們對事物了解的不確定性。信息量是指從N個相等的可能事件中選出一個事件所需要的信息度量和含量。從這個定義看,信息量跟機率是密切相關的。在機率論中,用P(x)表示在N個相等的可能事件出現某一個事件的機率,即P(x)=1/N。信息量I(x)定義為:

I(x)=logN = -log(1/N )= -logP(x)

結合機率論知識,推而廣之,可以用下面的公式——稱之為熵H(x)公式來表示一大堆數據帶來的平均信息量。

注意:這個平均信息量不是算術平均,是機率論的統計平均——數學期望值。

相關詞條

熱門詞條

聯絡我們