簡介
描述統計學(Descriptive Statistics)描述統計學內容包括統計數據的收集方法、數據的加工處理方法、數據的顯示方法、數據分布特徵的概括與分析方法等。
分析
描述統計是來描繪(describe)或總結(summarize)的觀察量的基本情況的統計總稱。描述統計學研究如何取得反映客觀現象的數據,並通過圖表形式對所收集的數據進行加工處理和顯示,進而通過綜合概括與分析得出反映客觀現象的規律性數量特徵。透過對於數據資料的進行圖像化處理,將資料摘要變為圖表,以直觀了解整體資料分布的情況。通常會使用的工具是頻數分布表(frequency distributiontable)與圖示法,如多邊圖(polygon)、直方圖(histogram barchart)、圓形圖(piechart)、散點圖(scatterplot)等。
透過分析數據資料,以了解各變數內的觀察值集中與分散的情況。運用的工具有:集中量數(Measureofcentrallocation),如平均數(Mean)、中位數(Median,Md)、眾數(Mode,Mo)、幾何平均數(Geometricmean,GM)、調和平均數(Harmonicmean,HM);變異量數(measureofvariation),如全距(range)、平均差(averagedeviation,AD)、標準差(Standarddeviation,SD)、相對差、四分差(quartiledeviation)。
在推論統計中,測量樣本的集中量數與變異量數都是變數(parameter)的不偏估計值,但是以平均數、變異數、標準差的有效性最高。數據的次數分配情況,往往會呈現常態分配。為了表示測量數據與常態分配偏離的情況,會使用偏態(skewness)、峰度(kurtosis)這兩種統計數據。
為了解個別觀察值在整體中所占的位置,會需要將觀察值轉換為相對量數,如百分等級(percentagerank,PR),或標準分數(Zscore,Tscore)。
推斷統計學
描述統計學和推斷統計學的劃分,一方面反映了統計方法發展的前後兩個階段,同時也反映了套用統計方法探索客觀事物數量規律性的不同過程。統計研究過程的起點是統計數據,終點是探索出客觀現象內在的數量規律性。在這一過程中,如果蒐集到的是總體數據(如普查數據),則經過描述統計之後就可以達到認識總體數量規律性的目的了;如果所獲得的只是研究總體的一部分數據(樣本數據),要找到總體的數量規律性,則必須套用機率論的理論並根據樣本信息對總體進行科學的推斷。
顯然,描述統計和推斷統計是統計方法的兩個組成部分。描述統計是整個統計學的基礎,推斷統計則是現代統計學的主要內容。由於在對現實問題的研究中,所獲得的數據主要是樣本數據,因此,推斷統計在現代統計學中的地位和作用越來越重要,已成為統計學的核心內容。當然,這並不等於說描述統計不重要,如果沒有描述統計收集可靠的統計數據並提供有效的樣本信息,即使再科學的統計推斷方法也難以得出切合實際的結論。從描述統計學發展到推斷統計學,既反映了統計學發展的巨大成就,也是統計學發展成熟的重要標誌。
推斷統計學的理論基礎是統計決策理論,由兩個部分組成:估計理論和假設檢驗理論。