內容提要
數據分析已經成為數據時代各行各業突破各自行業發展瓶頸的最有效手段,無論是公司職員還是個體商戶或大公司管理者,都需要有數據分析的能力。
《人人都會數據分析——從生活實例學統計》系統地介紹了數據分析的統計理論基礎內容,共5章。第1章闡述了數據分析在當今生活中的重要性,以及人們成為各自領域的數據分析師的必要性和學習路徑;第2章從數據描述的三個維度展開,詳細介紹了如何從集中趨勢、離散程度和分布形態對數據進行描述,從而使分析者充分了解自己手頭的數據;第3章介紹了推斷性數據統計分析的內容,介紹了如何通過樣本數據特性推斷出總體數據特徵;第4章是關於預測分析內容,介紹了變數之間的相關分析,以及如何使用容易獲取的數據信息預測難以獲取的數據信息,用過去的歷史數據信息預測未來可能出現的數據信息;第5章介紹了數據結果可視化的內容,包括各種統計圖形的功能及使用場景。
《人人都會數據分析——從生活實例學統計》以數據分析的統計理論基礎為主題,大多數知識點都列舉了生活中的實用案例,適合高等院校學生、公司職員、個體商戶和企業管理者學習參考。
目錄
第1 章 生活在數據時代 1
1.1 數據分析無處不在 2
1.1.1 常用的國家統計指標 2
1.1.2 製造業的數據分析套用 .9
1.1.3 行銷領域的數據分析套用 13
1.1.4 醫療行業的數據分析套用 15
1.2 人人都能成為數據分析師 16
1.2.1 數據分析過程 17
1.2.2 數據分析工具 21
1.2.3 數據分析師的成長之路 26
第2 章 耳熟能詳的數據你真的了解嗎 29
2.1 數據的類型 30
2.1.1 數據的結構屬性分類 30
2.1.2 數據的連續性特徵分類 . 31
2.1.3 數據的測量尺度分類 . 33
2.2 數據描述的三個維度 35
2.3 數據的集中趨勢描述 36
2.3.1 算術平均值 . 37
2.3.2 幾何平均值 . 39
2.3.3 眾數 . 40
2.3.4 中位數 . 41
2.4 數據的離散程度描述 42
2.4.1 極差 . 42
2.4.2 平均偏差 . 43
2.4.3 方差和標準差 . 44
2.4.4 變異係數 . 48
2.4.5 四分位極差 . 49
2.5 數據的分布形態描述 50
2.5.1 機率 . 50
2.5.2 機率分布 . 53
2.5.3 離散型機率分布:二項分布 . 54
2.5.4 離散型機率分布:多項分布 . 56
2.5.5 離散型機率分布:超幾何分布 . 57
2.5.6 離散型機率分布:泊松分布 . 59
2.5.7 連續型機率分布:指數分布 . 62
2.5.8 連續型機率分布:均勻分布 . 65
2.5.9 連續型機率分布:常態分配 . 66
2.5.10 常態分配作為二項分布近似 . 73
2.5.11 常態分配作為泊松分布近似 . 76
第3 章 數據分析的“核心”:推斷分析 . 79
3.1 見微知著的抽樣 80
3.1.1 抽樣的意義 . 80
3.1.2 抽樣方法 . 81
3.1.3 樣本推斷的理論基礎 . 84
3.2 數據的處理 86
3.2.1 數據處理的不良案例 . 86
3.2.2 正確的數據存儲形式 . 87
3.3 樣本到總體的橋樑:抽樣分布 88
3.3.1 抽樣分布的定義 . 88
3.3.2 ??分布 90
3.3.3 ??分布 95
3.3.4 切比雪夫定理 . 98
3.3.5 卡方(??2)分布 99
3.3.6 ??分布 100
3.4 數據分析的第一板“斧”:參數估計. 102
3.4.1 參數估計的類型 . 102
3.4.2 ??分布與總體均值的區間估計 . 104
3.4.3 ??分布與總體均值的區間估計 110
3.4.4 切比雪夫定理與總體均值的區間估計 113
3.4.5 卡方(??2)分布與總體方差的區間估計 115
3.4.6 ??分布與兩個總體方差比的區間估計 .119
3.4.7 兩個總體均值差的區間估計 . 121
3.4.8 總體比率的區間估計 . 133
3.4.9 樣本容量的確定 . 135
3.5 數據分析的第二板“斧”:假設檢驗. 142
3.5.1 假設檢驗的理論基礎 . 142
3.5.2 單樣本的假設檢驗 . 150
3.5.3 兩樣本的假設檢驗 . 159
3.5.4 多樣本的假設檢驗與方差分析 . 166
3.6 數據分析的第三板“斧”:非參數檢驗 . 184
3.6.1 非參數檢驗 . 185
3.6.2 卡方檢驗 . 187
3.6.3 ????????????????符號秩檢驗 191
第4 章 數據分析的終極目的:“為我所用” . 195
4.1 “相關”是繼續分析的前提 196
4.1.1 相關關係 . 196
4.1.2 相關分析 . 198
4.2 “回歸”是相關分析的歸宿 209
4.2.1 回歸分析綜述 . 209
4.2.2 簡單線性回歸分析 211
4.2.3 多元線性回歸分析 . 226
4.3 發現事物隨時間變化的規律 235
4.3.1 時間序列分析綜述 . 235
4.3.2 長期趨勢分析 . 238
4.3.3 季節變動趨勢分析 . 248
4.3.4 循環變動和不規則變動 . 252
4.3.5 時間序列分析套用 . 254
第5 章 給數據披上靚麗“外衣”:數據可視化 259
5.1 數據的可視化 260
5.1.1 數據可視化工具 . 260
5.1.2 常用的統計圖 . 261
5.2 條形圖、直方圖和餅圖 262
5.2.1 條形圖 . 262
5.2.2 直方圖 . 264
5.2.3 餅圖 . 266
5.3 線圖與面積圖 267
5.3.1 線圖 . 267
5.3.2 面積圖 . 267
5.4 散點圖 268
5.5 高低圖與箱線圖 270
5.5.1 高低圖 . 270
5.5.2 箱線圖 . 271
5.6 時間序列圖 272
5.7 帕累托圖 274
5.8 P-P 機率圖和Q-Q 機率圖 275
5.8.1 P-P 機率圖 275
5.8.2 Q-Q 機率圖 . 276