內容簡介
《Python數據科學入門》以Python 語言講解數據科學基礎知識,涵蓋了數據採集、清洗、存儲、檢索、轉換、可視化、數據分析(網路分析)、統計和機器學習等內容。具體內容包括:數據科學的Python 核心特性,文本數據、資料庫、表格形式的數值數據、series 和frame、網路數據的使用,數據的繪製,機率與統計,機器學習。
圖書目錄
第 1 章 什麼是數據科學 1
第 1 單元 數據分析步驟 2
第 2 單元 數據獲取途徑 3
第3 單元 報告的結構 4
輪到你了 5
第 2 章 數據科學的Python 核心 6
第4 單元 理解基本的字元串函式 6
第5 單元 選擇合適的數據結構 8
第6 單元 通過列表推導式理解列表 9
第7 單元 使用計數器 10
第8 單元 使用檔案 11
第9 單元 上網 12
第 10 單元 使用正則表達式實現模式匹配 13
第 11 單元 globbing 檔案名稱與其他字元串 17
第 12 單元 Pickling 和Unpickling 數據 18
輪到你了 18
第3 章 使用文本數據 20
第 13 單元 處理HTML 檔案 20
第 14 單元 處理CSV 檔案 24
第 15 單元 讀取JSON 檔案 25
第 16 單元 處理自然語言中的文本 27
輪到你了 31
第4 章 使用資料庫 33
第 17 單元 設定MySQL 資料庫 33
第 18 單元 使用MySQL 資料庫:命令行 36
第 19 單元 使用MySQL 資料庫:pymysql 39
第 20 單元 改善文檔存儲:MongoDB 41
輪到你了 44
第5 章 使用表格形式的數值數據 45
第 21 單元 創建數組 46
第 22 單元 轉置和重排 48
第 23 單元 索引和切片 49
第 24 單元 廣播 51
第 25 單元 揭秘通用函式 52
第 26 單元 理解條件函式 54
第 27 單元 數組的聚合與排序 54
第 28 單元 將數組用作集合 56
第 29 單元 數組的保存和讀取 57
第30 單元 生成合成正弦波 57
輪到你了 59
第6 章 使用series 和frame 61
第31 單元 pandas 數據結構 62
第32 單元 數據重塑 67
第33 單元 處理缺失數據 72
第34 單元 組合數據 75
第35 單元 數據的排序和描述 78
第36 單元 數據轉換 82
第37 單元 掌握pandas 的檔案讀寫功能 87
輪到你了 90
第7 章 使用網路數據 91
第38 單元 概念剖析 91
第39 單元 網路分析序列 94
第40 單元 使用networkx 95
輪到你了 101
第8 章 繪圖 103
第41 單元 使用PyPlot 進行基本繪圖 104
第42 單元 了解其他繪圖類型 106
第43 單元 精通繪圖裝飾 107
第44 單元 用pandas 繪圖 109
輪到你了 111
第9 章 機率與統計 113
第45 單元 回顧機率分布 113
第46 單元 回顧統計度量 115
第47 單元 以Python 的方式完成統計 117
輪到你了 120
第 10 章 機器學習 122
第48 單元 設計預測實驗 122
第49 單元 線性回歸擬合 124
第50 單元 用k 均值聚類實現數據分組 129
第51 單元 在隨機決策森林中生存 131
輪到你了 133
附錄1 擴展閱讀 135
附錄2 單星項目的解決方案 137
參考文獻 146