Python數據科學入門

《Python數據科學入門》是人民郵電出版社出版的一本圖書。

內容簡介

《Python數據科學入門》以Python 語言講解數據科學基礎知識,涵蓋了數據採集、清洗、存儲、檢索、轉換、可視化、數據分析(網路分析)、統計和機器學習等內容。具體內容包括:數據科學的Python 核心特性,文本數據、資料庫、表格形式的數值數據、series 和frame、網路數據的使用,數據的繪製,機率與統計,機器學習。

圖書目錄

第 1 章 什麼是數據科學 1

第 1 單元 數據分析步驟 2

第 2 單元 數據獲取途徑 3

第3 單元 報告的結構 4

輪到你了 5

第 2 章 數據科學的Python 核心 6

第4 單元 理解基本的字元串函式 6

第5 單元 選擇合適的數據結構 8

第6 單元 通過列表推導式理解列表 9

第7 單元 使用計數器 10

第8 單元 使用檔案 11

第9 單元 上網 12

第 10 單元 使用正則表達式實現模式匹配 13

第 11 單元 globbing 檔案名稱與其他字元串 17

第 12 單元 Pickling 和Unpickling 數據 18

輪到你了 18

第3 章 使用文本數據 20

第 13 單元 處理HTML 檔案 20

第 14 單元 處理CSV 檔案 24

第 15 單元 讀取JSON 檔案 25

第 16 單元 處理自然語言中的文本 27

輪到你了 31

第4 章 使用資料庫 33

第 17 單元 設定MySQL 資料庫 33

第 18 單元 使用MySQL 資料庫:命令行 36

第 19 單元 使用MySQL 資料庫:pymysql 39

第 20 單元 改善文檔存儲:MongoDB 41

輪到你了 44

第5 章 使用表格形式的數值數據 45

第 21 單元 創建數組 46

第 22 單元 轉置和重排 48

第 23 單元 索引和切片 49

第 24 單元 廣播 51

第 25 單元 揭秘通用函式 52

第 26 單元 理解條件函式 54

第 27 單元 數組的聚合與排序 54

第 28 單元 將數組用作集合 56

第 29 單元 數組的保存和讀取 57

第30 單元 生成合成正弦波 57

輪到你了 59

第6 章 使用series 和frame 61

第31 單元 pandas 數據結構 62

第32 單元 數據重塑 67

第33 單元 處理缺失數據 72

第34 單元 組合數據 75

第35 單元 數據的排序和描述 78

第36 單元 數據轉換 82

第37 單元 掌握pandas 的檔案讀寫功能 87

輪到你了 90

第7 章 使用網路數據 91

第38 單元 概念剖析 91

第39 單元 網路分析序列 94

第40 單元 使用networkx 95

輪到你了 101

第8 章 繪圖 103

第41 單元 使用PyPlot 進行基本繪圖 104

第42 單元 了解其他繪圖類型 106

第43 單元 精通繪圖裝飾 107

第44 單元 用pandas 繪圖 109

輪到你了 111

第9 章 機率與統計 113

第45 單元 回顧機率分布 113

第46 單元 回顧統計度量 115

第47 單元 以Python 的方式完成統計 117

輪到你了 120

第 10 章 機器學習 122

第48 單元 設計預測實驗 122

第49 單元 線性回歸擬合 124

第50 單元 用k 均值聚類實現數據分組 129

第51 單元 在隨機決策森林中生存 131

輪到你了 133

附錄1 擴展閱讀 135

附錄2 單星項目的解決方案 137

參考文獻 146

相關詞條

熱門詞條

聯絡我們