深度學習與計算機視覺

深度學習與計算機視覺

本書全面介紹了深度學習及計算機視覺中基礎的知識,並結合常見的套用場景和大量實例,帶領讀者進入豐富多彩的計算機視覺領域。作為一本“原理+實踐”教程,本書在講解原理的基礎上,通過有趣的實例帶領讀者一步步親自動手,不斷提高動手能力,而不是枯燥和深奧原理的堆砌。

書籍介紹

內容簡介

全書共13章,分為2篇。第1篇基礎知識,介紹了人工智慧發展歷程、計算機視覺概要、深度學習和計算機視覺中的基礎數學知識、神經網路及其相關的機器學習基礎、卷積神經網路及其一些常見結構,最後對前沿的趨勢進行了簡單探討。第2篇實例精講,介紹了Python基礎、OpneCV基礎、簡單的分類神經網路、圖像識別、利用Caffe做回歸、遷移學習和模型微調、目標檢測、度量學習和圖像風格遷移等常見的計算機視覺套用場景。本書從第5章開始包含很多有趣和實用的代碼示例。從第7章開始的所有實例都基於當前流行的深度學習框架Caffe和MXNet,其中包含作者原創的大量代碼和蒐集的數據,這些代碼和作者訓練好的部分模型已分享到本書github頁面上供讀者自行下載。

本書適合對人工智慧、機器學習、深度學習和計算機視覺感興趣的讀者閱讀。閱讀本書要求讀者具備一定的數學基礎和基本的編程能力,並需要讀者了解Linux的基本使用。

一分鐘了解本書精華內容

引言

深度學習和計算機視覺中的基礎數學知識

神經網路和機器學習基礎

深度卷積神經網路

Python基礎

OpenCV基礎

Hello World!

簡單的圖片分類——手寫數字識別

利用Caffe做回歸

遷移學習和模型微調

目標檢測

度量學習

圖像風格遷移

編輯推薦

西門子高級研究員田疆博士作序力薦!Google軟體工程師呂佳楠力、英偉達高級工程師華遠志、理光軟體研究院研究員鍾誠博士力薦!

作者擁有超過5年的機器學習研發經驗,在京東專注於深度學習和計算機視覺算法的研發。

西門子高級研究員田疆博士作序力薦!Google軟體工程師呂佳楠、英偉達高級工程師華遠志、理光軟體研究院研究員鍾誠博士力薦!

注重原理和上手實戰,讓讀者不僅能理解算法背後的思想,還能具備獨立開發基於深度學習的計算機視覺算法的能力。

原理講解通俗易懂,能通過圖文定性講解的就儘量不用公式,不可避免要用公式的地方儘量讓公式作為圖文講解的輔助手段。

結合常見的套用場景,通過大量有趣、實用的實例和原創代碼,帶領讀者一步步親自動手,不斷提高動手能力。

從第7章開始的所有實例都基於當前流行的深度學習框架Caffe和MXNet,其中包含了作者原創的大量代碼和蒐集的數據。

作者介紹

叶韻

2007年7月畢業於北京大學信息科學技術學院,獲學士學位。2011年4月獲得了美國亞利桑那州立大學的電氣工程博士學位。擁有超過5年的機器學習研發經驗,在京東專注於深度學習和計算機視覺算法的研發。加入京東前,曾先後在ProPlus Design Solutions矽谷和北京研發中心任職研發經理,負責統計建模和機器學習算法的研發。後加入西門子中國研究院擔任研究員,專注於計算影像和計算機視覺的研究。

目錄

序言

前言

第1篇 基礎知識

第1章 引言 2

1.1 人工智慧的新焦點——深度學習 2

1.1.1 人工智慧——神話傳說到影視漫畫 2

1.1.2 人工智慧的誕生 3

1.1.3 神經科學的研究 4

1.1.4 人工神經網路的興起 5

1.1.5 神經網路的第一次寒冬 6

1.1.6 神經網路的第一次復興 8

1.1.7 神經網路的第二次寒冬 9

1.1.8 2006年——深度學習的起點 10

1.1.9 生活中的深度學習 11

1.1.10 常見深度學習框架簡介 12

1.2 給計算機一雙眼睛——計算機視覺 14

1.2.1 計算機視覺簡史 14

1.2.2 2012年——計算機視覺的新起點 16

1.2.3 計算機視覺的套用 17

1.2.4 常見計算機視覺工具包 19

1.3 基於深度學習的計算機視覺 19

1.3.1 從ImageNet競賽到AlphaGo戰勝李世石——計算機視覺超越人類 19

1.3.2 GPU和並行技術——深度學習和計算視覺發展的加速器 21

1.3.3 基於卷積神經網路的計算機視覺套用 22

第2章 深度學習和計算機視覺中的基礎數學知識 27

2.1 線性變換和非線性變換 27

2.2 機率論及相關基礎知識 43

2.3 維度的詛咒 50

2.4 卷積 66

2.5 數學最佳化基礎 71

第3章 神經網路和機器學習基礎 87

3.1 感知機 87

3.2 神經網路基礎 89

3.3 後向傳播算法 95

3.4 隨機梯度下降和批量梯度下降 104

3.5 數據、訓練策略和規範化 108

3.6 監督學習、非監督學習、半監督學習和強化學習 117

第4章 深度卷積神經網路 120

4.1 卷積神經網路 120

4.2 LeNet——第一個卷積神經網路 132

4.3 新起點——AlexNet 133

4.4 更深的網路——GoogLeNet 136

4.5 更深的網路——ResNet 142

第2篇 實例精講

第5章 Python基礎 148

5.1 Python簡介 148

5.2 Python基本語法 150

5.3 Python的科學計算包——NumPy 167

5.4 Python的可視化包——matplotlib 175

第6章 OpenCV基礎 182

6.1 OpenCV簡介 182

6.2 Python-OpenCV基礎 184

6.3 用OpenCV實現數據增加小工具 193

6.4 用OpenCV實現物體標註小工具 203

第7章 Hello World! 212

7.1 用MXNet實現一個神經網路 212

7.2 用Caffe實現一個神經網路 219

第8章 最簡單的圖片分類——手寫數字識別 227

8.1 準備數據——MNIST 227

8.2 基於Caffe的實現 228

8.3 基於MXNet的實現 242

第9章 利用Caffe做回歸 249

9.1 回歸的原理 249

9.2 預測隨機噪聲的頻率 250

第10章 遷移學習和模型微調 264

10.1 吃貨必備——通過Python採集美食圖片 264

10.2 美食分類模型 271

第11章 目標檢測 288

11.1 目標檢測算法簡介 288

11.2 基於PASCAL VOC數據集訓練SSD模型 296

第12章 度量學習 304

12.1 距離和度量學習 304

12.2 用MNIST訓練Siamese網路 307

第13章 圖像風格遷移 317

13.1 風格遷移算法簡介 317

13.2 MXNet中的圖像風格遷移例子 320

相關詞條

熱門詞條

聯絡我們