本書以深度學習在計算機視覺領(lǐng)域的常用技術(shù)與案例相結(jié)合的方式,深入淺出地介紹計算機視覺的常見任務(wù)及實現(xiàn)技術(shù)。全書共7章,內(nèi)容包含概述、圖像處理基本操作、深度學習視覺基礎(chǔ)任務(wù)、基于FaceNet的人臉識別實戰(zhàn)、基于 Faster R-CNN 的目標檢測實戰(zhàn)、基于 U-Net 的城市道路場景分割實戰(zhàn)、基于SRGAN 的圖像超分辨率技術(shù)實戰(zhàn)等。本書大部分章包含操作實踐代碼和課后習題,希望能夠幫助讀者在計算機視覺基礎(chǔ)任務(wù)中應(yīng)用算法,鞏固所學內(nèi)容。
本書可以作為高校人工智能相關(guān)專業(yè)教材,也可以作為從事計算機視覺技術(shù)研究的從業(yè)者和科技人員的參考用書。對于有一定基礎(chǔ)和經(jīng)驗的讀者,本書也能幫助他們查漏補缺,深入理解和掌握相關(guān)原理及方法,提升解決實際問題的能力。
理論與實戰(zhàn)結(jié)合。本書以深度學習在計算機視覺的應(yīng)用為主線,注重任務(wù)案例的學習,以深度學習常用技術(shù)與任務(wù)案例相結(jié)合的方式,介紹了使用深度學習TensorFlow框架實現(xiàn)深度學習視覺任務(wù)的主要方法。
以應(yīng)用為導向。本書從傳統(tǒng)圖像處理技術(shù)到深度學習視覺基礎(chǔ)任務(wù)介紹,再到具體深度學習視覺任務(wù)實現(xiàn),讓讀者明白如何利用所學知識來解決問題,從而真正理解并應(yīng)用所學知識。
注重啟發(fā)式教學。本書大部分章節(jié)緊扣深度學習視覺任務(wù)需求展開,不堆積知識點,著重于思路的啟發(fā)與解決方案的實施。通過對深度學習視覺任務(wù)介紹到實現(xiàn)的完成工作流程的體驗,讓讀者真正理解并掌握深度學習視覺的相關(guān)技術(shù)。
彭小紅,女,廣東海洋大學數(shù)學與計算機學院教授,院長,碩士生導師,國家級一流專業(yè)建設(shè)點(計算機科學與技術(shù))負責人、廣東省計算機科學與技術(shù)專業(yè)教學團隊負責人、廣東省計算機科學與技術(shù)專業(yè)綜合改革試點負責人、廣東省一流課程計算機組成與結(jié)構(gòu)負責人、南粵優(yōu)秀教師。 研究方向:智能系統(tǒng)及其智能信息處理、智能水下機器人。先后主持廣東省科技計劃、南方海洋科學與工程廣東省實驗室(湛江)、廣東省高校創(chuàng)新強校工程等課題10余項,發(fā)表學術(shù)論文30余篇(其中SCI/EI收錄16篇),譯著1部;以第一完成人獲得專利6項、計算機軟件著作權(quán)22項,獲湛江市科學技術(shù)進步獎二等獎1項、三等獎2項。 主講本科專業(yè)課程:《計算機組成與結(jié)構(gòu)》、《計算機接口技術(shù)》、《微機原理及接口》、《匯編語言與接口技術(shù)》、《生產(chǎn)實習》,研究生課程:《計算機體系結(jié)構(gòu)》、《人工智能導論》;近五年,主持省部級以上協(xié)同育人、質(zhì)量工程、教學改革項目9項,廣東省研究生教育創(chuàng)新計劃項目1項,發(fā)表教改論文8篇;獲得廣東海洋大學教學成果特等獎和一等獎、廣東海洋大學教學質(zhì)量優(yōu)秀獎。指導學生參加學科競賽獲國家級和省部級獎勵26項,榮獲得互聯(lián)網(wǎng) 大學生創(chuàng)新創(chuàng)業(yè)大賽、挑戰(zhàn)杯大賽、中國軟件杯、中國計算機設(shè)計大賽優(yōu)秀指導教師稱號。
張良均 資深大數(shù)據(jù)專家,廣東泰迪智能科技股份有限公司董事長,國家科技部入庫技術(shù)專家,全國專業(yè)學位水平評估專家,工信部教育與考試中心入庫專家,中國工業(yè)與應(yīng)用數(shù)學學會理事,廣東省工業(yè)與應(yīng)用數(shù)學學會副理事長,廣東省高等職業(yè)教育教學指導委員會委員,華南師范大學、中南財經(jīng)政法大學等40余所高校校外碩導或兼職教授,泰迪杯全國數(shù)據(jù)挖掘挑戰(zhàn)賽發(fā)起人。 曾在國內(nèi)外重要學術(shù)刊物上發(fā)表學術(shù)論文10余篇,主導編寫圖書專著60余部,其中獲普通高等教育十一五規(guī)劃教材一部,十三五職業(yè)教育國家規(guī)劃教材一部;參與標準建設(shè)4項,主持國家級課題1項、省部級課題4項。獲得SAS、SPSS數(shù)據(jù)挖掘認證及Hadoop開發(fā)工程師證書,具有信訪、電力、電信、銀行、制造企業(yè)、電子商務(wù)和電子政務(wù)的項目經(jīng)驗和行業(yè)背景,并榮獲中國產(chǎn)學研合作促進獎、中國南方電網(wǎng)公司發(fā)明專利一等獎、廣東省農(nóng)業(yè)技術(shù)推廣二等獎、廣州市荔灣區(qū)科學技術(shù)進步獎。
第 1章 概述 1
1.1 計算機視覺與深度學習 1
1.1.1 計算機視覺 2
1.1.2 深度學習 3
1.2 深度學習的計算機視覺應(yīng)用 4
1.2.1 人臉識別 5
1.2.2 圖像分類 5
1.2.3 目標檢測 6
1.2.4 圖像分割 6
1.2.5 姿態(tài)估計 7
1.2.6 場景識別 7
1.2.7 目標跟蹤 8
1.2.8 動作識別 8
1.2.9 黑白照片自動著色 9
1.2.10 圖像風格轉(zhuǎn)移 9
1.3 相關(guān)Python庫 10
1.3.1 深度學習框架 10
1.3.2 圖像處理庫 12
小結(jié) 13
課后習題 13
第 2章 圖像處理基本操作 15
2.1 讀寫圖像 15
2.1.1 常用圖像類型 16
2.1.2 讀取圖像 17
2.1.3 顯示圖像 18
2.1.4 保存圖像 20
2.2 圖像顏色空間 20
2.2.1 常用顏色空間簡介 20
2.2.2 顏色空間轉(zhuǎn)換 22
2.3 圖像幾何變換 24
2.3.1 圖像平移 24
2.3.2 圖像縮放 25
2.3.3 圖像旋轉(zhuǎn) 32
2.3.4 圖像仿射 34
2.4 圖像增強 38
2.4.1 灰度級修正 39
2.4.2 圖像平滑 47
2.4.3 圖像銳化 51
小結(jié) 56
課后習題 57
第3章 深度學習視覺基礎(chǔ)任務(wù) 59
3.1 深度神經(jīng)網(wǎng)絡(luò) 59
3.2 卷積神經(jīng)網(wǎng)絡(luò) 61
3.2.1 卷積層 63
3.2.2 池化層 64
3.2.3 全連接層 64
3.2.4 卷積神經(jīng)網(wǎng)絡(luò)訓練過程 65
3.3 圖像分類 67
3.3.1 圖像分類簡介 67
3.3.2 圖像分類經(jīng)典算法 68
3.3.3 訓練圖像分類網(wǎng)絡(luò) 83
3.4 目標檢測 86
3.4.1 目標檢測簡介 86
3.4.2 目標檢測經(jīng)典算法 88
3.4.3 訓練目標檢測網(wǎng)絡(luò) 104
3.5 圖像分割 111
3.5.1 圖像分割簡介 111
3.5.2 圖像分割經(jīng)典算法 113
3.5.3 訓練圖像分割網(wǎng)絡(luò) 127
3.6 圖像生成 132
3.6.1 圖像生成簡介 133
3.6.2 圖像生成經(jīng)典算法 134
3.6.3 訓練圖像生成器網(wǎng)絡(luò) 144
小結(jié) 149
課后習題 149
第4章 基于FaceNet的人臉識別實戰(zhàn) 152
4.1 背景與目標 152
4.1.1 背景 152
4.1.2 目標 154
4.1.3 項目工程結(jié)構(gòu) 154
4.2 流程與步驟 155
4.2.1 人臉檢測 156
4.2.2 人臉對齊 160
4.2.3 人臉特征提取 161
4.2.4 人臉特征匹配 164
4.3 結(jié)果分析 165
小結(jié) 167
課后習題 168
第5章 基于Faster R-CNN的目標檢測實戰(zhàn) 170
5.1 背景與目標 170
5.1.1 背景 170
5.1.2 目標 171
5.1.3 項目工程結(jié)構(gòu) 171
5.2 流程與步驟 172
5.2.1 數(shù)據(jù)準備 172
5.2.2 定義Faster R-CNN配置信息類 174
5.2.3 生成先驗錨框 174
5.2.4 定義損失函數(shù) 176
5.2.5 訓練網(wǎng)絡(luò) 180
5.3 結(jié)果分析 181
小結(jié) 183
課后習題 184
第6章 基于U-Net的城市道路場景分割實戰(zhàn) 186
6.1 背景與目標 186
6.1.1 背景 186
6.1.2 目標 187
6.1.3 項目工程結(jié)構(gòu) 188
6.2 流程與步驟 188
6.2.1 數(shù)據(jù)準備 189
6.2.2 搭建U-Net 191
6.2.3 定義損失函數(shù) 194
6.2.4 訓練網(wǎng)絡(luò) 195
6.3 結(jié)果分析 197
小結(jié) 199
課后習題 199
第7章 基于SRGAN的圖像超分辨率技術(shù)實戰(zhàn) 201
7.1 背景與目標 201
7.1.1 背景 201
7.1.2 目標 203
7.1.3 項目工程結(jié)構(gòu) 203
7.2 流程與步驟 204
7.2.1 數(shù)據(jù)準備 204
7.2.2 搭建SRGAN 206
7.2.3 定義SRGAN損失函數(shù) 209
7.2.4 訓練網(wǎng)絡(luò) 210
7.3 結(jié)果分析 211
小結(jié) 213
課后習題 213