深度學(xué)習(xí)及應(yīng)用 徐國艷 新形態(tài)教材 新工科 一流本科
定 價(jià):49.8 元
- 作者:徐國艷
- 出版時(shí)間:2025/9/1
- ISBN:9787111789864
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書內(nèi)容涵蓋深度學(xué)習(xí)的基礎(chǔ)理論及前沿技術(shù),內(nèi)容循序漸進(jìn),旨在逐步提升學(xué)習(xí)者對深度學(xué)習(xí)技術(shù)的理解和應(yīng)用能力。本書共10章,主要內(nèi)容包括緒論、深度學(xué)習(xí)基礎(chǔ)理論及實(shí)踐、卷積神經(jīng)網(wǎng)絡(luò)理論及實(shí)踐、基于CNN的目標(biāo)檢測算法及實(shí)踐、基于CNN的圖像分割算法及實(shí)踐、循環(huán)神經(jīng)網(wǎng)絡(luò)理論及實(shí)踐、注意力機(jī)制與Transformer、生成式網(wǎng)絡(luò)及實(shí)踐、強(qiáng)化學(xué)習(xí)理論及實(shí)踐、大模型技術(shù)及實(shí)踐等。本書緊密結(jié)合產(chǎn)教融合與科教融匯的理念,將機(jī)械、醫(yī)工、自動(dòng)駕駛等領(lǐng)域的產(chǎn)業(yè)級工程項(xiàng)目和科研成果轉(zhuǎn)化為教學(xué)實(shí)踐項(xiàng)目,確保理論知識與實(shí)際應(yīng)用的無縫對接。本書可作為工科類專業(yè)研究生的教材,也可作為工科類專業(yè)高年級本科生的教材,還可作為有志于掌握深度學(xué)習(xí)知識的學(xué)習(xí)者的參考讀物。本書配有項(xiàng)目代碼講解視頻、部分習(xí)題參考答案,讀者可掃描書中的二維碼進(jìn)行觀看;本書提供了部分教學(xué)案例和實(shí)踐項(xiàng)目的源代碼,讀者可打開書中所附鏈接運(yùn)行或掃描內(nèi)封上的二維碼進(jìn)行下載。本書還配有PPT課件、教學(xué)大綱等,免費(fèi)贈(zèng)送給采用本書作為教材的教師(可登錄www.cmpedu.com注冊下載)。首次使用二維碼的方法請見封底有關(guān)說明。
本書遵循教指委相關(guān)指導(dǎo)文件和高等院校學(xué)生學(xué)習(xí)規(guī)律編寫而成。踐行四新理念,融入思政元素,注重理論與實(shí)踐相結(jié)合。
隨著人工智能技術(shù)的迅猛發(fā)展,深度學(xué)習(xí)已成為其核心推動(dòng)力,深入滲透至各行各業(yè),極大地促進(jìn)了新質(zhì)生產(chǎn)力的發(fā)展。從圖像識別、語音識別到自然語言處理,深度學(xué)習(xí)技術(shù)正逐步賦予機(jī)器“理解”與“思考”的能力,為科技和社會(huì)的進(jìn)步注入了新的活力。本書采用理論與實(shí)踐相結(jié)合的教學(xué)方法,全面、系統(tǒng)地闡述了深度學(xué)習(xí)的基本原理、卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)經(jīng)典模型以及豐富的實(shí)踐案例。同時(shí),本書緊跟深度學(xué)習(xí)領(lǐng)域的新研究動(dòng)態(tài),介紹了大模型、注意力機(jī)制、生成式網(wǎng)絡(luò)等前沿技術(shù),旨在幫助讀者把握深度學(xué)習(xí)的新發(fā)展趨勢。本書的特色與優(yōu)勢主要體現(xiàn)在以下幾個(gè)方面。1)全面性與前瞻性:本書內(nèi)容覆蓋了深度學(xué)習(xí)系統(tǒng)且全面的內(nèi)容,從基礎(chǔ)理論到經(jīng)典模型,再到實(shí)踐應(yīng)用,同時(shí)緊跟行業(yè)前沿,引入了新的研究成果,為讀者提供了一個(gè)既全面又具有前瞻性的學(xué)習(xí)體系。2)理論與實(shí)踐的深度融合:本書不僅注重理論知識的傳授,更通過大量的實(shí)踐項(xiàng)目,引導(dǎo)讀者將所學(xué)理論應(yīng)用于實(shí)際項(xiàng)目中,從而深化對知識的理解和應(yīng)用。3)項(xiàng)目驅(qū)動(dòng)式學(xué)習(xí):本書以項(xiàng)目為導(dǎo)向,每個(gè)章節(jié)都配備了多個(gè)實(shí)踐項(xiàng)目,這些項(xiàng)目旨在幫助讀者將理論知識轉(zhuǎn)化為解決實(shí)際問題的能力,提升學(xué)習(xí)的實(shí)用性和針對性。期望讀者通過對本書的學(xué)習(xí),能夠快速掌握深度學(xué)習(xí)技術(shù),并在實(shí)際項(xiàng)目中靈活運(yùn)用,為未來的科研和職業(yè)發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。本書由北京航空航天大學(xué)徐國艷擔(dān)任主編,王章宇、周帆擔(dān)任副主編,參加編寫的還有白浩杰、王愛增、趙雁雨、苑海濤。本書的編寫得到了北京航空航天大學(xué)研究生蔡捍、王闖、張佳瑩、劉星澤、劉明達(dá)、魏軒的幫助和支持,謹(jǐn)在此向他們表示深切的謝意。編者在編寫過程中參閱了大量教材、文件、網(wǎng)站資料及有關(guān)參考文獻(xiàn),特別是一些論述和例文,部分參考書目附于文末以供參詳,但由于篇幅有限,還有一些參考書目未能一一列出,在此謹(jǐn)向相關(guān)作者表示謝忱和歉意。由于編者水平有限,書中不足之處在所難免,誠望廣大讀者不吝賜教,提出寶貴意見。編者
高等院校教師
前言第1章緒論111人工智能技術(shù)及其發(fā)展112深度學(xué)習(xí)的特點(diǎn)及進(jìn)展313深度學(xué)習(xí)的框架與平臺7131國外深度學(xué)習(xí)框架與平臺7132國內(nèi)深度學(xué)習(xí)框架與平臺8習(xí)題9第2章深度學(xué)習(xí)基礎(chǔ)理論及實(shí)踐1121神經(jīng)網(wǎng)絡(luò)簡介11211神經(jīng)網(wǎng)絡(luò)基本概念11212單層感知機(jī)11213多層感知機(jī)1422深度學(xué)習(xí)數(shù)學(xué)理論15221信號前向傳播16222激活函數(shù)17223損失函數(shù)19224參數(shù)優(yōu)化方法20225誤差反向傳播22226計(jì)算圖2823全連接神經(jīng)網(wǎng)絡(luò)實(shí)踐項(xiàng)目30231基于MLP的車牌識別32232基于MLP的機(jī)械零件分類識別34233基于MLP的自動(dòng)駕駛數(shù)據(jù)集分類識別35234基于MLP加速生物醫(yī)學(xué)成像中的圖像重建35習(xí)題36第3章卷積神經(jīng)網(wǎng)絡(luò)理論及實(shí)踐3831卷積神經(jīng)網(wǎng)絡(luò)理論基礎(chǔ)38311卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)與特點(diǎn)38312卷積層41313池化層4432典型的卷積神經(jīng)網(wǎng)絡(luò)模型46321LeNet46322AlexNet47323VGGNet49324GoogLeNet51325ResNet5533卷積神經(jīng)網(wǎng)絡(luò)實(shí)踐項(xiàng)目57331基于CNN的斑馬線檢測57332基于多個(gè)典型CNN的眼疾數(shù)據(jù)集分類識別58333基于飛槳高層API的交通圖像分類識別58334基于殘差網(wǎng)絡(luò)的自動(dòng)駕駛數(shù)據(jù)集分類識別59335基于殘差網(wǎng)絡(luò)的機(jī)械零件分類59習(xí)題60第4章基于CNN的目標(biāo)檢測算法及實(shí)踐6141目標(biāo)檢測概述61411目標(biāo)檢測的基本介紹61412目標(biāo)檢測算法的發(fā)展62413數(shù)據(jù)格式與評估指標(biāo)6442兩階段目標(biāo)檢測算法66421RCNN66422SPPNet和Fast RCNN68423Faster RCNN70424進(jìn)階的兩階段目標(biāo)檢測算法7243單階段目標(biāo)檢測算法73431YOLO系列73432SSD80433RetinaNet8244Anchor Free目標(biāo)檢測算法83441CornerNet83442FCOS和CenterNet8545目標(biāo)檢測實(shí)踐項(xiàng)目86451基于PaddleHub預(yù)訓(xùn)練模型的車輛目標(biāo)檢測86452基于YOLOv3的自動(dòng)駕駛數(shù)據(jù)集目標(biāo)檢測87453基于YOLOv5的機(jī)械零件數(shù)據(jù)集目標(biāo)檢測88習(xí)題89第5章基于CNN的圖像分割算法及實(shí)踐9151圖像分割概述91511圖像分割的分類91512圖像分割算法的發(fā)展91513數(shù)據(jù)格式與評估指標(biāo)9452全卷積神經(jīng)網(wǎng)絡(luò)95521上采樣方法96522特征融合98523FCN總結(jié)9953UNet/SegNet99531UNet99532SegNet10054DeepLab系列101541DeepLab V1/V2102542DeepLab V3/V3+10555圖像分割實(shí)踐項(xiàng)目109551基于PaddleHub預(yù)訓(xùn)練模型的人像分割109552基于DeepLab V3+的自動(dòng)駕駛數(shù)據(jù)集圖像分割110553基于PaddleX的醫(yī)學(xué)影像視盤分割110554基于DeepLab V3+的機(jī)械零件數(shù)據(jù)集圖像分割112習(xí)題112第6章循環(huán)神經(jīng)網(wǎng)絡(luò)理論及實(shí)踐11461自然語言處理及其相關(guān)技術(shù)114611自然語言處理的發(fā)展歷程114612詞向量技術(shù)11562循環(huán)神經(jīng)網(wǎng)絡(luò)11763長短期記憶網(wǎng)絡(luò)和門控循環(huán)單元118631長短期記憶網(wǎng)絡(luò)118632門控循環(huán)單元12164深度循環(huán)神經(jīng)網(wǎng)絡(luò)122641堆疊循環(huán)神經(jīng)網(wǎng)絡(luò)123642深度雙向循環(huán)神經(jīng)網(wǎng)絡(luò)12365序列到序列模型12566循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)踐項(xiàng)目127661使用Gensim庫進(jìn)行詞向量生成127662基于LSTM的文本情感分析128663基于循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU/LSTM)的車輛軌跡預(yù)測128習(xí)題129第7章注意力機(jī)制與Transformer13171從RNN到Transformer的演進(jìn)131711循環(huán)架構(gòu)的鏈?zhǔn)剿p問題131712時(shí)序依賴與并行計(jì)算的博弈132713編碼器解碼器架構(gòu)的演進(jìn)132714Transformer的里程碑意義13472注意力機(jī)制基礎(chǔ)134721注意力機(jī)制的核心思想134722傳統(tǒng)注意力機(jī)制135723自注意力機(jī)制13673Transformer模型架構(gòu)137731Transformer整體架構(gòu)概述137732編碼器138733解碼器141734位置編碼142735Transformer的輸入和輸出14374Transformer模型訓(xùn)練14475Vision Transformer模型145751Vision Transformer簡介145752Vision Transformer的整體結(jié)構(gòu)14676實(shí)踐項(xiàng)目149761Transformer注意力機(jī)制及其擴(kuò)展技術(shù)實(shí)現(xiàn)149762基于Transformer的文本情感分析149763基于ViT的車輛圖片分類149764基于ViT的醫(yī)學(xué)數(shù)字病理圖像制片缺陷分類150習(xí)題152第8章生成式網(wǎng)絡(luò)及實(shí)踐15481生成式網(wǎng)絡(luò)概述15482變分自編碼器15583生成對抗網(wǎng)絡(luò)155831生成對抗網(wǎng)絡(luò)機(jī)理155832生成對抗網(wǎng)絡(luò)變體架構(gòu)15984生成擴(kuò)散模型16285基于Transformer的生成模型16386生成式網(wǎng)絡(luò)實(shí)踐項(xiàng)目164861基于生成式網(wǎng)絡(luò)的手寫數(shù)字圖片生成164862基于生成式網(wǎng)絡(luò)的城市駕駛場景數(shù)據(jù)生成164863基于變分自編碼器的圖像生成166864基于擴(kuò)散模型的車輛圖像生成167習(xí)題167第9章強(qiáng)化學(xué)習(xí)理論及實(shí)踐16991強(qiáng)化學(xué)習(xí)概述169911強(qiáng)化學(xué)習(xí)簡介169912強(qiáng)化學(xué)習(xí)分類17092強(qiáng)化學(xué)習(xí)基礎(chǔ)理論171921馬爾可夫決策過程171922強(qiáng)化學(xué)習(xí)算法原理17293表格型強(qiáng)化學(xué)習(xí)方法174931Qlearning174932SARSA17694值函數(shù)強(qiáng)化學(xué)習(xí)方法178941DQN178942DDQN180943DRQN18195策略梯度強(qiáng)化學(xué)習(xí)方法182951策略梯度計(jì)算182952演員評論家算法183953近端策略優(yōu)化算法185954深度確定性策略梯度算法188955雙延遲深度確定性策略梯度算法189956SAC19196強(qiáng)化學(xué)習(xí)實(shí)踐項(xiàng)目194961基于Qlearning的智能體配送路徑規(guī)劃194962基于DQN的智能體配送路徑規(guī)劃194963基于PPO小車爬坡195習(xí)題196第10章大模型技術(shù)及實(shí)踐198101大模型技術(shù)概述1981011大模型的定義和分類1981012大模型技術(shù)研究進(jìn)展概述2001013大模型發(fā)展中的倫理考量202102大模型生成技術(shù)原理2031021自回歸生成機(jī)制2031022檢索增強(qiáng)生成2041023知識處理技術(shù)206103大模型部署優(yōu)化技術(shù)2071031模型壓縮2071032稀疏架構(gòu)2081033部署框架209104大模型提示詞工程211105大模型訓(xùn)練213106MCP模型上下文協(xié)議215107大模型智能體2181071LLM Agent定義與能力2181072LLM Agent的類型與能力劃分2181073智能體系統(tǒng)的構(gòu)建流程與運(yùn)行機(jī)制2181074典型智能體框架與工具生態(tài)219108大模型實(shí)踐項(xiàng)目2201081大模型調(diào)用基礎(chǔ)——文本與圖像的生成方法2201082文心大模型ERNIE45VL多模態(tài)應(yīng)用實(shí)踐2211083文心大模型ERNIE45監(jiān)督微調(diào)文本生成實(shí)踐2211084基于計(jì)算機(jī)視覺和大語言模型的智能停車場管理系統(tǒng)2211085基于DeepSeek檢索增強(qiáng)的智能問答系統(tǒng)2221086基于LangChain自動(dòng)駕駛決策智能體構(gòu)建2231087基于大視覺語言模型的汽車駕駛場景描述226習(xí)題234參考文獻(xiàn)236