AIGC基礎、應用與展望
定 價:59.8 元
叢書名:高等學校數(shù)智人才培養(yǎng)AI通識精品系列
AI是近年來炙手可熱的前沿技術。隨著越來越多的AI應用進入人們的視野,AI技術也贏得了國內外社會公眾、專家、學者和開發(fā)者的廣泛關注。 自2022年ChatGPT橫空出世以來,AIGC迅速成為極其火爆的AI發(fā)展方向。近年來,各種AIGC大模型層出不窮,AIGC大模型生成的內容也日臻完善,并且已經(jīng)達到可以落地應用的程度,因此可能創(chuàng)造大量的就業(yè)機會。 本書概述了AIGC的基礎技術,從機器學習、深度學習的基本概念和基礎算法,到生成模型、自然語言處理和計算機視覺的相關技術,即使是沒有學過 AI 基礎知識的讀者,也可以輕松入門。本書還從眾多AIGC大模型中選擇了具有代表性的大模型進行解讀,使讀者能夠輕松理解其工作原理,內容涵蓋代碼生成、圖像生成、語音生成和視頻生成等諸多應用領域。在此基礎上,本書還將帶領讀者一起試用各種類型的AIGC大模型,使讀者能夠直觀體驗AIGC大模型落地應用的效果。 本書既可作為高校人工智能通識課程或AIGC相關課程的教材,也可作為相關領域的從業(yè)人員入門了解AI的參考用書。
1.面向通識教育,構建知識體系 本書從最基礎的 AI 概念入手,沿著 AI 基礎概念、機器學習基礎、深度學習基礎、AIGC背后的基礎技術、AIGC 大模型的學習路線逐層遞進,讀者不需要學習其他基礎課程,即可讀懂書中的內容。AI 是以計算機科學為基礎,涉及計算機、數(shù)學、統(tǒng)計學等知識的交叉學科。書中講到涉及其他學科的知識時,都會提前介紹,比如第 2 章介紹生成模型時涉及較多統(tǒng)計學的知識,因此 2.1.3 小節(jié)講解了生成模型中用到的統(tǒng)計學概念,為讀者學習和理解后面的內容奠定基礎。 2.理論深度較淺,適合入門學習 AI 模型的核心技術是算法和模型的網(wǎng)絡結構。模型的網(wǎng)絡結構是算法的具體實現(xiàn),而理解深度學習模型(特別是 AIGC 大模型)中的算法需要很多數(shù)學知識。為了便于初學者理解深度學習模型的工作原理,本書只簡要介紹一些基礎算法的數(shù)學公式,而在介紹深度學習模型時,通常只介紹其網(wǎng)絡結構,不涉及算法的數(shù)學公式,因為初學者只要理解模型的工作原理即可,不需要掌握設計 AI 模型的理論與技術。 3.緊跟時代發(fā)展,融合前沿技術 AIGC 技術在近幾年高速發(fā)展,涌現(xiàn)出很多新技術和新的 AIGC 大模型。為了讓讀者能夠緊跟 AIGC 技術發(fā)展的潮流,本書不但重點講解了經(jīng)典 AIGC 技術大語言模型的工作原理和具體應用,還介紹了 AIGC 在代碼生成、圖像生成、語音生成和視頻生成等領域的應用。書中講解的很多 AIGC 大模型都是近年來推出的新模型,涵蓋了 AIGC 技術的最新發(fā)展趨勢。 4.創(chuàng)新教材形態(tài),助力讀者自學 編者結合書中重點內容錄制了大量微課,為讀者開展高效自學提供了便捷路徑,并提供豐富的教輔資源,以幫助院校老師快速開展教學。為了便于初學者理解 AIGC 大模型的具體應用,本書還設計了各種體驗任務,可與讀者共同體驗大語言模型和各種多模態(tài) AIGC 大模型的應用效果,使讀者在體驗豐富、新奇的 AI 技術的同時,加深對基礎理論和 AIGC 大模型工作原理的理解,實現(xiàn)理論性、趣味性與實用性相結合。
賈小林: 教授,博士生導師,畢業(yè)于西南交通大學,獲工學博士學位;現(xiàn)任計算機科學與技術學院副院長,分工負責本?平逃虒W與改革、專業(yè)建設與評估、教學研究、本科人才培養(yǎng)團隊建設等工作,分管教學科研辦公室。四川省普通本科高校教學指導委員會委員,國際電子電器工程師學會(IEEE)高級會員,中國計算機學會(CCF)高級會員,CCF優(yōu)秀傳播大使,四川省海外高層次留學人才,綿陽市4 3高端成長型產(chǎn)業(yè)領軍人才,綿陽市優(yōu)秀教師,西南科技大學十佳崗位青年、優(yōu)秀共產(chǎn)黨員、優(yōu)秀教師、教學名師等,入選西南科技大學70周年校慶特輯《龍山薪火-西南科大人之教師篇》;主要從事射頻識別(RFID)技術、物聯(lián)網(wǎng)(IOT)技術、計算機應用技術等領域的研究和教學工作;主持完成國家自然科學基金面上項目、四川省科技支撐計劃重大項目、四川省應用基礎研究項目、四川省高校成果轉化重大培育項目、制造過程測試技術重點實驗室重點項目等重要研究課題;研究成果榮獲四川省科學技術進步二等獎1項,四川省高等教育教學成果三等獎2項,西南科技大學優(yōu)秀教學成果一等獎1項。 李曉黎: 軟件開發(fā)工程師,畢業(yè)于吉林大學計算機系;自2006年以來,帶領團隊一直從事網(wǎng)絡管理軟件、企業(yè)ERP系統(tǒng)和電商平臺等的開發(fā)與建設工作,具有中國投資銀行、國家開發(fā)銀行、中信銀行等多家銀行從業(yè)經(jīng)歷,參與銀行信息化建設、網(wǎng)銀平臺開發(fā)、智能合約設計與開發(fā)工作多年,在人工智能、AIGC、Java程序設計、系統(tǒng)軟件開發(fā)、團隊組織管理和系統(tǒng)架構設計等領域積累了豐富的實戰(zhàn)經(jīng)驗,主編圖書10余本,并被上百所高校選作教材。
【章名目錄】 【第 1篇 導論篇】 第 1章 AI技術概述 【第 2篇 基礎篇】 第 2章 生成模型 第3章 自然語言處理經(jīng)典模型 第4章 計算機視覺經(jīng)典模型 【第3篇 應用篇】 第5章 大語言模型 第6章 代碼生成大語言模型 第7章 圖像生成大模型 第8章 語音生成大模型 第9章 視頻生成大模型 【第4篇 展望篇】 第 10章 AIGC時代的機遇、挑戰(zhàn)及發(fā)展趨勢 附錄 大語言模型智能體精選與推薦 【詳細目錄】 【第 1篇 導論篇】 第 1章 AI技術概述 1.1 AI技術基礎 2 1.1.1 AI技術的發(fā)展歷程 2 1.1.2 AI領域的常用概念 4 1.2 機器學習基礎 7 1.2.1 機器學習的三要素 7 1.2.2 機器學習的分類 8 1.2.3 機器學習的工作流程 10 1.2.4 機器學習案例:使用線性回歸算法預測房價 11 1.3 深度學習基礎 16 1.3.1 深度學習的概念 16 1.3.2 前饋神經(jīng)網(wǎng)絡與反向傳播算法 17 1.3.3 深度學習案例:基于LeNet-5模型識別手寫數(shù)字 17 1.3.4 深度學習的常用基礎函數(shù)和算法 18 1.3.5 深度學習的基本工作流程 23 1.4 AIGC的發(fā)展歷史、應用方向及基礎技術 25 1.4.1 AIGC的發(fā)展歷史 25 1.4.2 AIGC的應用方向 26 1.4.3 AIGC的基礎技術 28 本章小結 32 習題 32 課程實踐 33 【第 2篇 基礎篇】 第 2章 生成模型 2.1 生成模型技術基礎 35 2.1.1 生成模型和判別模型 35 2.1.2 生成模型的分類 36 2.1.3 生成模型中用到的統(tǒng)計學概念 37 2.2 深度生成模型 42 2.2.1 GAN模型 42 2.2.2 自回歸模型 44 2.2.3 擴散模型 44 2.2.4 VAEs模型 46 2.2.5 標準化流模型 49 本章小結 50 習題 50 課程實踐 50 第3章 自然語言處理經(jīng)典模型 3.1 NLP技術的發(fā)展歷程和應用現(xiàn)狀 52 3.1.1 NLP技術的發(fā)展歷程 52 3.1.2 NLP技術的應用現(xiàn)狀 54 3.2 NLP技術基礎 55 3.2.1 文本的數(shù)值化表示 56 3.2.2 NLP模型 59 3.2.3 注意力機制 60 3.2.4 語料庫 66 3.3 經(jīng)典NLP深度學習模型 67 3.3.1 RNN模型 67 3.3.2 編碼器-解碼器架構 69 3.3.3 LSTM模型 69 3.3.4 Transformer架構 70 3.3.5 BERT模型 78 本章小結 80 習題 80 課程實踐 81 第4章 計算機視覺經(jīng)典模型 4.1 CV技術的發(fā)展歷程和應用現(xiàn)狀 82 4.1.1 CV技術的發(fā)展歷程 82 4.1.2 CV技術的應用現(xiàn)狀 84 4.2 CV技術基礎 85 4.2.1 圖像的表現(xiàn)形式 86 4.2.2 數(shù)字圖像處理 87 4.3 經(jīng)典CV模型 89 4.3.1 CNN模型 89 4.3.2 ResNet模型 96 4.3.3 ViT模型 97 本章小結 100 習題 100 課程實踐 100 【第3篇 應用篇】 第5章 大語言模型 5.1 大語言模型概述 102 5.1.1 大語言模型的定義 102 5.1.2 大語言模型的工作原理 104 5.1.3 大語言模型落地應用的方法 105 5.2 主流大語言模型簡析 105 5.2.1 國外主流大語言模型 105 5.2.2 國內主流大語言模型 107 5.3 GPT系列模型的工作原理 109 5.3.1 GPT-1 109 5.3.2 GPT-2 113 5.3.3 GPT-3 120 5.3.4 GPT-3.5和GPT-4 122 5.4 體驗主流大語言模型 123 5.4.1 設計體驗任務 123 5.4.2 體驗大語言模型的方法 125 5.4.3 體驗純文本任務 127 5.4.4 體驗多模態(tài)任務 131 本章小結 137 習題 138 課程實踐 138 第6章 代碼生成大語言模型 6.1 代碼生成大語言模型概述 139 6.1.1 什么是代碼生成大語言模型 139 6.1.2 代碼生成大語言模型的基本工作原理 141 6.2 主流代碼生成大語言模型選解 142 6.2.1 GitHub Copilot 142 6.2.2 CodeWhisperer 143 6.2.3 CodeGeeX 143 6.2.4 CodeBERT 146 6.3 體驗CodeWhisperer 148 6.3.1 在IDEA中安裝AWS Toolkit插件 148 6.3.2 在IDEA中使用CodeWhisperer 149 6.3.3 Amazon Q Chat 150 6.3.4 在開發(fā)過程中利用CodeWhisperer的編碼建議 152 6.4 體驗CodeGeeX 154 6.4.1 在VS Code中安裝CodeGeeX插件 154 6.4.2 在VS Code中使用CodeGeeX 155 本章小結 160 習題 160 課程實踐 160 第7章 圖像生成大模型 7.1 圖像生成大模型的工作原理 161 7.1.1 圖像嵌入 161 7.1.2 圖像生成大模型的基本工作流程 162 7.1.3 條件生成模型 163 7.1.4 建立文圖聯(lián)系的CLIP模型 165 7.2 主流圖像生成大模型選解 168 7.2.1 國外的圖像生成大模型 168 7.2.2 國內的圖像生成大模型 175 7.3 體驗圖像生成大模型 176 7.3.1 體驗圖像生成大模型的方法 176 7.3.2 設計體驗任務 180 7.3.3 體驗生成人物攝影圖像 183 7.3.4 體驗生成風景植物圖像 186 7.3.5 體驗生成建筑設計圖像 188 7.3.6 體驗生成中國風格圖像 190 本章小結 192 習題 192 課程實踐 192 第8章 語音生成大模型 8.1 語音生成大模型的工作原理 193 8.1.1 TTS技術的發(fā)展歷史 193 8.1.2 梅爾頻譜 194 8.1.3 TTS的工作原理 194 8.2 語音生成大模型選解 195 8.2.1 XTTS模型 195 8.2.2 Mega-TTS模型 196 8.3 體驗語音生成大模型 198 本章小結 199 習題 199 課程實踐 200 第9章 視頻生成大模型 9.1 視頻生成大模型的基礎技術 201 9.1.1 視頻表示 201 9.1.2 條件概率視頻生成大模型的概念 201 9.2 主流視頻生成大模型選解 202 9.2.1 Sora模型的工作原理 202 9.2.2 MagicVideo-V2模型的工作原理 205 9.3 體驗主流視頻生成大模型 206 9.3.1 Gen-3模型生成的視頻 206 9.3.2 Pika模型生成的視頻 207 9.3.3 MagicVideo-V2模型生成的視頻 208 本章小結 209 習題 209 課程實踐 209 【第4篇 展望篇】 第 10章 AIGC時代的機遇、挑戰(zhàn)及發(fā)展趨勢 10.1 AIGC的社會影響 211 10.1.1 AIGC對社會經(jīng)濟的影響 211 10.1.2 AIGC對普通人生活的影響 212 10.2 AIGC時代的機遇和挑戰(zhàn) 213 10.2.1 AIGC時代的機遇 213 10.2.2 AIGC時代的挑戰(zhàn) 216 10.3 AIGC技術所面臨的挑戰(zhàn)及發(fā)展趨勢 221 10.3.1 AIGC技術的倫理問題和所面臨的挑戰(zhàn) 221 10.3.2 AIGC技術的發(fā)展趨勢 224 本章小結 227 習題 228 課程實踐 228 附錄 大語言模型智能體精選與推薦 F.1 文心智能體平臺 229 F.2 通義智能體 229 F.3 ChatAI的定制模型 230 F.4 DeepSeek智能體 231