機(jī)器學(xué)習(xí)導(dǎo)論與實踐
定 價:59.8 元
本書詳細(xì)介紹機(jī)器學(xué)習(xí)主要算法,包括:C4.5決策樹、k-均值(K-means)、支持向量機(jī)(SVM)、Apriori、最大期望值、PageRank算法、AdaBoost算法、k-近鄰算法(kNN)、樸素貝葉斯算法和分類回歸樹算法以及神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的簡單介紹。
本書將機(jī)器學(xué)習(xí)的理論知識與實踐相結(jié)合。
機(jī)器學(xué)習(xí)是人工智能研究領(lǐng)域中一個重要的方向,是一門研究機(jī)器怎樣模擬或?qū)崿F(xiàn)人類學(xué)習(xí)行為以獲取新知識或技能,并重新組織已有知識結(jié)構(gòu)使之不斷改善自身性能的學(xué)科。機(jī)器學(xué)習(xí)算法在計算機(jī)視覺、數(shù)據(jù)挖掘、自然信息處理、個性化推薦等領(lǐng)域具有廣泛的應(yīng)用,不僅是計算機(jī)科學(xué)與技術(shù)、人工智能、數(shù)據(jù)科學(xué)領(lǐng)域?qū)I(yè)人士的常用手段,還成為各行各業(yè)解決實際問題的有力工具。本書深入淺出地介紹了機(jī)器學(xué)習(xí)的核心算法,為每個算法精心設(shè)計了應(yīng)用案例,并基于Python給出相應(yīng)算法案例的實現(xiàn)代碼,通過對基本理論的介紹和案例的設(shè)計與實現(xiàn),讀者能對機(jī)器學(xué)習(xí)基本算法有一個較深入的理解,并能理論聯(lián)系實際建立起使用機(jī)器學(xué)習(xí)方法解決實際問題的思路。由于深度學(xué)習(xí)近年來在眾多領(lǐng)域取得了飛躍性的進(jìn)步和突破,解決了傳統(tǒng)方法難以解決的問題,本書給出一定的篇幅專門介紹深度學(xué)習(xí)理論。飛槳是百度提供的國內(nèi)首個開源深度學(xué)習(xí)框架,是最適合中國開發(fā)者和企業(yè)使用的深度學(xué)習(xí)工具,本書基于飛槳框架給出了深度學(xué)習(xí)應(yīng)用案例的設(shè)計與實現(xiàn)過程。本書適用于但不局限于對人工智能和機(jī)器學(xué)習(xí)算法感興趣的讀者,適合作為高等院校計算機(jī)科學(xué)與技術(shù)、人工智能、數(shù)據(jù)科學(xué)等專業(yè)相關(guān)課程的教材和人工智能通識教育的教材,也可供廣大IT從業(yè)人員參考。全書共15章,第1章至第5章由饒泓編寫,第6、7章由段文影編寫,第8、9章由樊莉莉編寫,第10至11章由徐子晨編寫,第12至15章由邱睿韞編寫。饒泓負(fù)責(zé)(徐子晨、邱睿韞協(xié)助)全書的組織和統(tǒng)稿工作。由于作者水平有限,書中難免有錯誤與不妥之處,請讀者多多指正。
作者2023年10月
饒泓,女,1973年生,博士,南昌大學(xué)教授,現(xiàn)任南昌大學(xué)信息工程學(xué)院副院長,博士生導(dǎo)師。曾先后赴美國伊利諾伊州立大學(xué)、美國堪薩斯大學(xué)訪學(xué)。主要研究方向為機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、大數(shù)據(jù)處理算法及其應(yīng)用。近年來致力于機(jī)器學(xué)習(xí)領(lǐng)域的多分類模型研究,并將機(jī)器學(xué)習(xí)理論應(yīng)用于特種設(shè)備監(jiān)測、大型橋梁健康監(jiān)測及預(yù)測,網(wǎng)絡(luò)廣告的精準(zhǔn)推薦、輿情監(jiān)測與預(yù)測、自然語言理解等領(lǐng)域。
第1章 緒論 11.1 機(jī)器學(xué)習(xí)的定義 11.2 基本術(shù)語 21.3 模型評估與選擇 31.3.1 經(jīng)驗誤差與過擬合 31.3.2 評估方法 31.4 機(jī)器學(xué)習(xí)解決問題的基本思路 41.5 Python語言 51.5.1 Python簡介 51.5.2 Python基礎(chǔ)語法 51.5.3 NumPy 快速入門 121.5.4 Matplotlib 快速入門 161.6 習(xí)題 19第2章 線性模型 212.1 基本形式 212.2 線性回歸 212.3 邏輯回歸 232.3.1 Logistic分布 242.3.2 邏輯回歸與Sigmoid函數(shù) 242.3.3 基于最優(yōu)化方法確定最佳回歸系數(shù) 262.4 應(yīng)用實例 272.4.1 線性回歸波士頓房價預(yù)測 272.4.2 邏輯回歸從疝氣病癥預(yù)測病馬的死亡率 302.5 習(xí)題 33第3章 樸素貝葉斯 353.1 樸素貝葉斯相關(guān)統(tǒng)計學(xué)知識 353.2 樸素貝葉斯法的學(xué)習(xí)與分類 373.2.1 基本方法 373.2.2 后驗概率最大化的含義 383.2.3 樸素貝葉斯分類基本流程 393.3 極大似然估計 413.4 應(yīng)用實例PC評論分類 443.5 習(xí)題 48第4章 k-近鄰算法 514.1 k-近鄰算法概述 514.2 kNN算法主要步驟 524.2.1 距離度量 524.2.2 k值的選擇 524.2.3 分類決策 534.3 應(yīng)用實例鳶尾花分類 544.3.1 項目背景 544.3.2 讀取數(shù)據(jù)與數(shù)據(jù)可視化 544.3.3 劃分?jǐn)?shù)據(jù)集 564.3.4 kNN算法 564.3.5 如何測試分類器 574.4 習(xí)題 58第5章 決策樹 595.1 決策樹的基本概念 605.1.1 定義 605.1.2 決策樹的構(gòu)造 605.2 決策樹學(xué)習(xí)基礎(chǔ)算法 605.3 最優(yōu)屬性的選擇 615.3.1 ID3信息增益(Gain) 615.3.2 C4.5信息增益率(Gain_ratio) 625.3.3 CART基尼指數(shù)(Gini_index) 635.4 決策樹的剪枝 635.5 應(yīng)用實例性別決策 645.6 Python實現(xiàn)過程 655.6.1 計算給定數(shù)據(jù)集的信息熵 655.6.2 數(shù)據(jù)集的劃分 665.6.3 遞歸構(gòu)建決策樹 675.7 使用Matplotlib繪制決策樹 695.7.1 Matplotlib注解 695.7.2 繪制決策樹 695.8 習(xí)題 72第6章 支持向量機(jī) 746.1 基于最大間隔分隔數(shù)據(jù) 746.2 尋找最大間隔 766.2.1 拉格朗日對偶性 786.2.2 SMO算法 826.3 軟間隔最大化 836.4 核函數(shù) 856.5 徑向基函數(shù) 886.6 應(yīng)用實例 886.7 習(xí)題 95第7章 神經(jīng)網(wǎng)絡(luò) 977.1 神經(jīng)元模型 977.2 感知機(jī)與多層前饋神經(jīng)網(wǎng)絡(luò) 1007.2.1 感知機(jī) 1007.2.2 多層前饋神經(jīng)網(wǎng)絡(luò) 1027.3 BP神經(jīng)網(wǎng)絡(luò) 1037.4 其他常見神經(jīng)網(wǎng)絡(luò) 1067.4.1 RBF網(wǎng)絡(luò) 1067.4.2 ART網(wǎng)絡(luò) 1067.4.3 SOM網(wǎng)絡(luò) 1077.4.4 級聯(lián)相關(guān)網(wǎng)絡(luò) 1077.4.5 Elman網(wǎng)絡(luò) 1087.5 應(yīng)用實例從疝氣病癥預(yù)測病馬的死亡率 1097.5.1 處理數(shù)據(jù)中的缺失值 1097.5.2 用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測 1107.6 習(xí)題 113第8章 深度學(xué)習(xí) 1158.1 卷積神經(jīng)網(wǎng)絡(luò) 1168.2 典型的卷積神經(jīng)網(wǎng)絡(luò) 1198.2.1 LeNet 1198.2.2 AlexNet 1208.2.3 VGGNet 1208.2.4 ResNet 1218.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 1238.4 深度學(xué)習(xí)框架 1258.4.1 深度學(xué)習(xí)框架的作用 1258.4.2 常見的深度學(xué)習(xí)框架 1258.4.3 飛槳概述深度學(xué)習(xí)開源平臺PaddlePaddle 1268.5 線性回歸小實例在飛槳深度學(xué)習(xí)平臺的應(yīng)用 1298.6 深度學(xué)習(xí)應(yīng)用實例口罩識別 1398.7 習(xí)題 156第9章 集成學(xué)習(xí)方法 1579.1 集成學(xué)習(xí)的分類 1579.2 Bagging和隨機(jī)森林 1589.2.1 Bagging并行集成學(xué)習(xí) 1589.2.2 隨機(jī)森林 1609.3 Boosting集成學(xué)習(xí)方法 1619.4 基于AdaBoost的分類 1629.5 基于XGBoost的分類 1649.5.1 GBDT 1649.5.2 XGBoost 1669.6 應(yīng)用實例 1689.6.1 基于AdaBoost算法 1689.6.2 基于XGBoost算法 1729.7 習(xí)題 175第10章 K-均值聚類 17710.1 K-均值聚類算法 17710.1.1 模型 17810.1.2 算法 17810.1.3 算法特性 18010.2 二分K-均值算法 18010.2.1 使用后處理來提高聚類性能 18010.2.2 二分K-均值聚類算法 18110.3 應(yīng)用實例 18210.4 習(xí)題 187第11章 Apriori算法及關(guān)聯(lián)分析 18911.1 關(guān)聯(lián)分析 19011.1.1 頻繁項集的評估標(biāo)準(zhǔn) 19011.1.2 關(guān)聯(lián)分析算法過程 19111.2 Apriori算法基本原理 19211.3 使用Apriori算法來發(fā)現(xiàn)頻繁項集 19311.4 從頻繁項集中挖掘關(guān)聯(lián)規(guī)則 19511.5 應(yīng)用實例 19611.6 習(xí)題 200第12章 FP-growth算法及頻繁項集的挖掘 20112.1 FP樹介紹 20212.2 構(gòu)造FP樹 20312.2.1 頭指針表的建立 20412.2.2 FP樹的建立 20412.3 從FP樹中挖掘頻繁項集 20712.3.1 抽取條件模式基 20812.3.2 FP算法歸納 21012.4 應(yīng)用實例 21112.5 習(xí)題 215第13章 PCA及數(shù)據(jù)降維 21613.1 降維技術(shù) 21613.2 PCA技術(shù) 21713.2.1 PCA的推導(dǎo):基于最小投影距離 21913.2.2 PCA的推導(dǎo):基于最大投影方差 22013.2.3 PCA算法流程 22113.3 應(yīng)用實例 22213.4 習(xí)題 225第14章 奇異值分解及應(yīng)用 22614.1 奇異值分解的應(yīng)用 22614.1.1 隱形語義索引 22614.1.2 推薦系統(tǒng) 22714.2 奇異值分解原理 22714.2.1 特征值與特征向量的回顧 22814.2.2 奇異值分解的定義 22814.2.3 緊奇異值分解與截斷奇異值分解 23014.3 應(yīng)用實例 23214.3.1 觀影數(shù)據(jù)的生成 23214.3.2 基于協(xié)同過濾的推薦引擎 23314.3.3 基于物品的相似度和基于用戶的相似度 23414.3.4 示例:電影推薦引擎 23414.4 習(xí)題 237第15章 綜合實例 23815.1 綜合實例一 23815.2 綜合實例二 25115.3 綜合實例三 26615.4 綜合實例四 282參考文獻(xiàn) 288