本書是一本融合人工智能及其在海洋機器人中應用的綜合性教材,旨在為學生、研究人員和工程師提供全面的理論基礎和實際應用技能。本書內(nèi)容涵蓋了人工智能的基礎理論、人工神經(jīng)網(wǎng)絡在海洋機器人控制中的應用、強化學習方法在海洋機器人決策上的應用、基于深度學習的水下目標探測,以及人工智 能在海洋機器人中的具體應用實例。
更多科學出版社服務,請掃碼獲取。
研究生授課課程:
1潛器系統(tǒng)建模與仿真 碩士研究生
2計算機人工智能技術博士研究生人工智能和系統(tǒng)仿真2007年至今負責完成水下機器人和水面無人艇所有項目的計算機仿真實驗驗證,建立了水下機器人重點實驗室的包括軟硬件在內(nèi)的仿真系統(tǒng)。2010年開始進行人工智能理論方法在水下機器人領域應用的研究,致力于研究水下機器人領域對人工智能提出的新要求、新問題。2014年至今組織團隊成功申報了多項人工智能和水下機器人軟件領域的科研項目。中國仿真學會機器人系統(tǒng)仿真專委會委員、中國造船工程學會女科學家工作委員會委員
目錄
第一章 緒論 1
1.1 人工雛概述 1
1.2 人工智能的起源和發(fā)展史 1
1.3 圖靈測試 3
1.4 弱人工智能與強人工智能 4
1.4.1 弱人工智能 4
1.4.2 強人工智能 4
1.4.3 弱人工智能與強人工智能的對比 5
1.5 人工智能的各個學派 6
1.5.1 符號主義 6
1.5.2 聯(lián)結主義 6
1.5.3 為主義 7
1.6 海洋機器人概述 7
1.6.1 水面無人艇 8
1.6.2 水下機器人 12
1.6.3 海洋機器人的應用與挑戰(zhàn) 15
第2章 知識表示 16
2.1 知識與知識表示的概念 16
2.1.1 知識的概念 16
2.1.2 知識的特性 17
2.1.3 知識的表示 18
2.2 狀態(tài)空間法 18
2.2.1 問題狀態(tài)描述 18
2.2.2 狀態(tài)圖示法 20
2.3 問題歸約法 22
2.3.1 問題歸約描述 22
2.3.2 與或酬述 24
2.4 P 生式表示法 27
2.4.1 P生式概述 27
2.4.2 f生式纖 29
2.4.3 產(chǎn)生式表示法的特點 30
2.5 面向對象的知識表示 31
2.5.1 關于對象的定義 31
2.5.2 消息、接口和方法 32
2.5.3 類 33
2.5.4 封裝與繼承 33
2.6 海洋機器人路徑規(guī)劃的知識表示 34
第3章 搜索策略 36
3.1 搜索概述 36
3.1.1 搜索的基本問題與主要過程 36
3.1.2 搜索策略分類 36
3.2 盲目搜索 37
3.2.1 寬度優(yōu)先搜索 37
3.2.2 深度優(yōu)先搜索 39
3.2.3 有界深度優(yōu)先搜索 41
3.2.4 迭代廳搜索 42
3.3 啟發(fā)式圖搜索策略 42
3.3.1 啟發(fā)式策略 43
3.3.2 啟發(fā)信息和估價函數(shù) 45
3.3.3 A搜索算法 46
3.3.4 A*搜索算法及其特性分析 49
3.4 回溯策略 51
3.5 博弈搜索 53
3.5.1 極大極小過程 55
3.5.2 *過程 57
3.6 海洋機器人路徑規(guī)劃的啟發(fā)式搜索 59
第4章 人工神經(jīng)網(wǎng)絡 61
4.1 神經(jīng)信息處理基本原理 61
4.1.1 生物神經(jīng)元結構 61
4.1.2 神經(jīng)元數(shù)學模型 62
4.1.3 神經(jīng)網(wǎng)絡的結構與工作方式 63
4.1.4 神經(jīng)網(wǎng)絡的學習 63
4.2 感知器 64
4.2.1 人工神經(jīng)元的基本構成 64
4.2.2 感知器的組成 65
4.3 BP神經(jīng)網(wǎng)絡 68
4.3.1 網(wǎng)絡的構成 68
4.3.2 訓練過程 69
4.3.3 誤差傳播分析 70
4.3.4 實例 72
4.4 RBF神經(jīng)網(wǎng)絡 74
4.4.1 徑向基函數(shù) 74
4.4.2 徑向基網(wǎng)絡 75
4.4.3 RBF神經(jīng)網(wǎng)絡的設計和求解 76
4.4.4 實例 77
4.5 Hopfield神經(jīng)網(wǎng)絡 79
4.5.1 Hopfield神經(jīng)網(wǎng)絡的組織 79
4.5.2 穩(wěn)定性分析 82
4.5.3 實例 85
4.6 自組織映射神經(jīng)網(wǎng)絡 86
4.6.1 典型結構 86
4.6.2 自組織學習過程 87
4.6.3 設計細 1? 88
4.6.4 實例 89
4.7 海洋機器人控制中的人工神經(jīng)網(wǎng)絡 90
4.7.1 基于RBF神經(jīng)網(wǎng)絡的監(jiān)督控制 90
4.7.2 基于RBF神經(jīng)網(wǎng)絡的模型參考自適應控制 91
第5章 強化學習 93
5.1 強化學習概述 93
5.1.1 強化學習要素 93
5.1.2 強化學習過程 93
5.1.3 強化學習的分類 94
5.1.4 強化學習的局限與適用范圍 94
5.2 馬爾可夫決策 94
5.2.1 馬爾可夫過程 95
5.2.2 馬爾可夫獎勵過程 96
5.2.3 馬爾可夫決策過程 98
5.3 動態(tài)細勝 101
5.3.1 策略評估 102
5.3.2 策略改進 106
5.3.3 策略迭代與價值迭代 107
5.3.4 異步動態(tài)規(guī)劃 108
5.4 蒙特卡羅法 109
5.4.1 蒙特卡羅概率統(tǒng)計 109
5.4.2 “經(jīng)驗”與“平均” 111
5.4.3 蒙特卡羅控制 112
5.4.4 非探索性初始化假設的蒙特卡羅控制 113
5.5 時間差分法 116
5.5.1 時間差分法的值函數(shù) 117
5.5.2 時間差分法的優(yōu)點 117
5.5.3 時間差分控制 118
5.6 策略梯度 124
5.7 海洋機器人中的強化學習 126
第6章 深度學習 131
6.1 深度前饋網(wǎng)絡 131
6.2 基于梯度的學習 132
6.2.1 代價函數(shù) 132
6.2.2 使用最大似然學習條件分布 133
6.2.3 輸出單元 133
6.3 正則化 137
6.3.1 參數(shù)范數(shù)懲罰 137
6.3.2 L2參數(shù)正則化 138
6.3.3 L1參數(shù)正則化 140
6.3.4 作為約束的范數(shù)懲罰 141
6.3.5 正則化和欠約束問題 143
6.3.6 數(shù)據(jù)集增強 143
6.3.7 噪聲魯棒性 144
6.3.8 半監(jiān)督學習 145
6.3.9 提前終止 145
6.3.10 Bagging方法 147
6.3.11 Dropout方法 148
6.4 卷積網(wǎng)絡 154
6.4.1 卷積運算的定義 155
6.4.2 卷積神經(jīng)網(wǎng)絡中的卷積運算 155
6.4.3 卷積神經(jīng)網(wǎng)絡的特點 156
6.4.4 卷積神經(jīng)網(wǎng)絡層 157
6.4.5 多層卷積 161
6.4.6 AlexNet(實例) 162
6.5 基于深度學習的目標探測框架 166
6.5.1 YOLO框架 166
6.5.2 Transformer框架 167
6.5.3 R-CNN算法 168
參考文獻 169