書單推薦
更多
新書推薦
更多

深度強化學習算法原理與實戰(zhàn):基于MATLAB

深度強化學習算法原理與實戰(zhàn):基于MATLAB

定  價:109 元

        

當前圖書已被 1 所學校薦購過!
查看明細

  • 作者:鄭一 編著
  • 出版時間:2025/9/1
  • ISBN:9787122475756
  • 出 版 社:化學工業(yè)出版社
  • 中圖法分類:TP181 
  • 頁碼:339
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
4
8
7
7
5
1
7
2
5
2
6

讀者對象:本書可作為高等院校深度強化學習課程的教材,亦可作為本科生畢業(yè)設計、研究生項目設計和廣大科研人員的技術參考用書。

本書在詳細闡述強化學習基本概念與基本理論的基礎上,循序漸進地介紹了深度強化學習各常用算法的基本思想、算法偽代碼、算法實現(xiàn)、基于實例的算法演示與程序分析等內容。具體介紹了Q-learning算法求解最優(yōu)路徑問題,SARSA算法求解最優(yōu)安全路徑問題,策略迭代算法求解兩地租車最優(yōu)調度問題,價值迭代算法求解最優(yōu)路徑問題,DQN?算法求解平衡系統(tǒng)的最優(yōu)控制問題,PG算法求解雙積分系統(tǒng)的最優(yōu)控制問題,AC類算法求解股票交易的最優(yōu)推薦策略,SAC算法求解機器人手臂控球平衡問題,PPO算法求解飛行器平穩(wěn)著陸最優(yōu)控制問題,DDPG算法求解四足機器人行走控制策略問題,TD3算法求解PID控制器參數(shù)整定問題,多智能體強化學習的基本概念與基本方法,MAPPO算法求解多智能體協(xié)作運送物體問題,IPPO算法與MAPPO算法求解協(xié)作競爭探索區(qū)域問題,MADDPG與DDPG算法求解車輛路徑跟蹤控制問題。
本書可作為高等院校深度強化學習課程的教材,亦可作為本科生畢業(yè)設計、研究生項目設計和廣大科研人員的技術參考用書。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容