書單推薦
更多
新書推薦
更多

Easy RL 強(qiáng)化學(xué)習(xí)教程

Easy RL 強(qiáng)化學(xué)習(xí)教程

定  價(jià):99.9 元

        

當(dāng)前圖書已被 45 所學(xué)校薦購(gòu)過!
查看明細(xì)

  • 作者:王琦、楊毅遠(yuǎn)、江季
  • 出版時(shí)間:2022/2/1
  • ISBN:9787115584700
  • 出 版 社:人民郵電出版社
  • 中圖法分類:TP181 
  • 頁(yè)碼:268
  • 紙張:
  • 版次:01
  • 開本:小16開
9
7
5
8
8
7
4
1
7
1
0
5
0
強(qiáng)化學(xué)習(xí)作為機(jī)器學(xué)習(xí)及人工智能領(lǐng)域的一種重要方法,在游戲、自動(dòng)駕駛、機(jī)器人路線規(guī)劃等領(lǐng)域得到了廣泛的應(yīng)用。 本書結(jié)合了李宏毅老師的“深度強(qiáng)化學(xué)習(xí)”、周博磊老師的“強(qiáng)化學(xué)習(xí)綱要”、李科澆老師的“世界冠軍帶你從零實(shí)踐強(qiáng)化學(xué)習(xí)”公開課的精華內(nèi)容,在理論嚴(yán)謹(jǐn)?shù)幕A(chǔ)上深入淺出地介紹馬爾可夫決策過程、蒙特卡洛方法、時(shí)序差分方法、Sarsa、Q 學(xué)習(xí)等傳統(tǒng)強(qiáng)化學(xué)習(xí)算法,以及策略梯度、近端策略優(yōu)化、深度Q 網(wǎng)絡(luò)、深度確定性策略梯度等常見深度強(qiáng)化學(xué)習(xí)算法的基本概念和方法,并以大量生動(dòng)有趣的例子幫助讀者理解強(qiáng)化學(xué)習(xí)問題的建模過程以及核心算法的細(xì)節(jié)。 此外,本書還提供習(xí)題解答以及Python 代碼實(shí)現(xiàn),可以讓讀者進(jìn)行端到端、從理論到輕松實(shí)踐的全生態(tài)學(xué)習(xí),充分掌握強(qiáng)化學(xué)習(xí)算法的原理并能進(jìn)行實(shí)戰(zhàn)。 本書適合對(duì)強(qiáng)化學(xué)習(xí)感興趣的讀者閱讀,也可以作為相關(guān)課程的配套教材。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容