![]() ![]() |
基于模型的強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個基本范示,其中智能體執(zhí)行動作以確保設(shè)備的最優(yōu)性能。雖然這種機(jī)器學(xué)習(xí)范式近年來取得了巨大的成功和普及,但以前的學(xué)術(shù)研究要么集中在理論上——最優(yōu)控制和動態(tài)規(guī)劃——要么集中在算法上——其中大多數(shù)是基于仿真的。
《基于模型的強(qiáng)化學(xué)習(xí)》提供了一個基于模型的框架來橋接這兩個方面,從而創(chuàng)建了一個基于模型的在線學(xué)習(xí)控制主題的整體處理。在此過程中,作者尋求開發(fā)一個基于模型的數(shù)據(jù)驅(qū)動控制框架,該框架將數(shù)據(jù)系統(tǒng)識別、基于模型的強(qiáng)化學(xué)習(xí)和最優(yōu)控制以及每個主題的應(yīng)用連接起來。這種評估經(jīng)典結(jié)果的新技術(shù)將會是更有效的強(qiáng)化學(xué)習(xí)系統(tǒng)。本書的核心是提供一個端到端的框架——從設(shè)計到應(yīng)用——一種更易于處理的基于模型的強(qiáng)化學(xué)習(xí)技術(shù)。
基于模型的強(qiáng)化學(xué)習(xí)的讀者還會發(fā)現(xiàn):
這是一本實用的教科書,適用于數(shù)據(jù)驅(qū)動和基于學(xué)習(xí)的控制研究生課程中,強(qiáng)調(diào)從數(shù)據(jù)對動態(tài)系統(tǒng)進(jìn)行建模和控制。
詳細(xì)比較了不同技術(shù)的影響,如基本線性二次型控制器、基于學(xué)習(xí)的模型預(yù)測控制、無模型強(qiáng)化學(xué)習(xí)和結(jié)構(gòu)化在線學(xué)習(xí)。
非完整動力學(xué)的地面車輛應(yīng)用與實例研究,以及在四旋翼直升機(jī)上的應(yīng)用與實例研究。
一個基于Python的在線工具箱,該工具箱包含本書所涵蓋的內(nèi)容以及必要的代碼和數(shù)據(jù)。
《基于模型的強(qiáng)化學(xué)習(xí)》是高年級本科生、研究生、研究助理、教授、過程控制工程師和機(jī)器人專家的有用參考書籍。
你還可能感興趣
我要評論
|