書單推薦
更多
新書推薦
更多

大模型算法:強(qiáng)化學(xué)習(xí)、微調(diào)與對齊

 大模型算法:強(qiáng)化學(xué)習(xí)、微調(diào)與對齊

定  價:109 元

叢書名:通用智能與大模型叢書

        

  • 作者:余昌葉
  • 出版時間:2025/4/1
  • ISBN:9787121500725
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP391 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:128開
9
7
5
8
0
7
0
1
7
2
2
1
5

本書系統(tǒng)地講解了大模型技術(shù)、訓(xùn)練算法(包括強(qiáng)化學(xué)習(xí)、RLHF、GRPO、DPO、SFT與CoT蒸餾等)、 微調(diào)與對齊、效果優(yōu)化及其實(shí)踐。全書以大語言模型(LLM)為主線,絕大部分內(nèi)容也適用于多模態(tài)大模型(VLM 和MLLM)。本書面向AI算法與工程領(lǐng)域的從業(yè)者、相關(guān)專業(yè)的學(xué)生,以及希望深入了解大模型技術(shù)、擁抱AI與大模型浪潮的跨行業(yè)讀者。

 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容