同类推荐
-
-
人工智能应用实训教程
-
¥59.00
-
-
人工智能应用实训教程
-
¥59.00
-
-
人工智能应用实训教程
-
¥59.00
-
-
国产龙虾实操手册:12款OpenClaw国产AI工具零…
-
¥49.80
-
-
人工智能数学基础
-
¥159.90
-
-
人工智能数学基础
-
¥159.90
-
-
人工智能数学基础
-
¥159.90
-
-
Claude Code技术架构深度解析:Harness…
-
¥89.80
-
-
Claude Code技术架构深度解析:Harness…
-
¥89.80
-
-
Claude Code技术架构深度解析:Harness…
-
¥89.80
|
|
图书信息
|
|
|
|
强化学习
|
| ISBN: | 9787302714699 |
定价: | ¥99.00 |
| 作者: | 张伟楠[等]主编 |
出版社: | 清华大学出版社 |
| 出版时间: | 2026年05月 |
开本: | 26cm |
| 页数: | 13,420页 |
装祯: | 平装 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
500
|
|
2026-06-26
|
图书简介 | | 本书分为三部分:第一部分强化学习基础(第1-7章),从学科概览与发展脉络出发,介绍马尔可夫决策过程(MDP)的理论基础,重点讲解表格型强化学习方法,通过网格世界、悬崖行走等经典案例;第二部分强化学习进阶(第8-13章),聚焦深度强化学习的范式迁移与方法创新,从线性近似过渡到深度神经网络的价值函数逼近,对比分析DQN、PPO、SAC等主流深度强化学习算法架构,并剖析基于模型的方法在环境建模方面的优势,特别注重算法原理的深入剖析;第三部分强化学习前沿(第14-20章),拓展学科交叉应用与前沿研究方向,涵盖模仿学习、离线强化学习等数据驱动范式,详解人类反馈强化学习(RLHF)的对齐技术,并探索量子计算、扩散模型等新兴交叉领域。 |
|