同类推荐
-
-
国产龙虾实操手册:12款OpenClaw国产AI工具零…
-
¥49.80
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
Claude Code橙皮书:AI编程实战
-
¥59.80
-
-
Claude Code橙皮书:AI编程实战
-
¥59.80
-
-
Claude Code橙皮书:AI编程实战
-
¥59.80
-
-
吾辈如神:重构AI时代的生存力与胜任力
-
¥119.90
-
-
大模型边缘推理系统设计:模型压缩、推理优化与跨平台部署
-
¥89.90
-
-
大模型边缘推理系统设计:模型压缩、推理优化与跨平台部署
-
¥89.90
|
|
图书信息
|
|
|
|
Easy RL 强化学习教程
|
| ISBN: | 9787115584700 |
定价: | ¥99.90 |
| 作者: | 王琦,杨毅远,江季编著 |
出版社: | 人民邮电出版社 |
| 出版时间: | 2022年03月 |
开本: | 23cm |
| 页数: | 245页 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
13
|
库区4/样本4
|
2026-06-19
|
|
其它供货商库存合计
|
303
|
|
2026-06-19
|
图书简介 | | 本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“百度强化学习”公开课的精华内容,在理论严谨的基础上深入浅出地介绍了马尔可夫决策过程、蒙特卡罗方法、时序差分方法、Sarsa、Q-learning等传统强化学习算法,以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法,并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。 |
|