同类推荐
-
-
AI时代生存手册:零基础掌握豆包
-
¥59.80
-
-
AI时代生存手册:零基础掌握豆包
-
¥59.80
-
-
AI时代生存手册:零基础掌握豆包
-
¥59.80
-
-
人工智能大模型数学基础
-
¥149.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
|
|
图书信息
|
|
|
|
深入浅出强化学习:编程实战
|
| ISBN: | 9787121367465 |
定价: | ¥89.00 |
| 作者: | 郭宪,宋俊潇,方勇纯著 |
出版社: | 电子工业出版社 |
| 出版时间: | 2020年03月 |
开本: | 24cm |
| 页数: | 264页 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
12
|
|
2026-01-29
|
图书简介 | | 本书分三大篇介绍了目前强化学习算法中最基本的算法。第一篇为基于值函数的强化学习算法,该篇介绍了基于两种策略评估方法(蒙特卡洛策略评估和时间差分策略评估)的强化学习算法,进而介绍了如何将函数逼近的方法引入到强化学习算法中。第二篇为直接策略搜索方法,该篇介绍了最基本的策略梯度方法、基本的AC方法、PPO方法和DDPG算法。第三篇为基于模型的强化学习方法,该篇介绍了基于mpc的方法,AlphaZero算法基本原理及在五子棋上的具体实现细节。 |
|