同类推荐
-
-
AI时代生存手册:零基础掌握豆包
-
¥59.80
-
-
AI时代生存手册:零基础掌握豆包
-
¥59.80
-
-
AI时代生存手册:零基础掌握豆包
-
¥59.80
-
-
人工智能大模型数学基础
-
¥149.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
|
|
图书信息
|
|
|
|
深度强化学习实践
|
| ISBN: | 9787111687382 |
定价: | ¥149.00 |
| 作者: | (俄)马克西姆·拉潘(Maxim Lapan)著 |
出版社: | 机械工业出版社 |
| 出版时间: | 2021年08月 |
开本: | 24cm |
| 页数: | 17,617页 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
2
|
|
2026-02-06
|
图书简介 | | 本书介绍了强化学习的基础知识,以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法:交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法,并研究可以使用策略梯度方法解决的实际问题:使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法:黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。 |
|