同类推荐
-
-
软件测试策略
-
¥99.00
-
-
软件测试策略
-
¥99.00
-
-
软件测试策略
-
¥99.00
-
-
LangChain与LangGraph实战
-
¥79.00
-
-
LangChain与LangGraph实战
-
¥79.00
-
-
LangChain与LangGraph实战
-
¥79.00
-
-
计算机基础及WPS Office应用教程 第二版
-
¥59.80
-
-
Python数据分析任务驱动教程
-
¥69.80
-
-
C++程序设计语言(第4版)(上、下册)
-
¥249.80
-
-
C++程序设计语言(第4版)(上、下册)
-
¥249.80
|
|
图书信息
|
|
|
|
基于Python的强化学习
|
| ISBN: | 9787519870379 |
定价: | ¥88.00 |
| 作者: | (美)安德里亚·隆萨(Andrea Lonza)著 |
出版社: | 中国电力出版社 |
| 出版时间: | 2023年01月 |
开本: | 24cm |
| 页数: | 265页 |
中图法: | TP312PY |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
1
|
库区6/样本6
|
2025-12-23
|
|
|
|
|
|
图书简介 | | 本书首先介绍在强化学习环境中工作所需的工具、库和设置,涵盖了强化学习的构成模块,深入探讨基于值的方法,如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外,在学习DDPG和TD3确定性算法之前,读者将学习策略梯度方法,如TRPO和PPO,以提高性能和稳定性。本书还介绍模仿学习的原理,以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。 |
|