同类推荐
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
深度学习实践:基于TensorFlow及PyTorch…
-
¥68.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
-
-
驾驭Gemini 3与Nano Banana:人人都是…
-
¥69.80
-
-
驾驭Gemini 3与Nano Banana:人人都是…
-
¥69.80
-
-
驾驭Gemini 3与Nano Banana:人人都是…
-
¥69.80
|
|
图书信息
|
|
|
|
Joy RL:强化学习实践教程
|
| ISBN: | 9787115631541 |
定价: | ¥79.80 |
| 作者: | 江季,王琦,杨毅远著 |
出版社: | 人民邮电出版社 |
| 出版时间: | 2025年04月 |
开本: | 23cm |
| 页数: | 160页 |
装祯: | 平装 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
67
|
库区13/库区4/库区7/样本13/样本4
|
2026-01-30
|
|
其它供货商库存合计
|
973
|
|
2026-01-30
|
图书简介 | | 本书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。 |
|