同类推荐
-
-
国产龙虾实操手册:12款OpenClaw国产AI工具零…
-
¥49.80
-
-
大模型边缘推理系统设计:模型压缩、推理优化与跨平台部署
-
¥89.90
-
-
大模型边缘推理系统设计:模型压缩、推理优化与跨平台部署
-
¥89.90
-
-
大模型边缘推理系统设计:模型压缩、推理优化与跨平台部署
-
¥89.90
-
-
吾辈如神:重构AI时代的生存力与胜任力
-
¥119.90
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
人工智能故事书:懂中文就能读懂的AI通识与应用
-
¥69.80
-
-
人工智能故事书:懂中文就能读懂的AI通识与应用
-
¥69.80
|
|
图书信息
|
|
|
|
强化学习:微课版
|
| ISBN: | 9787302587941 |
定价: | ¥69.00 |
| 作者: | 袁莎,白朔天,唐杰著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2021年10月 |
开本: | 26cm |
| 页数: | 20,276页 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
16
|
|
2026-06-16
|
图书简介 | | 本书为读者构建了一个完整的强化学习入门路径,深入浅出地介绍了强化学习算法的基本原理和实现方法。在正文开始前,本书带着初学者回顾了相关预备知识,包括数学基础和机器学习基础。在正文部分,本书首先介绍了强化学习的基本概念,给出了强化学习的数学框架(马尔科夫决策过程),随后介绍了强化学习的求解算法,包括表格求解法(动态规划法、蒙特卡洛法和时序差分法),以及近似求解法(值函数近似法、策略梯度法和深度强化学习)。本书最后一部分为实践与前沿,实践部分基于一个相同的例子实现了强化学习领域的主流基础算法,前沿部分介绍了强化学习领域的最新研究进展。本书配有相当数量的习题可供练习,配套代码基于Python实现,源代码均已开源,可开放获取。 |
|