本站收录馆配可供书目品种:1689531

同类推荐

: 大模型与提示词:构建AI时代高效工作流; ¥79.80

: 重构个体:AI时代如何打造个人竞争力; ¥69.00

: 重构个体:AI时代如何打造个人竞争力; ¥69.00

: 豆包AI高效实用手册; ¥59.80

: 豆包AI高效实用手册; ¥59.80

: 豆包AI高效实用手册; ¥59.80

: AI时代生存手册:零基础掌握豆包; ¥59.80

: AI时代生存手册:零基础掌握豆包; ¥59.80

: AI时代生存手册:零基础掌握豆包; ¥59.80

: 智算中心建设与实践; ¥99.90

图书信息

	深入浅出强化学习：编程实战
	ISBN：	9787121367465	定价：	￥89.00
	作者：	郭宪，宋俊潇，方勇纯著	出版社：	电子工业出版社
	出版时间：	2020年03月	开本：	24cm
	页数：	264页
	中图法：	TP181

图书简介

本书分三大篇介绍了目前强化学习算法中最基本的算法。第一篇为基于值函数的强化学习算法，该篇介绍了基于两种策略评估方法(蒙特卡洛策略评估和时间差分策略评估)的强化学习算法，进而介绍了如何将函数逼近的方法引入到强化学习算法中。第二篇为直接策略搜索方法，该篇介绍了最基本的策略梯度方法、基本的AC方法、PPO方法和DDPG算法。第三篇为基于模型的强化学习方法，该篇介绍了基于mpc的方法，AlphaZero算法基本原理及在五子棋上的具体实现细节。

蔚蓝网清华大学出版社北京大学出版社中国人民大学出版社中信出版社北京理工大学出版社

同类推荐

图书信息

深入浅出强化学习：编程实战

相关供货商

图书简介