同类推荐
-
-
深度强化学习算法原理与实战:基于MATLAB
-
¥109.00
-
-
Vibe编程:探索AI时代编程新范式
-
¥69.80
-
-
Kimi实战精粹
-
¥69.90
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人人都需要的通用智能体助手:Manus+扣子空间+秒哒…
-
¥79.00
-
-
AIGC基础与应用:微课版
-
¥68.00
-
-
这就是MCP
-
¥79.80
-
-
豆包实战精粹
-
¥69.90
|
|
图书信息
|
|
|
阿尔法零对最优模型预测自适应控制的启示
|
ISBN: | 9787302684718 |
定价: | ¥79.00 |
作者: | (美)德梅萃·P.博塞克斯(Dimitri P. Bertsekas)著 |
出版社: | 清华大学出版社 |
出版时间: | 2025年04月 |
版次: | [影印版] |
开本: | 24cm |
页数: | 14,227页 |
中图法: | TP18 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
北京人天书店有限公司
|
43
|
库区4/库区7/泰安展厅库/样本4
|
2025-08-28
|
其它供货商库存合计
|
500
|
|
2025-08-28
|
图书简介 | 本书构建了近似动态规划和强化学习的新的理论框架,简洁但雄心勃勃。这一框架以离线训练和在线学习这两个算法为中心,彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩。在看似纷繁复杂的数据与算法表象之下,其实蕴藏着简洁而美妙的规律。通过本书的学习,读者将能体会经典优化控制理论在分析理解当代强化学习算法性能中的强大威力,更能领悟到以阿尔法零为代表的新一代算法浪潮对经典理论提供的新的发展机遇。 |
|