同类推荐
-
-
世界模型——AI尚未理解的真实世界
-
¥59.00
-
-
世界模型——AI尚未理解的真实世界
-
¥59.00
-
-
AIGC技术及应用通识教程(微课版)
-
¥59.80
-
-
AI全工具提效应用到精通指南
-
¥68.00
-
-
AI全工具提效应用到精通指南
-
¥68.00
-
-
AI全工具提效应用到精通指南
-
¥68.00
-
-
OpenClaw:从入门到精通应用操作大全
-
¥68.00
-
-
OpenClaw:从入门到精通应用操作大全
-
¥68.00
-
-
OpenClaw:从入门到精通应用操作大全
-
¥68.00
-
-
豆包在手,万事不愁
-
¥59.80
|
|
图书信息
|
|
|
|
阿尔法零对最优模型预测自适应控制的启示
|
| ISBN: | 9787302684718 |
定价: | ¥79.00 |
| 作者: | (美)德梅萃·P.博塞克斯(Dimitri P. Bertsekas)著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2025年04月 |
版次: | [影印版] |
| 开本: | 24cm |
页数: | 14,227页 |
中图法: | TP18 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
13
|
库区7/泰安展厅库/样本4
|
2026-04-06
|
|
其它供货商库存合计
|
500
|
|
2026-04-03
|
图书简介 | | 本书构建了近似动态规划和强化学习的新的理论框架,简洁但雄心勃勃。这一框架以离线训练和在线学习这两个算法为中心,彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩。在看似纷繁复杂的数据与算法表象之下,其实蕴藏着简洁而美妙的规律。通过本书的学习,读者将能体会经典优化控制理论在分析理解当代强化学习算法性能中的强大威力,更能领悟到以阿尔法零为代表的新一代算法浪潮对经典理论提供的新的发展机遇。 |
|