同类推荐
-
-
DeepSeek即时通:提示词重塑AI生产力
-
¥79.00
-
-
大模型辅助编程
-
¥59.80
-
-
大模型辅助编程
-
¥59.80
-
-
大模型辅助编程
-
¥59.80
-
-
大模型工程师面试:算法原理、开发实践与系统部署
-
¥119.00
-
-
Grok 4大模型原理剖析及应用开发
-
¥89.00
-
-
Grok 4大模型原理剖析及应用开发
-
¥89.00
-
-
人工智能发展前沿
-
¥89.00
-
-
人工智能导论:慕课版
-
¥59.80
-
-
人工智能导论:慕课版
-
¥59.80
|
|
图书信息
|
|
|
阿尔法零对最优模型预测自适应控制的启示
|
ISBN: | 9787302684718 |
定价: | ¥79.00 |
作者: | (美)德梅萃·P.博塞克斯(Dimitri P. Bertsekas)著 |
出版社: | 清华大学出版社 |
出版时间: | 2025年04月 |
版次: | [影印版] |
开本: | 24cm |
页数: | 14,227页 |
中图法: | TP18 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
北京人天书店有限公司
|
20
|
库区4/库区7/泰安展厅库/样本4
|
2025-10-20
|
其它供货商库存合计
|
500
|
|
2025-10-17
|
图书简介 | 本书构建了近似动态规划和强化学习的新的理论框架,简洁但雄心勃勃。这一框架以离线训练和在线学习这两个算法为中心,彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩。在看似纷繁复杂的数据与算法表象之下,其实蕴藏着简洁而美妙的规律。通过本书的学习,读者将能体会经典优化控制理论在分析理解当代强化学习算法性能中的强大威力,更能领悟到以阿尔法零为代表的新一代算法浪潮对经典理论提供的新的发展机遇。 |
|