同类推荐
-
-
大模型架构与设计:构建高效能AI系统:building…
-
¥68.00
-
-
多模态大模型技术及应用
-
¥99.00
-
-
Cursor+Windsurf AI高性能架构开发与测…
-
¥89.00
-
-
Cursor+Windsurf AI高性能架构开发与测…
-
¥89.00
-
-
Cursor+Windsurf AI高性能架构开发与测…
-
¥89.00
-
-
OpenClaw+DeepSeek+Coze+飞书:A…
-
¥78.00
-
-
OpenClaw+DeepSeek+Coze+飞书:A…
-
¥78.00
-
-
OpenClaw+DeepSeek+Coze+飞书:A…
-
¥78.00
-
-
OpenClaw实战指南:从部署到上手,打造超级AI助手
-
¥58.00
-
-
OpenClaw实战指南:从部署到上手,打造超级AI助手
-
¥58.00
|
|
图书信息
|
|
|
|
异策略安全约束强化学习
|
| ISBN: | 9787118137071 |
定价: | ¥88.00 |
| 作者: | 杨奇松 ... [等] 著 |
出版社: | 国防工业出版社 |
| 出版时间: | 2025年07月 |
开本: | 24cm |
| 页数: | 117页 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
96
|
库区3/泰安展厅库/样本3
|
2026-04-18
|
|
其它供货商库存合计
|
500
|
|
2026-04-17
|
图书简介 | | 本书深入探讨了强化学习在现实世界应用中面临的安全挑战,特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法,区分奖励函数与安全相关的成本函数,以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题,开发了相应的算法。 |
|