同类推荐
-
-
扣子(Coze)从入门到精通:轻松搭建AI Agent
-
¥89.90
-
-
扣子(Coze)从入门到精通:轻松搭建AI Agent
-
¥89.90
-
-
扣子(Coze)从入门到精通:轻松搭建AI Agent
-
¥89.90
-
-
Grok 4大模型原理剖析及应用开发
-
¥89.00
-
-
Grok 4大模型原理剖析及应用开发
-
¥89.00
-
-
DeepSeek即时通:提示词重塑AI生产力
-
¥79.00
-
-
大模型辅助编程
-
¥59.80
-
-
大模型技术与构建:从入门到实战
-
¥89.00
-
-
这就是DeepSeek:DeepSeek从原理到实践
-
¥69.00
-
-
图机器学习
-
¥119.80
|
|
图书信息
|
|
|
异策略安全约束强化学习
|
ISBN: | 9787118137071 |
定价: | ¥88.00 |
作者: | 杨奇松 ... [等] 著 |
出版社: | 国防工业出版社 |
出版时间: | 2025年07月 |
开本: | 24cm |
页数: | 117页 |
中图法: | TP181 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
北京人天书店有限公司
|
3
|
库区3/泰安展厅库
|
2025-10-14
|
其它供货商库存合计
|
500
|
|
2025-10-14
|
图书简介 | 本书深入探讨了强化学习在现实世界应用中面临的安全挑战,特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法,区分奖励函数与安全相关的成本函数,以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题,开发了相应的算法。 |
|