同类推荐
-
-
国产龙虾实操手册:12款OpenClaw国产AI工具零…
-
¥49.80
-
-
智能体其实很简单:零基础入门AI Agent工作流搭建
-
¥59.00
-
-
人工智能教育基础:Python编程基础与实践
-
¥35.00
-
-
Claude Code实战:Harness工程之道
-
¥79.80
-
-
Claude Code实战:Harness工程之道
-
¥79.80
-
-
Claude Code实战:Harness工程之道
-
¥79.80
-
-
Claude Code Agentic编程与项目开发实战
-
¥89.90
-
-
从0到1精通AI智能体
-
¥59.80
-
-
共享智慧
-
¥89.90
-
-
共享智慧
-
¥89.90
|
|
图书信息
|
|
|
|
异策略安全约束强化学习
|
| ISBN: | 9787118137071 |
定价: | ¥88.00 |
| 作者: | 杨奇松 ... [等] 著 |
出版社: | 国防工业出版社 |
| 出版时间: | 2025年07月 |
开本: | 24cm |
| 页数: | 117页 |
中图法: | TP181 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
61
|
库区3/泰安展厅库/样本3
|
2026-06-10
|
|
其它供货商库存合计
|
500
|
|
2026-06-10
|
图书简介 | | 本书深入探讨了强化学习在现实世界应用中面临的安全挑战,特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法,区分奖励函数与安全相关的成本函数,以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题,开发了相应的算法。 |
|