同类推荐
-
-
网络服务器配置与管理
-
¥49.00
-
-
Stable Diffusion AIGC视觉教程
-
¥59.80
-
-
即梦Seedance AI视频生成与变现实战
-
¥79.00
-
-
Python程序设计基础与实践(微课版)(AI辅助学习…
-
¥49.80
-
-
Python程序设计基础与实践(微课版)(AI辅助学习…
-
¥49.80
-
-
Python程序设计基础与实践(微课版)(AI辅助学习…
-
¥49.80
-
-
Python程序设计(微课版)(高等职业院校互联网+新…
-
¥59.00
-
-
Qt Widgets及Qt Quick开发实战精解
-
¥79.00
-
-
LangChain大模型应用开发从入门到实践
-
¥99.00
-
-
WPS+豆包+DeepSeek办公效率革命:智能工具全…
-
¥79.80
|
|
图书信息
|
|
|
|
大模型算法:强化学习、微调与对齐:Reinforcement learning, fine-tuning, and alignment
|
| ISBN: | 9787121500725 |
定价: | ¥109.00 |
| 作者: | 余昌叶著 |
出版社: | 电子工业出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 230页 |
中图法: | TP391 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
51
|
库区13/泰安展厅库/样本13
|
2026-05-14
|
|
其它供货商库存合计
|
624
|
|
2026-05-14
|
图书简介 | | 本书系统地讲解了大模型技术及其后训练(Post-Training)相关的各类算法、实践。全书以大语言模型(LLM)为核心,内容广泛且深入,绝大部分同样适用于视觉语言模型(VLM)和多模态语言模型(MLLM)。本书共10章,第1章介绍SFT,第2章介绍对齐算法宏观架构,第3章介绍强化学习核心算法,第4章介绍PPO算法,第5章介绍RLHF,第6章介绍DPO算法,第7章介绍免训练的对齐和优化方法,第8章介绍对齐算法的衍生和进化,第9章和第10章是两个案例实践。 |
|