同类推荐
-
-
组态软件项目开发与实践(朱涛)
-
¥49.80
-
-
组态软件项目开发与实践(朱涛)
-
¥49.80
-
-
组态软件项目开发与实践(朱涛)
-
¥49.80
-
-
视觉伺服技术与应用
-
¥99.00
-
-
视觉伺服技术与应用
-
¥99.00
-
-
视觉伺服技术与应用
-
¥99.00
-
-
机器视觉系统硬件设计、算法开发及应用
-
¥79.00
-
-
机器视觉系统硬件设计、算法开发及应用
-
¥79.00
-
-
机器视觉系统硬件设计、算法开发及应用
-
¥79.00
-
-
像素蛋糕AI修图全攻略:人像后期从入门到精通
-
¥78.00
|
|
图书信息
|
|
|
|
大模型算法:强化学习、微调与对齐:Reinforcement learning, fine-tuning, and alignment
|
| ISBN: | 9787121500725 |
定价: | ¥109.00 |
| 作者: | 余昌叶著 |
出版社: | 电子工业出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 230页 |
中图法: | TP391 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
26
|
库区13/样本13
|
2026-01-30
|
|
其它供货商库存合计
|
594
|
|
2026-01-30
|
图书简介 | | 本书系统地讲解了大模型技术及其后训练(Post-Training)相关的各类算法、实践。全书以大语言模型(LLM)为核心,内容广泛且深入,绝大部分同样适用于视觉语言模型(VLM)和多模态语言模型(MLLM)。本书共10章,第1章介绍SFT,第2章介绍对齐算法宏观架构,第3章介绍强化学习核心算法,第4章介绍PPO算法,第5章介绍RLHF,第6章介绍DPO算法,第7章介绍免训练的对齐和优化方法,第8章介绍对齐算法的衍生和进化,第9章和第10章是两个案例实践。 |
|