同类推荐
-
-
Stable Diffusion AIGC视觉教程
-
¥59.80
-
-
微课学UE虚幻引擎场景搭建
-
¥79.80
-
-
Python编程:案例驱动的快速入门与实践
-
¥45.00
-
-
用AI决胜信息学奥赛(C++编程基础)
-
¥99.00
-
-
Spring Boot实践
-
¥129.80
-
-
JSP程序设计实训与案例教程(第3版)
-
¥89.00
-
-
RAG技术基础与开发实战
-
¥99.00
-
-
AIGC高效编程:Python游戏开发实战(慕课版)
-
¥59.80
-
-
三维设计基础:Blender
-
¥65.00
-
-
Java程序设计
-
¥55.00
|
|
图书信息
|
|
|
|
大模型算法:强化学习、微调与对齐:Reinforcement learning, fine-tuning, and alignment
|
| ISBN: | 9787121500725 |
定价: | ¥109.00 |
| 作者: | 余昌叶著 |
出版社: | 电子工业出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 230页 |
中图法: | TP391 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
19
|
库区13/样本13
|
2026-03-22
|
|
其它供货商库存合计
|
609
|
|
2026-03-20
|
图书简介 | | 本书系统地讲解了大模型技术及其后训练(Post-Training)相关的各类算法、实践。全书以大语言模型(LLM)为核心,内容广泛且深入,绝大部分同样适用于视觉语言模型(VLM)和多模态语言模型(MLLM)。本书共10章,第1章介绍SFT,第2章介绍对齐算法宏观架构,第3章介绍强化学习核心算法,第4章介绍PPO算法,第5章介绍RLHF,第6章介绍DPO算法,第7章介绍免训练的对齐和优化方法,第8章介绍对齐算法的衍生和进化,第9章和第10章是两个案例实践。 |
|