本站收录馆配可供书目品种:1661188

同类推荐

: 网络服务器配置与管理; ¥49.00

: Stable Diffusion AIGC视觉教程; ¥59.80

: CAXA 3D实体设计基础与实例教程; ¥75.00

: Java函数式编程实战; ¥149.00

: Java函数式编程实战; ¥149.00

: Java函数式编程实战; ¥149.00

: Java程序设计基础:微课版; ¥64.80

: Java程序设计基础:微课版; ¥64.80

: Java程序设计基础:微课版; ¥64.80

: openvela轻量系统开发实战; ¥119.00

图书信息

	大模型算法:强化学习、微调与对齐:Reinforcement learning, fine-tuning, and alignment
	ISBN：	9787121500725	定价：	￥109.00
	作者：	余昌叶著	出版社：	电子工业出版社
	出版时间：	2025年04月	开本：	24cm
	页数：	230页
	中图法：	TP391

图书简介

本书系统地讲解了大模型技术及其后训练(Post-Training)相关的各类算法、实践。全书以大语言模型(LLM)为核心，内容广泛且深入，绝大部分同样适用于视觉语言模型(VLM)和多模态语言模型(MLLM)。本书共10章，第1章介绍SFT，第2章介绍对齐算法宏观架构，第3章介绍强化学习核心算法，第4章介绍PPO算法，第5章介绍RLHF，第6章介绍DPO算法，第7章介绍免训练的对齐和优化方法，第8章介绍对齐算法的衍生和进化，第9章和第10章是两个案例实践。

蔚蓝网清华大学出版社北京大学出版社中国人民大学出版社中信出版社北京理工大学出版社

同类推荐

图书信息

大模型算法:强化学习、微调与对齐:Reinforcement learning, fine-tuning, and alignment

相关供货商

图书简介