重点推荐
-
-
苏共亡党十年祭:最新版
-
¥35.00
-
-
为什么戴着面具的人更受欢迎
-
¥32.00
-
-
我在华为16年:转身也是一种涅槃
-
¥36.00
-
-
成交是设计出来的:销售员不可不知的49个成交技巧
-
¥36.00
-
-
人力资源部:10大管理模板与工具
-
¥39.00
-
-
最强大脑:陈俊生快速记忆训练手册
-
¥35.00
-
-
节气·农谚·农事
-
¥98.00
-
-
美丽建筑
-
¥58.00
-
-
被选中的:哈佛、耶鲁和普林斯顿的入学标准秘史:the hidden history of admission and exclusion at harvard, yale and princeton
-
¥98.00
-
-
爸爸教我的人生课
-
¥36.00
|
|
图书信息
|
|
|
|
大模型压缩从基础到实践
|
| ISBN: | 9787301370346 |
定价: | ¥139.00 |
| 作者: | 李骏编著 |
出版社: | 北京大学出版社 |
| 出版时间: | 2026年05月 |
开本: | 26cm |
| 页数: | 729页 |
中图法: | TP181 |
图书简介 | | 全书共11章,分为五个部分。第一部分“基础与背景”梳理大模型压缩的必要性、发展历程与目标,搭建技术全景图与评估指标体系,深入分析Transformer架构冗余性、典型模型(LLaMA3.1、GLM-4等)冗余特征及硬件瓶颈,辅以长上下文处理挑战与可视化分析实战。第二部分“核心压缩技术”聚焦量化(训练后量化、量化感知训练、1bit量化)、结构化剪枝(重要性评分、动态稀疏训练、隐私保护剪枝)、知识蒸馏(动态自适应策略、数据高效蒸馏)三大核心方法,均配套实战案例。第三部分“内存与长上下文优化”展开KVCache压缩、低秩分解(SVD、LoRA/DoRA、张量分解)、Token压缩(剪枝、合并、多模态压缩)技术,解决内存与计算复杂度痛点。第四部分“部署与维护”讲解端到端压缩部署流程及硬件感知优化,详解LLMC、HuggingFaceOptimum、昇腾MindStudio等工具的实操方法。第五部分“综合项目实战”以端到端轻量级大模型压缩系统为案例,完整呈现从模型构建、训练到部署的工程化过程。 |
|