同类推荐
-
-
深度强化学习算法原理与实战:基于MATLAB
-
¥109.00
-
-
Vibe编程:探索AI时代编程新范式
-
¥69.80
-
-
Kimi实战精粹
-
¥69.90
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人人都需要的通用智能体助手:Manus+扣子空间+秒哒…
-
¥79.00
-
-
AIGC基础与应用:微课版
-
¥68.00
-
-
这就是MCP
-
¥79.80
-
-
豆包实战精粹
-
¥69.90
|
|
图书信息
|
|
|
大模型轻量化:模型压缩与训练加速
|
ISBN: | 9787302686002 |
定价: | ¥129.00 |
作者: | 梁志远著 |
出版社: | 清华大学出版社 |
出版时间: | 2025年04月 |
开本: | 24cm |
页数: | 384页 |
中图法: | TP18 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
北京人天书店有限公司
|
13
|
库区4/样本4
|
2025-08-28
|
其它供货商库存合计
|
283
|
|
2025-08-28
|
图书简介 | 本书分为三部分共10章,首先聚焦大模型的背景与面临的问题,讲解了Transformer和MoE架构的基本原理;随后重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效用;后续则详述端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等实际案例为导向,揭示算子优化的细节;结尾以最新的国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。 |
|