同类推荐
-
-
人工智能大模型数学基础
-
¥149.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
深度学习实践:基于TensorFlow及PyTorch…
-
¥68.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
-
-
驾驭Gemini 3与Nano Banana:人人都是…
-
¥69.80
-
-
驾驭Gemini 3与Nano Banana:人人都是…
-
¥69.80
|
|
图书信息
|
|
|
|
大模型轻量化:模型压缩与训练加速
|
| ISBN: | 9787302686002 |
定价: | ¥129.00 |
| 作者: | 梁志远著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 384页 |
中图法: | TP18 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
94
|
库区13/库区4/样本13
|
2026-01-31
|
|
其它供货商库存合计
|
188
|
|
2026-01-30
|
图书简介 | | 本书分为三部分共10章,首先聚焦大模型的背景与面临的问题,讲解了Transformer和MoE架构的基本原理;随后重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效用;后续则详述端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等实际案例为导向,揭示算子优化的细节;结尾以最新的国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。 |
|