同类推荐
-
-
世界模型——AI尚未理解的真实世界
-
¥59.00
-
-
世界模型——AI尚未理解的真实世界
-
¥59.00
-
-
AIGC技术及应用通识教程(微课版)
-
¥59.80
-
-
AI全工具提效应用到精通指南
-
¥68.00
-
-
AI全工具提效应用到精通指南
-
¥68.00
-
-
AI全工具提效应用到精通指南
-
¥68.00
-
-
OpenClaw:从入门到精通应用操作大全
-
¥68.00
-
-
OpenClaw:从入门到精通应用操作大全
-
¥68.00
-
-
OpenClaw:从入门到精通应用操作大全
-
¥68.00
-
-
豆包在手,万事不愁
-
¥59.80
|
|
图书信息
|
|
|
|
大模型轻量化:模型压缩与训练加速
|
| ISBN: | 9787302686002 |
定价: | ¥129.00 |
| 作者: | 梁志远著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 384页 |
中图法: | TP18 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
86
|
库区13/库区4/样本13
|
2026-04-06
|
|
其它供货商库存合计
|
23
|
|
2026-04-03
|
图书简介 | | 本书分为三部分共10章,首先聚焦大模型的背景与面临的问题,讲解了Transformer和MoE架构的基本原理;随后重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效用;后续则详述端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等实际案例为导向,揭示算子优化的细节;结尾以最新的国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。 |
|