同类推荐
-
-
人工智能通识与应用
-
¥39.80
-
-
AI助力开发:Trae+CodeWhisperer+D…
-
¥79.00
-
-
AI助力开发:Trae+CodeWhisperer+D…
-
¥79.00
-
-
AI助力开发:Trae+CodeWhisperer+D…
-
¥79.00
-
-
智能时代的伦理与法律:人工智能治理的多元视角:plur…
-
¥65.00
-
-
人工智能算法从基础到实战
-
¥99.00
-
-
【预售】【预售结束时间:2025-12-20 00:0…
-
¥79.80
-
-
人工智能技术及多智能体控制探究
-
¥89.00
-
-
实战扣子空间:场景智能化高效实现
-
¥69.00
-
-
实战扣子空间:场景智能化高效实现
-
¥69.00
|
|
图书信息
|
|
|
|
大模型轻量化:模型压缩与训练加速
|
| ISBN: | 9787302686002 |
定价: | ¥129.00 |
| 作者: | 梁志远著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 384页 |
中图法: | TP18 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
500
|
|
2025-12-05
|
图书简介 | | 本书分为三部分共10章,首先聚焦大模型的背景与面临的问题,讲解了Transformer和MoE架构的基本原理;随后重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效用;后续则详述端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等实际案例为导向,揭示算子优化的细节;结尾以最新的国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。 |
|