本站收录馆配可供书目品种:1670731

同类推荐

: 国产龙虾实操手册:12款OpenClaw国产AI工具零…; ¥49.80

: 大模型边缘推理系统设计：模型压缩、推理优化与跨平台部署; ¥89.90

: 大模型边缘推理系统设计：模型压缩、推理优化与跨平台部署; ¥89.90

: 大模型边缘推理系统设计：模型压缩、推理优化与跨平台部署; ¥89.90

: 吾辈如神:重构AI时代的生存力与胜任力; ¥119.90

: 智能体其实很简单:零基础入门AI Agent工作流搭建; ¥59.00

: 智能体其实很简单:零基础入门AI Agent工作流搭建; ¥59.00

: 智能体其实很简单:零基础入门AI Agent工作流搭建; ¥59.00

: 人工智能故事书:懂中文就能读懂的AI通识与应用; ¥69.80

: 人工智能故事书:懂中文就能读懂的AI通识与应用; ¥69.80

图书信息

	大模型轻量化:模型压缩与训练加速
	ISBN：	9787302686002	定价：	￥129.00
	作者：	梁志远著	出版社：	清华大学出版社
	出版时间：	2025年04月	开本：	24cm
	页数：	384页
	中图法：	TP18

图书简介

本书分为三部分共10章，首先聚焦大模型的背景与面临的问题，讲解了Transformer和MoE架构的基本原理；随后重点讲解模型压缩、训练加速和推理优化等核心技术，包括量化、蒸馏和剪枝等，并通过实际案例验证其效用；后续则详述端侧学习与计算引擎优化策略，尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发，分别以cuDNN、NEON、CUDA等实际案例为导向，揭示算子优化的细节；结尾以最新的国产开源模型DeepSeek-V3为例，展现从训练到推理的综合优化方案。

蔚蓝网清华大学出版社北京大学出版社中国人民大学出版社中信出版社北京理工大学出版社

同类推荐

图书信息

大模型轻量化:模型压缩与训练加速

相关供货商

图书简介