重点推荐
-
-
苏共亡党十年祭:最新版
-
¥35.00
-
-
为什么戴着面具的人更受欢迎
-
¥32.00
-
-
我在华为16年:转身也是一种涅槃
-
¥36.00
-
-
成交是设计出来的:销售员不可不知的49个成交技巧
-
¥36.00
-
-
人力资源部:10大管理模板与工具
-
¥39.00
-
-
最强大脑:陈俊生快速记忆训练手册
-
¥35.00
-
-
节气·农谚·农事
-
¥98.00
-
-
美丽建筑
-
¥58.00
-
-
被选中的:哈佛、耶鲁和普林斯顿的入学标准秘史:the hidden history of admission and exclusion at harvard, yale and princeton
-
¥98.00
-
-
爸爸教我的人生课
-
¥36.00
|
|
图书信息
|
|
|
|
图解大模型底层逻辑:大模型是怎么跑起来的
|
| ISBN: | 9787301369630 |
定价: | ¥149.00 |
| 作者: | 张治政著 |
出版社: | 北京大学出版社 |
| 出版时间: | 2026年03月 |
开本: | 19cm |
| 页数: | 781页 |
中图法: | TP18-64 |
图书简介 | | 本书从理论到实践、从基础原理到前沿技术,全方位解析了大模型的构建、训练、部署与应用的整个流程。第一部分介绍大模型的基础概念,包括大模型的定义、发展历程和构建所需的软硬件技术栈,重点讲解神经网络、训练优化及模型调优的基本原理。第二部分聚焦大模型的内在逻辑和实际应用,涵盖推理、记忆、数据管道、多模态处理、硬件加速以及部署和维护等,同时以基于MoE的DeepSeek多模态模型为案例,展示从项目架构设计到在线服务的全流程。全书内容严谨而生动,既涵盖了大模型开发的全流程技术细节,又不乏对大模型历史演变和未来趋势的前瞻性探讨,是探索大模型底层逻辑与实现技术的权威指南。 |
|