同类推荐
-
-
深度强化学习算法原理与实战:基于MATLAB
-
¥109.00
-
-
Vibe编程:探索AI时代编程新范式
-
¥69.80
-
-
Kimi实战精粹
-
¥69.90
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人工智能物联网应用:基于树莓派
-
¥49.00
-
-
人人都需要的通用智能体助手:Manus+扣子空间+秒哒…
-
¥79.00
-
-
AIGC基础与应用:微课版
-
¥68.00
-
-
这就是MCP
-
¥79.80
-
-
豆包实战精粹
-
¥69.90
|
|
图书信息
|
|
|
深度剖析DeepSeek大模型:原理、开发与优化部署
|
ISBN: | 9787111779223 |
定价: | ¥119.00 |
作者: | 丁小晶,崔远编著 |
出版社: | 机械工业出版社 |
出版时间: | 2025年04月 |
开本: | 24cm |
页数: | 12,312页 |
中图法: | TP18 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
北京人天书店有限公司
|
69
|
库区13/库区4/库区7/样本13/样本4
|
2025-08-28
|
其它供货商库存合计
|
500
|
|
2025-08-28
|
图书简介 | 本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的深入剖析,帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。 |
|