同类推荐
-
-
人工智能线性代数基础
-
¥169.00
-
-
人工智能大模型数学基础
-
¥149.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
MCP技术全解析:从架构原理到多场景应用实战
-
¥99.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
少年AI探索家:孩子学AI从这本书开始
-
¥128.00
-
-
深度学习实践:基于TensorFlow及PyTorch…
-
¥68.00
-
-
AI即未来:普通人用好人工智能的18大工作场景
-
¥69.00
|
|
图书信息
|
|
|
|
深度剖析DeepSeek大模型:原理、开发与优化部署
|
| ISBN: | 9787111779223 |
定价: | ¥119.00 |
| 作者: | 丁小晶,崔远编著 |
出版社: | 机械工业出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 12,312页 |
装祯: | 平装 |
中图法: | TP18 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
74
|
库区13/库区4/库区7/样本13/样本4
|
2026-02-05
|
|
其它供货商库存合计
|
176
|
|
2026-02-05
|
图书简介 | | 本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的深入剖析,帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。 |
|