同类推荐
-
-
AI工具超易上手:Kimi+百度文心+豆包+通义千问+…
-
¥79.00
-
-
豆包AI智能应用实战一本通
-
¥78.00
-
-
豆包AI智能应用实战一本通
-
¥78.00
-
-
豆包AI智能应用实战一本通
-
¥78.00
-
-
AI助力开发:Trae+CodeWhisperer+D…
-
¥79.00
-
-
AI助力开发:Trae+CodeWhisperer+D…
-
¥79.00
-
-
AI助力开发:Trae+CodeWhisperer+D…
-
¥79.00
-
-
智能时代的伦理与法律:人工智能治理的多元视角:plur…
-
¥65.00
-
-
人工智能算法从基础到实战
-
¥99.00
-
-
人工智能通识与应用
-
¥39.80
|
|
图书信息
|
|
|
|
深度剖析DeepSeek大模型:原理、开发与优化部署
|
| ISBN: | 9787111779223 |
定价: | ¥119.00 |
| 作者: | 丁小晶,崔远编著 |
出版社: | 机械工业出版社 |
| 出版时间: | 2025年04月 |
开本: | 24cm |
| 页数: | 12,312页 |
装祯: | 平装 |
中图法: | TP18 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
北京人天书店有限公司
|
34
|
库区4/库区7/样本13/样本4
|
2025-12-21
|
|
|
|
|
|
图书简介 | | 本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的深入剖析,帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。 |
|