同类推荐
-
-
工业机器人技术基础(付亮)
-
¥49.00
-
-
传感器技术导论(梁峻阁)
-
¥49.80
-
-
智能机器人系统及应用
-
¥79.00
-
-
大数据技术应用基础
-
¥58.00
-
-
新型网络环境下数据安全关键技术研究
-
¥76.00
-
-
工业机器人离线编程与仿真
-
¥48.00
-
-
连续系统建模与仿真
-
¥69.00
-
-
非线性系统自适应有限时间控制及其应用
-
¥99.00
-
-
大数据应用技术基础:新商科版
-
¥48.00
-
-
非平稳大数据建模及算法
-
¥96.00
|
|
图书信息
|
|
|
|
Hadoop与Spark入门
|
| ISBN: | 9787302613633 |
定价: | ¥59.00 |
| 作者: | 覃雄派,陈跃国编著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2022年11月 |
开本: | 26cm |
| 页数: | 14,233页 |
中图法: | TP274 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
179
|
|
2026-03-18
|
图书简介 | | 本书为一本大数据技术的入门书籍,介绍Hadoop大数据平台和Spark大数据平台及相关工具的原理,以及如何进行部署和简单开发。全书包含13章,分为三个部分:第一部分(第1章-第2章)介绍如何为深入学习Hadoop和Spark做环境准备,包括VMlware虚拟机的创建和CentOS操作系统的配置。第二部分(第3章-第6章),介绍Hadoop大数据平台的基本原理,包括HDFS分布式文件系统、MapReduce计算模型、HBase数据库、以及Hive数据仓库的原理、部署方法、以及开发技术。第三部分(第7章-第11章),介绍Spark大数据平台的基本原理,包括RDD弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、DAC有向无环图表达的作业及其处理过程等,并且介绍了SparkCore、SparkSQL、SparkMLLib、SparkGraphx的部署和开发技术。本书的最后,还附加介绍了Flume(第12章)和Kafka(第13章)等两个工具,F1ume用于大量日志的收集和处理,Kafka用于对大量快速到达的数据的及时可靠暂时存储。 |
|