同类推荐
-
-
智能产线:从数字化到智能化
-
¥79.80
-
-
智能产线:从数字化到智能化
-
¥79.80
-
-
智能产线:从数字化到智能化
-
¥79.80
-
-
工业机器人应用基础(周淑彦)
-
¥39.00
-
-
非线性控制原理
-
¥59.00
-
-
非线性控制原理
-
¥59.00
-
-
非线性控制原理
-
¥59.00
-
-
可信数据空间:从全球架构到中国实践:from glob…
-
¥139.00
-
-
数据治理与智慧治理
-
¥68.00
-
-
机器人系统开发与优化:算法、感知与控制策略
-
¥119.00
|
|
图书信息
|
|
|
|
Hadoop与Spark入门
|
| ISBN: | 9787302613633 |
定价: | ¥59.00 |
| 作者: | 覃雄派,陈跃国编著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2022年11月 |
开本: | 26cm |
| 页数: | 14,233页 |
中图法: | TP274 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
170
|
|
2026-05-15
|
图书简介 | | 本书为一本大数据技术的入门书籍,介绍Hadoop大数据平台和Spark大数据平台及相关工具的原理,以及如何进行部署和简单开发。全书包含13章,分为三个部分:第一部分(第1章-第2章)介绍如何为深入学习Hadoop和Spark做环境准备,包括VMlware虚拟机的创建和CentOS操作系统的配置。第二部分(第3章-第6章),介绍Hadoop大数据平台的基本原理,包括HDFS分布式文件系统、MapReduce计算模型、HBase数据库、以及Hive数据仓库的原理、部署方法、以及开发技术。第三部分(第7章-第11章),介绍Spark大数据平台的基本原理,包括RDD弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、DAC有向无环图表达的作业及其处理过程等,并且介绍了SparkCore、SparkSQL、SparkMLLib、SparkGraphx的部署和开发技术。本书的最后,还附加介绍了Flume(第12章)和Kafka(第13章)等两个工具,F1ume用于大量日志的收集和处理,Kafka用于对大量快速到达的数据的及时可靠暂时存储。 |
|