同类推荐
-
-
智能产线:从数字化到智能化:from digitali…
-
¥79.80
-
-
智能产线:从数字化到智能化:from digitali…
-
¥79.80
-
-
智能产线:从数字化到智能化:from digitali…
-
¥79.80
-
-
精进数据分析:从执行者到驱动者
-
¥99.00
-
-
可信数据空间:从全球架构到中国实践:from glob…
-
¥139.00
-
-
数据科学与工程数学基础
-
¥49.00
-
-
数据科学与大数据分析
-
¥78.00
-
-
数据科学与大数据分析
-
¥78.00
-
-
数据科学与大数据分析
-
¥78.00
-
-
非线性控制原理
-
¥59.00
|
|
图书信息
|
|
|
|
Apache Spark大数据分析:基于Azure Databricks云平台:unleashing large cluster analytics in the cloud
|
| ISBN: | 9787115614568 |
定价: | ¥79.80 |
| 作者: | (瑞典)罗伯特·伊利杰森(Robert Ilijason)著 |
出版社: | 人民邮电出版社 |
| 出版时间: | 2023年06月 |
开本: | 23cm |
| 页数: | 236页 |
中图法: | TP274 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
3
|
|
2026-06-17
|
图书简介 | | AzureDatabricks是一款基于云的大数据分析和机器学习平台,用于实现基于ApacheSpark的数据处理,为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念,然后介绍了受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法(涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外,书中还介绍了使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法,以及外部连接工具、生产环境集成等内容,最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 |
|