同类推荐
-
-
组态软件项目开发与实践(朱涛)
-
¥49.80
-
-
组态软件项目开发与实践(朱涛)
-
¥49.80
-
-
组态软件项目开发与实践(朱涛)
-
¥49.80
-
-
视觉伺服技术与应用
-
¥99.00
-
-
视觉伺服技术与应用
-
¥99.00
-
-
视觉伺服技术与应用
-
¥99.00
-
-
机器视觉系统硬件设计、算法开发及应用
-
¥79.00
-
-
机器视觉系统硬件设计、算法开发及应用
-
¥79.00
-
-
机器视觉系统硬件设计、算法开发及应用
-
¥79.00
-
-
像素蛋糕AI修图全攻略:人像后期从入门到精通
-
¥78.00
|
|
图书信息
|
|
|
|
Python和PySpark数据分析
|
| ISBN: | 9787302645368 |
定价: | ¥118.00 |
| 作者: | (加)乔纳森·里乌(Jonathan Rioux)著 |
出版社: | 清华大学出版社 |
| 出版时间: | 2023年10月 |
开本: | 24cm |
| 页数: | 13,402页 |
中图法: | TP312PY;TP274 |
相关供货商
|
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
|
|
其它供货商库存合计
|
500
|
|
2026-02-02
|
图书简介 | | 本书是一本精心设计的教程,可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据(从基于Hadoop的集群到Excel工作表)扩大多台机器的处理能力。通过阅读本书,读者将学习如何将大型分析任务分解为可管理的块,以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后,您将能够编写和运行速度极快的PySpark程序,这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码,管理跨多台机器扩展的数据,在PySpark中重写Pandas、RSAS作业,排查常见数据流水线问题,并创建可靠的长期工作。 |
|