剧情简介:·大数据技术和Spark概述。 ·通过实例学习DataFrame、SQL、Dataset等Spark的核心API。 ·了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。 ·了解Spark如何在集群上运行。 ·Spark集群和应用程序的调试、监控、和调优。 ·学习Spark强大的流处理引擎——结构化流处理。 ·学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
作者:Bill Chambers
出版社:中国电力出版社
ISBN:9787519840099