Spark大数据技术项目实战
本书主要围绕大数据处理技术Spark展开讲解,主要介绍大数据分析处理的全流程,并剖析每个环节中所使用的关键技术及其原理。全书共分为八个实战项目:项目一介绍如何搭建一个稳定且高效的Spark集群环境,并深入探讨Spark的基本概念、特点及应用场景,同时与Hadoop进行对比分析;项目二通过实现一个完整的人事管理系统,介绍Scala语言的基础语法与面向对象及函数式编程理念;项目三至项目七分别针对电商用户行为数据、电影数据、银行客户数据、设备故障数据以及社交媒体评论数据,运用Spark进行深入的数据分析与处理,涵盖从数据预处理到高级统计分析的全过程;项目八通过一个综合性的案例——基于SparkMLlib的广告点击率预测,将书中所讲知识融会贯通,完成大数据开发的核心流程,包括数据预处理、特征工程、模型训练与评估等步骤。

图书馆官方微信
文化高新APP