Spark大数据分析实战

本书从技术层面讲解了Spark的机制、生态系统与开发相关的内容。

本书首先从技术层面讲解了Spark的机制、生态系统与开发相关的内容;然后从应用角度讲解了日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的大数据场景下的数据分析。在每个场景中,首先是对场景进行抽象与概括,然后将Spark融入其中构建数据分析算法与应用,最后结合其他开源系统或工具构建更为丰富的数据分析流水线。

本书一共11章:其中第1~3章,主要介绍了Spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心知识点。


目录

第1章 Spark简介
第2章 Spark开发与环境配置
第3章 BDAS简介
第4章 Lamda架构日志分析流水线
第5章 基于云平台和用户日志的推荐系统
第6章 Twitter情感分析
第7章 热点新闻分析系统
第8章 构建分布式的协同过滤推荐系统
第9章 基于Spark的社交网络分析
第10章 基于Spark的大规模新闻主题分析
第11章 构建分布式的搜索引擎

24MB    下载
仅供读者预览及学习交流使用,下载后请24小时内删除

标签: Spark


评论: