注册 登录
您当前所在位置:
加载失败

Spark大数据分析实战

作者: 张伟洋

出版社: 清华大学出版社

出版日期: 2020-07-14

如何阅读

定价:79.0
阅读量:8
  • 收藏

  • 加书架

  • 引用

图书简介

本书基于Spark 2.4.x新版本编写,从Spark核心编程语言Scala讲起,涵盖当前整个Spark生态系统主流的大数据开发技术。全书共9章,第1章讲解Scala语言的基础知识,包括IDEA工具的使用等;第2章讲解Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行;第3~9章讲解离线计算框架Spark RDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理,同时包括常用Shell命令、API操作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。 本书内容丰富,以实操案例为主,理论为辅,可作为Spark新手的入门书,也可作为大数据开发人员和从业者的学习用书,还可以作为培训机构或大中专院校的教学用书。

编辑推荐

Spark已成为当今非常活跃、高效的大数据计算平台,很多互联网公司都使用Spark来实现公司的核心业务,如阿里的云计算平台、京东的推荐系统等,只要和海量数据相关的领域都有Spark的身影。 本书基于Spark 2.4.x新版本编写,涵盖当前整个Spark生态系统主流的大数据处理技术,以实操案例为主,理论为辅,一步一步手把手对常用的Spark离线计算及实时计算等系统进行详细论述。

更多图书信息
  • 版权: 清华大学出版社
  • 出版: 2020-07-14
  • 作者:张伟洋
  • 更新: 2023-06-22
  • 书号:9787302556954
  • 中图:TP274

东南大学 欢迎您!
您的IP:3.144.145.77 (来自校外)

温馨提示

您在校外访问本校资源,当前IP地址不在资源使用权限范围内!

输入有效的校外访问权限码方能免费使用学校已购买的资源!

没有校外访问权限码的用户,您可以访问 文泉学堂 购买您需要的资源

carsi CARSI直达

校外访问

在校外访问时,使用本校CARSI账户登录,即可免费使用学校已购买的资源。

作者信息

张伟洋

推荐专题

  • 农业现代化之路
  • 微观物质探秘:从量子奇点到分子宇宙
  • 入围2024年度好书
  • 三维技术的多元应用
  • AIGC时代
  • 仪器之光