1、内容简介本书从初学者角度详细介绍了Sprk应用程序体系架构的核心技术,全书共9章。第1章详细介绍开发Spark框架的Scala编程语言;第24、78章主要讲解Spark核心基础、SparkRDD弹性分布式数据集,Spark SQL处理结构化数据,Spark Streaming实时计算框架、Spark MLlib机器学习库,并包含了搭建Spark集群、Spark集群的操作方式、利用Spark解决大数据工作中遇到的基本问题。第56章主要讲解大数据环境中常见的辅助系统,HBase数据库以及Kafka流处理平台,包含辅助系统的搭建方式、使用方法以及相关底层实现的基本原理;第9章是一个综合项目,利用S印
2、ak框架开发流式计算系统。掌握Sak相关技术,能够很好地适应企业开发的技术需要,为离线、实时数据处理平台的开发奠定基础。本书附有配套源代码、教学PPT、题库、教学视频、教学补充案例、教学设计等资源。为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。本书可作为高等院校本、专科计算机相关专业,大数据课程的专用教材,是一本适合广大计算机编程爱好者的优秀读物。本书封面贴有清华大学出版杜防伪标签,无标签者不得销售。版权所有,侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(CIP)数据Spark大数据分析与实战/黑马程序员编著,一北京:清华大学出版社
3、,2019(2019.12重印)(大数据技术与应用丛书)ISBN978-7-302-53432-7I.S.黑.数据处理软件N.TP274中国版本图书馆CIP数据核字(2019)第166166号责任编辑:袁勤勇杨枫封面设计:韩冬责任校对:胡伟民责任印制:沈露出版发行:清华大学出版社网址:http:/,http:/地址:北京清华大学学研大厦A座邮编:100084社总机:010-62770175邮购:010-62786544投稿与读者服务:010-62776969,c-质量反馈:010-62772015,zhiliangtup.tsinghua,edu,cn课件下载:http:/,010-83470236印刷者:北京富博印刷有限公司装订者:北京市密云县京文制本装订厂经销:全国新华书店开本:185mm260mm印张:15.25学数:378千字版次:2019年9月第1版印次:2019年12月第2次印刷定价:49.00元产品编号:083855-01