收藏 分享(赏)

Hadoop大数据分析实战.pdf

上传人:g****t 文档编号:2355700 上传时间:2023-05-08 格式:PDF 页数:381 大小:46.07MB
下载 相关 举报
Hadoop大数据分析实战.pdf_第1页
第1页 / 共381页
Hadoop大数据分析实战.pdf_第2页
第2页 / 共381页
Hadoop大数据分析实战.pdf_第3页
第3页 / 共381页
Hadoop大数据分析实战.pdf_第4页
第4页 / 共381页
Hadoop大数据分析实战.pdf_第5页
第5页 / 共381页
Hadoop大数据分析实战.pdf_第6页
第6页 / 共381页
亲,该文档总共381页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、前言Apache Hadoop是一类流行的大数据处理平台,并可与大多数大数据工具集成,以构建功能强大的数据分析方案。本书将围绕这一点对相关软件展开讨论,同时辅以大量的操作实例。在本书阅读过程中,读者将会系统学习HDFS、MapReduce、YARN方面的知识,以及如何实现快速、高效的大数据处理方案。此外,本书还将Hadoop与其他开源工具集成,例如Python和R语言,进而分析和可视化数据,同时针对大数据进行统计计算。一旦读者掌握了这些内容,即可尝试在Apache Spark和Apache Flink的基础上应用Hadoop,最终实现实时数据分析和流式处理。除此之外,本书还将讨论如何在云端和端

2、到端管道上利用Hadoop构建数据分析方案,并通过操作实例执行大数据分析任务。在阅读完本书后,读者将具备基于Hadoop生态系统的分析能力,同时可构建强大的解决方案执行大数据分析,并拥有自己的技术观点。适用读者如果读者希望使用Hadoop3的强大功能为企业或业务构建高性能的分析解决方案,或者您是一名大数据分析新手,那么本书将十分适合于您。另外,本书需要读者具备Jav编程方面的基础知识。本书内容第1章将介绍Hadoop环境及其核心组件,包括HDFS和MapReduce。第2章将讨论大型数据集的检测处理过程,从中发现数据的模式,生成相应的报告并采集有价值的内容。第3章将讨论MapReduce,这也是大多数计算/处理系统中的基本概念。第4章探讨Python语言,并在此基础上通过Hadoop对大数据进行分析。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教育教学 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2