收藏 分享(赏)

开源大数据分析引擎Impala实战.pdf

上传人:g****t 文档编号:2361935 上传时间:2023-05-08 格式:PDF 页数:348 大小:39.64MB
下载 相关 举报
开源大数据分析引擎Impala实战.pdf_第1页
第1页 / 共348页
开源大数据分析引擎Impala实战.pdf_第2页
第2页 / 共348页
开源大数据分析引擎Impala实战.pdf_第3页
第3页 / 共348页
开源大数据分析引擎Impala实战.pdf_第4页
第4页 / 共348页
开源大数据分析引擎Impala实战.pdf_第5页
第5页 / 共348页
开源大数据分析引擎Impala实战.pdf_第6页
第6页 / 共348页
亲,该文档总共348页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、内容简介Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala 1.0版比原来基于MapReduce的Hive SQL查询速度提升390倍,因此,Impala有可能完全取代Hive。作者基于自己在本职工作中应用mpala的实践和心得编写了本书。本书共分10章,全面介绍开源大数据分析引擎Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及最富技术含量的应用设计原则和应用案例。本书紧扣目前计算技术发展热点,适合所有大数据分析人员、大数据开发人员和大数据管理人员参考使用。本书封面贴有清华大

2、学出版社防伪标签,无标签者不得销售版权所有,侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(CP)数据开源大数据分析引擎Impala实战/贾传青著.-北京:清华大学出版社,2015ISBN978-7-302-39002-2I.开.贾L.关系数据库系统IV.TP311.138中国版本图书馆CP数据核字(2015)第005181号责任编辑:夏非彼封面设计:王翔责任校对:闫秀华责任印制:出版发行:清华大学出版社网址:http:/.cm,http/地址:北京清华大学学研大厦A座邮编:100084社总机:010-62770175邮购:010-62786544投稿与读者

3、服务:010-62776969,c-service(质量反馈:010-62772015,zhiliangtup.tsinghua.edu.cm印刷者:装订者:经销:全国新华书店开本:190mm260mm印张:21.75字数:557千字版次:2015年3月第1版印次:2015年3月第1次印刷印数:13000定价:59.00元产品编号:057645-01Cloudera官方推荐序(中文)大数据,作为目前工业界的主要技术趋势,定位于转化工业界的每一个细分市场,推动企业运用其数据开展业务的革命,并从根本上改变了支撑现代社会的T基础架构。毫无疑问,大数据对中国意义重大,它给中国T业的创新带来了巨大机会,

4、没有其他任何一个国家比中国有更多的人口、更多的设备和更多的数据。目前Hadoop是用于大数据的优选平台解决方案。作为Hadoop技术以及提供Hadoop解决方案的领导者,Cloudera不仅提供经过了业界验证的Hadoop平台解决方案,也提供功能强大的工具帮助企业用户充分利用Cloudera企业版Hadoop解决他们的业务问题。Impala就是Cloudera开发的众多强大工具之一。Impala是为了在Hadoop上实现低延迟的SQL查询而设计开发的,它原生地运行在Hadoop/HBase存储系统和元数据之上,因此它继承了Hadoop的灵活性、伸缩性和经济性,具有分布式本地化处理的特性以避免网络瓶颈,它与现有Hadoop/CDH的、基于工业标准的SQL接口兼容。它支持交互式SQL,比最新版本的Hive快很多倍。由于Impala的这些优势,它受到了全球企业用户的热烈欢迎。看到将为中国读者发布的这一本中文版Impala书籍,我非常欣喜,这无疑对中国用户更好地使用Hadoop,解决他们的业务问题有很大帮助。因此,我要感谢所有为发布本书做出贡献的人们。最后,也要感谢广大读者对Impala的喜爱,以及你们在大数据一这一令人激动的T发展方向上所做的贡献!苗凯翔博士Cloudera副总裁

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教育教学 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2