ImageVerifierCode 换一换
格式:PDF , 页数:540 ,大小:73.25MB ,
资源ID:2351554      下载积分:14 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wnwk.com/docdown/2351554.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Python+Spark 2.0+Hadoop机器学习与大数据实战_2017.pdf)为本站会员(la****1)主动上传,蜗牛文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蜗牛文库(发送邮件至admin@wnwk.com或直接QQ联系客服),我们立即给予删除!

Python+Spark 2.0+Hadoop机器学习与大数据实战_2017.pdf

1、范例程序下载浅显易懂的原理介绍Step by Step实机操作、范例程序详细解说。降低机器学习与大数据技术的学习门槛Python+Spark 2.0+Hadoop机器学习与大数据实找林大贵著轻松快速学会机器学习与大数据热门技术清苇大学出版社内容简介本书从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了“机器学习”内容。为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解

2、,展示了如何在单机Vindows系统上通过Virtual Box虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境.书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校,参照书中介绍的搭建过程,同样可以实现将自己的平台搭建在多台实体计算机上,以便更加接近于大数据和机器学习真实的运行环境。本书非常适合于学习大数据基础知识的初学者阅读,更适合正在学习大数据理论和技术的人员作为上机实践用的教材。本书为博硕文化股份有限公司授权出版发行的中文简体字版本北京市版权局著作权合同登记号:图字01-2017-2317本书封面贴有清华大学出版社防伪标签,无标签

3、者不得销售版权所有,侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(CP)数据Python-+Spak2.0+Hadoop机器学习与大数据实战/林大贵著.一北京:清华大学出版社,2018ISBN978-7-302-49073-9I.P.林.软件工具一程序设计数据处理软件IV.TP311.561TP274中国版本图书馆CIP数据核字(2017)第296017号责任编辑:夏毓彦封面设计:王翔责任校对:闫秀华责任印制:李红英出版发行:清华大学出版社网址:htp:,http:/地址:北京清华大学学研大厦A座邮编:100084社总机:010-62770175邮购:01

4、0-62786544投稿与读者服务:010-62776969,c-质量反馈:010-62772015,hiliangtup.tsinghua.edu.cm印装者:清华大学印刷厂经销:全国新华书店开本:190mm260mm印张:33.75字数:864千字次:2018年1月第1版印次:2018年1月第1次印刷印数:13000价:99.00元产品编号:073908-01序本书将方兴未艾的“机器学习”和热门的“大数据分析”技术与应用在一本书中融会贯通地娓娓道来,体现了作者深厚的技术功底和丰富的经验。和己经出版的Hadoop+Spark大数据巨量分析与机器学习整合开发实战一书相比,本书不是简单的更新和升

5、级,而是在原有的基础上增加了大数据技术,还丰富了其中略显薄弱的“机器学习”内容,增加了4章都和机器学习有关的内容。另外,作者还用流行的“胶水语言”Python重新改写了另一本书中的范例程序,并添加了“机器学习”+“大数据”章节的范例程序,所以将书名改为“Python+Spak2.0+Hadoop机器学习与大数据实战”,更加突出“机器学习”,并且强调范例程序是运用更加流行的Python语言来编写的。在因特网、社交媒体、电子商务等交叉发展和呼应下,“网络”这个巨人己经拥有了难以计数的海量数据,虽有传统结构化的数据、半结构化的数据,但更多的是非结构化的数据。这些貌以杂乱无章、毫无意义的海量数据是一座

6、等待发掘的巨大“金和”。这些海量数据中蕴含着极为丰富的人类知识库,是一笔巨大的信息资产。随着云计算时代的来临,对这些原本很难收集整理的大数据进行及时甚至是实时分析和处理并加以有效利用就不再是“海市蜃楼”了。与大数据相关的内容不外乎三方面:大数据理论,大数据分析和处理的技术(机器学习为核心技术),大数据的实践应用。在与大数据有关的出版物中,偏重于理论教学和技术介绍类的比较多,而偏重于上机实践和自学的书比较少见。因此,本书非常适合“机器学习和大数据分析”的初学者和正在学习这个领域技术的人员作为学习和上机实践用的教材。本书不是对原理进行纯理论的阐述,而是提供了丰富的上机实践操作和范例程序,从而降低了

7、读者学习“机器学习和大数据分析”的门槛。对于需要直接上机实践的学习者而言,本书更像是一本学习实践和实战开发的上机手册。书中首先展示了如何在单台Windows系统上通过Virtual Box虚拟机安装多台Linux虚拟机,而后建立Hadoop集群,再建立Spark开发环境。搭建这个上机实践的平台并不限制于单台实体计算机,主要是考虑个人读者上机实践的实际条件和环境。对于有条件的公司和学校,参照这个搭建过程,同样可以将实践平台搭建在多台实体计算机上。另外,现在很多大专院校都开设了Pyho程序设计语言的课程,所以本书的所有范例程序都用Python语言重新改写了,非常接“地气”。在搭建好“机器学习和大数据分析”上机实践的软硬件环境之后,就可以在各章节的学习中结合本书提供的范例程序逐一设置、修改、调试和运行,从中学到“机器学习和大数据分析”

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2