1、CMYCMMYCYCMYK零起点Python机器学快速入門扉.pdf 1 17/3/30 下午5:32 内 容 简 介 本书采用独创的黑箱模式,MBA 案例教学机制,结合一线实战案例,介绍 Sklearn 人工智能模块库和常用的机器学习算法。书中配备大量图表说明,没有枯燥的数学公式,只要懂 Word、Excel,就能够轻松阅读全书,并学习使用书中的知识,分析大数据。本书具有以下特色:独创的黑箱教学模式,全书无任何抽象理论和深奥的数学公式。首次系统化融合 Sklearn 人工智能软件和 Pandas 数据分析软件,不用再直接使用复杂的 Numpy 数学矩阵模块。系统化的 Sklearn 函数 A
2、PI 接口中文文档,可作为案头工具书随时查阅。基于 Sklearn+Pandas 架构,全程采用 MBA 案例模式,无需任何理论基础,懂 Excel就可看懂。未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。版权所有,侵权必究。图书在版编目(CIP)数据 零起点 Python 机器学习快速入门/何海群著.北京:电子工业出版社,2017.5 ISBN 978-7-121-31141-3.零.何.软件工具程序设计.TP311.561 中国版本图书馆 CIP 数据核字(2017)第 059262 号 责任编辑:黄爱萍 印 刷:三河市兴达印务有限公司 装 订:三河市兴达印务有限公司 出版发行:电
3、子工业出版社 北京市海淀区万寿路 173 信箱 邮编:100036 开 本:7201000 1/16 印张:17.5 字数:252 千字 版 次:2017 年 5 月第 1 版 印 次:2017 年 5 月第 1 次印刷 定 价:59.00 元 凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888,88258888。质量投诉请发邮件至,盗版侵权举报请发邮件至。本书咨询联系方式:010-51260888-819,。前 言 本书是一部意外之作,也是一部惊喜之作。这是一本非常简单的 Python 机器学习入门教程,具有以下
4、特色。独创的黑箱教学模式,全书无任何抽象理论和深奥的数学公式。首次系统化融合 Sklearn 人工智能软件和 Pandas 数据分析软件,无须使用复杂的 Numpy 数学矩阵模块。三位一体的课件模式:图书+开发平台+成套的教学案例,系统讲解,逐步深入。系统化的Sklearn函数API接口中文文档,可作为案头工具书随时查阅。基于 Sklearn+Pandas 架构,全程采用 MBA 案例模式,无需任何理论基础,懂 Excel 就可看懂。本书内容原本是零起点 Python 足彩大数据与机器学习实盘分析中的章节,在我们内部小范围使用时,深受学员喜爱,于是,将书中与机器学习相关的内容和案例单独抽取出来
5、,加入部分 Python 入门内容,形成了零起点 Python 机器学习快速入门一书。Python量化三部曲 Python 量化三部曲包括:零起点 Python 大数据与量化交易(入门教材)零起点 Python 量化与机器学习实盘分析(重点分析 Sklearn)零起点Python 机器学习快速入门 IV 零起点 Python 量化与 TensorFlow 深度学习实盘分析(重点分析TensorFlow)此外,还有两部补充作品:零起点 Python 足彩大数据与机器学习实盘分析 零起点 Python 机器学习快速入门 Python学习路线 机器学习、人工智能和金融量化基本原理都是相通的,本质上都
6、是数据分析。本书虽然属于“零起点 Python”系列,但要更好地学习本书,掌握相关的配套程序,最好具备以下基础。Python 编程基础,不懂 Python 语言的读者,先花一周时间学习 Python基本知识以及 Pandas(潘达思)数据分析软件基础操作。Top 极宽量化社区有“Python 量化与 zwQuant 学习路线图”,大家可以参考,网址是:http:/topquant.vip/forum.php?mod=viewthread&tid=6。先花一周时间学习 Python 基础,再阅读zwPython 中文手册,可以少走很多弯路。学好 Python、Pandas 基础后,先将本书通读
7、12 遍。通读时,碰到问题没关系,记录一下跳过去,然后进行精读;正式学习每章的代码时,一定要将代码运行 12 遍,培养编程感觉。根据代码学习画流程图,有了流程图就可以把握程序逻辑,重点是程序和策略的逻辑。入门后,多看看配套的课件和程序源码,全套 zwQuant 量化开源程序都带有函数一级的中文注解。在学习过程当中一定要多问,可以在论坛提问,这样大家都受益。前 言1 V 本书读者 QQ 群号:124134140。在群文件中有一个小软件,即 Python流程图绘制软件 CODINGRAPH,使用该软件,拷贝代码就可以自动绘制流程图,对其他编程语言也适用。网络资源 与本书有关的程序和数据下载,请浏览
8、网站:http:/TopQuant.vip,极宽量化社区中的【下载中心】栏目。本书在 TopQuant.vip 极宽量化社区设有专栏,对本书、人工智能和机器学习有任何建议都可在社区相关栏目发布信息,我们会在第一时间进行反馈和答复。“零起点Python”系列丛书 本书继续保持了“零起点 Python”系列丛书的一贯风格简单实用。书中配备了大量的图表说明,没有枯燥的数学公式,只要懂 Word、Excel,就能够轻松阅读全书。IT 零起点:无需任何电脑编程基础,只要会打字、会使用 Excel,就能看懂本书,利用本书配套的 Python 软件包,轻松学会如何利用 Python对股票和足彩数据进行专业分
9、析和量化投资分析。投资零起点:无须购买任何专业软件,本书配套的 zwPython 软件包,采用开源模式,提供 100%全功能、全免费的工业级数据分析平台。配置零起点:所有软件、数据全部采用苹果“开箱即用”模式,绿色版本,无须安装,解压缩后即可直接运行系统。理财零起点:无需任何专业金融背景,采用通俗易懂的语言,配合大量专业的图表和实盘操作案例,轻松掌握各种量化投资策略。数学零起点:全书没有任何复杂的数学公式,只有最基本的加、减、乘、除,轻轻松松就能看懂全书。零起点Python 机器学习快速入门 VI 致谢 本书的出版要特别感谢电子工业出版社的黄爱萍编辑,感谢她在选题策划和稿件整理方面做出的大量工
10、作。在本书创作过程中,极宽开源量化团队和培训班的全体成员,也提出过很多宝贵的意见,并对部分内容程序做了中文注解。特别是吴娜、余勤两位同学,为极宽开源量化文库和 zwQuant 开源量化软件编写文档,并在团队成员管理方面做了大量工作,为他们的付出表示感谢。何海群(字王)北京极宽科技有限公司 CTO 2017 年 2 月 25 日 轻松注册成为博文视点社区用户(),您即可享受以下服务。提交勘误:提交勘误:您对书中内容的修改意见可在【提交勘误】处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。与我们交流:与我们交流:在页面下方【读者评论】处留下您的疑问或观点,与我
11、们和其他读者一同学习交流。页面入口:http:/ 二维码:目 录 第 1 章 从阿尔法狗开始说起.1 1.1 阿尔法狗的前世今生.1 1.2 机器学习是什么.2 1.3 机器学习大史记.3 1.4 机器学习经典案例.11 第 2 章 开发环境.13 2.1 数据分析首选 Python.13 2.2 用户运行平台.18 2.3 程序目录结构.19 2.4 Spyder 编辑器界面设置.20 2.5 Python 命令行模式.26 2.6 Notebook 模式.27 2.7 模块库控制面板.29 2.8 使用 pip 更新模块库.33 第 3 章 Python 入门案例.39 3.1 案例 3-
12、1:第一次编程“hello,ziwang”.39 3.2 案例 3-2:增强版“hello,zwiang”.42 3.3 案例 3-3:列举系统模块库清单.44 零起点Python 机器学习快速入门 VIII 3.4 案例 3-4:常用绘图风格.45 3.5 案例 3-5:Pandas 常用绘图风格.47 3.6 案例 3-6:常用颜色表 cors.49 3.7 案例源码.50 第 4 章 Python 基本语法.58 4.1 数据类型.58 案例 4-1:基本运算.59 4.2 字符串.61 案例 4-2:字符串入门.61 案例 4-3:字符串常用方法.63 4.3 List 列表.64 案
13、例 4-4:列表操作.65 4.4 Tuple 元组.66 案例 4-5:元组操作.67 4.5 Dictionary 字典.68 案例 4-6:字典操作.68 4.6 数据类型转换.70 案例 4-7:控制语句.71 案例 4-8:函数定义.73 4.7 案例源码.75 第 5 章 Python 人工智能入门与实践.85 5.1 从忘却开始.85 5.2 Iris 经典爱丽丝.89 案例 5-1:Iris 爱丽丝.90 案例 5-2:爱丽丝进化与文本矢量化.92 5.3 AI 操作流程.95 目 录1 IX 5.4 数据切割函数.98 案例 5-3:Iris 爱丽丝分解.99 案例 5-4:
14、线性回归算法.103 5.5 案例源码.109 第 6 章 机器学习经典算法案例(上).116 6.1 线性回归.116 6.2 逻辑回归算法.124 案例 6-1:逻辑回归算法.125 6.3 朴素贝叶斯算法.127 案例 6-2:贝叶斯算法.129 6.4 KNN 近邻算法.130 案例 6-3:KNN 近邻算法.133 6.5 随机森林算法.135 案例 6-4:随机森林算法.139 6.6 案例源码.140 第 7 章 机器学习经典算法案例(下).149 7.1 决策树算法.149 案例 7-1:决策树算法.151 7.2 GBDT 迭代决策树算法.153 案例 7-2:GBDT 迭代
15、决策树算法.154 7.3 SVM 向量机.156 案例 7-3:SVM 向量机算法.157 7.4 SVM-cross 向量机交叉算法.159 案例 7-4:SVM-cross 向量机交叉算法.160 7.5 神经网络算法.161 案例 7-5:MLP 神经网络算法.165 案例 7-6:MLP_reg 神经网络回归算法.168 零起点Python 机器学习快速入门 X 7.6 案例源码.170 第 8 章 机器学习组合算法.183 8.1 CCPP 数据集.183 案例 8-1:CCPP 数据集.184 案例 8-2:CCPP 数据切割.186 案例 8-3:读取 CCPP 数据集.189
16、 8.2 机器学习统一接口函数.192 案例 8-4:机器学习统一接口.193 案例 8-5:批量调用机器学习算法.201 案例 8-6:一体化调用.205 8.3 模型预制与保存.208 案例 8-7:储存算法模型.210 案例 8-8:批量储存算法模型.213 案例 8-9:批量加载算法模型.215 案例 8-10:机器学习组合算法.219 8.4 案例源码.224 附录 A Sklearn 常用模块和函数.242 附录 B 极宽量化系统模块图.266 第 1 章 从阿尔法狗开始说起 1.1 阿尔法狗的前世今生 百度百科的“阿尔法狗”词条是:阿尔法狗(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下 DeepMind 公司的戴密斯哈萨比斯、大卫席尔瓦、黄士杰与他们的团队开发,其主要工作原理是“深度学习”。2016 年 3 月,该程序与围棋世界冠军、职业九段选手李世石进行人机大战,并以 4:1 的总比分获胜。2016 年年末至 2017 年年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中国、日本、韩国数十位围棋高手进行快棋对决,连续 60 局无一