新書推薦:
《
历史的教训(浓缩《文明的故事》精华,总结历史教训的独特见解)
》
售價:HK$
62.7
《
不在场证明谜案(超绝CP陷入冤案!日本文坛超新星推理作家——辻堂梦代表作首次引进!)
》
售價:HK$
58.2
《
明式家具三十年经眼录
》
售價:HK$
524.2
《
敦煌写本文献学(增订本)
》
售價:HK$
221.8
《
耕读史
》
售價:HK$
109.8
《
地理计算与R语言 [英] 罗宾·洛夫莱斯 [德]雅纳·蒙乔 [波兰] 雅库布·诺沃萨德
》
售價:HK$
121.0
《
沈括的知识世界:一种闻见主义的实践(中华学术译丛)
》
售價:HK$
87.4
《
大思维:哥伦比亚商学院六步创新思维模型
》
售價:HK$
72.8
|
編輯推薦: |
详细阐述数学模型的理论基础和算法原理
使用Python编程和基于Numpy的算法实现,代码注释详尽
通过项目实战深入体验算法的应用场景及其使用中需注意的问题
|
內容簡介: |
本书用平实的语言深入浅出地介绍当前热门的机器学习经典算法,包括线性回归、Logistic回归与Softmax回归、决策树(分类与回归)、朴素贝叶斯、支持向量机、K近邻学习、K-Means和人工神经网络,针对每一个算法首先介绍数学模型及原理,然后根据模型和算法描述使用Python编程和Numpy库进行算法实现,*后通过案例让读者进一步体会算法的应用场景以及应用时所需注意的问题。 本书适合准备进入人工智能和数据分析与挖掘领域的初学者,对机器学习算法感兴趣的爱好者、程序员、大学生和各类IT培训班的学员使用。
|
關於作者: |
刘硕,硕士,曾就职于知名外企,从事一线开发工作10年,目前主要从事Python开发与教学及机器学习算法的研究工作,在慕课网开设有多门Python课程,深受学员欢迎。
|
目錄:
|
目录
第1章 线性回归 1
1.1 线性回归模型 1
1.2 最小二乘法 2
1.3 梯度下降 4
1.3.1 梯度下降算法 4
1.3.2 随机梯度下降和小批量梯度下降 6
1.4 算法实现 7
1.4.1 最小二乘法 7
1.4.2 梯度下降 9
1.5 项目实战 12
1.5.1 准备数据 12
1.5.2 模型训练与测试 13
第2章 Logistic回归与Softmax回归 20
2.1 Logistic回归 20
2.1.1 线性模型 20
2.1.2 logistic函数 21
2.1.3 Logistic回归模型 23
2.1.4 极大似然法估计参数 24
2.1.5 梯度下降更新公式 25
2.2 Softmax回归 26
2.2.1 Softmax函数 26
2.2.2 Softmax回归模型 27
2.2.3 梯度下降更新公式 27
2.3 编码实现 28
2.3.1 Logistic回归 28
2.3.2 Softmax回归 32
2.4 项目实战 36
2.4.1 Logistic回归 36
2.4.2 Softmax回归 43
第3章 决策树分类树 46
3.1 决策树模型 46
3.2 生成决策树 48
3.3 切分特征的选择 49
3.3.1 信息熵 49
3.3.2 条件信息熵 50
3.3.3 信息增益 51
3.3.4 信息增益比 53
3.4 算法实现 53
3.5 绘制决策树 57
3.6 项目实战 64
3.6.1 准备数据 64
3.6.2 模型训练与测试 66
第4章 决策树分类回归树 70
4.1 CART算法的改进 70
4.2 处理连续值特征 71
4.3 CART分类树与回归树 72
4.3.1 CART分类树 72
4.3.2 CART回归树 74
4.4 算法实现 75
4.4.1 CART分类树 75
4.4.2 CART回归树 80
4.5 项目实战 85
4.5.1 CART分类树 85
4.5.2 CART回归树 89
第5章 朴素贝叶斯 95
5.1 朴素贝叶斯模型 95
5.1.1 贝叶斯公式 95
5.1.2 贝叶斯分类器 97
5.1.3 朴素贝叶斯分类器 97
5.2 模型参数估计 98
5.2.1 极大似然估计 98
5.2.2 贝叶斯估计 102
5.3 算法实现 103
5.4 项目实战 105
5.4.1 准备数据 106
5.4.2 模型训练与测试 108
第6章 支持向量机 110
6.1 线性可分支持向量机 110
6.1.1 分离超平面 110
6.1.2 间隔最大化 112
6.1.3 拉格朗日对偶法 113
6.1.4 分类决策函数 116
6.1.5 线性可分支持向量机算法 117
6.2 线性支持向量机 118
6.2.1 软间隔最大化 118
6.2.2 线性支持向量机算法 121
6.3 非线性支持向量机 122
6.3.1 空间变换 122
6.3.2 核技巧 123
6.3.3 非线性支持向量机算法 124
6.4 SMO算法 125
6.4.1 两个变量最优化问题的求解 126
6.4.2 变量选择 129
6.4.3 更新b 131
6.4.4 更新E缓存 132
6.5 算法实现 133
6.6 项目实战 139
6.6.1 准备数据 140
6.6.2 模型训练与测试 141
第7章 k近邻学习 145
7.1 kNN学习 145
7.1.1 kNN学习模型 145
7.1.2 距离的度量 146
7.1.3 k值的选择 149
7.2 kNN的一种实现:k-d树 150
7.2.1 构造k-d树 150
7.2.2 搜索k-d树 153
7.3 算法实现 155
7.3.1 线性扫描版本 155
7.3.2 k-d树版本 157
7.4 项目实战 161
7.4.1 准备数据 162
7.4.2 模型训练与测试 163
第8章 K-Means 167
8.1 K-Means 167
8.1.1 距离的度量 168
8.1.2 聚类算法的性能 169
8.1.3 K-Means算法 171
8.2 K-Means 172
8.3 算法实现 173
8.3.1 K-Means 173
8.3.2 K-Means 176
8.4 项目实战 179
8.4.1 准备数据 180
8.4.2 模型训练与测试 181
第9章 人工神经网络 184
9.1 神经网络 184
9.1.1 人造神经元 184
9.1.2 神经网络 187
9.2 反向传播算法 188
9.2.1 输出节点的权值更新 189
9.2.2 隐藏节点的权值更新 190
9.3 算法实现 192
9.3.1 神经网络分类器 192
9.3.2 神经网络回归器 196
9.4 项目实战 202
9.4.1 准备数据 203
9.4.2 模型训练与测试 206
|
內容試閱:
|
前言
近年来,机器学习技术已经渗透到我们日常生活的各个方面,比如网上购物时的商品推荐、浏览网页时的广告推送、手机拍照后的图像处理、电子邮箱中的垃圾邮件过滤、停车场出入口的车牌识别、各种游戏中的机器人玩家以及汽车厂商正在研发的无人驾驶等,机器学习技术的应用随处可见,并且它的发展极其迅猛,在更多领域令人兴奋(或恐惧)的应用已被研发出来或正在研发中。
尤瓦尔?赫拉利在其畅销书《未来简史》中表明了一个观点:未来的世界由机器学习算法掌控。当了解到像谷歌、苹果、亚马逊、IBM这样的大公司投入巨资用于机器学习的理论和应用研究,并且时不时就听到AI在某领域把人类打得一败涂地的新闻时,或许我们就不会认为赫拉利的观点是离谱的异端邪说,或出于好奇,或出于恐惧,或出于实际的目的,我们都应有充足的动力学习机器学习。
市面上机器学习的书已经很多了,大体上分为两类:一类是偏重机器学习理论的书,这种类型的书,算法理论部分大都介绍得很详细,但对于算法仅给出粗略的伪代码,而没有详尽的编码实现,也没有提供案例应用,在初学者对机器学习了解甚少的情况下,直接面对枯燥烦琐的数学推导,难免痛苦与沮丧。另外,由于初学者很难直接根据理论自己实现算法以及恰当地运用算法进行项目实践,因此无法验证学习成果。另一类是偏重机器学习应用的书,这类书对算法的理论进行了简单的提及,省略了有助于理解的重要数学推导,且大多数不会带领读者编码实现一个算法,而是直接使用开源库(如sklearn)中实现的算法,这类书算法的案例应用部分介绍得很详细,初学者会对机器学习应用有所了解,但由于理论匮乏且没有亲自动手实现算法,故导致无法深入理解算法,学习一段时间后大部分内容便忘记了。
本书是一本写给初学者的机器学习算法入门书,试图填补以上两类书的不足。本书在讲解算法时,首先详细介绍数学模型及原理,然后带领读者根据模型和算法描述进行算法实现,最后通过案例让读者进一步体会算法的应用场景以及应用时所需注意的问题。其中,算法实现部分是本书的重点,这部分所有算法的实现都基于Numpy这样一个非常底层的数学库,这就意味着需自己手工实现更多的细节,例如在计算损失函数的梯度时,需要手工推导计算梯度的数学公式,然后对照公式编码实现计算梯度的函数,相信本书的这种做法对初学者来说是一个有益的训练。另外,书中几乎每一行代码都给出了详尽的注释,通过代码注释来讲解算法的实现能给读者带来更好的体验,也便于读者理解编码的思想。
本书精选了经典的机器学习算法进行讲解,主要包括:
? 线性回归
? Logistic回归与Softmax回归
? 决策树(分类与回归)
? 朴素贝叶斯
? 支持向量机
? k近邻学习
? K-Means
? 人工神经网络
以上算法涵盖机器学习领域重要的思想,建议初学者在学完本书后能深入理解并自己实现以上算法,它们是日后在机器学习领域继续深入学习的基础。
本书还提供了算法示例的源代码,读者可以扫描以下二维码下载:
如何在下载过程中遇到问题,请联系booksaga@163.com,邮件主题为Python机器学习算法:原理、实现与案例下载资源。
由于笔者水平有限,书中难免出现纰漏,恳请读者不吝赐教。
最后,感谢清华大学出版社的王金柱编辑对笔者的信任和在写作方面的指点,我们的第二次合作非常愉快。
刘 硕
2019年7月
|
|