新書推薦:
《
索恩丛书·盛清统治下的太监与皇帝
》
售價:HK$
88.5
《
透过器物看历史(全6册)
》
售價:HK$
490.6
《
我在台北故宫博物院读名画
》
售價:HK$
109.8
《
尼罗河往事:古埃及文明4000年
》
售價:HK$
76.2
《
一个人·谁也不是·十万人(诺贝尔文学奖得主反思自我的巅峰之作)
》
售價:HK$
54.9
《
重写晚明史(全5册 精装)
》
售價:HK$
781.8
《
汉末晋初之际政治研究
》
售價:HK$
132.2
《
强者破局:资治通鉴成事之道
》
售價:HK$
80.6
|
編輯推薦: |
《Python机器学习及实践》内容由浅入深,既有原理介绍,又有实战操作,使读者在实践中掌握相关知识,并为解决问题提供详细的方法。
《Python机器学习及实践》具有超强的实用性,实例丰富,书中给出了80多个实例让读者理解概念、原理和算法。
《Python机器学习及实践》以理论与实践相结合为出发点,介绍Python机器学习的相关内容,即使没有机器学习基础的读者也可以快速上手。
|
內容簡介: |
Python是目前比较热门的编程语言,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的*语言。本书以Python 3.6.5为编写平台,以帮助读者快速上手、理论与实践相结合为出发点,介绍Python机器学习的相关内容。全书共10章,分别介绍了机器学习的基础知识、近邻法、数据降维、分类算法、回归算法、聚类算法、神经网络、推荐算法、频繁项集、数据预处理。通过本书的学习,读者可了解Python编程及在机器学习中的应用。 本书可作为对Python和机器学习感兴趣的初学者的参考书,也可作为从事Python开发的广大科研人员、学者、工程技术人员的参考书,还可作为高等院校人工智能、计算机等相关专业的教材。
|
目錄:
|
目录
第1章机器学习的基础知识
1.1何谓机器学习
1.1.1传感器和海量数据
1.1.2机器学习的重要性
1.1.3机器学习的表现
1.1.4机器学习的主要任务
1.1.5选择合适的算法
1.1.6机器学习程序的步骤
1.2综合分类
1.3推荐系统和深度学习
1.3.1推荐系统
1.3.2深度学习
1.4何为Python
1.4.1使用Python软件的由来
1.4.2为什么使用Python
1.4.3Python设计定位
1.4.4Python的优缺点
1.4.5Python的应用
1.5Python编程第一步
1.6NumPy函数库基础
1.7Python迭代器与生成器
1.7.1迭代器
1.7.2生成器
1.8多线程
1.8.1学习Python线程
1.8.2线程模块
1.8.3线程同步
1.8.4线程优先级队列Queue
1.9小结
1.10习题
第2章Python近邻法
2.1k近邻法的三要素
2.1.1k值选择
2.1.2距离度量
2.1.3分类决策规则
2.2k近邻法
2.3kd树
2.3.1什么是kd树
2.3.2如何构建kd树
2.3.3如何在kd树中搜索
2.4Python实现kd树、k近邻法
2.5小结
2.6习题
第3章Python数据降维
3.1维度灾难与降维
3.2主成分分析
3.2.1PCA原理
3.2.2PCA算法
3.2.3PCA降维的两个准则
3.3SVD降维
3.4核主成分分析降维
3.5流形学习降维
3.6多维缩放降维
3.6.1原理
3.6.2MDS算法
3.7等度量映射降维
3.8局部线性嵌入
3.8.1原理
3.8.2LLE算法
3.9非负矩阵分解
3.10小结
3.11习题
第4章Python分类算法
4.1逻辑回归
4.1.1逻辑回归模型
4.1.2梯度下降法
4.2Softmax回归
4.3因子分解机
4.3.1逻辑回归算法的不足
4.3.2因子分解模型
4.3.3FM算法中交叉项的处理
4.3.4FM算法的求解
4.3.5FM算法流程
4.3.6Python实现FM模型
4.4支持向量机
4.4.1SVM简介
4.4.2线性可分支持向量机
4.4.3函数间距和几何间距
4.4.4线性支持向量机
4.4.5非线性支持向量机
4.5贝叶斯分类器
4.5.1贝叶斯定理
4.5.2相关的概念
4.5.3常用贝叶斯分类器
4.6随机森林
4.6.1决策树分类器
4.6.2CART分类树算法
4.7小结
4.8习题
第5章Python回归算法
5.1线性回归
5.1.1基本线性回归
5.1.2线性回归的最小二乘解法
5.1.3牛顿法
5.1.4局部加权线性回归
5.2岭回归与Lasso回归
5.2.1线性回归存在的问题
5.2.2岭回归模型
5.2.3Lasso回归模型
5.2.4拟牛顿法
5.2.5LBFGS求解岭回归模型
5.3小结
5.4习题
第6章Python聚类算法
6.1kMeans算法
6.1.1相似性的度量
6.1.2kMeans算法原理
6.1.3kMeans 算法
6.2Mean Shift聚类算法
6.2.1Mean Shift向量
6.2.2核函数
6.2.3Mean Shift推导
6.2.4Mean Shift在图像上的聚类
6.3DBSCAN聚类
6.3.1密度聚类原理
6.3.2DBSCAN密度定义
6.3.3DBSCAN密度聚类思想
6.3.4DBSCAN聚类算法
6.3.5DBSCAN小结
6.4小结
6.5习题
第7章Python神经网络
7.1感知机
7.1.1感知机原理
7.1.2感知机模型
7.1.3感知机学习策略
7.1.4感知机学习算法
7.1.5神经网络
7.1.6感知机的实现
7.2BP神经网络
7.2.1BP神经网络原理
7.2.2BP神经网络的实现
7.3径向基神经网络
7.3.1径向基函数解决插值问题
7.3.2正则化理论
7.3.3正则化RBF网络
7.3.4广义RBF网络
7.3.5数据中心的监督学习算法
7.4小结
7.5习题
第8章Python推荐算法
8.1协同过滤算法
8.1.1协同过滤算法概述
8.1.2协同过滤算法的分类
8.1.3相似度的度量方法
8.1.4基于用户的协同过滤算法
8.1.5基于项的协同过滤算法
8.1.6基于物品的协同过滤算法
8.2基于矩阵分解的推荐算法
8.2.1矩阵分解
8.2.2基于矩阵分解的推荐算法
8.2.3非负矩阵分解
8.3基于图的推荐算法
8.3.1二部图
8.3.2由用户商品矩阵到二部图
8.3.3PageRank算法
8.3.4问题说明
8.4小结
8.5习题
第9章Python频繁项集
9.1关联分析
9.1.1支持度与置信度
9.1.2穷举法
9.2Apriori算法
9.2.1Apriori算法简介
9.2.2Apriori定理
9.2.3Apriori算法应用
9.2.4Python生成候选项集
9.3FPGrowth算法
9.3.1用FP树编码数据集
9.3.2从FP树中挖掘频繁项
9.3.3从新闻网站点击流中挖掘
9.4小结
9.5习题
第10章Python数据预处理
10.1概述
10.1.1为什么要对数据预处理
10.1.2数据预处理的主要任务
10.2数据清理
10.2.1数据缺失
10.2.2过滤数据
10.2.3检测和过滤异常值
10.2.4移除重复数据
10.3处理缺失值
10.3.1处理缺失值的方法
10.3.2缺失值补全法
10.3.3特征编码
10.3.4数据标准化、正则化
10.3.5特征选择
10.3.6稀疏表示和字典学习
10.4机器模型
10.4.1损失函数和风险函数
10.4.2模型评估
10.4.3性能度量
10.5小结
10.6习题
参考文献
|
內容試閱:
|
前言
机器学习(Machine Learning,ML)是多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
由于Python语言的简洁性、易读性及可扩展性,在国外用Python做科学计算的研究机构日益增多,一些知名大学也采用Python来教授程序设计课程,Python已经成为最受欢迎的程序设计语言之一。
Python在设计上坚持清晰划一的风格,这使得Python成为一门易读、易维护,并且被大量用户欢迎的、用途广泛的语言。
本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。书中讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。不管你是机器学习的初学者,还是想进一步拓展对机器学习领域的认知,本书都是一个重要且不可错失的资源,它能帮助你了解如何使用Python解决机器学习中的关键问题。
之所以学习Python,用Python解决机器问题,是因为Python对于大数据的提取、分析完全是没有压力的,这也与其自身的特点有关。
本书共10章,从各方面介绍了机器学习内容,主要包括:
第1章机器学习的基础知识,主要介绍了机器学习的概念、综合分类、推荐系统和深度学习、Python软件相关介绍等内容。
第2章Python近邻法,主要介绍了k近邻法三要素、k近邻法、kd树等内容。
第3章Python数据降维,主要介绍了维度灾难与降维、主成分分析、SVD降维、多维缩放降维等内容。
第4章Python分类算法,主要介绍了逻辑回归、Softmax回归、因子分解机、支持向量机、随机森林的内容。
第5章Python回归算法,主要介绍了线性回归、岭回归与Lasso回归的内容。
第6章Python聚类算法,主要介绍了kMeans算法、Mean Shift聚类算法、DBSCAN聚类的内容。
第7章Python神经网络,主要介绍了感知机、BP神经网络、径向基神经网络的内容。
第8章Python推荐算法,主要介绍了协同过滤算法、基于矩阵分解的推荐算法、基于图的推荐算法的内容。
第9章Python频繁项集,主要介绍了关联分析、Apriori算法、FPGrowth算法的内容。
第10章Python数据预处理,主要介绍了数据预处理的基本概述、数据清理、处理缺失值、机器模型的内容。
这些算法目前应用非常广泛,效果也不错,是机器学习的入门知识,另外还需要深入理解算法的原理、优劣势等特点以及应用场景,要掌握利用Python解决这些问题的方法,并达到应用自如的程度。
本书特点
每个章节都是理论与Python实例相结合进行编写,让读者快速掌握利用Python实现机器学习算法;
每章最后通过小结与习题进行章节内容的总结与掌握情况的检测,习题类型有填空题、问答题、编写题,这样可使读者做到学以致用,上手快。
本书提供PPT课件、程序代码、习题答案等资料,请扫描下方二维码获取。
配套资料
本书主要由梁佩莹编写,此外参加编写的还有王宇华、吴茂、辛焕平、李晓东、李丹、李炳辉、顾艳春、方清城、邓奋发、周品、赵书兰、杨文茵。
由于时间仓促,加之编者水平有限,书中疏漏之处在所难免。在此,诚恳地希望得到各领域的专家和广大读者的批评指正。
编者
2020年2月
|
|