新書推薦:
《
冯友兰和青年谈心系列
》
售價:HK$
167.3
《
利他主义的生意:偏爱“非理性”的市场(英国《金融时报》推荐读物!)
》
售價:HK$
77.3
《
认知行为疗法:心理咨询的顶层设计
》
售價:HK$
99.7
《
FANUC工业机器人装调与维修
》
售價:HK$
99.7
《
吕著中国通史
》
售價:HK$
62.7
《
爱琴海的光芒 : 千年古希腊文明
》
售價:HK$
199.4
《
不被他人左右:基于阿德勒心理学的无压力工作法
》
售價:HK$
66.1
《
SDGSAT-1卫星热红外影像图集
》
售價:HK$
445.8
|
編輯推薦: |
采用机器学习方法和Python,可以使丰富的认知得以自动呈现。《Python机器学习 5个数据科学家案例解析》使用基于案例解析的实践方法来解决实际应用中运用机器学习的难题。这些更智能的机器将使你的业务流程以*短的时间和*少的资源获得更高的效率。《Python机器学习 5个数据科学家案例解析》将指导你逐步完善业务流程,并确定框架策略的关键点。你将了解可用于产品和服务的机器学习技术。此外,还将了解每个机器学习概念的优缺点,以帮助确定哪一种*适合需求。通过逐步采用Python编程的方法,你将能够理解机器学习过程中模型选择和决策背后的基本原理。《Python机器学习 5个数据科学家案例解析》提供实用的示例和代码,以确保你理解解决实际问题的数据科学方法。
|
內容簡介: |
题的丰富见解和解决方案。《Python机器学习 5个数据科学家案例解析》使用基于案例研究的实践方法来破解真实世界的应用,里面涉及的机器学习概念再适合不过。这些更智能的机器将使你的业务流程以*短的时间和*少的资源获得更高的效率。 《Python机器学习 5个数据科学家案例解析》将引导你逐步完善业务流程,帮助你发现构建公司战略的关键点。你将阅读可以为产品和服务提供支持的机器学习技术。《Python机器学习 5个数据科学家案例解析》还突出了这些机器学习概念的优缺点,以帮助你决定哪一个*适合你的需求。 通过逐步的编码方法,你将能够理解机器学习过程中模型选择背后的基本原理。《Python机器学习 5个数据科学家案例解析》配备了实用的示例和代码片段,以确保你了解用于解决实际问题的数据科学的方法。《Python机器学习 5个数据科学家案例解析》可以帮助来自技术和非技术背景的人们将机器学习技术应用于现实世界问题。每一章都从一个具有明确定义的业务问题的案例研究开始,然后通过整合案例情节和代码片段来决定*解决方案。练习贯穿于整个章节,使所学概念得以动手实现。每章*后都以现实世界应用的亮点为结尾,这些概念可以应用到实践中。
|
關於作者: |
Danish Haroon目前领导Market IQ Inc的数据科学团队,该团队专注于从情感转折点中剔除可操作实时情报的专利预测分析平台。他获得了卡拉奇学校karachi School商业与领导学院的MBA学位,曾为公司客户及其数据分析要求提供服务。最近,他开始领导PredictifyME的数据商业化团队,这家初创公司专注于为美国市场的需求规划和房地产市场提供预测分析。他目前的研究主要集中在用于改善客户体验Customer Experiences,CX的数据科学混合物上。
|
目錄:
|
目录
第1章 统计与概率 1 1.1 案例研究:自行车共享计划确定品牌角色 1 1.2 进行探索性数据分析 3 1.2.1 特征探索 4 1.2.2 变量的类型 5 1.2.3 单变量分析 8 1.2.4 多变量分析 12 1.2.5 时间序列成分 15 1.3 度量测度中心 17 1.3.1 平均数 17 1.3.2 中位数 18 1.3.3 众数 19 1.3.4 方差 19 1.3.5 标准差 19 1.3.6 由于常量的存在而导致中心统计度量的变化 20 1.3.7 正态分布 22 1.4 相关性 29 1.4.1 Pearson R相关 29 1.4.2 Kendall秩相关 29 1.4.3 Spearman秩相关 30 1.5 假设检验:比较两组 31 1.5.1 t-统计量 32 1.5.2 t-分布和样本容量 32 1.6 中心极限定理 34 1.7 案例研究发现 35 1.8 统计和概率的应用 36 1.8.1 精算科学 36 1.8.2 生物统计学 36 1.8.3 天文统计学 36 1.8.4 商业分析 37 1.8.5 计量经济学 37 1.8.6 机器学习 37 1.8.7 统计信号处理 37 1.8.8 选举 37 第2章 回归 39 2.1 案例研究:消除混凝土抗压强度的不一致性 39 2.2 回归的概念 42 2.2.1 内插和外推 42 2.2.2 线性回归 42 2.2.3 y在x上的最小二乘回归线 43 2.2.4 多重回归 44 2.2.5 逐步回归 45 2.2.6 多项式回归 46 2.3 回归的假设 47 2.3.1 案例数量 47 2.3.2 缺失数据 47 2.3.3 多重共线性与奇异性 48 2.4 特征探索 49 2.5 过拟合和欠拟合 55 2.6 回归度量的评估 58 2.6.1 解释方差得分 58 2.6.2 平均绝对误差 58 2.6.3 均方误差 59 2.6.4 R2 59 2.6.5 残差 60 2.6.6 残差图 60 2.6.7 残差平方和 60 2.7 回归的类型 61 2.7.1 线性回归 61 2.7.2 网格搜索 65 2.7.3 岭回归 65 2.7.4 套索回归 68 2.7.5 ElasticNet 70 2.7.6 梯度boosting回归 71 2.7.7 支持向量机 74 2.8 回归的应用 78 2.8.1 预测销售额 78 2.8.2 预测债券价值 78 2.8.3 通货膨胀率 78 2.8.4 保险公司 79 2.8.5 呼叫中心 79 2.8.6 农业 79 2.8.7 预测薪水 79 2.8.8 房地产行业 80 第3章 时间序列 83 3.1 案例研究:预测雅虎的每日调整的收盘价 83 3.2 特征探索 85 3.3 评估时间序列对象的平稳性 86 3.3.1 具有平稳本质的时间序列的性质 87 3.3.2 测试以确定时间序列是否平稳 87 3.3.3 制作时间序列对象的方法 90 3.4 测试以确定时间序列是否具有自相关性 100 3.4.1 自相关函数 100 3.4.2 偏自相关函数 100 3.4.3 度量自相关 101 3.4.4 Durbin Watson统计 101 3.5 建模时间序列 102 3.5.1 验证预测序列的实验 102 3.5.2 确定建模参数 103 3.6 自回归综合移动平均 105 3.6.1 自回归移动平均 105 3.6.2 自回归 106 3.6.3 移动平均线 107 3.6.4 组合模型 108 3.7 缩减预测规模 109 3.8 时间序列分析应用 113 3.8.1 销售预测 113 3.8.2 天气预测 113 3.8.3 失业率估计 113 3.8.4 疾病爆发 113 3.8.5 股市预测 114 第4章 聚类 115 4.1 案例研究:确定营销短尾关键词 115 4.2 特征的探索 117 4.3 有监督学习与无监督学习 118 4.3.1 有监督学习 119 4.3.2 无监督学习 119 4.4 聚类分析 120 4.5 为建模作数据转换 120 4.6 聚类模型 124 4.6.1 k-means聚类 124 4.6.2 将k-means聚类应用于簇的最优数量 129 4.6.3 主成分分析 130 4.6.4 高斯混合模型 137 4.6.5 贝叶斯高斯混合模型 142 4.7 聚类的应用 144 4.7.1 疾病识别 144 4.7.2 搜索引擎中的文档聚类 144 4.7.3 基于人口统计的客户划分 145 第5章 分类 147 5.1 案例研究:俄亥俄州诊所满足供求 147 5.2 特征探究 149 5.3 实施数据整理 154 5.4 实施探索性数据分析 157 5.5 特征的生成 162 5.6 分类 164 5.6.1 模型评估技术 164 5.6.2 二元分类器:受试者工作特征 165 5.6.3 决策树分类 168 5.7 核近似 16 95.7.1 SGD分类器 169 5.7.2 集成方法 172 5.8 随机森林分类 173 5.9 分类应用 178 5.9.1 图像分类 178 5.9.2 音乐分类 178 5.9.3 E-mail的垃圾邮件过滤 178 5.9.4 保险 179附录A 图表类型以及何时使用它们 181
|
內容試閱:
|
学习 5个数据科学家案例解析》使用基于案例研究的实践方法来破解真实世界的应用,里面涉及的机器学习概念再适合不过。这些更智能的机器将使你的业务流程以最短的时间和最少的资源获得更高的效率。《Python机器学习 5个数据科学家案例解析》将引导你逐步完善业务流程,帮助你发现构建公司战略的关键点。你将阅读可以为产品和服务提供支持的机器学习技术。《Python机器学习 5个数据科学家案例解析》还突出了这些机器学习概念的优缺点,以帮助你决定哪一个最适合你的需求。通过逐步的编码方法,你将能够理解机器学习过程中模型选择背后的基本原理。《Python机器学习 5个数据科学家案例解析》配备了实用的示例和代码片段,以确保你了解用于解决实际问题的数据科学方法。《Python机器学习 5个数据科学家案例解析》可以帮助来自技术和非技术背景的人们将机器学习技术应用于现实世界问题。每一章都从一个具有明确定义的业务问题的案例研究开始,然后通过整合案例情节和代码片段来决定最佳解决方案。练习贯穿于整个章节,使所学概念得以动手实现。每章最后都以现实世界应用的亮点为结尾,这些概念可以应用到实践中。以下简要概述各章的内容:第1章介绍统计和概率的概念。第2章讨论回归技术和方法以微调模型。第3章向读者展示时间序列模型,并详细介绍平稳的性质。第4章使用聚类方法作为辅助,从而将数据划分用于营销目的。第5章讨论分类模型和评估指标,以评估模型的优劣。
|
|