新書推薦:
《
纯粹·古代中国的历史与制度
》
售價:HK$
62.7
《
生活来来往往 别等来日方长 新版(伍佰:“讲好了这一辈子,再度重相逢。”别等,别遗憾!珍惜当下才是最好的解药)
》
售價:HK$
58.2
《
一个英国军事顾问眼中的二战
》
售價:HK$
277.8
《
就业、利息和货币通论(徐毓枬译本)(经济学名著译丛)
》
售價:HK$
67.2
《
瘦肝
》
售價:HK$
99.7
《
股票大作手回忆录
》
售價:HK$
55.8
《
秩序四千年:人类如何运用法律缔造文明(世界重归混乱,文明岌岌可危,法律与秩序是我们仅有的武器。穿越时间,鸟瞰全球,一部波澜壮阔的人类文明史)
》
售價:HK$
154.6
《
民法典1000问
》
售價:HK$
99.7
|
編輯推薦: |
讲解过程图文并茂,读者学习时更加轻松;
讲解详细,并安排了项目实例,使读者能够边学边练,在短时间内就可以有一个较大的提高。采用由浅入深、简单实用的形式,方便读者快速掌握可视化软件的基本操作,并通过系统的案例使读者迅速掌握应用技巧。
|
內容簡介: |
数据可视化允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释,数据可视化技术在国内市场长期看好,而现阶段国内相关书籍相对较少,本书选择这个方向进行系统基础研究,希望为那些在想此领域有所发展的读者提供学习帮助。在本书中,我们首先介绍数据可视化的一些基本知识,随后重点介绍使用Tableau、SAS及SPSS Modeler的可视化界面进行数据分析与数据挖掘的方法。
|
關於作者: |
王国平,大数据分析师,具体工作经历如下:2011-2014 上海大智慧股份有限公司 数据研究员2014-2016 中国电信上海分公司 大数据分析师2016至今 上海博辕信息技术服务有限公司 数据分析师
|
目錄:
|
目录
序 言1
第1部分11
数据可视化篇11
1.1数据可视化12
1.1.1 Tableau13
1.1.2 QlikView15
1.1.3 Power BI15
1.2可视化数据挖掘16
1.2.1 IBM SPSS Modeler16
1.2.2 Intelligent Miner17
1.2.3 SAS Enterprise Miner18
2.1 软件页面简介20
2.1.1 开始页面21
2.1.2 数据源页面23
2.1.3 工作簿页面24
2.2 数据类型25
2.2.1 主要数据类型25
2.2.2 更改数据类型26
2.3 运算符及优先级28
2.3.1 算术运算符28
2.3.2 逻辑运算符29
2.3.3 比较运算符29
2.3.4 运算符优先级29
2.4 软件安装30
2.4.1软件下载30
2.4.2安装步骤31
2.4.3软件激活35
2.5 文件类型37
3.1连接到文件39
3.1.1 Excel文件39
3.1.2 文本文件41
3.1.3 Access43
3.1.4 JSON文件45
3.1.5 PDF文件47
3.1.6 空间文件49
3.1.7 统计文件51
3.1.8 其他文件53
3.2连接到数据库54
3.2.1Tableau Server54
3.2.2 SQL Server55
3.2.3 MySQL56
3.2.4 Oracle58
3.2.5 Amazon Redshift59
3.2.6 更多数据库61
4.1维度和度量64
4.1.1 维度64
4.1.2 度量66
4.2连续和离散67
4.2.1 连续字段67
4.2.2 离散字段68
4.3工作区操作68
4.3.1数据窗格69
4.3.2分析窗格71
4.3.3工具栏71
4.3.4状态栏72
4.3.5卡和功能区73
4.4工作表操作74
4.4.1创建工作表75
4.4.2复制工作表75
4.4.3导出工作表77
4.4.4删除工作表77
4.5Tableau高级应用78
4.5.1表计算78
4.5.2创建字段81
4.5.3创建参数83
4.5.4聚合计算90
4.5.5缺失值处理92
5.1单变量图形95
5.1.1条形图95
5.1.2饼图98
5.1.3直方图100
5.1.4折线图101
5.2 多变量图形103
5.2.1散点图103
5.2.2甘特图105
5.3 地图106
5.3.1设置角色106
5.3.2标记地图108
5.3.3添加字段信息108
5.3.4设置地图选项109
5.3.5创建分布图112
5.3.6自定义地图112
第2部分114
可视化数据挖掘篇114
6.1软件简介115
6.1.1 软件历史115
6.1.2 软件界面117
6.1.3 软件特点123
6.2算法及功能124
6.2.1 软件算法124
6.2.2 软件功能125
6.3软件安装及启动127
6.3.1 软件安装127
6.3.2 授权许可131
6.3.3 启动软件134
7.1业务理解137
7.2数据理解138
7.3数据准备138
7.4建立模型140
7.5评估模型140
7.6应用模型141
8.1连接到文件142
8.1.1Excel文件142
8.1.2变量文件143
8.1.3固定文件145
8.1.4SAS文件146
8.1.5Statistics文件146
8.2连接到数据库147
9.1数据流操作151
9.1.1生成数据流151
9.1.2添加和删除节点151
9.1.3连接数据流152
9.1.4修改连接节点153
9.1.5执行数据流155
9.2图形制作155
9.2.1散点图155
9.2.2直方图157
9.2.3网络图158
9.2.4评估图160
第3部分162
案例实战篇162
10.1建模思路164
10.2Logistic回归165
10.3业务理解167
10.4数据理解168
10.5数据准备171
10.6建立模型173
10.6.1模型参数设置173
10.6.2模型运行结果183
10.7模型评估187
10.7.1模型精确度187
10.7.2模型拟合度187
10.8模型应用189
10.9小结192
11.1建模思路194
11.2时间序列模型195
11.3业务理解196
11.4数据理解197
11.5数据准备198
11.6建立模型200
11.6.1模型参数设置200
11.6.2模型运行结果216
11.7模型评估218
11.8模型应用220
11.9小结221
12.1建模思路223
12.2聚类模型224
12.3业务理解225
12.4数据理解226
12.5数据准备228
12.6建立模型230
12.6.1模型参数设置230
12.6.2模型运行结果233
12.7模型评估236
12.8模型应用239
12.9小结241
13.1建模思路243
13.2判别分析244
13.3业务理解245
13.4数据理解246
13.5数据准备248
13.6建立模型249
13.6.1模型参数设置249
13.6.2模型运行结果257
13.7模型评估262
13.8模型应用263
13.9 小结265
14.1建模思路268
14.2神经网络模型269
14.2.1 神经元270
14.2.2 多层感知器272
14.2.3 径向基函数273
14.3业务理解275
14.4数据理解276
14.5数据准备278
14.6建立模型280
14.6.1模型参数设置280
14.6.2模型运行结果287
14.7模型评估291
14.8模型应用292
14.9小结294
15.1建模思路296
15.2决策树模型297
15.3业务理解299
15.4数据理解300
15.5数据准备303
15.6建立模型306
15.6.1模型参数设置306
15.6.2模型运行结果316
15.7模型评估318
15.7.1模型精确度318
15.7.2模型拟合度318
15.8模型应用320
15.9小结323
附录A324
配置MySQL ODBC数据源324
A1 添加数据源管理器324
A2 选择相应的驱动程序324
A3 连接数据库服务器325
附录B327
Tableau重要函数327
B1 数字函数327
B2 字符串函数329
B3 日期函数331
B4 类型转换334
B5 逻辑函数335
B6 聚合函数337
B7 直通函数338
B8 用户函数340
B9 表计算函数341
B10 其他函数346
附录C349
SPSS Modele函数349
C1 信息函数349
C2 转换函数350
C3 比较函数351
C4 逻辑函数352
C5 数值函数352
C6 三角函数353
C7 概率函数354
C8 位元整数运算354
C9 随机函数355
C10 字符串函数356
C11 日期和时间函数359
C12 序列函数362
C13 全局函数365
C14 空值和Null值处理函数366
C15 特殊函数366
|
內容試閱:
|
序 言
大数据时代正在变革着我们的生活、工作和思维,如何让大数据发挥出最大价值,最重要的手段就是进行数据可视化挖掘。利用可视化数据挖掘工具和技术,分析人员能够从全新的角度快速、轻松地挖掘信息,可视化数据挖掘使数据挖掘变得更简单,建模过程不需要编写代码,非技术出身的业务人员等,可以更好地利用数据做出决策。
本书基于Tableau 10.3和IBM SPSS Modeler 18.0编写,详细介绍了Tableau的数据连接、图形编辑、创建地图、表计算和聚合计算等功能,以及IBM SPSS Modeler的数据连接、CRISP-DM 跨行业数据挖掘标准流程等功能。通过6个实际案例,重点介绍了可视化数据挖掘技术在电信、电力、医药、银行、电商和房地产等行业中的应用。
本书的内容
第1章介绍数据可视化和可视化数据挖掘的基本理论及其主要软件,前者包括Tableau、QlikView和Power BI,后者包括SPSS Modeler、Intelligent Miner和SAS Enterprise Miner。
第2章介绍Tableau Desktop 10.3的软件概括、数据类型、运算符及优先级、软件的安装与激活和Tableau的文件类型等。
第3章介绍Tableau Desktop可以连接的数据源,包括Excel文件、文本文件、Access、JSON文件、PDF文件、空间文件和统计文件等,还介绍了如何连接各类数据库,如Tableau Server、SQL Server、MySQL、Oracle等。
第4章首先介绍Tableau Desktop的维度和度量、连续和离散的概念和操作,然后介绍了工作区和工作表的等基础操作,最后详细介绍了表计算、创建字段、创建参数和聚合计算等高级操作。
第5章介绍如何使用Tableau 生成一些统计图形,如条形图、饼图、直方图、折线图、散点图、并排图、甘特图等,重点介绍了如何使用Tableau创建地图,包括设置角色、比较地图、添加字段信息、设置地图选项、创建分布图和自定义地图等。
第6章介绍IBM SPSS Modeler的发展历史、软件特点、软件算法、软件功能、安装过程和授权许可等。
第7章介绍使用IBM SPSS Modeler进行数据挖掘的6个基本步骤:业务理解、数据理解、数据准备、建立模型、评估模型和应用模型。
第8章介绍IBM SPSS Modeler的一些基本操作,包括连接到文件和连接到数据库,前者包括Excel文件、SAS文件、SPSS Statistics文件、变量文件和固定文件等,后者包括Oracle、SQL Server、DB2、MySQL等数据库。
第9章介绍IBM SPSS Modeler的数据流操作,包括生成数据流、添加和删除节点、连接数据流、修改连接节点和执行数据流等。
第10章介绍可视化数据挖掘在电信行业中的应用,根据客户流失数据,运用Logistic回归算法,建立了基于客户属性、服务属性和客户消费信息的客户流失预警模型。
第11章介绍可视化数据挖掘在电力行业中的应用,由于用电负荷具有季节性和周期性的特点,因此运用时间序列模型,同时我们选择时间序列中的专家建模器进行建模。
第12章介绍可视化数据挖掘在医药行业中的应用,根据患者的用药数据,应用K-Means聚类算法,建立了基于药物在人体的类胆固醇TC、Na、Ka等因素的药物效果聚类模型。
第13章介绍可视化数据挖掘在银行业中的应用,根据客户流失数据,运用判别分析模型,建立了基于客户的属性数据、信用等级和资产状况等因素的客户类型判别模型。
第14章介绍可视化数据挖掘在电商行业中的应用,根据客户流失数据,运用神经网络模型,建立了基于促销费用、促销前的销售额和促销后的销售额等因素的促销效果评价模型。
第15章介绍可视化数据挖掘在房地产行业中的应用,根据客户流失数据,运用CHAID决策树算法,建立了基于年龄、性别、学历、月薪和家庭人数等因素的购房决策树模型。
本书的特色
(1)内容全面,讲解详细
本书是一本实践性的可视化数据挖掘著作,详细介绍了常用软件,对于初次学习可视化数据挖掘的读者来说帮助较大,书中列出了每一步操作,便于读者的练习实践。
(2)由浅入深、循序渐进
本书从Tableau和IBM SPSS Modeler的简介、连接数据源、基础操作到高级操作,逐步深入,从易到难,由浅入深,循序渐进,适合可视化数据挖掘各个层次的读者阅读。
(3)案例丰富,高效学习
本书在介绍数据可视化和数据挖掘软件后,为了使读者快速提高数据分析的整体能力,结合6个实际案例对可视化数据挖掘的流程及步骤进行了详细全面的介绍。
本书的读者对象
本书的内容和案例适用于互联网、银行证券、电商、医药等行业数据分析用户进行可视化数据挖掘,可供高等院校相关专业学生以及从事可视化数据挖掘的研究者参考使用,也可作为Tableau和IBM SPSS Modeler软件培训和自学的教材。
由于编者水平所限,书中难免存在错误和不妥之处,请广大读者批评指正。
编者
2017年9月
|
|