《数据分析与数据挖掘》 - 喻梅于健主编；王建荣王庆节副主编 - 清华大学出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』数据分析与数据挖掘

書城自編碼： 3143327
分類：簡體書→大陸圖書→教材→研究生/本科/专科教材
作者：喻梅于健主编；王建荣王庆节副主编
國際書號(ISBN)： 9787302493662
出版社：清华大学出版社
出版日期： 2018-03-01

書度/開本： 16开

售價：HK$ 56.1

我要買件

share:

** 我創建的書架 **
未登入.

新書推薦：

首辅养成手册（全三册）（张晚意、任敏主演古装剧《锦绣安宁》原著小说）

《首辅养成手册（全三册）（张晚意、任敏主演古装剧《锦绣安宁》原著小说）》
售價：HK$ 124.2

《清洁》
售價：HK$ 66.7

组队：超级个体时代的协作方式

《组队：超级个体时代的协作方式》
售價：HK$ 79.4

第十三位陪审员

《第十三位陪审员》
售價：HK$ 55.2

微观经济学（第三版）【2024诺贝尔经济学奖获奖者作品】

《微观经济学（第三版）【2024诺贝尔经济学奖获奖者作品】》
售價：HK$ 159.9

Python贝叶斯深度学习

《 Python贝叶斯深度学习》
售價：HK$ 91.8

文本的密码：社会语境中的宋代文学

《文本的密码：社会语境中的宋代文学》
售價：HK$ 69.0

启微·狂骉年代：西洋赛马在中国

《启微·狂骉年代：西洋赛马在中国》
售價：HK$ 80.5

建議一齊購買：

+

HK$ 70.7
《Python数据分析与应用》

+

HK$ 112.2
《自学Python 编程基础、科学计算及数据分析》

+

HK$ 140.6
《数据挖掘：实用机器学习工具与技术（原书第4版）》

+

HK$ 83.8
《Python数据分析入门——从数据获取到可视化》

+

HK$ 99.3
《工作中的数据分析》

+

HK$ 85.6
《实用数据分析（原书第2版）》

編輯推薦：

数据分析与数据挖掘是一门跨学科的计算机科学分支，是人工智能、机器学习、概率论、统计学和数据库知识的交叉学科。数据挖掘的目标是从一个或多个数据集中通过数据处理，结合一定的算法模型最终挖掘出有价值的信息。随着科技的发展，数据量呈爆炸式增长，数据挖掘在工业界和学术界都得到了越来越多的重视。国际知名的互联网公司和科研单位都在大力发展数据科学，在我国，数据科学的发展受到了极大的关注，通过数据分析与数据挖掘帮助决策，进而推动经济发展。本书主要介绍数据分析与数据挖掘的基本概念和方法，包括数据的基本属性和概念、数据预处理技术、数据仓库和OLAP技术、回归分析、频繁模式挖掘、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础，再给出应用实例，便于读者更好的理解和应用算法，*后给出习题。本书所讲述的内容均为数据分析与数据挖掘过程中常用方法和模型，目的是让爱好数据科学的计算机专业、统计学专业以及相关专业的学生熟悉数据挖掘的过程，掌握数据分析与数据挖掘过程中常用的算法模型及数据处理方式。本书知识点的介绍通过基础理论及概念介绍、应用例题、习题三部分进行，部分章节涉及算法应用实例。通过对数据分析与数据挖掘知

內容簡介：

《数据分析与数据挖掘》主要介绍数据挖掘和数据分析的基本概念和方法，包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。书中涉及到的模型和算法均给予了相应的实例。

目錄：

目录
第1章概述1
1.1数据分析与数据挖掘1
1.1.1数据分析1
1.1.2数据挖掘1
1.1.3区别和联系3
1.2分析与挖掘的数据类型3
1.3数据分析与数据挖掘的方法7
1.4数据分析与数据挖掘使用的技术9
1.5应用场景及存在的问题12
1.5.1数据分析与数据挖掘的应用12
1.5.2存在的主要问题13
1.6本书结构概述14
1.7习题14
第2章数据15
2.1数据对象与属性类别15
2.1.1属性的定义15
2.1.2属性的分类15
2.2数据基本统计描述16
2.2.1中心趋势度量17
2.2.2数据散布度量19
2.2.3数据的图形显示20
2.3数据的相似性和相异性度量25
2.3.1数据矩阵与相异性矩阵25
2.3.2标称属性的邻近性度量25
2.3.3二元属性的邻近性度量26
2.3.4数值属性的相异性27
2.3.5序数属性的邻近性度量29
2.3.6余弦相似性30
2.4习题30目录数据分析与数据挖掘第3章数据预处理32
3.1数据预处理及任务32
3.1.1数据预处理的必要性32
3.1.2数据预处理的主要任务34
3.2数据清理35
3.2.1缺失值、噪声和不一致数据的处理35
3.2.2数据清理方式38
3.3数据集成39
3.4数据归约42
3.4.1直方图43
3.4.2数据立方体聚集44
3.4.3属性子集选择45
3.4.4抽样46
3.5数据变换与数据离散化47
3.5.1数据变换策略及分类47
3.5.2数据泛化47
3.5.3数据规范化48
3.5.4数据离散化49
3.6习题51
第4章数据仓库与OLAP52
4.1数据仓库的基本概念52
4.1.1数据仓库的定义52
4.1.2数据仓库的性质52
4.1.3数据仓库体系结构53
4.1.4数据仓库设计模型54
4.2数据仓库设计55
4.2.1数据仓库的概念模型设计55
4.2.2数据仓库的逻辑模型设计58
4.2.3数据仓库的物理模型设计60
4.3数据仓库实现61
4.4联机分析处理70
4.4.1OLAP简介71
4.4.2OLAP与OLTP的关系72
4.4.3典型的OLAP操作73
4.5元数据模型76
4.5.1元数据的类型77
4.5.2元数据的作用77
4.5.3元数据的使用78
4.6习题79
第5章回归分析80
5.1回归分析概述80
5.1.1变量间的两类关系80
5.1.2回归分析的步骤81
5.2一元线性回归82
5.2.1原理分析82
5.2.2回归方程求解及模型检验82
5.2.3一元线性回归实例85
5.2.4案例分析：使用Weka实现一元线性回归88
5.3多元线性回归94
5.3.1原理分析94
5.3.2回归方程求解及模型检验95
5.3.3多元线性回归实例97
5.3.4案例分析：使用Weka实现多元线性回归99
5.4多项式回归102
5.4.1原理分析102
5.4.2多项式回归实例103
5.4.3案例分析：使用Excel实现多项式回归104
5.5习题111
第6章频繁模式挖掘113
6.1概述113
6.1.1案例分析114
6.1.2相关概念114
6.1.3先验性质116
6.2关联模式评估117
6.2.1支持度置信度框架117
6.2.2相关性分析117
6.2.3模式评估度量119
6.3Apriori算法120
6.3.1Apriori算法分析120
6.3.2案例分析：使用Weka实现Apriori算法124
6.4FPgrowth算法129
6.4.1FPgrowth算法分析129
6.4.2案例分析：使用Weka实现FPgrowth算法133
6.5压缩频繁项集136
6.5.1挖掘闭模式136
6.5.2挖掘极大模式136
6.6习题137
第7章分类139
7.1分类概述139
7.1.1分类的基本概念139
7.1.2分类的相关知识139
7.1.3分类的评价指标143
7.2决策树144
7.2.1决策树基本概念144
7.2.2决策树分类器的算法过程145
7.2.3ID3算法146
7.2.4C4.5算法149
7.2.5Weka中使用C4.5算法进行分类预测实例151
7.2.6决策树的剪枝156
7.2.7随机森林算法157
7.2.8使用Weka的随机森林进行分类预测160
7.3朴素贝叶斯分类164
7.3.1朴素贝叶斯学习基本原理164
7.3.2朴素贝叶斯分类过程165
7.3.3使用Weka的朴素贝叶斯分类器进行分类实例166
7.4惰性学习法170
7.4.1K近邻算法描述170
7.4.2K近邻算法性能172
7.4.3使用Weka进行K近邻分类实例173
7.5逻辑回归176
7.5.1逻辑回归基本概念176
7.5.2二项逻辑回归过程177
7.5.3使用逻辑回归分类算法的实例179
7.5.4使用Weka进行逻辑回归分类实例180
7.6支持向量机183
7.6.1线性可分支持向量机算法184
7.6.2线性可分支持向量机算法过程188
7.6.3使用Weka进行支持向量机分类实例189
7.7神经网络192
7.7.1神经网络基本概念192
7.7.2BP神经网络算法过程194
7.7.3BP神经网络分类算法的实例196
7.7.4使用Weka进行神经网络的分类实例198
7.8习题205
第8章聚类207
8.1聚类概述207
8.1.1聚类的基本概念207
8.1.2聚类算法的分类208
8.2基于划分的聚类210
8.2.1K均值算法210
8.2.2K中心点算法214
8.2.3使用Weka进行基于划分的聚类实例217
8.3基于层次的聚类221
8.3.1基于层次的聚类的基本概念221
8.3.2类间距离度量222
8.3.3分裂层次聚类222
8.3.4凝聚层次聚类224
8.3.5BIRCH算法226
8.3.6使用Weka进行基于层次的聚类实例228
8.4基于密度的聚类233
8.4.1基于密度的聚类的基本概念233
8.4.2DBSCAN算法233
8.4.3使用Weka进行基于密度的聚类实例236
8.5基于网格的聚类241
8.5.1基于网格的聚类的基本概念241
8.5.2STING算法241
8.5.3CLIQUE算法243
8.6聚类质量的评估245
8.7习题247
第9章离群点检测248
9.1离群点的定义与类型248
9.1.1离群点的定义248
9.1.2离群点类型249
9.2离群点的检测250
9.2.1检测方法的分类250
9.2.2统计学方法251
9.2.3近邻性方法253
9.2.4基于聚类的方法255
9.2.5基于分类的方法258
9.3习题259
附录AWeka的安装及使用规范260
A.1Weka的安装260
A.1.1Weka260
A.1.2JRE的安装260
A.1.3Weka的安装263
A.2Weka使用方法267
A.3Weka数据格式271
参考文献275

內容試閱：

前言
数据分析与数据挖掘是一门跨学科的计算机科学分支课程，是人工智能、机器学习、概率论、统计学和数据库知识的交叉学科。数据挖掘的目标是在一个或多个数据集中通过数据处理和结合一定的算法模型，最终挖掘出有价值的信息。随着科技的发展，数据量呈爆炸式增长，数据挖掘在工业界和学术界都得到了越来越多的重视。国际知名的互联网公司和科研单位都在大力发展数据科学。在我国，数据科学的发展受到了极大的关注，通过数据分析与数据挖掘可以帮助决策，进而推动经济发展。
本书内容均为数据分析与数据挖掘过程中常用方法和模型，目的是让爱好数据科学的计算机专业、统计学专业以及相关专业的学生熟悉数据挖掘的过程，掌握数据分析与数据挖掘过程中常用的算法模型及数据处理方式。本书知识点的介绍通过基础理论及概念讲解、应用例题、习题三部分进行，部分章节涉及算法应用实例。通过对数据分析与数据挖掘知识点的基础理论讲解，对数据分析与数据挖掘形成整体的认识及了解；通过应用例题，能够对算法的过程有深刻的理解；通过习题，能够巩固相应知识点。本书注重基础理论的介绍，使读者能够快速掌握数据分析与数据挖掘的基本过程和基础算法，为后续学习打下坚实的基础。
参与本书构思、撰写、审稿、应用实例的上机验证及截图校对的人员如下：
喻梅、于健、王庆节、王建荣、于瑞国、陈军、邸海波、尚鸿运、孟莹、成基元、赵永伟、李鑫、曹雅茹、郭佳、刘凯、邢文涛。
本书在撰写过程中得到了清华大学出版社张瑞庆编审的大力支持，在此表示衷心感谢。
由于时间仓促、编者水平有限，书中难免有不当之处，敬请读者批评、指正。

编者
2018年1月

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.