新書推薦:
《
卫宫家今天的饭9 附画集特装版(含漫画1本+画集1本+卫宫士郎购物清单2张+特制相卡1张)
》
售價:HK$
132.2
《
万千教育学前·与幼儿一起解决问题:捕捉幼儿园一日生活中的教育契机
》
售價:HK$
47.0
《
史铁生:听风八百遍,才知是人间(2)
》
售價:HK$
55.8
《
量子网络的构建与应用
》
售價:HK$
109.8
《
拍电影的热知识:126部影片里的创作技巧(全彩插图版)
》
售價:HK$
109.8
《
大唐名城:长安风华冠天下
》
售價:HK$
87.4
《
情绪传染(当代西方社会心理学名著译丛)
》
售價:HK$
88.5
《
中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版
》
售價:HK$
236.0
|
編輯推薦: |
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。
为零基础R语言与数据挖掘教学和自学量身打造,系统讲解R语言与数据挖掘的必备知识,配有大量的上机实验、源代码和教学PPT资源。
|
內容簡介: |
本书主要分为三个部分,基础篇、建模应用篇和Rattle篇。基础篇(第1~5章)介绍了有关R语言的安装与使用、R语言中的数据结构、常用操作和绘图功能等基础功能。建模应用篇(第6~10章)主要介绍了目前在数据挖掘中的常用的建模方法在R语言中的实现函数,并对输出结果进行了解释,有助于读者快速掌握应用R语言进行分析挖掘建模的方法。Rattle篇(第11章)介绍了一个R语言的图形界面工具。图书配套提供了程序代码及数据,读者可通过上机实验,快速掌握书中所介绍的R语言的使用方法。
|
關於作者: |
张良均
资深大数据挖掘专家,高级信息项目管理师,有近20年的大数据挖掘应用、咨询和培训经验,被称为中国大数据挖掘培训教父。为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验丰富。现任广东工业大学、华南师范大学、华南农业大学等6所高校兼职教授。著有《神经网络实用教程》《数据挖掘:实用案例分析》《R语言数据分析与挖掘实战》等畅销图书。
谢佳标
资深R语言专家,多次于中国R语言大会发表演讲,具有十余年的数据挖掘实战经验。目前于某上市互联网游戏公司,任高级数据分析师,负责大数据挖掘及可视化。培训过的精品课程有:《R语言基础培训》《数据分析之R语言实战》《机器学习与R语言实践》等。
万正勇
某国际投行VP,有超过10年的金融系统大数据挖掘及分析经验,超过15年的大型金融机构核心交易系统规划设计开发经验。数据库及中间件专家,先后获得中国首届十大杰出数据库工程师,Oracle 中间件 ACE Director以及 Oracle 数据库 ACE 等称号。曾为电信,电力,航空,银行,保险,互联网,交通,制造等等行业相关龙头企业提供过咨询服务。著有《衍生数学》,《Oracle数据库DBA专题技术精粹》等畅销书。
|
目錄:
|
Contents?目录前 言第一部分 基础篇第1章 R语言的安装与使用 21.1 R安装与升级 31.2 R使用入门 41.2.1 R操作界面 41.2.2 RStudio窗口介绍 51.2.3 R常用操作 61.3 R数据分析包 81.4 配套资源使用说明 101.5 小结 101.6 上机实验 10第2章 数据对象与数据读写 122.1 数据类型 122.2 数据结构 162.2.1 向量 162.2.2 矩阵 192.2.3 数组 242.2.4 数据框 252.2.5 因子 282.2.6 列表 312.3 数据文件的读写 342.3.1 键盘输入数据 342.3.2 读取不同格式的数据 352.3.3 从其他统计软件获取数据 372.3.4 从数据库获取数据 372.3.5 从网页获取数据 392.4 小结 402.5 上机实验 40第3章 R语言常用数据管理 423.1 变量的重命名 423.2 缺失值分析 453.3 数据排序 463.4 随机抽样 483.5 数值运算函数 493.6 字符串处理 523.7 文本分词 563.8 apply函数族 623.9 数据整合 653.10 控制流 683.11 函数的编写 713.12 小结 723.13 上机实验 73第4章 图形探索 754.1 图形元素 764.1.1 颜色 764.1.2 点 804.1.3 文本 824.1.4 线条 864.1.5 图例 914.1.6 坐标轴 924.2 图形组合 944.3 图形保存 974.4 图形函数 984.5 小结 1164.6 上机实验 116第5章 高级绘图工具 1175.1 lattice包绘图工具 1175.1.1 绘图特色 1175.1.2 基本图形 1225.2 ggplot2包绘图工具 1355.2.1 从qplot开始 1355.2.2 ggplot作图 1375.3 交互式绘图工具简介 1425.3.1 rCharts包 1435.3.2 recharts包 1475.3.3 googleVis包 1475.3.4 htmlwidgets包 1485.3.5 shiny包 1535.4 小结 1635.5 上机实验 163第二部分 建模应用篇第6章 分类与预测 1666.1 回归分析 1666.2 决策树 1756.2.1 C4.5算法 1766.2.2 CART算法 1786.2.3 C5.0算法 1806.3 人工神经网络 1816.4 KNN算法 1836.5 朴素贝叶斯分类 1856.6 其他分类与预测算法函数 1876.7 分类与预测算法评价 1926.8 小结 1966.9 上机实验 196第7章 聚类分析 1987.1 K-Means聚类分析函数 1997.2 层次聚类算法 2047.3 其他聚类分析函数 2077.4 小结 2117.5 上机实验 212第8章 关联规则 2138.1 Apriori关联规则 2148.2 小结 2268.3 上机实验 226第9章 智能推荐 2289.1 智能推荐模型构建 2289.2 智能推荐模型评价 2329.3 小结 2359.4 上机实验 235第10章 时间序列 23710.1 ARIMA模型 23710.2 其他时间序列模型 24510.3 小结 25010.4 上机实验 251第三部分 Rattle篇第11章 可视化数据挖掘工具Rattle 25411.1 Rattle简介及其安装 25411.1.1 Rattle简介 25411.1.2 Rattle安装 25411.2 功能预览 25511.3 数据导入 25611.3.1 导入CSV数据 25611.3.2 导入ARFF数据 26111.3.3 导入ODBC数据 26211.3.4 R Dataset——导入其他数据源 26411.3.5 导入RData File数据集 26711.3.6 导入Library数据 26811.4 数据探索 26911.4.1 数据总体概况 26911.4.2 数据分布探索 27211.4.3 相关性 27511.4.4 主成分 27711.4.5 交互图 27811.5 数据建模 28311.5.1 聚类分析 28311.5.2 关联规则 28811.5.3 决策树 29111.5.4 随机森林 29311.6 模型评估 29611.6.1 混淆矩阵 29611.6.2 风险图 29611.6.3 ROC图及相关图表 29711.6.4 模型得分数据集 29811.7 小结 29911.8 上机实验 299参考资料 301
|
|