《R语言数据高效处理指南》 - 黄天元 - 北京大学出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』R语言数据高效处理指南

書城自編碼： 3415305
分類：簡體書→大陸圖書→計算機/網絡→程序設計
作者：黄天元
國際書號(ISBN)： 9787301306086
出版社：北京大学出版社
出版日期： 2019-09-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 79.7

我要買件

** 我創建的書架 **
未登入.

新書推薦：

Python贝叶斯深度学习

《 Python贝叶斯深度学习》
售價：HK$ 89.4

启微·狂骉年代：西洋赛马在中国

《启微·狂骉年代：西洋赛马在中国》
售價：HK$ 78.4

有趣的中国古建筑

《有趣的中国古建筑》
售價：HK$ 67.0

十一年夏至

《十一年夏至》
售價：HK$ 76.2

如何打造成功的商业赛事

《如何打造成功的商业赛事》
售價：HK$ 89.5

万千教育学前·透视学前儿童的发展：解析幼儿教师常问的那些问题

《万千教育学前·透视学前儿童的发展：解析幼儿教师常问的那些问题》
售價：HK$ 58.2

慈悲与玫瑰

《慈悲与玫瑰》
售價：HK$ 87.4

启蒙的辩证：哲学的片简（法兰克福学派哲学经典，批判理论重要文本）

《启蒙的辩证：哲学的片简（法兰克福学派哲学经典，批判理论重要文本）》
售價：HK$ 76.2

編輯推薦：

（1）循序渐进式教学：本书由基础数据处理（base-r）简洁高效数据处理（tidyverse生态系统）高速数据处理（data.table）分布式数据处理（sparklyr），从基础到进阶操作，一应俱全。
（2）引导式教学：本书由浅入深，分层次讲解，每个知识点都配有可实现的代码辅助理解。
（3）案例式教学：本书实战应用部分涵盖数据搜集、数据处理、网络爬虫、文本挖掘、数据可视化、机器学习等多个领域，代码可直接用于实际工作和生活中。

內容簡介：

R 语言在近10 年来已经发生了日新月异的变化，不仅在内容上更加丰富多彩，而且在计算效率上也有了大幅的提升。它被更加广泛地用于数据可视化、统计建模、机器学习等领域，而且还能实现网络爬虫、网络应用开发等功能，成为数据科学领域的全能型工具。R 语言在学术界的地位已经不容置疑，在大数据时代中它是保证研究可重复性的重要工具。随着功能的日益完善，R 语言已经进军工业界，并在金融、保险、医疗、生物和信息计量等不同的应用场景中大放异彩，潜力不可估量。
尽管R 语言能够实现丰富多样的实际功能和框架，但是其本质是面向数据的，因此数据处理是R 语言核心中的核心。如果能够掌握高效的数据操作技术，就能够在各类数据分析任务中如鱼得水。本书定位即为R 语言数据处理101，希望R 语言的使用者能够在较早的阶段就习得基本而有效的数据处理基本技术。
《R语言数据高效处理指南》读者群体包括在校的大学生、数据分析从业人员和致力于更加高效地处理数据的所有的R语言使用者。尽管对数据科学、计算机编程、统计学有一定基础会帮助理解本书的内容，但这不是必需的，来自包括初学者在内的各个层次的读者群体都能从本书中有所收获。读者在本书中不仅能够学到数据处理中的实用技术，还能培养在数据分析中的探索性思维。可以作为零基础学习数据分析的教程、进阶数据分析实用技巧的参考书、常备查询的案头工具书，以及具有一定趣味性的数据分析入门启蒙书。

關於作者：

黄天元，复旦大学生态学博士在读，R语言忠实爱好者。热爱数据科学与开源工具，致力于利用数据科学迅速积累行业经验优势和科学知识发现，涉猎内容包括但不限于信息计量、机器学习、数据可视化、统计建模、知识图谱等。已发表SCI论文两篇，开设有知乎专栏R语言数据挖掘。

目錄：

第1 部分基础知识...................1
第1 章数据处理总论.......................... 2
1.1　数据处理的定义 ....................2
1.2　数据处理的意义 ...................3
1.3　数据处理基本工具 ..................3
第2 章 R 语言编程基础.................. 6
2.1　下载安装 ...................6
2.2　包的使用 ..................7
2.3　数据类型 .........................8
2.4　数据结构 ........................10
2.5　程序控制 ........................15
2.6　函数式编程 ....................17
第3 章数据处理基本范式....................... 19
第2 部分快速入门...................24
第4 章 base-r：基本数据处理................. 25
4.1　数据集及其基本探索 .....................25
4.2　基本范式实现 ................27
4.2.1　创建（read.csvdata.frame） ................................27
4.2.2　删除（rm） .........................28
4.2.3　检索（DF[i,j]） ...................28
4.2.4　插入（rbindcbind） ........................31
4.2.5　排序（order） .....................33
4.2.6　过滤（DF[condition,]） ...................35
4.2.7　汇总（apply） .....................36
4.2.8　分组（aggregate） ...........................36
4.2.9　连接（merge） ....................37
第5 章 tidyverse 生态系统：简洁高效数据处理.................... 40
5.1　tidyverse 生态系统简介 ........................40
5.2　基本范式实现 ............................41
5.2.1　包的加载（p_load） ........................41
5.2.2　创建（read_csvtibble） ..................42
5.2.3　删除（rm） .........................45
5.2.4　检索（selectslice） .........................46
5.2.5　插入（addbind） ................50
5.2.6　排序（arrange） ..................54
5.2.7　过滤（filter） ......................56
5.2.8　汇总（summarise） .........................59
5.2.9　分组（group_by） ...........................61
5.2.10 连接（join） .....................63
5.3　高级处理工具 ................67
5.3.1 长宽数据变换（gatherspread） ..........................68
5.3.2　集合运算（intersectunionsetdiff） .....................70
5.3.3　窗口函数（rankleadlagcum） ...........................74
5.3.4　连接数据库：对SQL 的支持（dbplyr） .........................81
5.3.5　巧妙写函数：变量的引用 ...............85
第3 部分高级进阶...................93
第6 章 data.table：高速数据处理............... 94
6.1　data.table 简介 ...............94
6.2　基本范式实现 ................96
6.3　高级特性探索 ............................... 116
第7 章 sparklyr：分布式数据处理.................................. 128
7.1　连接R 与Spark：sparklyr 包简介 ...............................128
7.2　基本操作指南 ...............................130
7.3　存储机制简介 ...............................135
7.4　分布式计算 ..................136
第4 部分实战应用................. 139
第8 章航班飞行数据演练..................... 140
8.1　nycflights13 数据集探索 ...........................140
8.2　flights14 数据集探索 ....................148
第9 章测试..................... 155
第10 章实用数据处理技巧..................... 157
10.1　数据存取 ....................157
10.1.1　令人头疼的编码格式（encoding） ..............................157
10.1.2　读写性能竞速赛（fstfeather & data.tablereadr） ....................158
10.1.3　数据存取转换的瑞士军刀（rio） ...................162
10.2　并行计算（doParallel） .........................164
10.3　混合编程 ....................168
第11 章实战案例：网络爬虫与文本挖掘............................. 173
11.1　网络爬取（rvest） .....................174
11.2　文本挖掘（tidytext）.................177
第12 章实战案例：数据塑型与可视化（ggplot2）.....................180
12.1　数据准备 ....................181
12.2　柱状图（geom_bar） .................182
12.3　折线图（geom_line） ................183
12.4　饼图（ggpie） ............................184
12.5　一行代码实现一页多图（gridExtra） .......................186
第13 章实战案例：机器学习.................. 193
13.1　机器学习概述 .............................193
13.2　为什么要做机器学习 .................193
13.3　如何入门机器学习 .....................194
13.4　数据处理与机器学习 .................195
13.5　案例分析：信贷风险预测模型构建 ...........................195
致谢..............................204

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.