新書推薦:
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:HK$
221.8
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:HK$
132.2
《
南方谈话:邓小平在1992
》
售價:HK$
80.6
《
纷纭万端 : 近代中国的思想与社会
》
售價:HK$
109.8
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:HK$
168.0
《
朋党之争与北宋政治·大学问
》
售價:HK$
99.7
《
甲骨文丛书·波斯的中古时代(1040-1797年)
》
售價:HK$
88.5
《
以爱为名的支配
》
售價:HK$
62.7
編輯推薦:
微软MVP通过讲解Power Query数据集成→数据清洗→数据重构,教你从几百条到数万条记录的处理和分析方法(无论是Excel还是Power BI中的Power Query都适用),配套作者亲自讲解视频。
內容簡介:
《Power Query从入门到精通》从 Excel 处理大型数据的缺点开始讲起,逐步讲解了 Excel 和 Power BI 中的 Power Query 组件,并重点介绍了Power Query 的底层 M 语言的应用知识。
《Power Query从入门到精通》分为 10 章,主要讲解了 Power Query 的入门知识和数据集成、Power Query 的 M 语法规则系列知识,针对 Power Query 如何实现数据清洗和重构系列知识做了详细的讲解,还重点介绍了目前 Power Query 的各类内置函数的功能,最后介绍了如何利用自定义函数实现复杂的数据处理和重构过程。
《Power Query从入门到精通》内容通俗易懂,案例丰富,实用性强,特别适合入门级数据分析人员学习,也适合进阶阅读,相信通过阅读《Power Query从入门到精通》,读者对数据分析过程中的清洗和重构会有一个新的认识。
關於作者:
徐鹏
----------------------------
徐鹏,微软最有价值专家MVP、微软公共论坛版主、51CTO特级讲师,原微软中国有限公司工程师,曾为中广核、华为、比亚迪、南航、台积电等中大型企业提供培训及顾问咨询服务。先后就职于宏碁(中国)有限公司、微软(中国)有限公司。为全球500强企业提供各类业务的优化服务及顾问咨询服务,精通数据分析方法论及Windows系统的自动化运维。
目錄 :
第1章 走入Power Query的世界
1.1Excel处理数据的缺点2
1.2Excel的Power数据处理组件3
1.3Power Query组件5
1.3.1Excel的Power Query组件8
1.3.2Power BI的Power Query数据导入界面10
1.4Power Query编辑器11
1.4.1Excel的Power Query编辑器
界面12
1.4.2Power BI的Power Query编辑器
界面14
1.4.3Excel在Power Query数据处理中的优势17
1.4.4Power BI在Power Query数据处理上的优势18
1.5Power Query的底层语言——M语言21
1.6本章总结24
第2章 Power Query的数据集成
2.1Power Query的CSV/TXT 数据集成26
2.1.1Excel 导入CSV数据26
2.1.2Power BI导入CSV数据30
2.2Power Query的Excel数据集成32
2.2.1Excel中的Excel数据导入与
集成32
2.2.2Power BI中的Excel数据导入与
集成34
2.3Excel 导入当前表格中的数据35
2.4XML格式数据集成37
2.4.1Excel 实现XML 数据的集成37
2.4.2Power BI 导入XML格式数据40
2.5JSON格式数据集成42
2.5.1Excel实现JSON数据集成43
2.5.2Power BI实现JSON数据集成45
2.6文本格式数据集成46
2.6.1Excel以文本格式导入数据47
2.6.2Power BI以文本格式导入数据48
2.7Power Query的SQL Server数据集成50
2.7.1Excel获取SQL Server全部
数据53
2.7.2Excel获取T-SQL 筛选后的
数据54
2.7.3Power BI以导入方式获取SQL
数据56
2.7.4Power BI采用Direct Query获取SQL数据58
2.8Power Query导入Web数据61
2.8.1Excel 实现Web的数据获取62
2.8.2Power BI实现Web的数据获取65
2.9Power Query 导入Web API数据70
2.9.1Excel 实现Web API数据获取71
2.9.2Power BI实现Web API数据获取72
2.10Power Query导入MySQL数据74
2.10.1Excel 实现MySQL 数据获取75
2.10.2Power BI 实现MySQL数据
获取77
2.11Power Query导入文件夹数据79
2.11.1Excel提取文件夹所有文件
数据79
2.11.2Power BI提取文件夹的所有
数据81
2.12Power BI中的数据流服务84
2.12.1Power BI Pro构建数据流服务84
2.12.2Power BI Desktop引用数据流
服务87
2.13数据源访问的权限管理88
2.14本章总结90
第3章 Power Query和M语言
3.1什么是M语言92
3.2M语言支持的基本数据类型96
3.3M语言支持的组合数据类型99
3.4Power Query的M语言结构101
3.5Power Query中M语言的智能提示105
3.6Power Query的M语言变量107
3.7Power Query的M语言参数109
3.8Power Query的M语言流程处理114
3.9Power Query的M语言的错误处理116
3.10Power Query的M语言嵌套119
3.11Power Query的M语言操作符120
3.12M语言的注释130
3.13本章总结131
第4章 Power Query实现数据的清洗和重构
4.1数据清洗遵从的原则133
4.2数据清洗后的操作134
4.3数据清洗和重构具体操作134
4.4Power Query实现数据类型的转换135
4.4.1Excel中数据类型转换135
4.4.2Power BI数据类型转换137
4.5Power Query实现列的删除138
4.6Power Query 实现行的删除139
4.7Power Query保留行操作146
4.8Power Query的数据筛选150
4.9Power Query添加数据列156
4.10Power Query按列分列164
4.11Power Query按列分行172
4.12Power Query的数据转置175
4.13Power Query数据替换176
4.14Power Query数据列交换179
4.15Power Query的数据排序179
4.16Power Query时间表的构建181
4.17本章总结186
第5章 Power Query实现数据合并操作
5.1Power Query数据多重合并操作188
5.2Power Query数据追加合并操作189
5.3Power Query数据横向合并192
5.4数据合并连接关系说明195
5.5Power Query处理缺失值203
5.6Power Query实现数据的分组207
5.7Power Query实现数据的透视217
5.8Power Query实现数据的逆透视219
5.9本章总结220
第6章 Power Query查询连接的分享与刷新
6.1Power Query数据连接的分享与重用222
6.2Excel中的Power Query连接与复制222
6.3Power Query连接的导出与导入226
6.4Power Query 的数据刷新229
6.4.1Excel的刷新功能230
6.4.2Power BI的刷新功能238
6.5本章总结247
第7章 Power Query的函数
7.1Power Query函数的获取与使用249
7.2Power Query文件系列访问函数259
7.2.1CSV文件解析260
7.2.2Excel 文件内表解析261
7.2.3引用第三方Excel数据263
7.2.4XML文件解析263
7.2.5JSON文件解析264
7.3数据库访问函数265
7.3.1Access 数据库访问265
7.3.2SQL Server 数据库访问266
7.3.3MySQL数据库访问266
7.4Web访问函数267
7.4.1Web.Contents函数267
7.4.2Web.Page 函数267
7.4.3Web.BrowserContents 函数268
7.4.4Html.Table 函数268
7.5Power Query文本处理函数269
7.5.1Text.Length计算字符串长度269
7.5.2Text.Insert插入字符串270
7.5.3Text.From 将其他数据类型转换为
文本类型270
7.5.4Text.Format 设置文本输出格式271
7.5.5Text.Tolist 将文本转换为列表271
7.5.6Text.Start截取字符串中前面的
字符272
7.5.7Text.Select删除不需要的字
符串272
7.5.8Text.Middle 截取中间部分字符273
7.5.9Text.End截取从设定位置到结尾的字符273
7.5.10Text.Range 获取字符串范围
数据274
7.5.11Text.Replace 替换特定数据274
7.5.12Text.ReplaceRange替换区域
数据274
7.5.13Text.Repeat重复文本275
7.5.14Text.Combine合并文本275
7.5.15Text.Trim删除前后特定字符276
7.5.16Text.Padstart 占位符填充277
7.5.17Text.Split字符串分隔278
7.5.18Text.BeforeDelimiter获取分隔符前的数据278
7.5.19Text.AfterDelimiter获取分隔符后的数据279
7.5.20Text.BetweenDelimiters获取分隔符中间值280
7.6Power Query列表处理函数280
7.6.1List.Accumulate列表累加器
计算281
7.6.2List.Range获取列表区域281
7.6.3List.Average计算列表平均数282
7.6.4List.Sum对列表求和282
7.6.5List.Combine合并列表283
7.6.6List.Count统计列表元素283
7.6.7List.Dates 创建日期列表284
7.6.8List.LastN获取列表最后N个
元素284
7.6.9List.MaxN 获取最大数据285
7.6.10List.Numbers 生成数值列表286
7.6.11List.Product列表元素乘积287
7.6.12List.Random生成随机数列表287
7.6.13List.RemoveFirstN删除列表前面N个数值288
7.6.14List.RemoveItems 删除列表项288
7.6.15List.RemoveRange删除列表区间
数值289
7.6.16List.Repeat重复列表数据290
7.6.17List.ReplaceRange 替换列表
区间290
7.6.18List.Select筛选列表291
7.6.19List.Skip实现列表行跳跃291
7.6.20List.Sort列表排序292
7.6.21List.Split列表分割292
7.6.22List.Union对列表非重复数据进行合并293
7.6.23List.Generate生成列表293
7.6.24List.Zip 列表提取与组合294
7.7Power Query记录处理函数295
7.7.1Record.AddField 添加记录字段
功能295
7.7.2Record.Combine 记录连接295
7.7.3Record.FromList将列表转换
记录296
7.7.4Record.RemoveFields删除字段296
7.7.5Record.SelectFields 选择记录297
7.7.6Record.Tolist将记录转换为
列表297
7.8Power Query表处理函数298
7.8.1Table.AddColumn在表中添加并计算列298
7.8.2Table.AddIndexColumn为表添加索引列299
7.8.3Table.AddJoinColumn添加嵌
套表299
7.8.4Table.AlternateRows行跳跃300
7.8.5Table.Combine合并数据表301
7.8.6Table.DemoteHeaders实现表标题
降级301
7.8.7Table.Distinct获取表唯一值302
7.8.8Table.ExpandListColumn扩展
列表303
7.8.9Table.ExpandRecordColumn 扩展记录列304
7.8.10Table.ExpandTableColumn扩展表数据304
7.8.11Table.FindText 查找内容305
7.8.12Table.FirstN 获取前面的表
数据305
7.8.13Table.Group对表数据聚合307
7.8.14Table.Join进行表连接307
7.8.15Table.LastN获取表最后几行
数据308
7.8.16Table.MaxN求表中最大的N个
数据309
7.8.17Table.MinN求表中最小的N个
数据310
7.8.18Table.PromoteHeaders将第一行提升为标题行311
7.8.19Table.Range选择区域行312
7.8.20Table.RemoveColumns 删除列313
7.8.21Table.RemoveFirstN删除表前面
的行313
7.8.22Table.RemoveLastN删除表后面
的行314
7.8.23Table.Repeat实现表行重复315
7.8.24Table.ReplaceRows 替换数
据行316
7.8.25Table.ReplaceValue替换数
据值317
7.8.26Table.SelectRows 筛选数据318
7.8.27Table.Skip实现表的行跳跃318
7.8.28Table.Sort对表排序319
7.8.29Table.Transpose互换行列320
7.9Power Query URL处理函数321
7.9.1Uri.BuildQueryString构建URL访问地址参数321
7.9.2Uri.Combine合并URL访问
地址321
7.10Power Query数据合并函数322
7.10.1Combiner.CombineTextByDelimiter 以分隔符方式合并字符322
7.10.2Combiner.CombineTextByEachDe-limiter按顺序分隔符合并文本323
7.11Power Query数据分割函数324
7.11.1Splitter.SplitTextByDelimiter按分隔符拆分数据324
7.11.2Splitter.SplitTextByEachDelimiter按分隔符列表拆分数据324
7.11.3Splitter.SplitTextByLengths按照长度拆分数据325
7.11.4Splitter.SplitTextByRepeatedLength按字符长度重复拆分325
7.11.5SplitTextByPositions按位置
拆分326
7.12Power Query日期时间函数327
7.12.1Date.Day获取日期部分327
7.12.2Date.DayOfWeek求取日期位于一周中的第几天327
7.12.3Date.DayOfYear求取日期位于一年中的第几天328
7.12.4Date.DaysInMonth求取日期所在月份的天数328
7.12.5Date.FromText将文本生成
日期328
7.12.6Date.AddDays日期的加减329
7.12.7Date.AddMonths月度加减
运算329
7.12.8Date.AddYears年度加减运算330
7.12.9Date.ToText将日期转换为
文本330
7.12.10Date.ToRecord将日期转换为
记录331
7.12.11DateTime.LocalNow获取当前
时间331
7.13本章总结331
第8章 Power Query的自定义函数
8.1从零开始构建自定义函数334
8.1.1无参数自定义函数构建335
8.1.2有参数自定义函数构建336
8.2基于数据结果建立函数337
8.3执行并获取自定义函数结果340
8.4自定义函数提取文件夹内所有请假
数据341
8.5自定义函数获取基金即时净值348
8.6本章总结353
第9章 Power Query与Python
9.1Power Query调用Python的前置
条件355
9.2Python环境的安装与部署355
9.3Power BI 启用Python 支持358
9.3.1Power Query执行Python验证358
9.3.2Power Query结合Python生成中文词云361
9.4本章总结365
第10章 Power Query数据综合应用案例
10.1身份证信息的初步导入368
10.2身份证号码数据初步清洗369
10.3身份证数据二次清洗373
10.4非中文姓名数据清洗375
10.5本章总结377
附录Power Query 简单案例处理378
內容試閱 :
其实编写本书是一件非常偶然的事情,人到中年开始思考人生,总得给自己的前半生来一个总结,况且写作也是我小时候的梦想之一。当然这并不是我的第一本书,第一本书现在已经在交付出版的路上。为什么会决定第二本以 Power Query 为主题呢?其实有偶然,也有必然。最近几年,我依然践行在转型的路上,选择的方向和产品以微软为主,这几年也深入地学习了微软的 Power 组件。“一入 Power 深似海,Excel 从此是路人”,Power 系列组件提供的功能让我看到未来数据分析的方向,而且它强大的功能让我对转型数据分析这条路充满信心。如今两年过去了,需要对自己这一阶段的学习做一个总结,也就有了本书的成型。
Power Query 的功能是进行数据的集成和清洗。在来源各异的数据中,没有进行清洗和重构的数
据,我们称为 RAW 数据。RAW 数据不进行清洗和重构则没有意义,让人无所适从。基于这两年对Excel 和 Power BI 的研究,我将个人经验进行总结和优化,形成了本书。读者朋友可以跟随我的学习路径进行 Excel 或 Power BI 的深度学习,完成从基础入门阶段的几百条记录到几万条记录的处理和分析,从基本的数据从业者向最终的数据分析师迈进。由于 Excel 和 Power BI 中的 Power Query 组件略有不同,因此本书将通过两个方向分享 Power Query 组件在 Excel 和 Power BI 中适用的功能。如果大家只是希望了解 Power Query 在相应程序中的功能,可以跳跃性阅读。
这个技术有什么前途
大家谈到 Excel 的自动化处理,就一定会想到 VBS 脚本或 Python,但是不管是 VBS 还是 Python,对于普通的分析人员来说都是会有一些难度的。为了降低自动化数据分析和处理的门槛,微软针对Excel 推出了 Power 系列组件,包括 Power Query、Power Pivot、Power Map、Power View。
Power Query 组件提供了海量数据的清洗和处理功能,将数据的处理范围扩大了多个量级。同时也针对 Oracle 和 MySQL 这样的关系型数据库提供了数据的访问和处理功能。随着数据分析理论和工具的发展,相信 Power Query 也会迎来快速的发展周期。
Power Query 拥有强大的数据处理功能,基于数据清洗语言 M 实现复杂化数据的导入、清洗和重构,这是 Excel 本身所不具备的功能。
通过 Power Query 的自定义函数,我们可以实现多个数据源数据的提取。例如,针对多个请假表单的数据提取和合并都是 Power Query 的标准功能,Power Query 的自定义函数还能够提供针对 Web API的 JSON 数据获取,这些功能都非常强大。
Power Query 大大扩展了 Excel 的使用场景,将 Excel 从传统的数据处理和存储变成桌面型海量数据清洗和重构的工具,同时能与 Power BI 的产品组件实现互联互通。相信通过 Power Query 的学习,你一定会成为一个轻量级工具使用的数据分析师。
本书特色 视频教学:本书提供相关的视频教程,可以更好地辅助 Power Query 的学习。从零开始:不管你处于数据处理的哪个阶段,通过本书的学习都能学到相应知识,从而受益匪浅。经验总结:全面总结了数据分析和数据清洗方面的经验。内容实用:针对复杂的知识点都有相对应的案例辅助讲解。 本书读者对象 Excel 数据处理人员。Excel 数据分析师。Power BI 数据分析师。高等学校数据分析相关专业学生。对 Excel 有兴趣的人员。对 Power BI 有兴趣的人员。有志于数据分析的人员。 资源下载
本书所涉及的视频已上传至百度网盘,供读者下载。请读者关注封底“博雅读书社”微信公众号,
找到“资源下载”栏目,输入图书 77 页的资源下载码,根据提示获取。
在学习过程中,制订学习计划是必须的,否则书很快就会被我们遗忘在某
个角落。为了让大家在看书过程中能够获得答疑服务,我建立了一个微信群,
帮助读者能够在阅读过程中快速地互助和得到我的答疑。如果对书中的内容有
疑问或者希望了解更多有关数据分析的内容,欢迎与我直接讨论。