新書推薦:
《
女人的中国医疗史:汉唐之间的健康照顾与性别
》
售價:HK$
103.8
《
资治通鉴熊逸版:第四辑
》
售價:HK$
470.8
《
中国近现代名家精品——项维仁:工笔侍女作品精选
》
售價:HK$
66.1
《
宋瑞驻村日记(2012-2022)
》
售價:HK$
115.6
《
汗青堂丛书138·帝国的切口:近代中国口岸的冲突与交流(1832-1914)
》
售價:HK$
127.4
《
人世事,几完缺 —— 啊,晚明
》
售價:HK$
115.6
《
樊树志作品:重写明晚史系列(全6册 崇祯传+江南市镇的早期城市化+明史十二讲+图文中国史+万历传+国史十六讲修订版)
》
售價:HK$
498.0
《
真谛全集(共6册)
》
售價:HK$
1156.4
|
編輯推薦: |
《谁说菜鸟不会数据分析》系列自面世以来赢得众多有分量的行业奖项,影响几十万读者
Python篇系小蚊子数据分析团队精心打磨的又一力作
沈浩教授、《数据化管理》作者黄成明、《统计之美》作者李舰博士、张文彤博士、路人甲TM等专家力荐
|
內容簡介: |
《谁说菜鸟不会数据分析(Python篇)》从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式。
《谁说菜鸟不会数据分析(Python篇)》定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓师傅领进门,修行在个人。
|
關於作者: |
方小敏,数据分析实战公众号主理人,资深机器学习工程师;曾服务于BAT等知名互联网企业,熟练掌握Python、R、Spark、Hive、TensorFlow等工具进行机器学习。
张文霖,新浪博客小蚊子数据分析博主,资深数据分析师,曾服务于国内知名市场研究公司、中国移动等公司,具有多年移动互联网数据分析经验,略懂Excel、PPT、SPSS、水晶易表等工具
|
目錄:
|
第1 章 数据分析概况 1
1.1 数据分析定义(What) 2
1.2 数据分析作用(Why) 4
1.3 数据分析步骤(How) 5
1.3.1 明确分析目的和思路 6
1.3.2 数据收集 7
1.3.3 数据处理 9
1.3.4 数据分析 9
1.3.5 数据展现 10
1.3.6 报告撰写 10
1.4 数据分析的三大误区 12
1.5 常用的数据分析工具 13
1.5.1 Excel 13
1.5.2 SPSS 14
1.5.3 R语言 15
1.5.4 Python语言 16
第2 章 Python 概况 17
2.1 Python简介 18
2.2 Python特点 19
2.3 Python模块 20
2.3.1 函数 20
2.3.2 模块 24
2.4 Python使用场景 27
2.5 Python 2与Python 3 28
2.6 Python与数据科学 29
2.7 Anaconda简介 30
2.8 安装Anaconda 31
2.8.1 下载Anaconda 31
2.8.2 安装Anaconda 33
2.9 使用Anaconda 37
2.9.1 PyCharm 与Spyder 37
2.9.2 Anaconda 开始菜单 38
2.9.3 Spyder 工作界面简介 39
2.9.4 项目管理 40
2.9.5 代码提示 43
2.9.6 变量浏览 44
2.9.7 图形查看 44
2.9.8 帮助文档 45
第3 章 编程基础 47
3.1 数据类型 48
3.1.1 数值型 48
3.1.2 字符型 50
3.1.3 逻辑型 56
3.2 赋值和变量 57
3.2.1 赋值和变量 57
3.2.2 变量命名规则 58
3.3 数据结构 59
3.3.1 列表 59
3.3.2 字典 63
3.3.3 序列 66
3.3.4 数据框 72
3.3.5 四种数据结构的区别 80
3.4 向量化运算 81
3.5 for 循环 83
3.6 Python 编程注意事项 87
第4 章 数据处理 90
4.1 数据导入与导出 91
4.1.1 数据导入 91
4.1.2 数据导出 99
4.2 数据清洗 100
4.2.1 数据排序 101
4.2.2 重复数据处理 102
4.2.3 缺失数据处理 106
4.2.4 空格数据处理 109
4.3 数据转换 110
4.3.1 数值转字符 110
4.3.2 字符转数值 112
4.3.3 字符转时间 113
4.4 数据抽取 115
4.4.1 字段拆分 116
4.4.2 记录抽取 121
4.4.3 随机抽样 127
4.5 数据合并 130
4.5.1 记录合并 130
4.5.2 字段合并 133
4.5.3 字段匹配 135
4.6 数据计算 140
4.6.1 简单计算 140
4.6.2 时间计算 141
4.6.3 数据标准化 142
4.6.4 数据分组 144
第5 章 数据分析 148
5.1 对比分析 149
5.2 基本统计分析 152
5.3 分组分析 155
5.4 结构分析 158
5.5 分布分析 159
5.6 交叉分析 162
5.7 RFM 分析 164
5.8 矩阵分析 173
5.9 相关分析 176
5.10 回归分析 178
5.10.1 回归分析简介 178
5.10.2 简单线性回归分析 180
5.10.3 多重线性回归分析 185
第6 章 数据可视化 189
6.1 数据可视化简介 190
6.1.1 什么是数据可视化 190
6.1.2 数据可视化常用图表 190
6.1.3 通过关系选择图表 191
6.2 散点图 192
6.3 矩阵图 203
6.4 折线图 210
6.5 饼图 215
6.6 柱形图 217
6.7 条形图 222
|
內容試閱:
|
《谁说菜鸟不会数据分析》系列图书自上市以来,已拥有数十万读者与粉丝,口口相传,成为职场人士案头必备的参考用书。同时非常荣幸地获得书刊发行业协会授予的全行业优秀畅销品种称号,这离不开广大读者的厚爱与支持。有读者告诉我们,每次阅读都会有新的体会与收获,这让我们很开心。
随着云计算、互联网、电子商务和物联网的飞速发展,世界已经逐步迈入大数据时代。数据分析、机器学习等数据科学技术也相应流行起来,主流的数据科学技术,都将Python 作为主要的计算工具。Python 越来越被大家熟悉和认可,成为数据分析师的新宠儿,特别是在互联网行业。
市面上Python 数据分析的相关书籍基本上多数由IT 人员编写,写作角度相对侧重技术层面,很多基础知识点和编写的代码并无详细介绍,并且在数据分析思维体系方面相对薄弱,学习门槛非常高,让非IT 专业朋友学起来较为痛苦。
鉴于此,本书作者于2015 年开始提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧,并录制成了视频课程《Python 数据分析实战》,发布于网易云课堂。课程上线后,受到了大量学员的支持与肯定。同时,课程上线后,根据热心学员的宝贵反馈意见,对课程不断进行升级更新。
通过《Python 数据分析实战》视频课程的录制、升级过程中,沉淀了大量的Python 数据分析实战教学经验。同时大量的学员与读者不断来信咨询希望早日出版《谁说菜鸟不会数据分析(Python篇)》。经过两年时间的打磨,这本书终于与读者见面了。
整个写作过程是艰辛的,但是也很有成就感。
本书从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书与其他《谁说菜鸟不会数据分析》系列图书一样,力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式,如需了解相关的知识,可查阅相关的书籍或资料。
本书的定位是带领Python数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓师傅领进门,修行在个人。
本书结构
本书以数据分析主要流程为主线,介绍如何用Python 进行数据分析。
第1 章 数据分析概况:主要通过3W 模型介绍数据分析相关知识,让读者了解与认识数据分析。
第2 章 Python 概况: 主要介绍了什么是Python,Python 的特点,Python 的函数与模块,Python 的使用场景,以及Anaconda 的安装与使用,让读者了解与认识Python。
第3 章 编程基础:主要介绍了Python 进行数据分析所需要的编程基础,包括数据类型、赋值和变量、数据结构、向量化运算、for 循环,让读者对Python 在数据分析方面的使用有基本的了解与认识。
第4 章 数据处理:主要介绍了在Python 中如何使用Pandas 进行数据处理操作,包括数据导入与导出、数据清洗、数据转换、数据抽取、数据合并、数据计算,让读者能够使用Python 进行常用的数据处理操作。
第5 章 数据分析:主要介绍了在Python 中如何使用Pandas、sklearn 进行相关的数据分析操作,包括描述统计分析、分组分析、结构分析、分布分析、交叉分析、RFM 分析、矩阵分析、相关分析、回归分析等常用分析方法,让读者能够使用Python进行常用的数据分析操作。
第6 章 数据可视化:主要介绍了在Python 中如何使用matplotlib.pyplot 进行常用的数据可视化图形绘制,包括散点图、矩阵图、折线图、饼图、柱形图、条形图,让读者能够使用Python 进行常用的数据可视化图形绘制。
本书主要基于Python 3 进行介绍,故部分方法可能在Python 2 中无法实现。
适合人群
★ 需要提升自身竞争力的职场新人。
★ 从事咨询、研究、分析等专业人士。
★ 在市场营销、产品运营、项目管理、开发运维等工作中需要进行数据分析的
人士。
案例数据下载
本书配套案例数据下载方式:
(1)扫码关注微信订阅号:小蚊子数据分析(wzdata),回复1或Python篇获取案例数据下载链接
(2)http:blog.sina.com.cnxiaowenzi22
致谢
感谢广大读者与学员的支持,让笔者下定决心写这本书。在此要衷心感谢成都道然科技有限责任公司的姚新军先生,感谢他的提议和在写作过程中的支持。感谢参与本书优化的朋友:王斌、李伟、范霈璐、李萍、王晓、景小艳、余松。非常感谢本书的插画师朴提的辛苦劳动,您的作品也让本书增色不少。
感谢沈浩、张文彤、路人甲、黄成明、阿橙、许树淮、肖骁、严婷、刘志军、崔庆才、齐德胜、数据小人、郑来轶、李舰、gashero、肖凯、郑跃平等书评作者,感谢他们在百忙之中抽空阅读书稿,撰写书评,并提出宝贵意见。
最后,要感谢两位作者的家人,感谢他们默默无闻的付出,没有他们的理解与支持,同样也没有本书。
尽管我们对书稿进行了多次修改,仍然不可避免地会有疏漏和不足之处,敬请广大读者批评指正,我们会在适当的时间进行修订,以满足更多人的需要。
|
|