新書推薦:
《
中国王朝内争实录:宠位厮杀
》
售價:HK$
61.6
《
凡事发生皆有利于我(这是一本读了之后会让人运气变好的书”治愈无数读者的心理自助经典)
》
售價:HK$
44.6
《
未来特工局
》
售價:HK$
55.8
《
高术莫用(十周年纪念版 逝去的武林续篇 薛颠传世之作 武学尊师李仲轩家世 凸显京津地区一支世家的百年沉浮)
》
售價:HK$
54.9
《
英国简史(刘金源教授作品)
》
售價:HK$
98.6
《
便宜货:廉价商品与美国消费社会的形成
》
售價:HK$
77.3
《
读书是一辈子的事(2024年新版)
》
售價:HK$
77.3
《
乐道文库·什么是秦汉史
》
售價:HK$
80.6
|
編輯推薦: |
来自一直盛产人工智能黑科技的神秘之师,他们也是开源分布式系统ytk-learn和ytk-mp4j的作者。 用一线工程视角,透过关键概念、模型、算法原理和实践经验,为入坑者破解深度学习炼金术。 算法、代码容易获取,结合产品需求落地机器学习才是难题,本书旨在让算法真正在团队扎根长大。 胸怀全局、了如指掌才能在实践中少走弯路,用理论滋养创新能力,这也是本书导向的至臻境界。
|
內容簡介: |
本书主要介绍深度学习的核心算法,以及在计算机视觉、语音识别、自然语言处理中的相关应用。本书的作者们都是业界*线的深度学习从业者,所以书中所写内容和业界联系紧密,所涵盖的深度学习相关知识点比较全面。本书主要讲解原理,较少贴代码。本书适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程来大致了解深度学习的相关前沿技术。
|
關於作者: |
猿辅导应用研究团队成立于2014年年中,一直从事深度学习在教育领域的应用和研究工作。团队成员均毕业于北京大学、清华大学、上海交大、中科院、香港大学等知名高校,大多数拥有硕士或博士学位。研究方向涵盖了图像识别、语音识别、自然语言理解、数据挖掘、深度学习等领域。团队成功运用深度学习技术,从零开始打造出活跃用户过亿的拍照搜题APP小猿搜题,开源了分布式机器学习系统ytk-learn和分布式通信系统ytk-mp4j。此外,团队自主研发的一系列成果均成功应用到猿辅导公司的产品中。包括:速算应用中的在线手写识别、古诗词背诵中的语音识别、英语口语智能批改、英文手写拍照识别和英语作文智能批改等技术。
|
目錄:
|
目录
第1 部分深度学习基础篇1
1 概述2
1.1 人工智能. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 人工智能的分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 人工智能发展史. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 机器学习. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 机器学习的由来. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 机器学习发展史. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 机器学习方法分类. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 机器学习中的基本概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 神经网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1 神经网络发展史. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 神经网络17
2.1 在神经科学中对生物神经元的研究. . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 神经元激活机制. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 神经元的特点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 神经元模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 线性神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 线性阈值神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.3 Sigmoid 神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.4 Tanh 神经元. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.5 ReLU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.6 Maxout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.7 Softmax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.8 小结. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 感知机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1 感知机的提出. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 感知机的困境. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 DNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1 输入层、输出层及隐层. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.2 目标函数的选取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.3 前向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.4 后向传播. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.5 参数更新. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.6 神经网络的训练步骤. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 初始化模型38
3.1 受限玻尔兹曼机. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.1.1 能量模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.1.2 带隐藏单元的能量模型. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.1.3 受限玻尔兹曼机基本原理. . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.4 二值RBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1.5 对比散度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.1 稀疏自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.2 降噪自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.3 栈式自动编码器. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 深度信念网络. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4 卷积神经网络53
4.1 卷积算子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2 卷积的特征. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3 卷积网络典型结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3.1 基本网络结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3.2 构成卷积神经网络的层. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3.3 网络结构模式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.4 卷积网络的层. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.1 卷积层. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.2 池化层. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5 循环神经网络68
5.1 循环神经网络简介. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.2 RNN、LSTM 和GRU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.3 双向RNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.4 RNN 语言模型的简单实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6 深度学习优化算法81
6.1 SGD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2 Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.3 NAG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.4 Adagrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.5 RMSProp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.6 Adadelta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.7 Adam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.8 AdaMax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.9 Nadam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.10 关于优化算法的使用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7 深度学习训练技巧94
7.1 数据预处理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.2 权重初始化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.3 正则化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.1 提前终止. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.2 数据增强. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.3 L2L1 参数正则化. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.3.4 集成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
7.3.5 Dropout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8 深度学习框架103
8.1 Theano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.1.1 Theano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
|
內容試閱:
|
前言
本书的大部分作者在深度学习流行之前有幸从事机器学习相关工作多年。在我们内部,
一直认同一个段子:有多少人工就有多少智能。
? 在深度学习流行之前的传统机器学习年代,我们认为人工更多强调的是特征工程
之难,需要机器学习从业者不断分析数据,挖掘新的特征。
? 在深度学习流行的这几年,我们认为这句话依然成立,只是人工更多地强调人工
标注,因为深度学习需要大量的标注数据。当然,也有人反驳说不需要标注,用户的
使用历史天然就是标注。实际上,这可以理解为一种众筹标注。
? 在深度学习发展的未来,我们希望这句话不再成立,期待无监督模型取得更长足的进
步,使得人工智能变为真正的智能。
在追求智能的路上,我们虽然是创业公司,但一直坚持机器学习相关课程的学习和Paper
Reading,陆续学习了传统的机器学习相关算法,也探索了深度学习的相关原理,并不断应用
到实践中。
受益于当今学术开放开源的氛围,深度学习的最新算法甚至代码实践大家都能在第一
时间进行学习。所以在创业公司的早期深度学习实践中,最重要的并不是算法理论方面的创
新,而是结合产品需求如何进行深度学习技术的落地。这需要团队不仅对业务非常熟悉,也
需要对深度学习相关算法了如指掌,同时还需要有人可以将算法真正用代码落地。很幸运,
我们的团队具备这样的能力,所以在深度学习的实践中较少走弯路。随着多年的积累,团队
在深度学习方面开始有不少自己的创新,也对理论有了整体的认识。从2016 年下半年开始,
团队部分成员利用周末等业余时间撰写了这本书,算是对团队过去所学深度学习知识的一个
总结。本书的撰写都是大家牺牲周末时间完成的,且在撰写过程中,碰到多次项目进度非常
紧急的情况,周末时间也被项目占用,但大家还是克服困难,完成了书稿,非常感谢这些作
者的配合!此外,猿辅导研究团队的大部分成员参与了审稿相关工作,在此一并表示感谢!
当然,本书撰写较仓促,作者人数也较多,错误和不足在所难免,烦请读者及时反馈,
我们将及时纠正。
在这个过程中,有了一点点微不足道的积累。希望通过本书,对过去学过的知识做一些
总结归纳,同时分享出来让更多的深度学习爱好者一起受益。
写作分工
朱珊珊编写了第1 章的1.2.1 节主要部分、1.3 节,第2 章的绝大部分内容,第13 章。
邓澍军编写了前言,第1 章的1.1 节、1.2.2 节至1.2.4 节,第2 章的2.2.2 节、2.2.6 节至
2.2.8 节,第3 章,第6 章的6.1 节、6.2 节,第7 章,第8 章的8.1 节,第9 章,第10 章的
10.6 节、10.7 节,第11、17、18、21 章,第25 章的25.3 节。
陈孟阳编写了第4、10 章。
孙萌编写了第5、22 章。
冯超编写了第6 章的6.3 节至6.10 节,第8 章的8.3 节、8.5 节至8.7 节,第27、28 章。
曹月恬编写了第8 章的8.2 节、8.4 节,第24 章。
杨晓庆编写了第12、26 章。
夏龙编写了第14、15 章,第16 章的16.1 节、16.2 节、16.5 节、16.6 节。
吴凡编写了第16 章的16.3 节、16.4 节。
赵薇编写了第19 章。
陈冬晓编写了第20 章。
赵玲玲编写了第23 章。
王锐坚编写了第25 章。
本书特点
本书首先介绍了深度学习的一些基本原理,然后介绍了计算机视觉、语音识别、自然语
言处理的相关应用,最后介绍了一些较前沿的研究方向。
本书具有如下特点:
? 计算机视觉、语音识别、自然语言处理这三方面的介绍内容绝大部分是作者团队有过
相关实践和研究的方向,和业界联系紧密。
? 所涵盖的深度学习相关知识点比较全面。
? 干货:主要讲解原理,较少贴代码。
本书的篇章脉络如下:
本书读者
本书适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程大致了
解深度学习的相关前沿技术。
关于团队
猿辅导研究团队成立于2014 年,是创业公司中较早从事深度学习的团队。该团队陆续
将深度学习应用于如下领域:
? 拍照印刷体OCR(Optical Character Recognition,光学字符识别):从0 开始打造拍照
搜题APP 小猿搜题(目前累计安装量达1.6 亿次)。
? 拍照手写体OCR:包括斑马速算产品中的屏幕手写笔迹的在线手写识别、拍照手写
图片的离线手写识别、与公务员考试相关的申论手写识别等。
? 语音识别:包括古诗词背诵、高考听说自动判卷、英语口语打分等项目。
? 自然语言处理:主要应用于英语作文自动批改、自动判卷、短文本对话等项目。
关于公司
猿辅导公司是中国领先的移动在线教育机构,拥有中国最多的中学生移动用户,以及
国内最大的中学生练习行为数据库,旗下有猿题库、小猿搜题、猿辅导三款移动教育APP。
2017 年6 月猿辅导获得由华平投资集团领投、腾讯跟投的1.2 亿美元E 轮融资,估值超过10
亿美元,成为国内K-12 在线教育领域首个独角兽公司。
|
|