新書推薦:
《
便宜货:廉价商品与美国消费社会的形成
》
售價:HK$
77.3
《
读书是一辈子的事(2024年新版)
》
售價:HK$
79.4
《
乐道文库·什么是秦汉史
》
售價:HK$
82.8
《
汉娜·阿伦特与以赛亚·伯林 : 自由、政治与人性
》
售價:HK$
109.8
《
女性与疯狂(女性主义里程碑式著作,全球售出300万册)
》
售價:HK$
112.7
《
药食同源中药鉴别图典
》
售價:HK$
68.8
《
设计中的比例密码:建筑与室内设计
》
售價:HK$
89.7
《
冯友兰和青年谈心系列:看似平淡的坚持
》
售價:HK$
55.8
|
編輯推薦: |
1.选题方向前沿,复现新的研究成果,包括ResNet、ShuffleNet、SqueezeNet等数据集中的成果;学习先进的算法技术,包括对象检测、目标跟踪、迁移学习以及生成对抗网络等。
2.作者均是深度学习和计算机视觉领域的一线研究人员,拥有多个重大项目的开发落地经验,获得多项科技进步奖。
3.本书深入浅出,用丰富详细的架构图、流程图生动展现,从根源剖析数据流的概念和原理,使晦涩难懂的专业概念清晰呈现。
|
內容簡介: |
本书着重阐述了深度学习时代的计算机视觉算法的工作原理,首先对深度学习与计算机视觉基础进行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测算法、图像分割算法、人体姿态估计算法、行人重识别与目标跟踪算法、人脸识别算法以及图像超分辨率重建方法进行了介绍。本书系统讲解了在日常生活和工作中常见的几项计算机视觉任务,并着重介绍了在当今深度学习时代,这些计算机视觉任务是如何工作的,可使读者快速了解这些算法原理,以及其相互之间的关系。本书适合高年级本科生、研究生、教师,以及对人工智能或计算机视觉算法感兴趣的工程技术人员阅读。
|
關於作者: |
徐从安,工学博士,海军航空大学信息融合研究所副教授,清华大学访问学者,入选中国科协青年人才托举工程。长期从事智能信息处理、计算机视觉研究,主持或参与国家自然科学基金、装备预研等课题项目10余项,相关成果获省部级科技进步奖4项。发表SCI、EI收录论文30余篇,出版译著1部,授权专利10余项。 李健伟,工学博士,主要研究方向为计算机视觉、雷达和电子对抗等,发表学术论文10余篇,牵头编写学术专著2本,获中国指挥与控制学会科学技术奖二等奖1项,构建了国内外首个用于SAR图像船舶目标检测的数据集SSDD。 董云龙,工学博士,海军航空大学信息融合研究所教授,主要研究方向为雷达信息处理、多源信息融合,主持雷达杂波抑制、目标检测、误差配准等相关科研项目20余项,曾获国家科技进步奖二等奖,省部级科技进步奖一等奖、二等奖共5项。 孙超,工学博士,主要研究方向为图像处理、计算机视觉等,发表SCI、EI收录论文10余篇,参与编写学术专著2本,授权专利2项。
|
目錄:
|
第 1章 深度学习与计算机视觉基础 001
1.1 人工智能简介 002
1.2 深度学习的崛起以及存在的问题 003
1.3 神经网络的基本概念 004
1.3.1 前馈神经网络 005
1.3.2 反向传播算法 005
1.3.3 权重系数更新 007
1.4 卷积神经网络原理 007
1.4.1 CNN的起源与发展 008
1.4.2 CNN结构简介 009
1.4.3 CNN的其他组件 016
1.5 计算机视觉简介 019
参考文献 020
第 2章 基于深度学习的图像分类算法 023
2.1 图像分类——从特征设计到卷积神经网络结构设计 024
2.2 卷积神经网络结构演化 026
2.2.1 从LeNet到VGG 026
2.2.2 Inception系列 028
2.2.3 ResNet系列 029
2.2.4 DenseNet系列 031
2.2.5 SqueezeNet系列 033
2.2.6 ShuffleNet系列 034
2.2.7 MobileNet系列 035
2.3 神经架构搜索 037
2.4 CNN的计算量与参数计算方法 037
2.5 小结 038
参考文献 039
第3章 基于深度学习的目标检测算法 043
3.1 目标检测——从特征设计到深度学习 044
3.1.1 任务简介 044
3.1.2 传统的目标检测算法 045
3.1.3 基于深度学习的目标检测方法 046
3.2 目标检测的重要概念 047
3.2.1 交并比和非极大值抑制 047
3.2.2 难负样本挖掘 048
3.2.3 边框回归 049
3.2.4 检测任务中的数据增广 050
3.2.5 先验框/默认边框/锚框 050
3.2.6 锚框与真实边框的匹配策略 051
3.2.7 感受野 051
3.2.8 RoI特征图映射 052
3.3 双阶段检测算法 054
3.3.1 从R-CNN到Fast R-CNN 054
3.3.2 Faster R-CNN算法原理 057
3.4 单阶段检测算法 061
3.4.1 YOLO检测算法 061
3.4.2 SSD检测算法 067
3.5 融合单阶段和双阶段的算法 073
3.5.1 单阶段检测算法及双阶段检测算法的特点 073
3.5.2 RefineDet:结合单阶段及双阶段优点 074
3.6 从头训练的检测算法 075
3.6.1 从头训练的检测算法简介 075
3.6.2 精心设计CNN实现从头训练 076
3.6.3 从头训练的本质 077
3.7 检测任务中的级联设计 079
3.7.1 传统的级联检测算法 079
3.7.2 深度学习下的级联检测 079
3.8 多尺度目标检测 081
3.8.1 问题描述以及常用方法 081
3.8.2 多尺度训练/测试 082
3.8.3 特征金字塔融合多层特征 082
3.8.4 小尺寸目标检测 086
3.9 检测任务中的不平衡处理策略 087
3.9.1 双阶段中的不平衡策略 087
3.9.2 单阶段中的不平衡策略 088
3.10 锚框的轮回 089
3.10.1 锚框的起源 089
3.10.2 现有检测算法中锚框的设计方法 090
3.10.3 锚框存在的问题 091
3.10.4 不需要锚框的算法 092
3.11 目标检测的骨干网络设计 092
3.12 检测算法加速 093
3.12.1 检测流程的加速 094
3.12.2 检测算法的轻量级网络 094
3.13 自然场景文字检测 095
3.14 遥感图像目标检测 096
3.15 常用数据集和评价指标 098
参考文献 099
第4章 基于深度学习的图像语义分割算法 103
4.1 图像语义分割简介 104
4.2 语义分割研究难点 105
4.3 语义分割算法模型 106
4.3.1 全卷积网络基础算法:FCN算法 106
4.3.2 编码 解码结构算法:U-Net算法 109
4.3.3 空洞卷积的应用:DeepLab系列 111
4.4 图像实时语义分割 117
4.4.1 实时语义分割简介 117
4.4.2 ENet算法 118
4.5 图像分割数据集以及评价指标 122
4.5.1 图像分割数据集 122
4.5.2 语义分割评估指标 123
参考文献 124
第5章 基于深度学习的人体姿态估计算法 127
5.1 人体姿态估计任务简介 128
5.1.1 任务简介 128
5.1.2 面临的挑战 130
5.1.3 方法概述 130
5.2 单人姿态估计 132
5.3 自顶向下的多人姿态估计 133
5.4 自底向上的多人姿态估计 134
5.5 常用数据集以及评价指标 136
参考文献 136
第6章 基于深度学习的行人重识别与目标跟踪 139
6.1 行人重识别任务简介 140
6.1.1 任务简介 140
6.1.2 工作流程 141
6.1.3 面临的挑战 142
6.1.4 与行人跟踪和人脸验证的关系 143
6.1.5 行人重识别数据集及评价指标 144
6.2 特征提取和相似度度量 144
6.3 行人重识别:从全局特征到局部特征 145
6.4 行人重识别:从表征学习到度量学习 148
6.5 目标跟踪任务简介 149
6.6 基于相关滤波的目标跟踪算法 150
6.7 基于孪生网络的跟踪算法 151
参考文献 153
第7章 基于深度学习的人脸识别 155
7.1 任务简介 156
7.1.1 人脸验证和人脸识别的区别 156
7.1.2 图像分类和人脸识别的异同 157
7.1.3 技术难点 157
7.1.4 人脸识别算法原理 158
7.2 Softmax原理及存在的问题 160
7.2.1 Softmax函数和Softmax损失 160
7.2.2 Softmax存在的问题 161
7.3 度量损失 162
7.3.1 对比损失 162
7.3.2 三元组损失 163
7.4 大间隔损失 165
7.4.1 L-Softmax 165
7.4.2 SphereFace 166
7.4.3 CosFace 167
7.4.4 ArcFace 167
7.4.5 大间隔损失总结 168
7.5 特征规范化和权重规范化 171
参考文献 172
第8章 基于深度学习的图像超分辨率重建方法 175
8.1 任务简介 176
8.2 传统方法 179
8.2.1 基于插值的方法 179
8.2.2 基于重建的方法 180
8.2.3 基于学习的方法 180
8.3 基于卷积神经网络的图像超分辨率重建方法 181
8.3.1 网络模型 182
8.3.2 损失函数 184
8.3.3 训练样本 184
8.3.4 训练策略 185
8.4 常用数据集与评价指标 186
参考文献 187
|
|