新書推薦:
《
大模型启示录
》
售價:HK$
112.0
《
东法西渐:19世纪前西方对中国法的记述与评价
》
售價:HK$
201.6
《
养育男孩:官方升级版
》
售價:HK$
50.4
《
小原流花道技法教程
》
售價:HK$
109.8
《
少女映像室 唯美人像摄影从入门到实战
》
售價:HK$
110.9
《
詹姆斯·伍德系列:不负责任的自我:论笑与小说(“美国图书评论奖”入围作品 当代重要文学批评家詹姆斯·伍德对“文学中的笑与喜剧”的精湛研究)
》
售價:HK$
87.4
《
武当内家散手
》
售價:HK$
50.4
《
诛吕:“诸吕之乱”的真相与吕太后时期的权力结构
》
售價:HK$
99.7
|
編輯推薦: |
本书详细讲解了36个计算机视觉与深度学习实战案例(含可运行程序),涉及雾霾去噪、答题卡自动阅卷、肺部图像分割、小波数字水印、图像检索、人脸二维码识别、车牌定位及识别、霍夫曼图像压缩、手写数字识别、英文字符文本识别、眼前节组织提取、全景图像拼接、小波图像融合、基于语音识别的音频信号模拟灯控、路面裂缝检测识别、视频运动估计追踪、Simulink图像处理、胸片及肝脏分割、基于深度学习的汽车目标检测、基于计算机视觉的自动驾驶应用、基于深度学习的视觉场景识别、基于深度特征的以图搜画、基于CNN的字符识别、基于CNN的物体识别、基于CNN的图像矫正、基于LSTM的时间序列分析、基于深度学习的以图搜图技术、基于YOLO的智能交通目标检测等多项重要技术及应用
本书涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习理论及其应用方面。本书对每个数字图像处理的知识点都提供了丰富、生动的案例素材,并以MATLAB、Python为工具详细讲解了实验的核心程序。
通过对这些程序的阅读、理解和仿真运行,读者可以更加深刻地理解图像处理的内容,并且更加熟练地掌握计算机视觉及深度学习在不同实际领域中的用法。
|
內容簡介: |
本书详细讲解了36个计算机视觉与深度学习实战案例(含可运行程序),涉及雾霾去噪、答题卡自动阅卷、肺部图像分割、小波数字水印、图像检索、人脸二维码识别、车牌定位及识别、霍夫曼图像压缩、手写数字识别、英文字符文本识别、眼前节组织提取、全景图像拼接、小波图像融合、基于语音识别的音频信号模拟灯控、路面裂缝检测识别、视频运动估计追踪、Simulink图像处理、胸片及肝脏分割、基于深度学习的汽车目标检测、基于计算机视觉的自动驾驶应用、基于深度学习的视觉场景识别、基于深度特征的以图搜画、基于CNN的字符识别、基于CNN的物体识别、基于CNN的图像矫正、基于LSTM的时间序列分析、基于深度学习的以图搜图技术、基于YOLO的智能交通目标检测等多项重要技术及应用,涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习理论及其应用方面。工欲善其事,必先利其器,本书对每个数字图像处理的知识点都提供了丰富、生动的案例素材,并以MATLAB、Python为工具详细讲解了实验的核心程序。通过对这些程序的阅读、理解和仿真运行,读者可以更加深刻地理解图像处理的内容,并且更加熟练地掌握计算机视觉及深度学习在不同实际领域中的用法。
本书以案例为基础,结构布局紧凑,内容深入浅出,实验简捷高效,适合计算机、信号通信和自动化等相关专业的教师、本科生、研究生,以及广大从事数字图像处理的工程研发人员阅读参考。
|
關於作者: |
刘衍琦,机器学习算法专家及视觉AI课程讲师,擅长视觉智能分析、多源异构数据采集和挖掘等工程化应用,并长期从事视觉大数据工程相关工作,涉及互联网海量图像、声纹、视频检索,以及OCR图文检索、手绘草图智能识别、特殊通道数据分析等应用的算法架构与研发,对图文识别、大规模以图搜图、数据感知和采集等进行过深入研究,并结合行业背景推动了一系列工程化应用。曾主编和参与编写多本书籍。
詹福宇,博士,资深飞行控制算法专家,毕业于西北工业大学航空学院飞行器设计专业。拥有近10年仿真控制开发经验,熟悉Simulink基于模型设计的流程,曾主编和参与编写多本书籍。
王德建,档案管理副研究馆员,毕业于西安建筑科技大学系统工程专业,从事档案数字化、智能化分类、OCR图文检索、图像智能识别相关工作。
刘衍琦,机器学习算法专家及视觉AI课程讲师,擅长视觉智能分析、多源异构数据采集和挖掘等工程化应用,并长期从事视觉大数据工程相关工作,涉及互联网海量图像、声纹、视频检索,以及OCR图文检索、手绘草图智能识别、特殊通道数据分析等应用的算法架构与研发,对图文识别、大规模以图搜图、数据感知和采集等进行过深入研究,并结合行业背景推动了一系列工程化应用。曾主编和参与编写多本书籍。
詹福宇,博士,资深飞行控制算法专家,毕业于西北工业大学航空学院飞行器设计专业。拥有近10年仿真控制开发经验,熟悉Simulink基于模型设计的流程,曾主编和参与编写多本书籍。
王德建,档案管理副研究馆员,毕业于西安建筑科技大学系统工程专业,从事档案数字化、智能化分类、OCR图文检索、图像智能识别相关工作。
陈峰蔚,熟悉机器学习、深度学习及计算机视觉在智能交通、智能驾驶领域的应用,长期从事汽车品牌识别、车型细粒度分类、目标检测与分割方面的相关工作,精通MATLAB、Python编程及TensorFlow深度学习框架,参与了多项专利的设计与开发。
蒋献文,资深专业医事放射师,毕业于中国医药大学医学院临床医学研究所。擅长医学图像处理技术、放射线射影技术及手术房计算机断层与血管摄影技术,在临床放射技术学与图像处理方面进行过深入研究并发表了相关医学论文。
周华英,新能源汽车高级工程师,毕业于北京交通大学交通运输规划与管理专业。长期进行纯电动及混合动力汽车系统建模与控制、汽车动力系统与控制、电动汽车能量管理和控制优化等研究,曾主编和参与编写多本书籍。
|
目錄:
|
第1章 基于直方图优化的图像去雾技术 1 1.1 案例背景 1 1.2 理论基础 1 1.2.1 空域图像增强 1 1.2.2 直方图均衡化 2 1.3 程序实现 3 1.3.1 设计GUI界面 4 1.3.2 全局直方图处理 4 1.3.3 局部直方图处理 6 1.3.4 Retinex增强处理 8 1.4 延伸阅读 12 第2章 基于形态学的权重自适应图像去噪 13 2.1 案例背景 13 2.2 理论基础 14 2.2.1 图像去噪的方法 14 2.2.2 数学形态学的原理 15 2.2.3 权重自适应的多结构形态学去噪 15 2.3 程序实现 16 2.4 延伸阅读 22 第3章 基于多尺度形态学提取眼前节组织 24 3.1 案例背景 24 3.2 理论基础 25 3.3 程序实现 28 3.3.1 多尺度结构设计 28 3.3.2 多尺度边缘提取 29 3.3.3 多尺度边缘融合 31 3.4 延伸阅读 33 第4章 基于Hough变化的答题卡识别 34 4.1 案例背景 34 4.2 理论基础 34 4.2.1 图像二值化 35 4.2.2 倾斜校正 35 4.2.3 图像分割 38 4.3 程序实现 40 4.3.1 图像灰度化 40 4.3.2 灰度图像二值化 41 4.3.3 图像平滑滤波 41 4.3.4 图像矫正 41 4.3.5 完整性核查 42 4.4 延伸阅读 51 第5章 基于阈值分割的车牌定位识别 53 5.1 案例背景 53 5.2 理论基础 53 5.2.1 车牌图像处理 54 5.2.2 车牌定位原理 58 5.2.3 车牌字符处理 58 5.2.4 车牌字符识别 60 5.3 程序实现 62 5.4 延伸阅读 69 第6章 基于分水岭分割进行肺癌诊断 71 6.1 案例背景 71 6.2 理论基础 71 6.2.1 模拟浸水的过程 72 6.2.2 模拟降水的过程 72 6.2.3 过度分割问题 72 6.2.4 标记分水岭分割算法 72 6.3 程序实现 73 6.4 延伸阅读 77 第7章 基于主成分分析的人脸二维码识别 79 7.1 案例背景 79 7.2 理论基础 79 7.2.1 QR二维码简介 80 7.2.2 QR二维码的编码和译码流程 82 7.2.3 主成分分析方法 84 7.3 程序实现 85 7.3.1 人脸建库 85 7.3.2 人脸识别 87 7.3.3 人脸二维码 87 7.4 延伸阅读 92 第8章 基于知识库的手写体数字识别 94 8.1 案例背景 94 8.2 理论基础 94 8.2.1 算法流程 94 8.2.2 特征提取 95 8.2.3 模式识别 96 8.3 程序实现 97 8.3.1 图像处理 97 8.3.2 特征提取 98 8.3.3 模式识别 101 8.4 延伸阅读 102 8.4.1 识别器选择 102 8.4.2 特征库改善 102 第9章 基于特征匹配的英文印刷字符识别 103 9.1 案例背景 103 9.2 理论基础 104 9.2.1 图像预处理 104 9.2.2 图像识别技术 105 9.3 程序实现 106 9.3.1 界面设计 106 9.3.2 回调识别 111 9.4 延伸阅读 112 第10章 基于不变矩的数字验证码识别 113 10.1 案例背景 113 10.2 理论基础 114 10.3 程序实现 114 10.3.1 设计GUI界面 114 10.3.2 载入验证码图像 115 10.3.3 验证码图像去噪 116 10.3.4 验证码数字定位 118 10.3.5 验证码归一化 120 10.3.6 验证码数字识别 121 10.3.7 手动确认并入库 124 10.3.8 重新生成模板库 125 10.4 延伸阅读 128 第11章 基于小波技术进行图像融合 129 11.1 案例背景 129 11.2 理论基础 130 11.3 程序实现 132 11.3.1 设计GUI界面 132 11.3.2 图像载入 133 11.3.3 小波融合 135 11.4 延伸阅读 137 第12章 基于块匹配的全景图像拼接 138 12.1 案例背景 138 12.2 理论基础 138 12.2.1 图像匹配 139 12.2.2 图像融合 141 12.3 程序实现 142 12.3.1 设计GUI界面 142 12.3.2 载入图片 143 12.3.3 图像匹配 144 12.3.4 图像拼接 148 12.4 延伸阅读 153 第13章 基于霍夫曼图像编码的图像压缩和重建 155 13.1 案例背景 155 13.2 理论基础 155 13.2.1 霍夫曼编码的步骤 156 13.2.2 霍夫曼编码的特点 157 13.3 程序实现 158 13.3.1 设计GUI界面 158 13.3.2 压缩和重建 159 13.3.3 效果对比 164 13.4 延伸阅读 167 第14章 基于主成分分析的图像压缩和重建 168 14.1 案例背景 168 14.2 理论基础 168 14.2.1 主成分降维分析原理 168 14.2.2 由得分矩阵重建样本 169 14.2.3 主成分分析数据压缩比 170 14.2.4 基于主成分分析的图像压缩 170 14.3 程序实现 171 14.3.1 主成分分析的源代码 171 14.3.2 图像数组和样本矩阵之间的转换 172 14.3.3 基于主成分分析的图像压缩 173 14.4 延伸阅读 176 第15章 基于小波的图像压缩技术 177 15.1 案例背景 177 15.2 理论基础 178 15.3 程序实现 180 15.4 延伸阅读 188 第16章 基于融合特征的以图搜图技术 189 16.1 案例背景 189 16.2 理论基础 189 16.3 程序实现 191 16.3.1 图像预处理 191 16.3.2 计算特征 191 16.3.3 图像检索 194 16.3.4 结果分析 194 16.4 延伸阅读 196 第17章 基于Harris的角点特征检测 198 17.1 案例背景 198 17.2 理论基础 199 17.2.1 Harris的基本原理 199 17.2.2 Harris算法的流程 201 17.2.3 Harris角点的性质 201 17.3 程序实现 202 17.3.1 Harris算法的代码 202 17.3.2 角点检测实例 204 17.4 延伸阅读 205 第18章 基于GUI搭建通用视频处理工具 206 18.1 案例背景 206 18.2 理论基础 206 18.3 程序实现 208 18.3.1 设计GUI界面 208 18.3.2 实现GUI界面 209 18.4 延伸阅读 220 第19章 基于语音识别的信号灯图像 模拟控制技术 221 19.1 案例背景 221 19.2 理论基础 221 19.3 程序实现 223 19.4 延伸阅读 232 第20章 基于帧间差法进行视频目标检测 234 20.1 案例背景 234 20.2 理论基础 234 20.2.1 帧间差分法 235 20.2.2 背景差分法 236 20.2.3 光流法 236 20.3 程序实现 237 20.4 延伸阅读 24 第21章 路面裂缝检测系统设计 247 21.1 案例背景 247 21.2 理论基础 247 21.2.1 图像灰度化 248 21.2.2 图像滤波 250 21.2.3 图像增强 252 21.2.4 图像二值化 253 21.3 程序实现 255 21.4 延伸阅读 267 第22章 基于K-means聚类算法的图像分割 268 22.1 案例背景 268 22.2 理论基础 268 22.2.1 K-means聚类算法的原理 268 22.2.2 K-means聚类算法的要点 269 22.2.3 K-means聚类算法的缺点 270 22.2.4 基于K-means聚类算法进行图像分割 270 22.3 程序实现 271 22.3.1 样本间的距离 271 22.3.2 提取特征向量 272 22.3.3 图像聚类分割 273 22.4 延伸阅读 275 第23章 基于光流场的车流量计数应用 276 23.1 案例背景 276 23.2 理论基础 276 23.2.1 基于光流法检测运动的原理 276 23.2.2 光流场的主要计算方法 277 23.2.3 梯度光流场约束方程 278 23.2.4 Horn-Schunck光流算法 280 23.3 程序实现 281 23.3.1 计算视觉系统工具箱简介 281 23.3.2 基于光流法检测汽车运动 282 23.4 延伸阅读 287 第24章 基于Simulink进行图像和视频处理 289 24.1 案例背景 289 24.2 模块介绍 289 24.2.1 分析和增强模块库(Analysis和Enhancement) 290 24.2.2 转化模块库(Conversions) 291 24.2.3 滤波模块库(Filtering) 292 24.2.4 几何变换模块库(Geometric Transformations) 292 24.2.5 形态学操作模块库(Morphological Operations) 292 24.2.6 输入模块库(Sources) 293 24.2.7 输出模块库(Sinks) 293 24.2.8 统计模块库(Statistics) 294 24.2.9 文本和图形模块库(Text 和 Graphic) 295 24.2.10 变换模块库(Transforms) 295 24.2.11 其他工具模块库(Utilities) 295 24.3 仿真案例 296 24.3.1 搭建组织模型 296 24.3.2 仿真执行模型 298 24.3.3 自动生成报告 299 24.4 延伸阅读 302 第25章 基于小波变换的数字水印技术 304 25.1 案例背景 304 25.2 理论基础 304 25.2.1 数字水印技术的原理 305 25.2.2 典型的数字水印算法 307 25.2.3 数字水印攻击和评价 309 25.2.4 基于小波的水印技术 310 25.3 程序实现 312 25.3.1 准备载体和水印图像 312 25.3.2 小波数字水印的嵌入 313 25.3.3 小波数字水印的提取 317 25.3.4 小波水印的攻击试验 319 25.4 延伸阅读 323 第26章 基于最小误差法的胸片分割技术 325 26.1 案例背景 325 26.2 理论基础 325 26.2.1 图像增强 326 26.2.2 区域选择 326 26.2.3 形态学滤波 327 26.2.4 基于最小误差法进行胸片分割 328 26.3 程序实现 329 26.3.1 设计GUI界面 329 26.3.2 图像预处理 330 26.3.3 基于最小误差法进行图像分割 333 26.3.4 形态学后处理 335 26.4 延伸阅读 338 第27章 基于区域生长的肝脏影像分割系统 339 27.1 案例背景 339 27.2 理论基础 340 27.2.1 阈值分割 340 27.2.2 区域生长 340 27.2.3 基于阈值预分割的区域生长 341 27.3 程序实现 342 27.4 延伸阅读 346 第28章 基于计算机视觉的自动驾驶应用 347 28.1 案例背景 347 28.2 理论基础 348 28.2.1 环境感知 348 28.2.2 行为决策 348 28.2.3 路径规划 349 28.2.4 运动控制 349 28.3 程序实现 349 28.3.1 传感器数据载入 349 28.3.2 追踪器创建 351 28.3.3 碰撞预警 353 28.4 延伸阅读 358 第29章 基于深度学习的汽车目标检测 359 29.1 案例背景 359 29.2 理论基础 360 29.2.1 基本架构 360 29.2.2 卷积层 360 29.2.3 池化层 362 29.3 程序实现 362 29.3.1 加载数据 362 29.3.2 构建CNN 364 29.3.3 训练CNN 365 29.3.4 评估训练效果 367 29.4 延伸阅读 368 第30章 基于深度学习的视觉场景 识别 370 30.1 案例背景 370 30.2 理论基础 371 30.3 程序实现 371 30.3.1 环境配置 372 30.3.2 数据集制作 373 30.3.3 网络训练 375 30.3.4 网络测试 381 30.4 延伸阅读 383 第31章 深度学习综合应用 385 31.1 应用背景 385 31.2 理论基础 387 31.2.1 分类识别 387 31.2.2 目标检测 391 31.3 案例实现1:基于CNN的数字识别 395 31.3.1 自定义CNN 397 31.3.2 AlexNet 399 31.3.3 基于MATLAB进行实验设计 405 31.3.4 基于TensorFlow进行实验设计 413 31.3.5 实验小结 418 31.4 案例实现2:基于CNN的物体识别 418 31.4.1 CIFAR-10数据集 418 31.4.2 VggNet 421 31.4.3 ResNet 422 31.4.4 实验设计 424 31.4.5 实验小结 432 31.5 案例实现3:基于CNN的图像矫正 432 31.5.1 倾斜数据集 432 31.5.2 自定义CNN回归网络 434 31.5.3 AlexNet回归网络 436 31.5.4 实验设计 437 31.5.5 实验小结 445 31.6 案例实现4:基于LSTM的时间序列分析 445 31.6.1 厄尔尼诺南方涛动指数数据 446 31.6.2 样条拟合分析 446 31.6.3 基于MATLAB进行LSTM分析 448 31.6.4 基于Keras进行LSTM分析 451 31.6.5 实验小结 455 31.7 案例实现5:基于深度学习的以图搜图技术 455 31.7.1 人脸的深度特征 455 31.7.2 AlexNet的特征 460 31.7.3 GoogleNet的特征 461 31.7.4 深度特征融合计算 462 31.7.5 实验设计 462 31.7.6 实验小结 46731.8 案例实现6:基于YOLO的交通目标检测应用 467 31.8.1 车辆目标的YOLO检测 468 31.8.2 交通标志的YOLO检测 475 31.9 延伸阅读 481
|
內容試閱:
|
计算机视觉(Computer Vision,CV)主要研究如何用图像采集设备和计算机软件代替人眼对物体进行分类识别、目标跟踪和视觉分析等应用。深度学习则源自经典的神经网络架构,属于机器学习领域,它通过不同形式的神经网络,结合视觉大数据的大规模存量与不断产生的增量进行训练,自动提取细粒度的特征并组合粗粒度的特征,形成抽象化的视觉描述,在视觉分析方面取得很大的进步,是当前人工智能爆发性发展的内核驱动。随着大数据及人工智能技术的不断发展,计算机视觉以其可视性、规模性、普适性逐步成为AI落地应用的关键领域之一,在理论研究和工程应用上均迅猛发展。
MATLAB是MathWorks公司推出的一款用于科学计算和工程仿真的交互式编程软件,近几年已经发展成为集数值分析、数学建模、图像处理、控制系统、信号处理、经济金融、计算生物学、动态仿真等于一体的科学工程软件。Python是一种解释型、面向对象、动态数据类型的高级程序设计语言,具有易学习、易拓展、跨平台等优点,被广泛应用于Web开发、网络爬虫、数据分析、人工智能等领域,是当前主流的编程语言之一。
自电子计算机诞生以来,通过计算机仿真来模拟人类的视觉便成为非常热门且颇具挑战性的研究课题。随着数码相机、智能手机等硬件设备的普及,图像以其易于采集、信息相关性多、抗干扰能力强的特点得到越来越广泛的应用。信息化和数字化时代已经来临,随着国家对人工智能领域的投入力度加大,计算机视觉处理的需求量也会越来越大,应用也将越来越广泛。
通过计算机视觉处理工具箱可为用户提供诸如图像变换、图像增强、图像特征检测、图像复原、图像分割、图像去噪、图像配准、视频处理、深度学习等功能研发的技术支撑。同时,借助MATLAB、Python方便的编程及调试技巧,用户可根据需要进一步拓展计算机视觉处理工具箱,实现定制的业务需求。
本书目的
本书以案例的形式展现,力求为读者提供更便捷、直接的技术支持,解决读者在研发过程中遇到的实际技术难点,并力求全面讲解广大读者在研发过程中所涉及的功能模块及成熟的系统框架,为读者进行科学实验、项目开发提供一定的技术支持。
通过对书中案例的阅读、理解、运行和仿真,读者可以有针对性地进行算法调试,这样可以更加深刻地理解计算机视觉与深度学习应用的含义,并且更加熟练地掌握MATLAB、Python进行算法设计与工程研发。
本书特点
◎作者阵容强大,经验相当丰富
本书其中一位主编刘衍琦(ID:lyqmath)是机器学习算法专家及视觉AI课程讲师,擅长视觉智能分析、多源异构数据采集和挖掘等工程应用,并长期从事视觉大数据工程相关工作,涉及互联网海量图像、声纹、视频检索,以及OCR图文检索、手绘草图智能识别、特殊通道数据分析等应用的算法架构与研发,对图文识别、大规模以图搜图、数据感知和采集等进行过深入研究,并结合行业背景推动了一系列的工程化应用。
本书另外两位主编中,詹福宇(ID:dynamic)擅长模型设计与分析,在计算机视觉处理方面积累了丰富的工程经验;王德建在档案数字化、智能化分类、OCR图文检索、图像智能识别方面积累了丰富的项目实战经验。
◎案例丰富、实用、拓展性强
本书以案例的形式进行编写,充分强调案例的实用性及程序的可拓展性,所选案例均来自作者的日常研究及业务需求,每个案例都与实际课题相结合。另外,书中的每个案例都经过作者的程序调试,作者也为此编写了大量的测试代码。
◎点面完美结合,兼顾中高级用户
本书点面兼顾,涵盖了数字图像处理中几乎所有的基本模块,并涉及视频处理、配准拼接、数字水印、生物识别等高级图像处理方面的内容,全面讲解了基于MATLAB、Python进行计算机视觉及深度学习应用的原理及方法。
内容架构
本书讲解了36个MATLAB、Python计算机视觉与深度学习实战案例,并提供配套程序下载,其内容架构如下所述。
第1章:讲解基于直方图优化的图像去雾技术,通过对直方图增强技术的相关讲解,引入对雾霾图像进行优化的应用。
第2章:讲解基于形态学的权重自适应图像去噪,通过形态学的图像去噪效果,引入加权形态学去噪的应用。
第3章:讲解基于多尺度形态学提取眼前节组织,通过形态学的图像边缘提取效果,引入多尺度形态学的应用。
第4章:讲解基于Hough变化的答题卡识别,通过对答题卡自动阅卷的研究,引入图像分割、目标定位等领域的应用。
第5章:讲解基于阈值分割的车牌定位识别,通过对车牌定位、分割、识别的研究,引入图像处理在车牌识别领域的应用。
第6章:讲解基于分水岭分割进行肺癌诊断,通过对分水岭算法在肺部图像分割中的研究,引入分水岭及医学图像处理的应用。
第7章:讲解基于主成分分析的人脸二维码识别,通过对主成分分析、人脸识别、QR二维码的研究,引入QR人脸识别的应用。
第8章:讲解基于知识库的手写体数字识别,通过对手写数字特征的提取,引入模式识别在手写数字方面的应用。
第9章:讲解基于特征匹配的英文印刷字符识别,通过对英文片段图像的分割、识别,引入在MATLAB中生成自定义标准字符库、GUI交互等领域的应用。
第10章:讲解基于不变矩的数字验证码识别,通过对验证码生成的特点、分割定位、检测识别的研究,引入对某特定类型验证码从获取到识别的应用。
第11章:讲解基于小波技术进行图像融合,通过对图像融合的研究,引入小波分解、图像多分辨率处理的应用。
第12章:讲解基于块匹配的全景图像拼接,通过对全景图像生成方法的研究,引入块匹配、加权融合等的应用。
第13章:讲解基于霍夫曼图像编码的图像压缩和重建,通过对霍夫曼编码的研究,引入图像压缩重建的应用。
第14章:讲解基于主成分分析的图像压缩和重建,通过对主成分分析的研究,引入不同压缩参数下重建效果调优的应用。
第15章:讲解基于小波的图像压缩技术,通过对小波图像处理的研究,引入多分辨率图像压缩重建的应用。
第16章:讲解基于融合特征的以图搜图技术,通过对图像库Hu矩特征及颜色特征提取的研究,引入图像检索的应用。
第17章:讲解基于Harris的角点特征检测,通过对Harris检测算法的研究,引入图像角点检测的应用。
第18章:讲解基于GUI搭建通用视频处理工具,通过对GUI、视频图像处理工具箱的应用,引入搭建MATLAB图像视频处理框架的应用。
第19章:讲解基于语音识别的信号灯图像模拟控制技术,通过对语音特征及建库的研究,引入语音控制光信号的应用。
第20章:讲解基于帧间差法进行视频目标检测,通过对视频跟踪的研究,引入视频中多目标跟踪的应用。
第21章:讲解路面裂缝检测系统设计,通过对裂缝图像特征、识别的研究,引入路面裂缝检测和提取的应用。
第22章:讲解基于K-means聚类算法的图像分割,通过对K-means聚类算法的研究,引入其在图像分割方面的应用。
第23章:讲解基于光流场的车流量计数应用,通过对汽车视频跟踪的研究,引入光流场在跟踪和检测方面的应用。
第24章:讲解基于Simulink进行图像和视频处理,通过对Simulink模块的介绍,引入其在图像视频处理领域的应用。
第25章:讲解基于小波变换的数字水印技术,通过对图像水印的相关研究,引入图像水印嵌入、提取等的应用。
第26章:讲解基于最小误差法的胸片分割技术,通过对肺部影像的分割算法进行对比,介绍最小误差分割算法及其应用。
第27章:讲解基于区域生长的肝脏影像分割系统,通过对区域生长的相关研究,介绍如何自动定义种子点并将其应用到肝脏影像的分割方面。
第28章:讲解基于计算机视觉的自动驾驶应用,介绍自动驾驶的相关技术,从计算机视觉的角度分析相关应用。
第29章:讲解基于深度学习的汽车目标检测,介绍深度学习的相关知识,基于MATLAB的CNN工具箱实现汽车目标检测的应用。
第30章:讲解基于深度学习的视觉场景识别,对深度学习进行深入研究,基于经典的MatConvNet工具箱讲解如何进行图像分类识别应用。
第31章:讲解深度学习综合应用方面的内容,涉及6个相关实战案例:基于CNN的字符识别、基于CNN的物体识别、基于CNN的图像矫正、基于LSTM的时间序列分析、基于深度学习的以图搜图技术、基于YOLO的智能交通目标检测,讲解了经典的AlexNet、VggNet、ResNet、GoogleNet等知识,还通过网络编辑、拆分、中间层激活、多算法集成等方式进行了拓展,既实现了图像分类识别、以图搜图、交通目标检测等方面的应用,也对时间序列分析、图像倾斜角度分析等进行了探索。
特别致谢
本书由刘衍琦、詹福宇、王德建、陈峰蔚、蒋献文、周华英编著,本书的编写也得到了电子工业出版社博文视点编辑张国霞的大力支持,在此对其表示衷心的感谢。在本书深度学习部分的实验设计及研发过程中,Windoer-AI实验室提供了很多帮助,在此感谢他们的信任与鼓励。感谢各位读者朋友对本书作者给予的启发和帮助,感谢家人的默默支持!感谢女儿刘沛萌每天带给我欢乐,她给予我无限的动力进行计算机视觉及人工智能探索及应用,也祝天下的小朋友们都能健康快乐地成长!
由于时间仓促,加之作者水平和经验有限,书中难免存在疏漏及错误之处,希望广大读者批评指正。
刘衍琦
2019年10月
|
|