新書推薦:
《
武人琴音(十周年纪念版 逝去的武林系列收官之作 形意拳一门三代:尚云祥、韩伯言、韩瑜的人生故事 凸显百年武人命运)
》
售價:HK$
43.7
《
剑桥斯堪的纳维亚戏剧史(剑桥世界戏剧史译丛)
》
售價:HK$
154.6
《
禅心与箭术:过松弛而有力的生活(乔布斯精神导师、世界禅者——铃木大拙荐)
》
售價:HK$
66.1
《
先进电磁屏蔽材料——基础、性能与应用
》
售價:HK$
221.8
《
可转债投资实战
》
售價:HK$
99.7
《
王氏之死(新版,史景迁成名作)
》
售價:HK$
54.9
《
敢为天下先:三年建成港科大
》
售價:HK$
77.3
《
长高食谱 让孩子长高个的饮食方案 0-15周岁儿童调理脾胃食谱书籍宝宝辅食书 让孩子爱吃饭 6-9-12岁儿童营养健康食谱书大全 助力孩子身体棒胃口好长得高
》
售價:HK$
47.0
|
編輯推薦: |
近年来,深度学习在自然语言处理、计算机视觉等领域取得了非凡的进展。从机器翻译和文本生成到自动驾驶和虚拟助手,我们受益于深度学习技术的逐渐普及。然而,深度学习还远未发挥全部潜力。欢迎来到深度学习的世界!在这个规模呈爆发式增长的领域,仍有许多“宝藏”等待你去发掘。本书由流行深度学习框架Keras之父弗朗索瓦·肖莱执笔,不用数学公式,而用Python代码帮助你直观理解深度学习的核心思想。本书在第1版的基础上进行了大幅更新和增补,以体现深度学习领域的快速发展。- Keras和TensorFlow入门:详解实践深度学习所需的全部知识- 神经网络入门:分类与回归- 计算机视觉、时间序列预测、生成式深度学习- 新增Transformer架构的原理及用法- 新增机器学习的工作流程- 随书提供Jupyter notebook,采用TensorFlow 2.6
|
內容簡介: |
本书由流行深度学习框架Keras之父弗朗索瓦·肖莱执笔,通过直观的解释和丰富的示例帮助你构建深度学习知识体系。作者避免使用数学符号,转而采用Python代码来解释深度学习的核心思想。全书共计14章,既涵盖了深度学习的基本原理,又体现了这一迅猛发展的领域在近几年里取得的重要进展,包括Transformer架构的原理和示例。读完本书后,你将能够使用Keras解决从计算机视觉到自然语言处理等现实世界的诸多问题,包括图像分类、图像分割、时间序列预测、文本分类、机器翻译、文本生成等。
|
關於作者: |
【作者简介】弗朗索瓦·肖莱(Franc?ois Chollet)谷歌公司深度学习科学家,流行深度学习框架Keras之父。Keras的GitHub星标数近6万,用户数量已超100万。此外,他也是TensorFlow框架的贡献者,个人Kaggle竞赛全球排名曾获第17名。利用Keras,他致力于普及深度学习技术和实现通用人工智能。【译者简介】张亮(hysic)毕业于北京大学物理学院,核安全高级工程师,深谙机器学习和数据分析,译有《Python机器学习基础教程》《Python数据处理》等。
|
目錄:
|
第 1章 什么是深度学习 11.1 人工智能、机器学习和深度学习 11.1.1 人工智能 21.1.2 机器学习 21.1.3 从数据中学习规则与表示 31.1.4 深度学习之“深度” 51.1.5 用三张图理解深度学习的工作原理 71.1.6 深度学习已取得的进展 81.1.7 不要相信短期炒作 91.1.8 人工智能的未来 101.2 深度学习之前:机器学习简史 101.2.1 概率建模 111.2.2 早期神经网络 111.2.3 核方法 111.2.4 决策树、随机森林和梯度提升机 121.2.5 回到神经网络 131.2.6 深度学习有何不同 141.2.7 机器学习现状 141.3 为什么要用深度学习,为什么是现在 161.3.1 硬件 171.3.2 数据 171.3.3 算法 181.3.4 新一轮投资热潮 181.3.5 深度学习的普及 191.3.6 这种趋势会持续下去吗 20第 2章 神经网络的数学基础 212.1 初识神经网络 212.2 神经网络的数据表示 252.2.1 标量(0阶张量) 252.2.2 向量(1阶张量) 252.2.3 矩阵(2阶张量) 262.2.4 3阶张量与更高阶的张量 262.2.5 关键属性 262.2.6 在NumPy中操作张量 282.2.7 数据批量的概念 282.2.8 现实世界中的数据张量实例 292.2.9 向量数据 292.2.10 时间序列数据或序列数据 292.2.11 图像数据 302.2.12 视频数据 312.3 神经网络的“齿轮”:张量运算 312.3.1 逐元素运算 322.3.2 广播 332.3.3 张量积 342.3.4 张量变形 362.3.5 张量运算的几何解释 372.3.6 深度学习的几何解释 402.4 神经网络的“引擎”:基于梯度的优化 402.4.1 什么是导数 412.4.2 张量运算的导数:梯度 422.4.3 随机梯度下降 442.4.4 链式求导:反向传播算法 462.5 回顾第 一个例子 512.5.1 用TensorFlow 从头开始重新实现第 一个例子 522.5.2 完成一次训练步骤 542.5.3 完整的训练循环 552.5.4 评估模型 552.6 本章总结 56第3章 Keras 和TensorFlow 入门 573.1 TensorFlow 简介 573.2 Keras 简介 583.3 Keras 和TensorFlow 简史 593.4 建立深度学习工作区 603.4.1 Jupyter笔记本:运行深度学习实验的首选方法 603.4.2 使用Colaboratory 613.5 TensorFlow入门 633.5.1 常数张量和变量 643.5.2 张量运算:用TensorFlow进行数学运算 663.5.3 重温GradientTape API 663.5.4 一个端到端的例子:用TensorFlow编写线性分类器 673.6 神经网络剖析:了解核心Keras API 713.6.1 层:深度学习的基础模块 713.6.2 从层到模型 743.6.3 编译步骤:配置学习过程 753.6.4 选择损失函数 773.6.5 理解fit()方法 773.6.6 监控验证数据上的损失和指标 783.6.7 推断:在训练后使用模型 793.7 本章总结 80第4章 神经网络入门:分类与回归 814.1 影评分类:二分类问题示例 824.1.1 IMDB 数据集 824.1.2 准备数据 834.1.3 构建模型 844.1.4 验证你的方法 874.1.5 利用训练好的模型对新数据进行预测 904.1.6 进一步实验 904.1.7 小结 904.2 新闻分类:多分类问题示例 914.2.1 路透社数据集 914.2.2 准备数据 924.2.3 构建模型 924.2.4 验证你的方法 934.2.5 对新数据进行预测 964.2.6 处理标签和损失的另一种方法 964.2.7 拥有足够大的中间层的重要性 964.2.8 进一步实验 974.2.9 小结 974.3 预测房价:标量回归问题示例 974.3.1 波士顿房价数据集 984.3.2 准备数据 984.3.3 构建模型 994.3.4 利用K折交叉验证来验证你的方法 994.3.5 对新数据进行预测 1034.3.6 小结 1034.4 本章总结 104第5章 机器学习基础 1055.1 泛化:机器学习的目标 1055.1.1 欠拟合与过拟合 1055.1.2 深度学习泛化的本质 1105.2 评估机器学习模型 1155.2.1 训练集、验证集和测试集 1155.2.2 超越基于常识的基准 1185.2.3 模型评估的注意事项 1195.3 改进模型拟合 1195.3.1 调节关键的梯度下降参数 1195.3.2 利用更好的架构预设 1215.3.3 提高模型容量 1215.4 提高泛化能力 1235.4.1 数据集管理 1235.4.2 特征工程 1245.4.3 提前终止 1255.4.4 模型正则化 1255.5 本章总结 132第6章 机器学习的通用工作流程 1336.1 定义任务 1346.1.1 定义问题 1346.1.2 收集数据集 1356.1.3 理解数据 1386.1.4 选择衡量成功的指标 1396.2 开发模型 1396.2.1 准备数据 1396.2.2 选择评估方法 1406.2.3 超越基准 1416.2.4 扩大模型规模:开发一个过拟合的模型 1426.2.5 模型正则化与调节超参数 1426.3 部署模型 1436.3.1 向利益相关者解释你的工作并设定预期 1436.3.2 部署推断模型 1436.3.3 监控模型在真实环境中的性能 1466.3.4 维护模型 1466.4 本章总结 147第7章 深入Keras 1487.1 Keras 工作流程 1487.2 构建Keras 模型的不同方法 1497.2.1 序贯模型 1497.2.2 函数式API 1527.2.3 模型子类化 1577.2.4 混合使用不同的组件 1597.2.5 用正确的工具完成工作 1607.3 使用内置的训练循环和评估循环 1607.3.1 编写自定义指标 1617.3.2 使用回调函数 1627.3.3 编写自定义回调函数 1647.3.4 利用TensorBoard进行监控和可视化 1657.4 编写自定义的训练循环和评估循环 1677.4.1 训练与推断 1687.4.2 指标的低阶用法 1697.4.3 完整的训练循环和评估循环 1697.4.4 利用tf.function加快运行速度 1717.4.5 在fit()中使用自定义训练循环 1727.5 本章总结 174第8章 计算机视觉深度学习入门 1758.1 卷积神经网络入门 1768.1.1 卷积运算 1788.1.2 最大汇聚运算 1828.2 在小型数据集上从头开始训练一个卷积神经网络 1848.2.1 深度学习对数据量很小的问题的适用性 1848.2.2 下载数据 1858.2.3 构建模型 . 1878.2.4 数据预处理 1898.2.5 使用数据增强 1938.3 使用预训练模型 1968.3.1 使用预训练模型做特征提取 1978.3.2 微调预训练模型 2048.4 本章总结 208第9章 计算机视觉深度学习进阶 2099.1 三项基本的计算机视觉任务 2099.2 图像分割示例 2109.3 现代卷积神经网络架构模式 2189.3.1 模块化、层次结构和复用 2189.3.2 残差连接 2219.3.3 批量规范化 2249.3.4 深度可分离卷积 2269.3.5 综合示例:一个类似Xception的迷你模型 2279.4 解释卷积神经网络学到的内容 2299.4.1 中间激活值的可视化 2309.4.2 卷积神经网络滤波器的可视化 2359.4.3 类激活热力图的可视化 2419.5 本章总结 246第 10章 深度学习处理时间序列 24710.1 不同类型的时间序列任务 24710.2 温度预测示例 24810.2.1 准备数据 25110.2.2 基于常识、不使用机器学习的基准 25410.2.3 基本的机器学习模型 25410.2.4 一维卷积模型 25610.2.5 第 一个RNN 基准 25810.3 理解RNN 25910.4 RNN 的高级用法 26510.4.1 利用循环dropout 降低过拟合 26510.4.2 循环层堆叠 26810.4.3 使用双向RNN 26910.4.4 进一步实验 27110.5 本章总结 272第 11章 深度学习处理文本 27311.1 自然语言处理概述 27311.2 准备文本数据 27411.2.1 文本标准化 27511.2.2 文本拆分(词元化) 27611.2.3 建立词表索引 27711.2.4 使用TextVectorization层 27811.3 表示单词组的两种方法:集合和序列 28211.3.1 准备IMDB 影评数据 28211.3.2 将单词作为集合处理:词袋方法 28411.3.3 将单词作为序列处理:序列模型方法 28911.4 Transformer架构 29811.4.1 理解自注意力 29811.4.2 多头注意力 30211.4.3 Transformer编码器 30311.4.4 何时使用序列模型而不是词袋模型 30911.5 超越文本分类:序列到序列学习 31011.5.1 机器翻译示例 31211.5.2 RNN 的序列到序列学习 31411.5.3 使用Transformer 进行序列到序列学习 31811.6 本章总结 323第 12章 生成式深度学习 32412.1 文本生成 32512.1.1 生成式深度学习用于序列生成的简史 32512.1.2 如何生成序列数据 32612.1.3 采样策略的重要性 32712.1.4 用Keras 实现文本生成 32812.1.5 带有可变温度采样的文本生成回调函数 33112.1.6 小结 33412.2 DeepDream 33412.2.1 用Keras 实现DeepDream 33512.2.2 小结 34112.3 神经风格迁移 34112.3.1 内容损失 34212.3.2 风格损失 34212.3.3 用Keras 实现神经风格迁移 34312.3.4 小结 34812.4 用变分自编码器生成图像 34812.4.1 从图像潜在空间中采样 34812.4.2 图像编辑的概念向量 35012.4.3 变分自编码器 35012.4.4 用Keras 实现变分自编码器 35212.4.5 小结 35712.5 生成式对抗网络入门 35812.5.1 简要实现流程 35912.5.2 诸多技巧 36012.5.3 CelebA 数据集 36012.5.4 判别器 36112.5.5 生成器 36212.5.6 对抗网络 36412.5.7 小结 36612.6 本章总结 367第 13章 适合现实世界的最佳实践 36813.1 将模型性能发挥到极致 36813.1.1 超参数优化 36813.1.2 模型集成 37513.2 加速模型训练 37613.2.1 使用混合精度加快GPU上的训练速度 37713.2.2 多GPU训练 38013.2.3 TPU训练 38213.3 本章总结 384第 14章 总结 38514.1 重点概念回顾 38514.1.1 人工智能的多种方法 38514.1.2 深度学习在机器学习领域中的特殊之处 38614.1.3 如何看待深度学习 38614.1.4 关键的推动技术 38714.1.5 机器学习的通用工作流程 38814.1.6 关键网络架构 38814.1.7 可能性空间 39214.2 深度学习的局限性 39414.2.1 将机器学习模型拟人化的风险 39414.2.2 自动机与智能体 39614.2.3 局部泛化与极端泛化 39714.2.4 智能的目的 39914.2.5 逐步提高泛化能力 40014.3 如何实现更加通用的人工智能 40114.3.1 设定正确目标的重要性:捷径法则 40114.3.2 新目标 40214.4 实现智能:缺失的内容 40314.4.1 智能是对抽象类比的敏感性 40414.4.2 两种抽象 40514.4.3 深度学习所缺失的那一半 40714.5 深度学习的未来 40814.5.1 模型即程序 40814.5.2 将深度学习与程序合成融合 40914.5.3 终身学习和模块化子程序复用 41114.5.4 长期愿景 41214.6 了解快速发展的领域的最新进展 41314.6.1 在Kaggle 上练习解决现实世界的问题 41314.6.2 在arXiv上了解最新进展 41414.6.3 探索Keras 生态系统 41414.7 结束语 414
|
|