新書推薦:
《
我们为何建造(城市与生态文明丛书)
》
售價:HK$
89.7
《
算法经济 : 商业逻辑与人类生活的智能演进(生动呈现AI与算法的创新应用与商业价值)
》
售價:HK$
79.4
《
家书中的百年史
》
售價:HK$
79.4
《
偏爱月亮
》
售價:HK$
45.8
《
生物安全与环境
》
售價:HK$
56.4
《
泥土:文明的侵蚀(城市与生态文明丛书)
》
售價:HK$
84.0
《
医用化学(第三版)
》
售價:HK$
57.3
《
别怕,试一试
》
售價:HK$
67.9
|
編輯推薦: |
1.使用特定的数据结构和(或)算法来提高性能”,解决工程实战中存在的真实问题。2.Github国内大厂、美国大厂的面试题中会多有涉及。3.涵盖国内大厂、美国大厂常见面试,包括动态规划、布隆过滤器、图计算等。
|
內容簡介: |
这是一本关于“高级/进阶”算法和数据结构的图书,主要介绍了用于Web应用程序、系统编程和数据处理领域的各种算法,旨在让读者了解如何用这些算法应对各种棘手的编码挑战,以及如何将其应用于具体问题,以应对新技术浪潮下的“棘手”问题。本书对一些广为人知的基本算法进行了扩展,还介绍了用于改善优先队列、有效缓存、对数据进行集群等的技术,以期读者能针对不同编程问题选出更好的解决方案。书中示例大多辅以图解,并以不囿于特定语言的伪代码以及多种语言的代码样本加以闸释。学完本书,读者可以了解高级算法和数据结构的相关内容,并能运用这些知识让代码具备更优性能,甚至能够独立设计数据结构,应对需要自定义解决方案的情况。本书可作为高等院校计算机相关专业本科高年级学生以及研究生的学习用书,也可供从事与算法相关工作的开发者参考。
|
關於作者: |
Marcello La Rocca现为一家电商公司的高级软件工程师,曾参与开发Twitter、微软和苹果等公司的大型Web应用程序和数据基础设施,并发明了NeatSort这一自适应排序算法。他的主要研究领域为图、算法优化、机器学习和量子计算。
|
目錄:
|
第 1章 初识数据结构 11.1 数据结构 21.1.1 定义数据结构 21.1.2 描述数据结构 31.1.3 算法与数据结构有区别吗 41.2 设定目标:阅读本书后的期望 41.3 打包背包:数据结构与现实世界的结合 51.3.1 抽象化问题 51.3.2 寻找解决方案 61.3.3 拯救大家的算法 71.3.4 打破常规来思考问题 81.3.5 完美的结局 91.4 小结 9 第 一部分 改进基本数据结构 第 2章 改进优先队列:d叉堆 122.1 本章结构 132.2 问题:处理优先级 132.3 已知解决方案:让列表保持有序 152.4 描述数据结构API:优先队列 152.4.1 使用优先队列 162.4.2 优先级为何非常重要 172.5 具体数据结构 172.5.1 性能比较 182.5.2 正确的具体数据结构是什么 182.5.3 堆 182.5.4 优先级、最小堆和最大堆 202.5.5 高级变体:d叉堆 212.6 如何实现堆 222.6.1 向上冒泡 222.6.2 向下推动 252.6.3 插入 272.6.4 移除顶部元素 282.6.5 修改 302.6.6 处理重复优先级 312.6.7 堆化 322.6.8 API之外的方法:包含 342.6.9 性能回顾 342.6.10 从伪代码到实现 352.7 用例:找到最大的k个元素 352.7.1 选择正确的数据结构 362.7.2 正确地使用数据结构 362.7.3 代码写起来 362.8 更多的用例 372.8.1 图中的最小距离:Dijkstra算法 372.8.2 更多的图算法:Prim算法 372.8.3 数据压缩:霍夫曼编码 382.9 对分支因子进行分析 412.9.1 是否需要d叉堆 412.9.2 运行时间 422.9.3 寻找最佳分支因子 422.9.4 分支因子与内存的关系 432.10 性能分析:寻找最佳分支因子 432.10.1 剖析 442.10.2 解释结果 452.10.3 堆化的谜团 492.10.4 选择最佳分支因子 492.11 小结 50第3章 树堆:使用随机化来平衡二叉搜索树 523.1 问题:多索引 533.2 解决方案:描述与API 533.3 树堆 543.3.1 旋转 573.3.2 一些设计问题 603.3.3 实现搜索方法 613.3.4 插入 613.3.5 删除 643.3.6 去顶、看顶以及修改 663.3.7 返回最小键和最大键 673.3.8 性能回顾 673.4 应用:随机树堆 683.4.1 平衡树 683.4.2 引入随机化 703.4.3 随机树堆的应用 713.5 性能分析和剖析 723.5.1 理论:期望高度 723.5.2 剖析高度 743.5.3 剖析运行时间 763.5.4 剖析内存使用情况 783.5.5 结论 783.6 小结 80第4章 布隆过滤器:减少跟踪内容所需的内存 814.1 字典问题:跟踪事物 824.2 实现字典的其他方法 834.3 描述数据结构API:关联数组 834.4 具体数据结构 844.4.1 无序数组:快速插入,慢速搜索 844.4.2 有序数组和二分查找:慢插入,稍微快一些的搜索 854.4.3 哈希表:在不需要有序的情况下,具有平均常数时间的性能 864.4.4 二叉搜索树:所有操作都是对数阶的 864.4.5 布隆过滤器:与哈希表一样快,但(由于一个缺陷而)更节省内存 884.5 表面之下:布隆过滤器是如何工作的 884.6 实现 894.6.1 使用布隆过滤器 904.6.2 位的读取和写入 914.6.3 找到键存储的位置 924.6.4 生成哈希函数 934.6.5 构造函数 934.6.6 查找键 944.6.7 存储键 954.6.8 估计准确率 964.7 应用场景 974.7.1 缓存 974.7.2 路由 984.7.3 爬虫 984.7.4 I/O提取器 984.7.5 拼写检查器 984.7.6 分布式数据库和文件系统 994.8 为什么布隆过滤器是可行的 994.8.1 为什么没有假阴性 1004.8.2 为什么有假阳性 1004.8.3 作为随机算法的布隆过滤器 1014.9 性能分析 1014.9.1 运行时间 1014.9.2 构造函数 1024.9.3 存储元素 1024.9.4 查找元素 1024.10 估计布隆过滤器的精确度 1024.11 改进的变体 1064.11.1 布隆表过滤器 1064.11.2 组合布隆过滤器 1064.11.3 分层布隆过滤器 1064.11.4 压缩布隆过滤器 1074.11.5 可扩展布隆过滤器 1074.12 小结 108第5章 不交集:次线性时间的处理过程 1095.1 不同子集问题 1105.2 解决方案的论证 1115.3 描述数据结构API:不交集 1125.4 简单解决方案 1135.5 使用树状结构 1175.5.1 从链表转移到树 1175.5.2 实现使用树的版本 1185.6 改进运行时间的启发式算法 1205.6.1 路径压缩 1215.6.2 实现平衡性与路径压缩 1225.7 应用程序 1245.7.1 图:连通分量 1245.7.2 图:最小生成树的Kruskal算法 1245.7.3 聚类 1255.7.4 合一 1265.8 小结 126第6章 trie与基数树:高效的字符串搜索 1276.1 拼写检查 1286.1.1 拼写检查器的设计 1286.1.2 压缩是关键 1296.1.3 描述与API 1296.2 trie 1306.2.1 为什么trie更好 1326.2.2 搜索 1346.2.3 插入 1376.2.4 删除 1396.2.5 搜索最长前缀词 1406.2.6 返回匹配特定前缀的所有键 1416.2.7 什么时候应该使用trie 1436.3 基数树 1446.3.1 节点和边 1466.3.2 搜索 1486.3.3 插入 1496.3.4 删除 1516.3.5 搜索最长前缀词 1536.3.6 返回匹配特定前缀的所有键 1536.4 应用程序 1546.4.1 拼写检查器 1546.4.2 字符串相似度 1566.4.3 字符串排序 1576.4.4 T9 1576.4.5 自动完成 1586.5 小结 158第7章 用例:LRU缓存 1607.1 不要重复计算 1607.2 第 一次尝试:记住数据 1637.2.1 描述与API 1647.2.2 请保存新数据 1647.2.3 处理异步调用 1657.2.4 将缓存的值标记为“正在加载” 1667.3 内存(真的)不够 1677.4 清除陈旧数据:LRU缓存 1687.4.1 有时必须要重复解决问题 1697.4.2 时间排序 1707.4.3 性能 1747.5 当新数据更有价值时:LFU 1757.5.1 如何选择缓存的清除策略 1767.5.2 LFU缓存有什么不同 1767.5.3 性能 1787.5.4 LFU缓存的不足 1787.6 如何使用缓存也同样重要 1797.7 同步简介 1807.7.1 (在Java中)解决并发问题 1827.7.2 锁简介 1837.7.3 获取锁 1837.7.4 重入锁 1847.7.5 读锁 1857.7.6 解决并发的其他方法 1867.8 缓存应用程序 1867.9 小结 187 第二部分 多维查询 第8章 最近邻搜索 1908.1 最近邻搜索问题 1908.2 解决方案 1918.2.1 第 一次尝试 1918.2.2 有时缓存并不是答案 1918.2.3 简化事情以获得灵感 1928.2.4 谨慎选择数据结构 1938.3 描述与API 1948.4 迁移到k维空间 1958.4.1 一维二分查找 1968.4.2 迁移到更高维度 1968.4.3 用数据结构对二维空间进行建模 1978.5 小结 198第9章 k-d树:索引多维数据 1999.1 从结束的地方继续 1999.2 迁移到k维空间:循环遍历维度 1999.2.1 构造BST 2019.2.2 不变量 2049.2.3 保持平衡的重要性 2049.3 方法 2059.3.1 搜索 2069.3.2 插入 2089.3.3 平衡树 2099.3.4 删除 2129.3.5 最近邻搜索 2189.3.6 区域搜索 2249.3.7 所有方法的回顾 2279.4 限制与可能的改进 2289.5 小结 229第 10章 相似性搜索树:图像检索的近似最近邻搜索 23010.1 从结束的地方继续 23010.1.1 一个新的(更复杂的)例子 23110.1.2 克服k-d树的缺陷 23210.2 R树 23210.2.1 先退一步:B树简介 23210.2.2 由B树到R树 23310.2.3 在R树中插入点 23610.2.4 搜索 23710.3 SS树 23810.3.1 搜索 24110.3.2 插入 24410.3.3 插入:方差、均值与投影 24910.3.4 插入:分裂节点 25210.3.5 删除 25510.4 相似性搜索 25910.4.1 最近邻搜索 26010.4.2 区域搜索 26210.4.3 近似相似性搜索 26310.5 SS+树 26510.5.1 SS树会更好吗 26610.5.2 缓解超球体的限制 26710.5.3 改进拆分启发式算法 26710.5.4 减少重叠 26810.6 小结 270第 11章 最近邻搜索的应用 27111.1 应用程序:查找最近的枢纽 27111.1.1 解决方案的初稿 27211.1.2 天堂里的麻烦 27311.2 中心化应用程序 27411.2.1 过滤点 27411.2.2 复杂的决定 27611.3 迁移到分布式应用程序 27811.3.1 处理HTTP通信的问题 27911.3.2 保持库存同步 28111.3.3 经验教训 28111.4 其他应用程序 28211.4.1 色彩还原 28211.4.2 粒子的相互作用 28311.4.3 多维数据库查询的优化 28511.4.4 聚类 28711.5 小结 287第 12章 聚类 28812.1 聚类简介 28912.1.1 机器学习的类型 28912.1.2 聚类的类型 29012.2 k均值算法 29112.2.1 k均值算法的问题 29512.2.2 维度诅咒再次来袭 29612.2.3 k均值算法的性能分析 29712.2.4 用k-d树来加快k均值算法 29712.2.5 关于k均值算法的最后一些提示 30012.3 DBSCAN算法 30012.3.1 直接可达与密度可达 30112.3.2 从定义到算法 30212.3.3 实现 30412.3.4 DBSCAN算法的优缺点 30512.4 OPTICS算法 30712.4.1 定义 30812.4.2 OPTICS算法的核心思想 30812.4.3 从可达距离到聚类 31112.4.4 分层聚类 31412.4.5 性能分析和最终的考虑 31812.5 评估聚类结果:评估指标 31812.6 小结 322第 13章 并行聚类:MapReduce与树冠聚类 32313.1 并行化 32313.1.1 并行计算与分布式计算 32413.1.2 并行化k均值算法 32513.1.3 树冠聚类 32513.1.4 应用树冠聚类 32713.2 MapReduce 32813.2.1 MapReduce是如何工作的 32813.2.2 先映射,后归约 33113.2.3 表面之下,还有更多 33413.3 MapReduce版本的k均值算法 33413.3.1 并行化树冠聚类 33713.3.2 使用树冠聚类来进行质心的初始化 33913.3.3 MapReduce版本的树冠聚类 34013.4 MapReduce版本的DBSCAN 算法 34313.5 小结 348 第三部分 平面图与最小交叉数 第 14章 图简介:寻找距离最短的路径 35014.1 定义 35114.1.1 图的实现 35114.1.2 作为代数类型的图 35314.1.3 伪代码 35414.2 图的属性 35414.2.1 无向 35514.2.2 连通 35514.2.3 无环 35614.3 图的遍历:BFS与DFS 35714.3.1 优化配送路线 35714.3.2 广度优先搜索 35914.3.3 重建到目标的路径 36114.3.4 深度优先搜索 36214.3.5 再次比较队列与堆栈 36414.3.6 投递包裹的最佳路线 36514.4 加权图中的最短路径:迪杰斯特拉 算法 36514.4.1 与BFS算法的区别 36614.4.2 实现 36714.4.3 分析 36814.4.4 投递包裹的最佳路线 36914.5 超越迪杰斯特拉算法:A* 算法 37014.5.1 A*算法到底有多好 37214.5.2 将启发式函数作为平衡实时数据的一种方式 37514.6 小结 376第 15章 图嵌入与平面性:绘制具有最少相交边的图 37715.1 图嵌入 37815.1.1 一些基础定义 37915.1.2 完全图与完全二分图 38015.2 平面图 38115.2.1 在实践中使用库拉托夫斯基定理 38115.2.2 平面性测试 38215.2.3 用于平面性测试的朴素算法 38315.2.4 提高性能 38615.2.5 高效的算法 38815.3 非平面图 38915.3.1 找到交叉数 39115.3.2 直线交叉数 39215.4 边的交叉点 39315.4.1 直线线段 39415.4.2 折线 39715.4.3 贝塞尔曲线 39715.4.4 二次贝塞尔曲线之间的交点 39815.4.5 顶点与顶点相交以及边与顶点相交 40115.5 小结 402第 16章 梯度下降:(不仅是)图的优化问题 40316.1 用于交叉数的启发式算法 40416.1.1 刚才提到启发式了吗 40416.1.2 扩展到曲线边 40816.2 优化的工作原理 40916.2.1 成本函数 41016.2.2 阶跃函数与局部最小值 41216.2.3 优化随机抽样算法 41216.3 梯度下降 41416.3.1 梯度下降中的数学描述 41516.3.2 几何解释 41616.3.3 什么时候可以应用梯度下降 41816.3.4 梯度下降的问题 41816.4 梯度下降的应用 41916.5 使用梯度下降进行图嵌入 42216.5.1 另一种标准 42316.5.2 实现 42516.6 小结 426第 17章 模拟退火:超越局部最小值的优化 42717.1 模拟退火 42817.1.1 有时候需要先向上爬才能到达底部 42917.1.2 实现 43117.1.3 为什么模拟退火是有效的 43217.1.4 短程与长程的转换 43417.1.5 变体 43517.1.6 模拟退火与梯度下降:应该选择哪一个呢 43617.2 模拟退火与旅行推销员 43617.2.1 精确解与近似解 43817.2.2 可视化成本 43817.2.3 修剪域 44017.2.4 状态转换 44017.2.5 相邻交换与随机交换 44317.2.6 TSP近似算法的应用 44417.3 模拟退火与图嵌入 44417.3.1 最小边交叉 44517.3.2 力导向绘制 44617.4 小结 450第 18章 遗传算法:受生物学启发的快速收敛优化 45118.1 遗传算法简介 45118.1.1 来自大自然的灵感 45318.1.2 染色体 45618.1.3 种群 45718.1.4 适应度 45818.1.5 自然选择 45918.1.6 选择交配的个体 46118.1.7 交叉操作 46618.1.8 突变操作 46818.1.9 遗传算法模板 46918.1.10 遗传算法在什么时候效果最好 47018.2 TSP 47118.2.1 适应度、染色体与初始化 47118.2.2 突变操作 47218.2.3 交叉操作 47218.2.4 结果与参数调整 47318.2.5 超越TSP:优化整个车队的路线 47618.3 最小顶点覆盖 47718.3.1 顶点覆盖的应用 47818.3.2 实现遗传算法 47818.4 遗传算法的其他应用 48018.4.1 最大流问题 48018.4.2 蛋白质折叠 48118.4.3 超越遗传算法 48218.4.4 算法,超越本书 48318.5 小结 483附录A 伪代码快速指南 485附录B 大O符号 494附录C 核心数据结构 500附录D 类似于优先队列的容器 511附录E 递归 514附录F 分类问题与随机算法的度量指标 520
|
|