登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書

『簡體書』大数据时代的算法:机器学习、人工智能及其典型实例

書城自編碼: 2948434
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 刘凡平 编著
國際書號(ISBN): 9787121304293
出版社: 电子工业出版社
出版日期: 2017-01-01
版次: 1 印次: 1
頁數/字數: 220/330000
書度/開本: 16开 釘裝: 平装

售價:HK$ 71.1

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
瘦肝
《 瘦肝 》

售價:HK$ 99.7
股票大作手回忆录
《 股票大作手回忆录 》

售價:HK$ 55.8
秩序四千年:人类如何运用法律缔造文明(世界重归混乱,文明岌岌可危,法律与秩序是我们仅有的武器。穿越时间,鸟瞰全球,一部波澜壮阔的人类文明史)
《 秩序四千年:人类如何运用法律缔造文明(世界重归混乱,文明岌岌可危,法律与秩序是我们仅有的武器。穿越时间,鸟瞰全球,一部波澜壮阔的人类文明史) 》

售價:HK$ 154.6
民法典1000问
《 民法典1000问 》

售價:HK$ 99.7
国术健身 易筋经
《 国术健身 易筋经 》

售價:HK$ 33.4
古罗马800年
《 古罗马800年 》

售價:HK$ 188.2
写出心灵深处的故事:踏上疗愈之旅(修订版)(创意写作书系)
《 写出心灵深处的故事:踏上疗愈之旅(修订版)(创意写作书系) 》

售價:HK$ 66.1
控制权视角下的家族企业管理与传承
《 控制权视角下的家族企业管理与传承 》

售價:HK$ 87.4

 

建議一齊購買:

+

HK$ 85.6
《构建实时机器学习系统》
+

HK$ 85.6
《Python机器学习经典实例》
+

HK$ 114.6
《深度学习与计算机视觉 算法原理、框架应用与代码实现》
+

HK$ 114.6
《深度学习算法实践》
+

HK$ 100.1
《多智能体机器学习:强化学习方法》
+

HK$ 243.6
《深度学习》
編輯推薦:
面向实际:针对现实中的问题,给出对应算法
底层讲解:详细讲解了算法的设计思路,体会大师的思想
涵盖面广:囊括常用的53种算法,用以解决各类问题
应用广泛:可用在数据挖掘、商务智能、广告与商品推荐等多个领域
內容簡介:
本书介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。本书涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。本书是一本算法领域内的技术参考书籍,涵盖数十种算法,通过由浅入深的介绍基础算法和机器学习算法相关理论和应用,阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不只是停留在表面,还从应用的角度提供了大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。
關於作者:
刘凡平,硕士,毕业于中国科学技术大学软件系统设计专业。曾任职微软亚太研发集团,从事互联网广告与分布式实时计算相关研发工作。后任职百度(中国)有限公司,并担任高级研发工程师。擅长于搜索引擎、大数据分析、分布式计算等相关研发工作,曾出版《大数据搜索引擎原理分析及编程实现》,是Iveely开源搜索引擎的主要贡献者之一,也是执着于将互联网技术演绎为艺术的完美追求者。
目錄
第1章 算法基础1
1.1 基础算法分析类型1
1.1.1 分治法1
1.1.2 动态规划法2
1.1.3 回溯法3
1.1.4 分支限界法4
1.1.5 贪心法4
1.2 算法性能分析5
1.3 概率论与数理统计基础6
1.4 距离计算8
1.4.1欧氏距离8
1.4.2马氏距离9
1.4.3曼哈顿距离9
1.4.4切比雪夫距离9
1.4.5闵氏距离9
1.4.6海明距离10
1.5 排序算法10
1.5.1 快速排序11
1.5.2 归并排序11
1.5.3 堆排序13
1.5.4 基数排序15
1.5.5 外排序16
1.6 字符压缩编码17
1.6.1 哈夫曼编码17
1.6.2 香农-范诺编码21
1.7 本章小结24
第2章 数据查找与资源分配算法25
2.1 数值查找算法25
2.1.1 二分搜索算法25
2.1.2 分块查找27
2.1.3 哈希查找28
2.2 字符串查找算法30
2.2.1 Knuth-Morris-Pratt算法31
2.2.2 Boyer-Moore算法34
2.2.3 Sunday算法37
2.3 海量数据中的查找39
2.3.1 基于布隆过滤器查找39
2.3.2 倒排索引查找41
2.4 银行家算法43
2.5 背包问题45
2.5.1 0-1背包问题45
2.5.2 部分背包问题47
2.6 本章小结47
第3章 路径分析算法49
3.1 基于Dijkstra算法的路径分析49
3.1.1 应用示例:极地探险49
3.1.2 基于Dijkstra的最短路径规划50
3.2 基于Floyd算法的路径分析53
3.2.1 应用示例:任意两个城市之间的最短路径53
3.2.2 Floyd原理54
3.2.3 基于Floyd算法计算两个城市最短距离56
3.3 基于A*算法的路径搜索58
3.3.1 应用实例:绕过障碍区到达目的地58
3.3.2 A*算法与最短距离计算59
3.4 基于维特比算法的概率路径61
3.4.1 应用实例:推断天气状态61
3.4.2 维特比算法思想62
3.4.3 计算天气状态62
3.5 最长公共子序列问题64
3.5.1 概要64
3.5.2 最长公共子串64
3.5.3 最长公共子序列原理66
3.5.4 实例:求两字符串的最长公共子序列66
3.6 本章小结68
第4章 相似度分析算法69
4.1 应用实例:海量网页相似度分析69
4.2 基于Jaccard相似系数的相似度计算70
4.2.1 计算流程70
4.2.2 狭义Jaccard相似系数71
4.2.3 广义Jaccard相似系数71
4.3 基于MinHash的相似性算法71
4.3.1 与Jaccard相似性关系71
4.3.2 计算网页文本相似性过程72
4.4 向量空间模型73
4.4.1 词袋模型73
4.4.2 TF-IDF算法74
4.5 基于余弦相似性算法的相似度分析76
4.5.1 原理基础76
4.5.2 公式解析77
4.5.3 计算网页文本相似性过程77
4.6 基于语义主题模型的相似度算法78
4.7 基于SimHash算法的指纹码80
4.7.1 SimHash引入81
4.7.2 SimHash的计算流程81
4.7.3 计算重复信息83
4.8 相似度算法的差异性84
4.9 本章小结85
第5章 数据分类算法86
5.1 基于朴素贝叶斯分类器86
5.1.1 有监督分类与无监督分类87
5.1.2 应用实例:识别车厘子与樱桃88
5.1.3 分类流程归纳91
5.1.4 应用扩展:垃圾邮件识别92
5.1.5 常用评价指标96
5.2 基于AdaBoost分类器100
5.2.1 AdaBoost概述100
5.2.2 AdaBoost算法具体流程101
5.2.3 AdaBoost算法的应用实例102
5.2.4 AdaBoost算法的优点105
5.3 基于支持向量机的分类器105
5.3.1 线性可分与线性不可分106
5.3.2 感知器107
5.3.3 支持向量机108
5.4 基于K邻近算法的分类器109
5.4.1 应用实例:电影观众兴趣发现109
5.4.2 核心思想109
5.4.3 电影观众兴趣发现110
5.5 本章小结113
第6章 数据聚类算法115
6.1 采用系统聚类法115
6.1.1 概述116
6.1.2 最短距离法117
6.1.3 重心聚类法119
6.1.4 动态聚类法120
6.2 基于K-Means聚类算法122
6.2.1 应用实例:新闻聚类122
6.2.2 逻辑流程123
6.2.3 实现新闻聚类分析124
6.2.4 K-Means128
6.2.5 K-中心点聚类算法129
6.2.6 ISODATA聚类算法130
6.3 基于密度的DBSCAN算法131
6.4 基于BIRCH算法的聚类分析133
6.4.1 聚类特征133
6.4.2 聚类特征树134
6.5 聚类与分类差异135
6.6 本章小结136
第7章 数据预测与估算算法137
7.1 产生式模型与判别式模型137
7.2 基于最大似然估计的预测138
7.3 基于线性回归的估算140
7.3.1 概要140
7.3.2 最小二乘法141
7.4 基于最大期望算法分析143
7.5 基于隐马尔科夫模型预测144
7.5.1 应用实例:高温天气与行为概率144
7.5.2 原理分析145
7.5.3 高温天气与行为概率147
7.6 基于条件随机场的序列预测151
7.6.1 应用实例151
7.6.2 原理分析151
7.6.3 条件随机场的优缺点153
7.7 本章小结154
第8章 数据决策分析算法155
8.1 基于ID3算法的决策分析156
8.1.1 信息量156
8.1.2 信息熵156
8.1.3 信息增益157
8.1.4 ID3算法流程157
8.1.5 ID3算法的应用157
8.2 基于C4.5算法的分类决策树159
8.2.1 概要159
8.2.1 应用实例159
8.3 基于分类回归树的决策划分161
8.3.1 概要162
8.3.2 应用实例:决策划分163
8.3.2 剪枝164
8.4 基于随机森林的决策分类168
8.4.1 随机森林的特点169
8.4.2 随机森林的构造方法169
8.4.3 应用实例:决定车厘子的售价层次170
8.5 本章小结172
第9章 数据关联规则分析算法174
9.1 基于Apriori算法的关联项分析174
9.1.1 应用实例:超市的货架摆放问题175
9.1.2 基本概要175
9.1.3 算法原理176
9.1.4 有效摆放货架176
9.2 基于FP-Growth算法的关联性分析179
9.2.1 构建FP树179
9.2.2 频繁项分析181
9.2.3 与Apripri算法比较184
9.3 基于Eclat算法的频繁项集挖掘184
9.4 本章小结185
第10章 数据与推荐算法187
10.1 概要187
10.1.1 推荐算法发展188
10.1.2 协同过滤推荐189
10.2 基于Item-Based协同过滤推荐190
10.2.1 Item-Based基本思想190
10.2.2 Slope One实例:基于评分推荐190
10.3 基于User-Based协同过滤推荐193
10.3.1 应用实例:根据人群的推荐194
10.3.2 User-Based与Item-Based对比197
10.4 基于潜在因子算法的推荐198
10.4.1 应用实例:新闻推荐198
10.4.2 流行度与推荐200
10.5 推荐算法与效果评价201
10.6 本章小结203
內容試閱
致 谢
本书的内容来自于我对日常学习和工作的总结,我要感谢本人曾经的导师于炯教授、叶勇教授,以及在微软和百度工作时的前辈王明雨、何绍建、黄诚,正是你们对我的悉心指导,才能使我有能力和勇气写出这本书,无论你们在哪里,凡平永远心存感激。当然还有那些曾经一起学习的同学、共事的朋友,你们曾经给予我很多无私的帮助,使我在和你们相处的过程中能够快速成长,感谢一路上有你们的陪伴,正是有你们,沿途的风景才格外美丽。
感谢英国的Peter Boden先生,虽然我们素未谋面,但是你却一直支持我们团队去实现自己的梦想,并连续两年无偿支持我们在Github开源社区的项目。在开源项目中,我们实现了不少有一定难度的算法,如果没有你的支持,也许我们不能正常完成相关的研发任务,更不可能去挑战搜索引擎中各类算法,尤其在人工智能领域的算法,对你的感激之情溢于言表。
感谢我的创业伙伴魏琪,当我提出我们一起研究人工智能技术时,你毫不犹豫地选择了和我一起艰苦创业。无论处在创业的何种困难期,你总是为团队加鼓气,你踏实和认真的工作态度让我钦佩不已,感谢你为本书的技术细节提出了真知灼见的修改意见,还有我一起工作的同学和朋友都对本书提出了改进意见,对此也表示深深的感谢。
感谢北京源智天下公司的吉老师及电子工业出版社的各位编辑,对本书的内容都给予了极大的帮助,对本书的出版也付出了辛苦汗水。
衷心感谢我的家人,感谢你们在过去一年中对我的理解和支持,为我营造了一个良好的写作环境,并鼓励我坚持认真写作,使本书能够顺利完成。
本书编写过程中还得到了很多朋友的支持和帮助,限于篇幅,虽然不能一一对你们表示感谢,但是我对你们一样表示感激。
最后,感谢这个时代给予每位有理想的人,赋予实现人生价值的机会!

前 言
中国在很早就开始了算法研究,如《周髀算经》、《九章算术》这类最具历史的算法书籍,以及后来的唐宋元明清各历史朝代也出现了如《一位算法》、《算法绪论》、《算法全书》、《算法统宗》等一系列算法名著,算法已经成为各行各业的基础研究。
本书通过介绍在互联网行业中经常涉及的算法包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法包括分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。本书是一本算法领域内的技术手册,涵盖数十种算法,不仅使读者深入了解各类算法的基本理论,还从应用的角度为读者提供大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。
本书特色
本书不仅将目前工程应用中主流的基础算法和机器学习算法都做了详尽的介绍,还囊括了当前热门算法内容,如分类算法、聚类算法、推荐算法等。本书充分利用了最新算法的应用研究结果,从实例的角度为读者展现一个清晰的算法应用,不拘泥于算法枯燥的理论,更多地从实用价值、工程价值的角度呈现给读者。
本书中的算法可以广泛应用于各个领域,可以在自然语言处理研究、数据分析与挖掘、商务智能、广告与商品推荐等领域中深入应用。作者秉承数据结合算法产生价值的理论体系,在介绍算法的同时与数据紧密关联,并结合多年实际工作经验,将算法的内容阐述淋漓尽致。本书中的算法研究在当前甚至未来相当一段时间内都具有很高的实际意义。
本书结构
本书按照由浅入深、循序渐进的顺序对现代搜索引擎原理和实现进行介绍。全书共分为两大部分,共十个章节。第一部分主要针对基础领域算法的介绍和应用,包含第1章到第4章;第二部分主要针对机器学习领域算法的理论认识和实例解析,包含第5章到第10章。全书各章的主要内容如下。
第1章 算法基础
本章从算法的分析类型,如从分治法、动态规划、回溯法、分支限界法、贪心法,入手开始介绍算法内容,不仅如此还分析了算法的性能,并介绍了概率论与数理统计基础部分的内容。同时,还对算法中常用的距离计算算法、排序算法及字符串压缩编码也做了完整介绍。
第2章 数据查找与资源分配算法
本章以数据的查找和资源分配作为突破口,介绍了常用的数值查找算法,如二分查找算法、分块查找及哈希查找算法。除此之外,还介绍了常见的字符串查找算法及在海量数据中的查找算法:布隆过滤器和倒排索引查找。介绍了资源分配算法,包括常用的银行家算法和背包问题的解决算法。
第3章 路径分析算法
本章介绍的内容主要集中在路径规划算法上,包括基于Dijkstra算法、Floyd算法、A*算法的路径分析方法。除了介绍传统的路径规划算法外,还介绍了维特比算法在概率中的路径选择,以及最长公共子串、最长公共子序列问题的求解算法。整个内容涵盖了绝大部分的路径选择算法。
第4章 相似度分析算法
本章介绍的内容主要集中在相似内容的分析理论和应用,从简单的Jaccard相似系数开始入手,逐步深入到MinHash相似性算法,以及后续的向量空间模型,向量空间模型已经成为众多算法的基础理论。后续还深入介绍了余弦相似性算法和基于语义主题模型的语义相似度计算方法,以及基于SimHash的指纹码重复值验证算法。
第5章 数据分类算法
本章集中介绍了数据分类算法的解决方案,从简单易于理解的朴素贝叶斯模型开始,由浅入深地介绍AdaBoost分类器及支持向量机,它们都是数据分类的有效解决方案,还对机器学习的相关基础知识做了概要介绍。最后还介绍了K邻近算法在数据分类中的应用。
第6章 数据聚类算法
本章介绍了数据聚类的相关算法,其中,无监督的聚类算法目前是研究比较热门的领域。首先介绍了传统的基于系统聚类的方法;然后介绍了基于距离计算的K-Means聚类算法及基于密度的DBSCAN算法;最后还介绍了基于BIRCH算法的聚类分析,通过聚类特征及聚类特征实现数据聚类。
第7章 数据预测与估算算法
本章介绍了数据的预测和估算的算法体系和应用范例,从产生式模型和判别式模型入手介绍各类模型的方法论。首先介绍了基于最大似然估计的预测算法,以及基于线性回归的方法、最大期望算法;然后介绍了基于隐马尔科夫模型的问题预测模型;最后介绍了基于隐马尔科夫模型的条件随机场模型。
第8章 数据决策分析算法
本章对数据决策的分析方法做了详细介绍,主要围绕决策树的理论基础展开介绍。首先介绍了基于ID3算法的决策树分析,包括信息熵、信息增益等;然后介绍了基于ID3算法扩展的C4.5算法及分类回归树模型;最后还介绍了随机森林在决策分类中的应用。介绍过程中包含了大量实例。
第9章 数据关联规则分析算法
本章主要介绍了关联规则分析方法的理论和实践。Apriori算法作为最常用的关联规则分析算法已经被广泛应用到各个领域,本章也对Apriori算法进行了深入的介绍,并对和Apriori算法同等重要的FP-Growth算法也通过实例做了详细介绍。本章最后还介绍了利用倒排文件思想的Eclat算法。
第10章 数据与推荐算法
本章主要介绍了数据与推荐算法中的应用关系,推荐算法作为目前各行各业最热门的算法之一,已经应用非常广泛。本章介绍了基于物品本身属性关系的Item-Based协同过滤推荐算法,以及基于人群的User-Based协同过滤推荐算法。除此之外,还介绍了基于流行度和潜在因子的推荐算法,以及推荐算法的效果评估相关内容。
本书通过对数据与算法相关理论介绍和应用,将理论和实际应用结合,并阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不仅停留在表面。由浅入深地将基础算法和机器学习算法成熟应用到各个领域,达到游刃有余的状态。但因为每个算法都存在一定的缺点,所以希望读者能充分了解、掌握各个算法,将算法的作用发挥到极致。
除此之外,读者也能够从本书中快速、高效地从大量数据中找出所需要的数据或其他信息,这在大数据时代起到了非常重要的作用,给读者带来极大的便利。
读者对象
?适合对基本算法和机器学习算法有兴趣的读者。
?适合于对数据分析和统计学有兴趣的读者。
?适合于对算法有研究的基础算法、机器学习工程师。
?适合互联网行业的不同层次从业者。
?适合于在校学习的软件或计算机专业的大学生。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.