新書推薦:
《
甲骨文丛书·剑桥世界暴力史(第一卷):史前和古代世界(套装全2册)
》
售價:HK$
210.6
《
甲骨文丛书·中华早期帝国:秦汉史的重估
》
售價:HK$
300.2
《
欲望与家庭小说
》
售價:HK$
98.6
《
惜华年(全两册)
》
售價:HK$
70.3
《
甲骨文丛书·古代中国的军事文化
》
售價:HK$
99.7
《
中国王朝内争实录(套装全4册):从未见过的王朝内争编著史
》
售價:HK$
244.2
《
半导体纳米器件:物理、技术和应用
》
售價:HK$
177.0
《
创客精选项目设计与制作 第2版 刘笑笑 颜志勇 严国陶
》
售價:HK$
61.6
|
內容簡介: |
本书是首部关于网页排名科学的著作,是搜索排序姊妹篇的一本。本书主要内容有:网络搜索引擎简介、网络爬行、索引建立和查询处理、通过欢迎度对网页排名、PageRank的数学、PageRank模型中的参数、PageRank的敏感性、作为线性系统的PageRank问题、PageRank大规模实现中的问题、加速PageRank计算、更新PageRank向量、HITS网页排名方法、网页排名的其他链接方法、网络信息检索的未来、网络信息检索资源、数学指南、术语汇编、参考文献、索引。
本书可作为数学、计算机、网络技术、管理学和数据科学等专业领域科研人员和工程技术人员的参考书,也可作为教材使用。
|
關於作者: |
艾米N兰维尔是查尔斯顿学院的数学教授。
卡尔D梅耶是北卡罗莱纳州立大学的数学教授。
他们是《谁排第一?关于评价和排序的科学》(机械工业出版社普林斯顿大学出版社)的作者。
|
目錄:
|
目录
前言Ⅲ
第1章网络搜索引擎简介1
1 1信息检索简史1
1 2传统信息检索回顾5
1 3网络信息检索9
第2章网络爬行、索引建立和查询处理15
2 1网络爬行15
2 2内容索引19
2 3查询处理21
第3章通过欢迎度对网页排名25
3 11998年的情景25
3 2两篇论文26
3 3查询无关性30
第4章谷歌PageRank的数学31
4 1PageRank的原始求和公式32
4 2求和方程的矩阵表示33
4 3迭代过程问题34
4 4一点关于马尔可夫链理论的介绍36
4 5基本模型的早期修正36
4 6PageRank向量的计算39
4 7谷歌矩阵的谱定理及其证明45
第5章PageRank模型中的参数47
5 1α因子47
5 2超链接矩阵H48
5 3跳转矩阵E49
第6章PageRank的敏感性57
6 1对α的敏感性57
6 2对H的敏感性62
6 3对vT的敏感性63
6 4其他敏感性分析63
6 5有关敏感性的定理和证明66
第7章作为线性系统的PageRank问题71
7 1I-αS的性质71
7 2I-αH的性质72
7 3PageRank稀疏线性系统的证明73
第8章PageRank大规模实现中的问题75
8 1存储问题75
8 2收敛准则79
8 3精度79
8 4悬挂结点80
8 5对后退按钮建模84
第9章加速PageRank计算89
9 1一种自适应的幂法89
9 2外插90
9 3聚合94
9 4其他数值方法97
第10章更新PageRank向量99
10 1两类更新问题及其发展历程100
10 2重启幂法101
10 3使用近似聚合进行近似更新102
10 4精确聚合104
10 5精确聚合与近似聚合的比较105
10 6利用迭代聚合进行更新107
10 7确定划分109
10 8结论111
第11章HITS网页排名方法115
11 1HITS算法115
11 2HITS的实现117
11 3HITS的收敛性119
11 4HITS示例120
11 5HITS的优点与缺点122
11 6HITS与文献统计学的关系123
11 7查询无关的HITS124
11 8加速HITS126
11 9HITS的敏感性126
第12章网页排名的其他链接方法131
12 1SALSA131
12 2混成排名方法135
12 3基于流量的排名136
第13章网络信息检索的未来139
13 1垃圾信息139
13 2个性化142
13 3聚类142
13 4智能体143
13 5趋势与时间敏感搜索144
13 6隐私和审查146
13 7图书馆分类方式147
13 8数据融合148
第14章网络信息检索资源149
14 1入门阶段的资源149
14 2用于严肃的科学研究的资源150
第15章数学指南153
15 1线性代数153
15 2佩隆弗罗贝尼乌斯定理167
15 3马尔可夫链175
15 4佩隆补186
15 5随机补192
15 6设限194
15 7聚合195
15 8去聚合198
第16章术语汇编201
参考文献207
索引218
|
內容試閱:
|
《谷歌的PageRank及更多》是首部关于网页排名科学的著作,不论是对于好奇于科学的读者而言,还是对于关注于计算方面的技术型读者而言,该书都是易于理解的,书中的每一章都包含了某些能同时适用于这两类读者的内容。艾米兰维尔和卡尔梅耶在书中包括了若干富于娱乐性的杂谈,如搜索引擎如何赢利,以及中国大陆的防火长城如何对研究工作产生影响,等等。书中包括了若干MATLAB代码、示例性网络数据集的链接,以及为帮助一般读者学习更多有关搜索引擎的数学知识而设计的、背景知识广泛的一个介绍性章节。贯穿全书,作者们都鼓励读者去实验书中的思路和算法进行。
任何对提高在主要搜索引擎中的排名抱有严肃兴趣的业者,都能从清晰的示例、例程和所提供的资源列表中获益。
|
|