新書推薦:
《
敦煌通史:魏晋北朝卷
》
售價:HK$
162.3
《
唯美手编16:知性优雅的编织
》
售價:HK$
54.9
《
情绪的惊人力量:跟随内心的指引,掌控情绪,做心想事成的自己
》
售價:HK$
50.4
《
棉的全球史(历史·文化经典译丛)
》
售價:HK$
109.8
《
超越百岁看这本就够了
》
售價:HK$
55.8
《
亚洲戏剧史·南亚卷
》
售價:HK$
143.4
《
中国历代竹器图谱与数字活化
》
售價:HK$
557.8
《
EDA技术与设计(第2版)
》
售價:HK$
85.0
|
內容簡介: |
本书详细阐述了稀疏矩阵相关计算的应用背景,并对目前已知的主要压缩编码格行了简要介绍。在此基础上,分别对稀疏矩阵向量乘(SpMV)、稀疏矩阵、稀疏矩阵乘(SpGEMM)的算法设计和实现技行了详细阐述。介绍了面向异构计台的稀疏矩阵划分方法及SpMV负载均衡算法,能够充分利用CPU GPU以及多GPU构成的异构计算系统的资源。介绍了一种基于数学形态学的稀疏矩阵划分方法,该方法基于稀疏矩阵缩略图和形态学方法,提取稀疏矩阵中稠密子矩阵括矩形区域、三角形区域,以及对角线,并根据非零元分布为不同的子矩阵选择较优的压缩编码格式。本书还介绍了基于机器学SpMV性能预测方法,以及多精度优化相关内容。后对常用的开源库程序以及相关的工行了简要介绍。本书建议的读者为从事相关科学计算和工程计算的研究人员、工程师,以及从事大规模稀疏线性方程组求解和稀疏矩阵计算优化的高校教师和研究生。
|
目錄:
|
第1章 稀疏矩阵概述 1
1.1 矩阵与稀疏矩阵 1
1.2 应用领域 1
1.2.1 线性系统 2
1.2.2 图计算 7
1.2.3 线性规划 8
1.2.4 PageRank算法 9
1.3 稀疏矩阵相关计算 12
1.3.1 BLAS 12
1.3.2 Sparse BLAS 14
1.3.3 SpMV 16
1.3.4 SpGEMM 16
1.3.5 SpMM 17
本章参考文献 18
第2章 稀疏矩阵压缩编码方法 23
2.1 常见压缩编码概述 23
2.2 常见基本压缩格式 24
2.2.1 COO 24
2.2.2 CSR 24
2.2.3 ELL 25
2.2.4 DIA 26
2.3 切片和分块压缩格式 26
2.3.1 BCSR 26
2.3.2 BCCOO/BCCOO 27
2.3.3 CSR5 28
2.3.4 CSR2 30
2.3.5 SELL 30
2.3.6 CDS 31
2.4 混合格式 31
2.4.1 HYB 31
2.4.2 MMSparse 32
2.4.3 其他 33
本章参考文献 33
第3章 SpMV研究现状综述 36
3.1 问题定义 36
3.2 格式选择 37
3.2.1 基于目标平台特性的格式选择 37
3.2.2 基于强化学习的格式选择 37
3.2.3 基于决策树的格式选择 38
3.2.4 基于SVM的格式选择 38
3.2.5 基于深度学习的格式选择 39
3.3 面向体系结构的优化 40
3.3.1 面向多核/众核处理器的优化 40
3.3.2 面向GPU的优化 42
3.3.3 基于FPGA的优化 42
3.3.4 面向异构计算平台的优化 43
3.4 自动调优技术 43
3.5 矩阵划分 44
3.5.1 一维划分 44
3.5.2 二维划分 45
本章参考文献 45
第4章 SpGEMM研究现状综述 51
4.1 SpGEMM介绍 51
4.2 常见应用 52
4.2.1 代数多网格求解器 52
4.2.2 三角形计数 53
4.2.3 多源宽度优先搜索 55
4.3 主要研究方法 56
4.3.1 结果矩阵的大小预测 56
4.3.2 矩阵划分和负载均衡 59
4.3.3 中间结果累加 62
4.4 面向体系结构的优化 64
4.4.1 多核平台 64
4.4.2 现场可编程门阵列 67
4.4.3 异构计算平台 67
4.4.4 分布式平台 67
4.5 实验评估 68
4.5.1 系统设置 69
4.5.2 测试基准 70
4.5.3 评估结果 71
4.6 挑战与未来工作 76
本章参考文献 77
第5章 面向异构平台的SpMV优化算法 86
5.1 CPU-GPU异构平台编程 86
5.2 基于机器学习的SpMV性能预测 88
5.2.1 基于回归分析的性能预测 89
5.2.2 模型训练与测试 89
5.2.3 性能分析 91
5.3 面向异构平台的划分与协同优化算法 91
5.3.1 稀疏矩阵数据布局分析 91
5.3.2 特定模式稀疏矩阵的SpMV划分 92
5.3.3 SpMV计算协同任务优化 93
5.3.4 实验评估 96
5.3.5 小结 99
5.4 多GPU异构平台的SpMV优化 100
5.4.1 面向CPU - GPU异构平台的稀疏矩阵划分 101
5.4.2 实验评估 106
5.4.3 小结 114
本章参考文献 115
第6章 基于数学形态学的SpMV划分优化方法 119
6.1 矩阵划分 119
6.2 基本工作流程 121
6.3 形状识别 123
6.4 矩阵二维划分 132
6.5 算法实现与GPU优化 135
6.5.1 形状识别算法实现 135
6.5.2 GPU优化 136
6.6 实验评估 138
6.6.1 SpMV性能分析 139
6.6.2 形态学参数选择 142
6.6.3 数据失真 143
6.6.4 额外开销分析 144
本章参考文献 145
第7章 面向GPU的SpMV编码选择算法 146
7.1 引言 146
7.2 在GPU上进行稀疏格式选择的重要性 148
7.2.1 SpMV内核在GPU上的性能 148
7.2.2 SpMV内核在GPU上的能效 150
7.3 BestSF:一种稀疏元格式 151
7.3.1 离线训练 152
7.3.2 在线决策 153
7.4 稀疏特征选择 153
7.5 Pairwise Model学习 155
7.5.1 学习算法 155
7.5.2 特征选择 156
7.5.3 训练与测试 156
7.6 评估 157
7.7 总结 164
本章参考文献 164
第8章 SpMV性能预测分析 168
8.1 引言 168
8.2 面向硬件体系结构的性能预测方法 169
8.3 基于传统机器学习的性能预测方法 170
8.4 基于深度学习的性能预测方法 180
8.5 多性能指标下SpMV性能分析 182
本章参考文献 183
第9章 面向精度的稀疏矩阵计算优化 186
9.1 数据表示与精度 186
9.1.1 常见浮点数据表示 186
9.1.2 处理器与精度 188
9.1.3 精度可调算法设计的主要挑战 191
9.2 混合精度算法设计 192
9.2.1 数据驱动的混合精度算法 192
9.2.2 混合精度的迭代算法 192
9.2.3 混合精度的预条件迭代算法 193
9.2.4 计算格式与存储格式解耦 195
本章参考文献 197
220章 开源库和工具 199
10.1 测试集 199
10.1.1 SuiteSparse Matrix Collection 199
10.1.2 SparseBench 201
10.2 相关库 201
10.2.1 cuSPARSE 201
10.2.2 CSPARSE 202
10.2.3 CUSP 202
10.2.4 bhSPARSE 203
10.2.5 KokkosKernels 203
10.2.6 SpBLAS 203
10.2.7 Scilab 204
10.2.8 各类库对比 204
本章参考文献 204
彩插 206
|
|