1.4_结构

1.4 结构

本书按照逻辑结构分成三部分。第一部分包括第 141 \sim 4 章,概述 CUDA硬件和软件的架构。

第2章详细介绍CUDA的硬件平台和GPU本身。

第3章介绍CUDA的软件架构。

第4章介绍CUDA软件环境,包括CUDA软件工具描述和亚马逊的ECI环境。

第二部分包括第 5105 \sim 10 章,深入介绍CUDA编程模型的方方面面。

第5章涵盖内存,包括设备内存、常量内存、共享内存和纹理内存。

第6章介绍流和事件,这一机制用于CPU和GPU之间、GPU不同硬件单元(例如,复制引擎和流处理器簇)之间或者多个独立GPU之间的“粗-细粒度”结合的并行处理。

第7章涵盖内核执行,包括动态并行这一CUDA 5.0和SM 3.5中的新特性。

第8章涵盖流处理器簇的各个方面。

第9章涵盖多GPU应用程序,包括以N-体为例的点对点操作和高难度的并行操作。

第10章涵盖CUDA纹理的各个方面。

最后,在 111511 \sim 15 章的第三部分讨论几个有针对性的CUDA应用程序。

第11章介绍带宽限制、以向量乘法为例的流式负载等内容。

第12和13章描述归约和并行前缀求和(也称为“扫描”)算法,两者都是并行编程的重要基石。

第14章介绍N-体应用,这是一族可以大大受益于GPU计算的重要的高计算密集型应用。

第15章深入考查称为归一化相关系数特征提取的图像处理操作。第15章提供的代码是本书中唯一同时使用纹理和共享内存以提供最佳性能的地方。

1.4_结构 - The CUDA Handbook | OpenTech