6.4_本章小结

6.4 本章小结

除了在前面章节中介绍的全局内存和常量内存外,NVIDIA硬件还提供了其他类型的内存可供使用。与标准的全局常量内存相比,常量内存存在着一些限制,但在某些情况中,使用常量内存将提升应用程序的性能。特别是,当线程束中的所有线程都访问相同的只读数据时,将获得额外的性能提升。在这种数据访问模式中使用常量内存可以节约内存带宽,不仅是因为这种模式可以将读取操作在半线程束中广播,而且还因为在芯片上包含了常量内存缓存。在许多算法中,内存带宽都是一种瓶颈,因此采用一些机制来改善这种情况是非常有用的。

接着我们学习了如何通过CUDA事件在GPU执行过程的特定时刻上记录时间戳,看到了如何将CPU与GPU在某个事件上同步,以及如何计算在两个事件之间经历的时间。我们设计了一种方法来比较采用不同类型的内容来计算光线跟踪球面时的运行时间差异,并得出结论,对于本章的示例程序,使用常量内存将带来显著的性能提升。

6.4_本章小结 - CUDA by Example | OpenTech