2.7_延伸阅读
2.7 延伸阅读
英伟达已经在其网站上的白皮书中详细描述了费米架构和开普勒架构。下面的白皮书介绍了费米架构。
NVIDIA GeForce GPU的下一代:
www.nvidia.com/object/GTX_400_architecture.html。
以下的白皮书介绍了开普勒架构及其在英伟达 GeForce GTX 680(GK104)的具体实现:
www.geforce.com/Active/en_US/en_US/pdf/GeForce-GTX-680-Whitepaper-FINAL.pdf。
英伟达的工程师们也发表了多篇架构方面的论文,提供了各种支持CUDA的GPU的更详细的描述:
Lindholm, E., J. Nickolls, S. Oberman, and J. Montrym. NVIDIA Tesla: A unified graphics and computing architecture. IEEE Micro 28 [2], March-April 2008, pp. 39-55.
Wittenbrink, C., E. Kilgariff, and A. Prabhu. Fermi GF100 GPU architecture. IEEE Micro 31 (2), March-April 2011, pp. 50-59.
Wong等人使用CUDA开发了验证性实验,并阐明了特斯拉架构硬件方面的知识点:
Wong, H., M. Papadopoulou, M. Sadooghi-Alvandi, and A. Moshovos. Demystifying GPU microarchitecture through microbenchmarking. 2010 IEEE International Symposium on Performance Analysis of Systems and Software (IPSASS), March 28-30, 2010, pp. 235-246.