永久免费男同av无码入口,日韩av午夜在线观看老司机wx,亚洲熟妇无码久久精品爱

本書內容簡潔、直觀、實用，強調計算思維能力和并行編程技巧。本書主要分為四個部分：第一部分介紹異構并行計算編程的基礎概念，包括數(shù)據并行化、GPU架構、CUDA編程及程序性能優(yōu)化方法等內容；第二部分介紹并行模式，包括卷積、模板、并行直方圖、歸約、前綴和、歸并等內容；第三部分介紹高級模式及應用，包括排序、稀疏矩陣計算、圖遍歷、深度學習、迭代式磁共振成像重建、靜電勢能圖和計算思維等內容；第四部分介紹高級編程實踐，包括異構計算集群編程、CUDA動態(tài)并行化等內容。本書不僅適合高等院校計算機相關專業(yè)的學生學習，也適合并行計算領域的技術人員參考。

前　　言
Programming Massively Parallel Processors: A Hands-on Approach, Fourth Edition

我們非常自豪地向你介紹本書。
融合多核CPU和多線程GPU的大眾市場計算系統(tǒng)已經將萬億級別的計算能力引入筆記本電腦中，將億億級別的計算能力引入計算集群中。在如此強大的計算動能下，我們正處于科學、工程、醫(yī)學以及商業(yè)領域廣泛應用計算實驗的黎明。我們也親歷了GPU計算在金融、電子商務、石油與天然氣、制造等關鍵產業(yè)垂直市場的廣泛滲透。通過具有前所未有的規(guī)模、精確度、安全性、可控性與可視性的計算實驗，這些領域的突破將得以實現(xiàn)。本書為這一愿景提供了關鍵要素，即將并行編程教授給數(shù)百萬研究生和本科生，使得計算思維和并行編程技能能夠與微積分技能一樣廣泛普及。
本書的主要讀者是所有需要通過計算思維和并行編程技能來取得科學與工程學科上的突破的研究生和本科生。此外，本書還被業(yè)內專業(yè)開發(fā)人員廣泛使用，目標是在并行計算領域學習新的技能，與技術的飛速進步保持同步。這些專業(yè)開發(fā)人員涵蓋機器學習、網絡安全、自動駕駛、計算金融、數(shù)據分析、認知計算、機械工程、土木工程、電氣工程、生物工程、物理學、化學、天文學以及地理學等領域，他們運用計算推動著各自領域前沿技術的發(fā)展。因此，這些開發(fā)人員既需要是領域專家，同時也必須是編程專家。本書通過逐步建立對技術的直觀理解這一方式講授并行編程。我們假設讀者至少具備基本的C編程經驗。我們選用了CUDA C這一并行編程環(huán)境，該環(huán)境需要NVIDIA GPU的支持。在大眾消費者和專業(yè)人員手中已有超過10億臺這樣的處理器，而超過40萬名程序員在積極地運用CUDA進行開發(fā)。你在學習過程中開發(fā)出的應用程序，將有可能被非常龐大的用戶社群所使用。
自2016年第3版上市以來，我們收到了許多來自讀者和教師的寶貴意見。其中，很多人肯定了本書現(xiàn)有的非常重要的特點，其他人則提供了關于如何擴展本書內容以使其更具價值的建議。與此同時，自2016年以來，用于異構并行計算的硬件和軟件技術已經取得了巨大的進步。在硬件領域，GPU計算架構已經推出了三代新版本，分別是Volta、Turing和Ampere。在軟件領域，從CUDA 9到CUDA 11的發(fā)展使程序員得以訪問新的硬件和系統(tǒng)功能。同時，新的算法也得到了開發(fā)。為適應這些變化，我們新增了四章，并對大部分現(xiàn)有章節(jié)進行了重寫。

新增的四章包括一個基礎性章節(jié)（第4章），以及三個關于并行模式和應用的章節(jié)（第8章、第10章和第13章）。我們增加這些章節(jié)的初衷如下：

第4章：在之前的版本中，關于架構和調度方面的討論分布在多個章節(jié)中。在這一版中，我們將這些討論集中在一起，以便感興趣的讀者學習。
第8章：在之前的版本中，模板模式在關于卷積的章節(jié)中略有提及，因為這兩種模式有相似之處。在這一版中，第8章對模板模式進行了更為全面的介紹，強調其背后的數(shù)學原理，突出其與卷積不同的方面，從而為進一步的優(yōu)化提供了可能。這一章還提供了處理三維網格和數(shù)據的示例。
第10章：在之前的版本中，歸約模式在關于性能的章節(jié)中略有提及。在這一版中，第10章更為全面地呈現(xiàn)了歸約模式，采用漸進的方式應用優(yōu)化方法，并更深入地分析了相關的性能權衡。
第13章：在之前的版本中，歸并排序在關于歸并模式的章節(jié)中略有提及。在這一版中，第13章將基數(shù)排序作為一種極其適用于GPU并行化的非比較排序算法進行介紹。第13章采用漸進的方式進行優(yōu)化，并分析了性能權衡。此外，這一章還對歸并排序進行了探討。
除了新增的章節(jié)外，所有章節(jié)都經過了修訂，部分章節(jié)經過了大幅修改。這些章節(jié)包括：
第6章：之前在本章中的關于架構的內容已經移到第4章，歸約示例部分則移至第10章。對于刪改的部分，我們進行了重寫以更全面地處理線程粒度問題，更為重要的是，提供一份常見的性能優(yōu)化策略清單，并討論了每種策略所解決的性能瓶頸。這份清單在本書的其余部分中被用來優(yōu)化各種并行模式和應用程序的代碼。我們的目標是強調一種用于優(yōu)化并行程序性能的系統(tǒng)且漸進的方法。
第7章：在之前的版本中，關于卷積模式的章節(jié)以一維卷積作為示例，對二維卷積僅進行了簡要處理。在這一版中，我們對本章進行了重寫，從一開始就更加注重討論二維卷積。這一變化使我們能夠更全面地探討更高維度平鋪的復雜性和細節(jié)，并為讀者學習卷積神經網絡（第16章）提供更好的背景。
第9章：在之前的版本中，關于直方圖模式的章節(jié)從一開始就應用了線程粗化優(yōu)化，并將私有化優(yōu)化與共享內存的使用相結合。在這一版中，我們對本章進行了重寫，采用更漸進的方式進行性能優(yōu)化�，F(xiàn)在介紹的初始實現(xiàn)不再應用線程粗化，并將私有化和在私有bin中使用共享內存區(qū)分為兩種獨立的優(yōu)化方式，前者旨在減少原子操作的爭用，后者旨在減少訪問延遲。線程粗化在私有化后應用，因為粗化的一個主要優(yōu)點是減少提交到公共副本的私有副本數(shù)量。這種新的章節(jié)組織方式更加貼合本書始終遵循的系統(tǒng)化和漸進化的性能優(yōu)化方法。此外，由于原子操作被用于多塊歸約和單次掃描核函數(shù)中，因此為了更早地引入原

你還可能感興趣

我要評論