GPU和CPU的區(qū)別是什么?_第1頁
GPU和CPU的區(qū)別是什么?_第2頁
GPU和CPU的區(qū)別是什么?_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本文格式為Word版,下載可任意編輯GPU和CPU的區(qū)別是什么? GPU在幾個主要方面有別于DSP(Digital Signal Processing,簡稱DSP(數(shù)字信號處理)架構(gòu)。其全部計算均使用浮點算法,而且目前還沒有位或整數(shù)運算指令。此外,由于GPU專為圖像處理設(shè)計,因此存儲系統(tǒng)實際上是一個二維的分段存儲空間,包括一個區(qū)段號(從中讀取圖像)和二維地址(圖像中的X、Y坐標(biāo))。此外,沒有任何間接寫指令。輸出寫地址由光柵處理器確定,而且不能由程序轉(zhuǎn)變。這對于自然分布在存儲器之中的算法而言是極大的挑戰(zhàn)。最終一點,不同碎片的處理過程間不允許通信。實際上,碎片處理器是一個SIMD數(shù)據(jù)并行執(zhí)行單元,

2、在全部碎片中獨立執(zhí)行代碼。 盡管有上述約束,但是GPU還是可以有效地執(zhí)行多種運算,從線性代數(shù)和信號處理到數(shù)值仿真。雖然概念簡潔,但新用戶在使用GPU計算時還是會感到迷惑,由于GPU需要專有的圖形學(xué)問。這種狀況下,一些軟件工具可以供應(yīng)關(guān)心。兩種高級描影語言CG和HLSL能夠讓用戶編寫類似C的代碼,隨后編譯成碎片程序匯編語言。Brook是專為GPU計算設(shè)計,且不需要圖形學(xué)問的高級語言。因此對第一次使用GPU進(jìn)行開發(fā)的工作人員而言,它可以算是一個很好的起點。Brook是C語言的延長,整合了可以直接映射到 GPU的簡潔數(shù)據(jù)并行編程構(gòu)造。經(jīng) GPU存儲和操作的數(shù)據(jù)被形象地比方成“流”(stream),類

3、似于標(biāo)準(zhǔn)C中的數(shù)組。核心(Kernel)是在流上操作的函數(shù)。在一系列輸入流上調(diào)用一個核心函數(shù)意味著在流元素上實施了隱含的循環(huán),即對每一個流元素調(diào)用核心體。Brook還供應(yīng)了約簡機制,例如對一個流中全部的元素進(jìn)行和、最大值或乘積計算。Brook還完全隱蔽了圖形API的全部細(xì)節(jié),并把GPU中類似二維存儲器系統(tǒng)這樣很多用戶不熟識的部分進(jìn)行了虛擬化處理。用Brook編寫的應(yīng)用程序包括線性代數(shù)子程序、快速傅立葉轉(zhuǎn)換、光線追蹤和圖像處理。利用ATI的X800XT和Nvidia的GeForce 6800 Ultra型GPU,在相同高速緩存、SSE匯編優(yōu)化Pentium 4執(zhí)行條件下,很多此類應(yīng)用的速度提上升

4、達(dá)7倍之多。 對GPU計算感愛好的用戶努力將算法映射到圖形基本元素。類似Brook這樣的高級編程語言的問世使編程新手也能夠很簡單就把握GPU的性能優(yōu)勢。訪問GPU計算功能的便利性也使得GPU的演化將連續(xù)下去,不僅僅作為繪制引擎,而是會成為個人電腦的主要計算引擎。 GPU和CPU的區(qū)分是什么? 要解釋兩者的區(qū)分,要先明白兩者的相同之處:兩者都有總線和外界聯(lián)系,有自己的緩存體系,以及數(shù)字和規(guī)律運算單元。一句話,兩者都為了完成計算任務(wù)而設(shè)計。 兩者的區(qū)分在于存在于片內(nèi)的緩存體系和數(shù)字規(guī)律運算單元的結(jié)構(gòu)差異:CPU雖然有多核,但總數(shù)沒有超過兩位數(shù),每個核都有足夠大的緩存和足夠多的數(shù)字和規(guī)律運算單元,并

5、幫助有許多加速分支推斷甚至更簡單的規(guī)律推斷的硬件;GPU的核數(shù)遠(yuǎn)超CPU,被稱為眾核(NVIDIA Fermi有512個核)。每個核擁有的緩存大小相對小,數(shù)字規(guī)律運算單元也少而簡潔(GPU初始時在浮點計算上始終弱于CPU)。從結(jié)果上導(dǎo)致CPU擅特長理具有簡單計算步驟和簡單數(shù)據(jù)依靠的計算任務(wù),如分布式計算,數(shù)據(jù)壓縮,人工智能,物理模擬,以及其他許多許多計算任務(wù)等。GPU由于歷史緣由,是為了視頻嬉戲而產(chǎn)生的(至今其主要驅(qū)動力還是不斷增長的視頻嬉戲市場),在三維嬉戲中經(jīng)常消失的一類操作是對海量數(shù)據(jù)進(jìn)行相同的操作,如:對每一個頂點進(jìn)行同樣的坐標(biāo)變換,對每一個頂點根據(jù)同樣的光照模型計算顏色值。GPU的眾

6、核架構(gòu)特別適合把同樣的指令流并行發(fā)送到眾核上,采納不同的輸入數(shù)據(jù)執(zhí)行。在 2003-2004年左右,圖形學(xué)之外的領(lǐng)域?qū)<议_頭留意到GPU與眾不同的計算力量,開頭嘗試把GPU用于通用計算(即GPGPU)。之后NVIDIA 發(fā)布了CUDA,AMD和Apple等公司也發(fā)布了OpenCL,GPU開頭在通用計算領(lǐng)域得到廣泛應(yīng)用,包括:數(shù)值分析,海量數(shù)據(jù)處理(排序,Map- Reduce等),金融分析等等。 簡而言之,當(dāng)程序員為CPU編寫程序時,他們傾向于利用簡單的規(guī)律結(jié)構(gòu)優(yōu)化算法從而削減計算任務(wù)的運行時間,即Latency。當(dāng)程序員為GPU編寫程序時,則利用其處理海量數(shù)據(jù)的優(yōu)勢,通過提高總的數(shù)據(jù)吞吐量(Throughput)來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論