



下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、流處理器數(shù)量目錄概述詳細(xì)定義分類編輯本段概述賣場(chǎng)中,一位裝機(jī)技術(shù)員侃侃而談:“ NVIDIA 最新的GTX295顯卡核 心只有2*240個(gè)流處理器,ATI的HD5970顯卡核心卻有3200個(gè)流處理器, 你要最高性能的顯卡,當(dāng)然要選 HD5970顯卡?!盇MD-ATI顯卡(以下簡(jiǎn)稱A卡)和NVIDIA (以下簡(jiǎn)稱N卡)在流處理 器數(shù)量上的巨大差異給許多讀者造成巨大的困惑。其實(shí),這個(gè)情況和不同 廠商、相當(dāng)于CPU的二級(jí)緩存數(shù)量存在差異情況類似,簡(jiǎn)單來(lái)說(shuō)就是“不 同架構(gòu)的GPU,流處理器的作用不盡相同,不能直接比較數(shù)量。”深入的解 釋請(qǐng)看下文說(shuō)明編輯本段詳細(xì)定義早在微軟推出的DirectX 7當(dāng)中就
2、曾經(jīng)提出過一個(gè)概念 T&L (中文 名稱是坐標(biāo)轉(zhuǎn)換和光源),它可以看做是流處理器的鼻祖,隨著顯卡核心 芯片技術(shù)的發(fā)展,在DirectX 8中。由微軟首次提出了 Shader的概念。并 且將Shader分為Vertex Shader (頂點(diǎn)著色器,又稱VS單元)和Pixel Shader (像素著色器,又稱PS單元)。一副游戲畫面是怎么顯示的呢?其中,3D物體的幾何形狀、光亮和陰 影的控制是由Vetex Shader來(lái)實(shí)現(xiàn)的,而Pixel Shader是對(duì)象素資料進(jìn) 行操作運(yùn)算的指令程序。其中包括了像素的色彩、深度坐標(biāo)等資料,在 GeForce 8之前,Pixel Shader和Vetex Sh
3、ader這兩個(gè)參數(shù)非常重要,這 兩個(gè)部分的多少完全決定了顯卡的性能表現(xiàn),N卡和A卡雙方都為了提升Pixel Shader和Vetex Shader的數(shù)量而想盡一切辦法。但是,在DirectX10這一代顯卡中,業(yè)界提出了一個(gè)新的概念一一統(tǒng)一渲染架構(gòu),就是把原有的VS單元和PS單元統(tǒng)一起來(lái),統(tǒng)稱為Shader運(yùn)算單元。這也就是我們 所說(shuō)的流處理器(Stream Processor)。因此,上述任務(wù)就由流處理器統(tǒng)一 執(zhí)行了,既然流處理器是來(lái)自于 VS單元和PS單元的統(tǒng)一渲染架構(gòu)。那么, 流處理器的作用于VS單元+PS單元的合作用就是基本相同的。只是添加了 全新的處理單元Geometry Shader
4、(幾何渲染器,又稱GS單元)。同一架構(gòu)的顯卡,流處理器的個(gè)數(shù)自然是越多越好。相信讀者也在各 大網(wǎng)站了解到這樣的信息一一“同價(jià)位的產(chǎn)品中,N卡的流處理器數(shù)量要少 于A卡”。比如本文開頭的裝機(jī)技術(shù)員提到ATI Radeon HD5890顯卡比NVIDIA GeForce GTX275顯卡的流處理器數(shù)量多,這是正確的。但是性能卻 是前者稍遜于后者.這是為什么呢,其實(shí)在“流處理器”的名稱上 A卡和N 卡存在細(xì)微的差別,N卡的流處理器全稱為Stream Processing,而A卡的 流處理器全稱為Stream Processing Units,一詞之差卻讓兩者的的性能差 距有著天壤之別。而且因?yàn)锳卡和
5、N卡的GPU架構(gòu)存在根本性的差異,所 以流處理器的工作方式和用途也有所差異,故不能直接比較流處理器的數(shù) 量。這就可以解決許多讀者的疑問了。A卡的GPU流處理器數(shù)量多很多但性能不一定就好。下面我們來(lái)分析 A卡和N卡的GPU架構(gòu)及流處理器的工 作方式,看看有什么不同.在DirectX 9時(shí)代末期,ATI意識(shí)到像素渣染的重要性,就通過 1: 3的架 構(gòu)提高了像素著色器的數(shù)量.到了 DirectX 10時(shí)代,ATI還是通過這種方 式來(lái)提高重要的像素渲染性能。從RV770的核心架構(gòu)圖中可以看出,現(xiàn)在 在ATI的GPU中,流處理器(Scteam Processing)和流處理單元(Stream Proce
6、ssing Units )的比例就是1: 5,也就是說(shuō)ATI的每個(gè)“Stream Processing 都包含有 5 個(gè)“Stream Processing Units。 RV770 的流處 理器組群擴(kuò)充至10組,因此數(shù)量也有了 25倍的增長(zhǎng)。達(dá)到160個(gè)(160 x5=800 個(gè)流處理單元).所以A卡所稱的“流處理器”實(shí)際上一般是指流處理單元。NVIDIA方面,GeForce GTX200核心架構(gòu)分為四個(gè)層。最上面一層包括 幾何著色器(Geometry Shader)、頂點(diǎn)著色器(Vetex Shader )和像素著色 器(Pixel Shader ) .中間一層包括了 10組TPCs(計(jì)算
7、處理器群集)。每組 TPC里面又包含了 3組SMs (流處理器組),每組SM里面就包含了 8個(gè)流 處理器單元或計(jì)算單元,這樣一來(lái),GeForce GTX 200顯卡就一共包含了 240個(gè)流處理器單元或計(jì)算單元.流處理器是直接將多媒體的圖形數(shù)據(jù)流映 射到流處理器上進(jìn)行處理的,有可編程和不可編程兩種。1995年公布的名為 Cheops中的流處理器,是針對(duì)某一個(gè)特定的視頻處理功能而設(shè)計(jì)的一種不可編程的流處理器。但為了得到一定的靈活性,系統(tǒng)中也包含一個(gè)通用的可 編程處理器。從1996年到2001年,MIT和Standford針對(duì)圖像處理的應(yīng)用,研制了名 為Imagine的可編程流處理器。Imagine
8、流處理器沒有采用cache,而是采 用一個(gè)流寄存器文件SRF(Stream Register File),作為流(主)存儲(chǔ)器與 處理器寄存器之間的 緩沖存儲(chǔ)器,來(lái)解決存儲(chǔ)器帶寬問題的。流存儲(chǔ)器與 SRF之間的帶寬是2GB/s,SRF與處理器寄存器之間的帶寬是32GB/s, ALU簇 (ALU Cluster)內(nèi)寄存器與ALU之間的帶寬是544GB/s,三種帶寬的比例關(guān) 系為 1:16:272。抗鋸齒是3D特效中最重要的效果之一,它經(jīng)過多年的發(fā)展,變?yōu)橐粋€(gè) 龐大的家庭,有必要獨(dú)立開來(lái)說(shuō)明一下。作用:去除物體邊緣的鋸齒現(xiàn)象,廣州話稱之為“狗牙”,大家可以 想像一下狗牙是如何的凹凸不平。過程:我們?cè)?/p>
9、真實(shí)世界看到的物體,由無(wú)限的像素組成,不會(huì)看到有 鋸齒現(xiàn)象,而顯示器沒有足夠多的點(diǎn)來(lái)表現(xiàn)圖形,點(diǎn)與點(diǎn)之間的不連續(xù)就 造成了鋸齒??逛忼X通過采樣算法,在像素與像素之間進(jìn)行平均值計(jì)算,增加像素 的數(shù)目,達(dá)到像素之間平滑過渡的效果。去掉鋸齒后,還可以模擬高分辨 率游戲的精致畫面。它是目前最熱門的特效,主要用于1600 * 1200以下的低分辨率。理論上來(lái)說(shuō),在17寸顯示器上,1600 * 1200分辨率已經(jīng)很 難看到鋸齒,無(wú)須使用抗鋸齒算法。如此類推,在19寸顯示器上,必須使用1920 x 1080分辨率,總之,越大的顯示器,分辨率越高,才越不會(huì)看 到抗鋸齒 1920 x 1200。由于 RAMDA
10、C (Random Access Memory Digital to Analog Converter,隨機(jī)存儲(chǔ)器數(shù)/模轉(zhuǎn)換器)頻率和顯示器制造技術(shù)的限 制,我們不可能永無(wú)止境地提升顯示器和顯卡的分辨率,抗鋸齒技術(shù)變得 很有必要了。超級(jí)采樣抗鋸齒最早期的全屏抗鋸齒,方法簡(jiǎn)單直接。首先,圖像創(chuàng)建到一個(gè)分離的 緩沖區(qū),緩沖區(qū)圖像分辨率高于屏幕分辨率,假設(shè)是 2*1 (或2x),那么 緩沖區(qū)場(chǎng)景的水平尺寸比屏幕分辨率高兩倍,若是2*2 (或4x)抗鋸齒,緩沖區(qū)圖像的水平和垂直均比顯示圖像大兩倍。像素計(jì)算加倍之后,選取2個(gè)或4個(gè)鄰近像素,此過程稱為采樣。把這些采樣混合起來(lái)后,生成的最 終像素,擁有鄰近
11、像素的特征,那么像素與像素之間的過渡色彩,就變得 更為近似,整個(gè)圖像的色彩過渡趨于平滑。再把最終像素輸出到幀緩沖, 作為一幅圖像存儲(chǔ)起來(lái),然后發(fā)到顯示器,顯示出一幀畫面。每幀都進(jìn)行 抗鋸齒處理,游戲過程中的所有畫面都變得帶有抗鋸齒效果了。游戲卡曼奇四中采用的4X抗鋸齒算法,Commanche 4 4xs邊緣超級(jí)采樣抗鋸齒超級(jí)采樣效果很好,但效率極低,嚴(yán)重影響顯卡性能。新的4x抗鋸齒方法,只把抗鋸齒應(yīng)用于物體邊緣,避免占用過大的緩沖區(qū)。工作過程比 超級(jí)采樣稍為復(fù)雜,幾何引擎生成多邊形后,光柵單元會(huì)進(jìn)行描色工作, 同時(shí)檢查當(dāng)前的紋理,看看它是否需要用 2x2采樣的方式填充到多邊形邊 緣。如果不是,
12、GPU只計(jì)算一種色彩,在中間插入紋理像素,然后用單色填 充這個(gè)塊。這些就是非邊緣像素,無(wú)須進(jìn)行抗鋸齒處理。編輯本段分類在進(jìn)入統(tǒng)一渲染架構(gòu)時(shí)代后,提高 Shade運(yùn)行頻率與效率是NVIDIA主 導(dǎo)的設(shè)計(jì)思路,而AMD則維持龐大的流處理器數(shù)量。兩種思路各有優(yōu)劣。1、N的優(yōu)勢(shì)和A的劣勢(shì)N卡的GPU中每個(gè)流處理器都具有完整的ALU (算術(shù)邏輯單元)功能,在 發(fā)出一條操作指令時(shí)每個(gè)流處理器都能充分工作.而A卡的GPU中每個(gè)流處理器的5個(gè)流處理單元都是固定的,不能拆開重組,如果在處理純 4D指 令的時(shí)候,每個(gè)流處理器只能處理一條4D指令,有一個(gè)流處理器單元閑置, 但卻無(wú)法加入其他組合來(lái)共同工作.簡(jiǎn)單地說(shuō),一個(gè)指令任務(wù)派發(fā)下來(lái)的時(shí)候,N卡的GPU是需要1個(gè)“人” 獨(dú)立工作即可完成。而A卡的GPU則需要5個(gè)“人”。結(jié)組工作才能完成 ATI的人數(shù)雖然多,但這5個(gè)“人”中有可能會(huì)有4個(gè)“人”閑置,因?yàn)檫@ 4個(gè)“人”不具有獨(dú)立完整的ALU功能,不能執(zhí)行函數(shù)運(yùn)算,浮點(diǎn)運(yùn)算和 Multipy 運(yùn)算。2、N
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 科技館物理試題及答案
- 2025年軍隊(duì)文職人員招聘之軍隊(duì)文職教育學(xué)綜合檢測(cè)試卷A卷含答案
- 2025年消防設(shè)施操作員之消防設(shè)備高級(jí)技能題庫(kù)檢測(cè)試卷A卷附答案
- 2022年遼寧省沈陽(yáng)市生物中考真題(含答案)
- 2022-2023學(xué)年廣東省廣州市海珠區(qū)中山大學(xué)附中七年級(jí)(下)期中數(shù)學(xué)試卷(含答案)
- 中小學(xué)教師學(xué)生心理健康教育及案例分析
- 遺產(chǎn)繼承遺囑聲明合同(2篇)
- 2025年法律知識(shí)學(xué)習(xí)競(jìng)賽必考題庫(kù)及答案(60題)
- 產(chǎn)品銷售記錄表-網(wǎng)絡(luò)銷售
- 農(nóng)村生態(tài)農(nóng)業(yè)示范區(qū)協(xié)議書
- 2025年中國(guó)羊毛絨線市場(chǎng)調(diào)查研究報(bào)告
- 肥料登記申請(qǐng)書
- 礦產(chǎn)勘探數(shù)據(jù)分析-深度研究
- 人教版高中英語(yǔ)挖掘文本深度學(xué)習(xí)-選修二-UNIT-4(解析版)
- 2025年北京控股集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 2024年07月江蘇銀行招考筆試歷年參考題庫(kù)附帶答案詳解
- 2025中智集團(tuán)招聘重要崗位高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年人事科年度工作計(jì)劃
- 2023-2024學(xué)年高中信息技術(shù)必修一滬科版(2019)第二單元項(xiàng)目三《 調(diào)查中學(xué)生移動(dòng)學(xué)習(xí)現(xiàn)狀-經(jīng)歷數(shù)據(jù)處理的一般過程》說(shuō)課稿
- 院感知識(shí)手衛(wèi)生培訓(xùn)內(nèi)容
- 產(chǎn)教融合咨詢協(xié)議書
評(píng)論
0/150
提交評(píng)論