版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、. 西南交通大學(xué)本科畢業(yè)設(shè)計(論文) 第 PAGE V頁:.;西 南 交 通 大 學(xué) 畢業(yè)設(shè)計英文翻譯節(jié)能型機(jī)房溫濕度遠(yuǎn)程控制系統(tǒng)測控節(jié)點(diǎn)設(shè)計年 級: 學(xué) 號: 姓 名: 專 業(yè): 指點(diǎn)教師: 二零一一年六月西南交通大學(xué)本科畢業(yè)設(shè)計(英文翻譯) 第 PAGE 34頁MosixMosix修正bsdi上的BSD/ OS來提供電腦上的跨網(wǎng)絡(luò)的動態(tài)負(fù)載平衡組和先發(fā)制人進(jìn)程遷移。這是不錯的東西,不只是為并行處置,但對于通常運(yùn)用一個集群很像一個可擴(kuò)展的SMP。能否有Linux版本?詳細(xì)信息,請看httpcs.huji.ac.il/mosix/。NOW (任務(wù)站網(wǎng)絡(luò))伯克利任務(wù)站網(wǎng)絡(luò)工程,/,曾經(jīng)極大地推行
2、了并行計算中運(yùn)用任務(wù)站網(wǎng)絡(luò),這里還有很多任務(wù)在進(jìn)展中,都努力于“在未來幾年內(nèi)展現(xiàn)一個實踐的100處置器系統(tǒng)。唉,他們不運(yùn)用linux。并行處置運(yùn)用linux并行處置運(yùn)用Linux WWW站點(diǎn),/LDP/,是這些指南和許多相關(guān)文件包括為全日制量身訂造的在線幻燈片的家園。除了在報紙工程上,普渡大學(xué)電機(jī)與計算機(jī)工程系曾經(jīng)是并行處置的領(lǐng)先者,這個網(wǎng)站的設(shè)立是為了協(xié)助 他人懇求并行處置的Linux電腦。 自從普渡大學(xué)的第一組Linux個人電腦在1994年2月組裝以來,曾經(jīng)誕生了許多的Linux PC集群,有些還包括視頻墻。然而這些集群運(yùn)用386,486和奔騰系統(tǒng)沒有奔騰Pro系統(tǒng),英特爾最近獲得普渡大學(xué)
3、的捐贈,將允許它的奔騰II系統(tǒng)構(gòu)建多個大型集群與單個群集方案多達(dá)165機(jī)。并且這些集群都將有論文網(wǎng),也具有最傳統(tǒng)的網(wǎng)絡(luò)。奔騰Pro集群研討會1997年,4月10-11日,埃姆斯實驗室在得梅因,愛荷華州舉行了奔騰Pro集群研討會。WWW在本次研討會,/workshops/PPCworkshop.html,從云集的參與者中搜集了很多豐富的PC集群信息。TreadMarks帝斯曼(分布式共享內(nèi)存)帝斯曼分布式共享內(nèi)存是一種技術(shù),即一個音訊傳送系統(tǒng)可以出現(xiàn)的行為作為一個SMP。有不少這樣的系統(tǒng),其中大部分運(yùn)用OS頁缺點(diǎn)觸發(fā)音訊傳輸機(jī)制。TreadMarks,/willy/TreadMarks/over
4、view.html,是這種系統(tǒng)更有效地之一,并在Linux集群上運(yùn)轉(zhuǎn)。壞音訊是“TreadMarks正在由一個小本錢的大學(xué)和非盈利機(jī)構(gòu)的分配。欲了解更多有關(guān)該軟件,請聯(lián)絡(luò)treadmarks信息。U型網(wǎng) (用戶級網(wǎng)絡(luò)接口架構(gòu))U型網(wǎng)用戶級網(wǎng)絡(luò)接口架構(gòu)在康奈爾大學(xué), HYPERLINK /U-Net/Default.html /U-Net/Default.html,工程試圖提供低延遲,高帶寬的網(wǎng)絡(luò)硬件運(yùn)用商品由虛擬的網(wǎng)絡(luò)接口,以便運(yùn)用程序可以發(fā)送和接納郵件沒有作業(yè)系統(tǒng)的干涉。在Linux上運(yùn)轉(zhuǎn)的U型網(wǎng),運(yùn)用DECchip DC21140的快速以太網(wǎng)卡或前置系統(tǒng)的主成分- 200不常設(shè)仲裁法院-2
5、00EATM卡。WWT (威斯康星風(fēng)洞)確實有相當(dāng)多集群相關(guān)的任務(wù)在威斯康星州。該WWT的威斯康星風(fēng)洞工程, HYPERLINK /wwt/ /wwt/,正在努力于對開展的“規(guī)范之間的并行編譯器和底層硬件接口各項任務(wù)。還有就是威斯康星牛集群任務(wù)站,協(xié)作共享內(nèi)存和暴風(fēng)雨的Paradyn并行性能工具等,不幸的是關(guān)于Linux的不是很多。4. 在A存放器的SIMD (例如,運(yùn)用MMX公司)在A存放器的SIMD單指令流多數(shù)據(jù)流SWAR并不是一個新想法。給定一個有k位存放器,數(shù)據(jù)途徑和功能單元機(jī),人們早知道,普通的存放器操作可以像SIMD一樣并行操作n,n/k位,整數(shù)字段值。然而,這只是由于對多媒體最近
6、有SIMD推進(jìn)的2倍到8倍加速技術(shù)已成為主流計算的關(guān)注。大多數(shù)微處置器1997的版本包括硬件SWAR支持: HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=amd/html/products/pcd/techdocs/appnotes/20726a.pdf AMD的K6型MMX公司多媒體擴(kuò)展 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=cyrix:80/process/SUPPORT/isv.htm Cy
7、rix的貨幣供應(yīng)M2 MMX公司多媒體擴(kuò)展 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=ftp.digital/pub/Digital/info/semiconductor/literature/alphahb2.pdf 數(shù)字Alpha馬克斯多媒體擴(kuò)展 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=hpcc997.external.hp:80/wsg/strategies/pa2go3/pa2go3.h
8、tml 惠普的PA - RISC的最大多媒體加速擴(kuò)展 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=el/drg/mmx/ 英特爾奔騰II和奔騰MMX公司與多媒體擴(kuò)展 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=microunity/www/mediaprc.htm Microunity Mediaprocessor SIGD單一數(shù)據(jù)組指令上 HYPERLINK translate.google/tra
9、nslate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=mips/arch/ISA5/ MIPS的數(shù)字媒體擴(kuò)展MDMX,發(fā)音瘋狂的麥克斯 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=sun/sparc/vis/index.html 的Sun SPARC V9的VIS視覺指令集還有一些新的微處置器提供了一個由硬件支持的幾洞,怪癖像場大小只支持一些操作一些。 重要的是要記住,但是,他不需求任何SWAR運(yùn)營的硬件有效的支持。 例如,位操作是不會被存放器邏輯分區(qū)影響的。4.1 S
10、WAR:有什么優(yōu)勢?雖然每個現(xiàn)代處置器至少具有一些并行執(zhí)行才干的SWAR,不幸的是,即使是最好的SWAR加強(qiáng)指令集不支持非常通用并行?,F(xiàn)實上,許多人曾經(jīng)認(rèn)識到,奔騰與“帶MMX技術(shù)的奔騰之間性能上的差別通常都是由宏大的L1緩存存在MMX呵斥的。因此,實踐上,什么是SWAR或MMX的優(yōu)勢呢?僅整數(shù),越小越好。 兩個32位值可安裝在64位MMX存放器,但這樣做的八單字節(jié)字符,更或者是一個完好的國際象棋板上的一位。注:將會有一個浮點(diǎn)版本的MMX,雖然在此篇文章中很少提及。Cyrix曾經(jīng)發(fā)布了一些幻燈片, HYPERLINK ftpftp.cyrix/developr/mpf97rm.pdf ftpf
11、tp.cyrix/developr/mpf97rm.pdf其中包括一些MMFP的評論。顯然,MMFP將支持兩個32位浮點(diǎn)數(shù)字裝入到一個64位的MMX存放器,結(jié)合這兩個MMFP管道將產(chǎn)生四個單精度每時鐘觸發(fā)器。SIMD或向量式并行。一樣的操作同事運(yùn)用到各個領(lǐng)域。有許多方法來廢止選定域的作用即相當(dāng)于掩蔽的SIMD,但它會帶來更為復(fù)雜的編碼和性能的損害。本地化,有規(guī)律的完美的包裝,內(nèi)存參考方式。SWAR在普通情況下,特別是MMX,在隨機(jī)存取方面很可怕;聚集一個相當(dāng)昂貴的xy向量其中y是一個索引陣列。這些都是嚴(yán)重的限制,但這種類型的并行算法,發(fā)生在許多并行而不只是多媒體運(yùn)用。對于算法的正確類型,SWA
12、R比SMP或并行群集更效率得多,而且它不需求任何費(fèi)用。4.2 SWAR編程導(dǎo)論SWAR的根本概念,在A存放器里的SIMD,是指在字長存放器的操作能被用于加速由SIMD在n,k/n位表上的操作運(yùn)算。然而,運(yùn)用SWAR技術(shù)能夠會難以處置,并且一些SWAR操作確實比串行序列比昂貴的多,由于他們需求額外的指令以執(zhí)行實地劃分。為了闡明這一點(diǎn),讓我們思索一個大大簡化的SWAR模型,管理每一個32位存放器里的4個8位字段。兩個存放器中的值可以表示為: PE3 PE2 PE1 PE0 +Reg0 | D 7:0 | C 7:0 | B 7:0 | A 7:0 | +Reg1 | H 7:0 | G 7:0 |
13、 F 7:0 | E 7:0 | +這個模型闡明每一個存放器都被有必要地視為一個包含4個獨(dú)立的8位整型的向量。另外,把A和E作為Reg0和Reg1來處置元素0PE0,把B和F視為PE1的存放器,等等。本文檔的其他部分簡要回想這些整數(shù)向量的SIMD并行操作的根本類型如何將這些功能都可以實現(xiàn)。多態(tài)操作有些SWAR操作可以很普通地運(yùn)用普通的32位整型操作,而不用擔(dān)憂這個操作是真的計劃在這些8位的字段上并行操作。我們呼吁任何SWAR操作多態(tài)性,由于該功能并未遭到字段類型大小的影響。測試假設(shè)任何字段是非零是多態(tài)的,由于都是按位邏輯運(yùn)算。例如,一個普通的位與操作C的&操作符執(zhí)行按位與,無論這個字段的大小。
14、一個簡單的存放器位與實例如下: PE3 PE2 PE1 PE0 +Reg2 | D&H 7:0 | C&G 7:0 | B&F 7:0 | A&E 7:0 | +由于位與操作總有K值的結(jié)果位值來影響操作,一切字段的大小都支持運(yùn)用一樣的單指令。分區(qū)操作不幸的是,很多重要的SWAR操作都不具有多態(tài)性。算術(shù)運(yùn)算,如加,減,乘,除等都實行在字段間進(jìn)/借位。我們稱這樣的SWAR操作為分區(qū),由于每一個這樣的操作必需有效地分開操作數(shù)和結(jié)果之間的相互作用,以防止字段間相互影響。然而,實踐上有三種不同的方法來獲得這樣的效果。分區(qū)闡明也許最明顯的方法來實現(xiàn)分區(qū)操作是字段間提供硬件支持的“分區(qū)并行指令來進(jìn)展字段見的
15、進(jìn)/借位。這種方法可以產(chǎn)生最高的性能,但它需求改動處置器的指令體系,但普通存在許多限制例如,8位字段能夠得到支持,但12位的并不能。AMD/Cyrix/Intel MMX, Digital MAX, HP MAX和 Sun VIS都實現(xiàn)分區(qū)指令限制版本。不幸的是,這些不同的指令集擴(kuò)展有不同的限制,使得他們之間的算法有些不簡便。例如,分析下面的采樣分區(qū)操作: 指令 AMD/Cyrix/Intel MMX DEC MAX HP MAX Sun VIS+| 絕對差別 | | 8 | | 8 |+| 相融最大值 | | 8, 16 | | |+| 比較 | 8, 16, 32 | | | 16, 32
16、 |+| 相乘 | 16 | | | 8x16 |+| 相加 | 8, 16, 32 | | 16 | 16, 32 |+在這個表中,這些數(shù)字闡明了字段的大小,以位為單位,因此每個操作都是支持的。即使此表省略了絕大多部分的外來指令,還是可以清楚地看到有許多差別。直接結(jié)果是高級言語HLLS并沒有編程模型那樣有效,并且可移植性普遍較差。未劃分的操作與校正碼用分區(qū)指令來實現(xiàn)分區(qū)操作一定是有效的,但假設(shè)他所需求的分區(qū)操作并不被硬件所支持時該如何處理?方法是他可以運(yùn)用一連串普通指令來實現(xiàn)字段見的進(jìn)/借位操作,來矯正那些不受歡迎的限制。這是一個純軟件的方法,并且做了上層引見,但它能在通用字段分區(qū)環(huán)境下任務(wù)
17、。這種做法也是完全通用的,由于它不僅可以被用來填補(bǔ)空白,闡明硬件支持的分區(qū),也可以用來提供完好的功能在一切的目的機(jī)器沒有硬件支持。現(xiàn)實上,如C一樣的表達(dá)言語,這種方法使得SWAR方案得到充分的可移植性。問題立刻出現(xiàn)了:很明顯,運(yùn)用帶糾錯碼的未分區(qū)操作來模擬SWAR分區(qū)操作是多么的無效?因此,這是一個類似于$64K的問題但許多操作并不像人們想象中的那么難。思索推行運(yùn)用四個原色的8位整型向量經(jīng)過運(yùn)用普通32位操作來實現(xiàn)兩個源向量的相加操作。一個普通的32位加法實踐上能夠產(chǎn)生正確的結(jié)果,但8位字段進(jìn)位操作排除在外。因此,我們的目的僅僅是確保這一的進(jìn)位不會發(fā)生。由于兩個k位字段的數(shù)相加最少會產(chǎn)生k+1
18、位的結(jié)果,我們能經(jīng)過簡單地掩蓋每個字段最有效的位來確保沒有進(jìn)位發(fā)生。下面是一個經(jīng)過與0 x7f7f7f7f的與操作來實現(xiàn)普通32位的加操作。t = (x & 0 x7f7f7f7f) + (y & 0 x7f7f7f7f);很顯然結(jié)果是正確的,除了每個字段里的最有效位。計算每個字段的正確值僅僅是一個分區(qū)的問題做兩個1位添加了7位最重要的位從x和y進(jìn)展計算的結(jié)果。僥幸的是,1位分區(qū)加操作是有一個普通的異或操作來實現(xiàn)的。因此,結(jié)果很簡單:(t (x y) & 0 x80808080)好吧,也許現(xiàn)實遠(yuǎn)非如此簡單。畢竟,這是經(jīng)過6次操作僅僅來實現(xiàn)4次相加。然而,請留意操作數(shù)并不是由一個功能有多少字段來
19、表示的因此,在更多的領(lǐng)域,我們需求提高?,F(xiàn)實上,我們能夠會加速反正只是由于字段被裝和操作存儲在一個單一整數(shù)向量,存放器的供應(yīng)情況能夠會有所改善,并且會有更少的動態(tài)代碼調(diào)度依賴由于部分字詞援用以被防止??刂谱侄沃刀硗鈨蓚€分區(qū)的操作方法來執(zhí)行兩個存放器中心得到利用的最大空間,可以更有效地計算,而不是控制字段值,使不同字段間的進(jìn)/借位永遠(yuǎn)不會發(fā)生。例如,例如,假設(shè)我們知道一切的字段值被添加的字段溢出,這樣會不會發(fā)生,分區(qū)添加操作可實現(xiàn)運(yùn)用一個普通的ADD指令,現(xiàn)實上,由于這個限制,一個普通的ADD指令出現(xiàn)多態(tài)性,是代碼可用的大小沒有收到有效的校正。因此,問題變成了如何確保字段值不會引起進(jìn)/借位事件
20、。確保這一點(diǎn)的一個方法是實施分區(qū)指令來限制字段值的范圍。Digital MAX的最低和最高指令可以被視為由硬件支持的防止內(nèi)部字段的進(jìn)/借位。然而,假設(shè)我們沒有分區(qū)才做指令來有效地限制字段值的范圍能否有充分的條件,能以廉價地確保進(jìn)/借位事件不會干擾相鄰字段?答案在于性能分析算法。兩個k位數(shù)相加最多會生成k+1位的結(jié)果;因此,一個k+1位字段可以平安地運(yùn)用這樣的操作雖然運(yùn)用普通指令來操作。因此,假設(shè)前面例子中的8位字段如今改成7位并帶有1位“進(jìn)/借位操作的字段: PE3 PE2 PE1 PE0 +Reg0 | D | D 6:0 | C | C 6:0 | B | B 6:0 | A | A 6:
21、0 | +7位向量之間的加操作的實現(xiàn)如下:讓我們假設(shè)一下,行動開場之前的任何分區(qū),一切的執(zhí)行間隔位A的,B的,C的,和D的的值為0.只需執(zhí)行一個普通的加操作,一切字段即可獲得正確的7位值;雖然,一些間隔位能夠會是1。我們可以經(jīng)過一個更傳統(tǒng)的操作來矯正它,如掩蓋間隔位。這樣7位的整型向量x與y相加,是這樣的:(x + y) & 0 x7f7f7f7f)這只用了兩個操作就實現(xiàn)了四次相加,很明顯效果良好。銳利的讀者能夠曾經(jīng)留意到,設(shè)置間隔位為0不適宜減操作。然而,這次修正卻非常簡單。為了計算x-y,我們只需確保一切x里的間隔位為1,而在y里的一切間隔位為0。最壞的情況下,我們可以得到:(x | 0
22、x80808080) - y) & 0 x7f7f7f7f)然而,更多的按位或操作往往可以得到優(yōu)化,確保最后一步操作生成的值是用X|0 x80808080而來的,而不是用&0 x7f7f7f7f而來的。哪種方法更適宜用于SWAR分區(qū)操作?答案很簡單“能產(chǎn)生最好的加速比。有趣的是,理想的方法,不同的是可在一樣的機(jī)器上運(yùn)轉(zhuǎn)一樣程序見的不同字段。通訊與類型轉(zhuǎn)換操作雖然一些并行計算,包括許多在圖像像素上的操作,所具備的性能是,一個向量里的第i個值是一個出如今第i個位置的僅值功能,通常卻不是這樣的。例如,例如,即使像素的FFT變換一樣的操作,如需求相鄰像素值從操作數(shù),并作為平滑需求更復(fù)雜的較少本地化的通
23、訊方式。有效地實現(xiàn)一維臨近溝通來讓SWAR運(yùn)用未分區(qū)的移位操作并不難。例如,挪動一個值從PEi到PEi+1,就是一個簡單的例子。假設(shè)字段是8位長的話,我們將運(yùn)用:(x 8) & 0 x00ffffff)參與“纏繞銜接也是合理有效地運(yùn)用未分區(qū)的變化。例如,環(huán)繞式地挪動一個值從PE(i)到PE(i+1):(x 24) & 0 x000000ff)真正的問題是當(dāng)更普通的溝通方式必需得到執(zhí)行。只需HP MAX指令集支持恣意的表,就是所謂的Permute。它確實是一個名不副實的表,不僅可以執(zhí)行恣意置換的字段,更可以允許反復(fù)??偸撬鼘崿F(xiàn)了一個恣意xy操作。不幸的是,xy在沒有如此的指令下很難實現(xiàn)。普通的代
24、碼序列都很長而且效率低下;實踐上它是延續(xù)的代碼。這樣非常另人絕望。在MasPar MP1/MP2 和具有思想的CM1/CM2/CM200 SIMD上執(zhí)行相對高速的xy操作是這些機(jī)器運(yùn)轉(zhuǎn)良好的關(guān)鍵要素。然而,xy以后都慢于臨近的溝通計算機(jī),即使是這些超級計算機(jī),所以許多算法的目的是為了盡量減少xy操作的需求??傊?,沒有硬件的支持,最好的做法就是開展SWAR算法,即使xy并不合法,更或者說至少不廉價。復(fù)發(fā)操作約化,掃描等復(fù)發(fā)是一種在被計算的質(zhì)之間存在明顯的延續(xù)關(guān)系的計算。然而,假設(shè)這些復(fù)發(fā)包含關(guān)系操作,它很有能夠會重新編碼計算運(yùn)用樹構(gòu)造的并行算法。并行發(fā)生的最常見的類型是能夠的減少關(guān)聯(lián)的類稱。例如
25、,要計算一個向量的值的綜合,一個純粹的延續(xù)C寫法如下:t = 0;for (i=0; i 8) & 0 x00ff00ff);第二步是將這些兩個16位字段的9位值進(jìn)展運(yùn)算而產(chǎn)生一個10位的結(jié)果:(t + (t 16) & 0 x000003ff)其實,第二步執(zhí)行兩個16位字段的相加但前16位加法是沒有意義的,這就是為什么結(jié)果是一個偽10位的結(jié)果。掃描,也被稱為“并行前綴行動,普通情況下比較難以有效地實現(xiàn)。這是由于,不像減少,掃描會產(chǎn)生分區(qū)結(jié)果。居于這個緣由,掃描可以實現(xiàn)于運(yùn)用一個相當(dāng)明顯的并行操作序列。4.3 Linux下的MMX SWAR對于Linux,IA32處置器是我們首要關(guān)注的。好音訊
26、是,AMD公司,Cyrix和英特爾都實現(xiàn)了同樣的MMX指令。不過,MMX公司的表現(xiàn)各不一樣,例如,在K6型只需一個MMX的管道-的MMX奔騰有兩個。 獨(dú)一真正的壞音訊是,英特爾依然在運(yùn)轉(zhuǎn)那些愚笨的MMX的廣告.實踐上有三種方法可以運(yùn)用MMX for SWAR:1.從MMX公司運(yùn)用程序庫。 特別是,英特爾曾經(jīng)開發(fā)了幾個“性能庫 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=el/drg/tools/ad.htm el/drg/tools/ad.htm ,可以向用戶提供各種義務(wù)的手,共同優(yōu)化多媒體程序。
27、 隨著一點(diǎn)點(diǎn)努力,許多非多媒體算法可以返工來確保一些計算密集型來實現(xiàn)運(yùn)用一個或多個這些庫例程。這些庫目前沒有可用的Linux,但可以移植。2.直接運(yùn)用MMX指令。出于兩個現(xiàn)實,這確實有點(diǎn)復(fù)雜。第一個問題是,MMX公司能夠并不運(yùn)用于處置器,因此另一種實現(xiàn)還必需提供。第二個問題是,IA32的Linux運(yùn)用的匯編器目前通常還無法識別MMX指令。3.運(yùn)用高級言語或模塊的編譯器,可以直接生成相應(yīng)的MMX指令。這些工具目前正在開展,但還沒有一個在Linux下充分發(fā)揚(yáng)作用。例如,在美國普渡大學(xué) HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh
28、-CN&prev=_t&u=/hankd/SWAR/ /hankd / SWAR / ,我們正在開發(fā)一個編譯器,將采取方言的C函數(shù)寫在一個顯式并行,并會產(chǎn)生SWAR模塊的調(diào)用為C的功能,以此來運(yùn)用現(xiàn)有的SWAR支持技術(shù),包括MMX。第一個原型模塊的編譯器,建于1996年秋季,然而,運(yùn)用這種技術(shù)將會比我們原先預(yù)期的更多的時間??傊?,MMX SWAR依然難以運(yùn)用。然而,隨著一點(diǎn)點(diǎn)額外的努力,上述第二種方法目前可以運(yùn)用了。下面是一些根底:1.他不能運(yùn)用MMX假設(shè)他的處置器不支持它。下面的GCC代碼將被用于測試MMX能否被他的處置器所支持。假設(shè)前往0那么表示不支持,假設(shè)前往非0那么表示支持。inlin
29、e externint mmx_init(void) int mmx_available; _asm_ _volatile_ ( /* Get CPU version information */ movl $1, %eaxnt cpuidnt andl $0 x800000, %edxnt movl %edx, %0 : =q (mmx_available) : /* no input */ ); return mmx_available;2.一個MMX存放器根本上長期持一個在GCC里稱之為無符號雙字型。因此,這種類型的內(nèi)存根底變量成為了MMX模塊與C程序之間的溝通機(jī)制?;蛘撸梢月暶魉?/p>
30、MMX數(shù)據(jù)為64位數(shù)據(jù)構(gòu)造的數(shù)據(jù)這樣便于確保64位隊列能經(jīng)過聲明他的數(shù)據(jù)類型為一個帶無符號雙字字段的結(jié)合體。3.假設(shè)MMX可用,他可以在他的MMX代碼中運(yùn)用字節(jié)的匯編指令,使每個指令進(jìn)展編碼。經(jīng)過手工來制造確實是一件苦楚的事情,但對于一個編譯器來生成卻不是一件難事。例如,MMX指令PADDB MM0,MM1可被編碼為GCC里的如下代碼:_asm_ _volatile_ (.byte 0 x0f, 0 xfc, 0 xc1nt);請記住,MMX通常運(yùn)用一些同樣類型的能被用于浮點(diǎn)操作的硬件,所以代碼與MMX混合運(yùn)用不得征引任何浮點(diǎn)運(yùn)算。浮點(diǎn)堆棧在執(zhí)行任何MMX代碼之前必需為空;浮點(diǎn)堆棧通常在不適用
31、浮點(diǎn)的C函數(shù)功能前是空的。4.經(jīng)過執(zhí)行EMMS指令的方式退出您的MMX代碼,它可被編碼為:_asm_ _volatile_ (.byte 0 x0f, 0 x77nt);能否上面看起來很為難很粗糙?然而,MMX還相當(dāng)年輕.這個文件的未來版本將提供更好的方法來運(yùn)用MMX SWAR。5. Linux的托管附加處置器雖然這種方法最近失寵了,這幾乎是不能夠的并行處置方法,以到達(dá)舉行一個附加的并行計算系統(tǒng)的低本錢,高性能的能夠,運(yùn)用Linux系統(tǒng)。 問題是,很少提供軟件支持,幾乎都是關(guān)于本人的研討。5.1 Linux的PC是良好的主機(jī)在普通情況下,往往附加并行處置器是專門履行職能的詳細(xì)類型。在知道幾乎一
32、切研討都是居于本人之前,了解一個道理:雖然它能夠很難找到一個適當(dāng)?shù)腖inux PC主機(jī)特定的系統(tǒng),在Linux平臺PC是一個非常適宜少數(shù)這種運(yùn)用類型。對以后的學(xué)習(xí)將會有很大的協(xié)助 。PC機(jī)作為主機(jī)有兩個主要緣由。首先是價錢低廉,且易于擴(kuò)展的才干;資源如:更多的內(nèi)存,磁盤,網(wǎng)絡(luò)等等,都是平凡地添加到個人電腦。第二個是銜接方便。不僅是ISA和PCI總線原型卡的廣泛運(yùn)用,并行端口提供合理的性能侵入接口更是一個優(yōu)勢。在在IA32的獨(dú)立的I/O空間也便于借口提供單獨(dú)的I/O端口地址,以起到硬件I/O地址的維護(hù)作用。Linux也成為了一名優(yōu)秀的主機(jī)操作系統(tǒng)。源代碼免費(fèi)提供全面和廣泛的“黑客導(dǎo)游,顯然是一個
33、宏大的協(xié)助 。然而,Linux還提供了良好的近實時調(diào)度,甚至有一個真正的實時Linux版本在 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=/rtlinux/ /RTLinux的/。也許更為重要的是,同時提供一個完好的UNIX環(huán)境中,Linux可以支持開發(fā)Windows工具,比如那些在微軟DOS和/或Windows。MSODS的程序可以在Linux中運(yùn)用dosemu MSDOS的情況下執(zhí)行,并且提供一個受維護(hù)的并且能真正運(yùn)轉(zhuǎn)MSDOS的虛擬機(jī)。Linux程序支持Windows 3.xx系列更是直接:
34、免費(fèi)軟件比如wine, HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=linpro.no/wine/ linpro.no/wine/,對于大多數(shù)的程序它模擬Windows 3.11非常的恰到益處,便于在UNIX/X環(huán)境下正確而且有效地執(zhí)行。以下兩部分將舉一些結(jié)合了并行系統(tǒng)的例子,我也希望它能在Linux下被支持。5.2 他的DSP是這樣么?有一個處置器昌盛的高性能DSP數(shù)字信號處置處置器市場。雖然這些芯片通常都被設(shè)計為嵌入式特定運(yùn)用系統(tǒng)中,但他們與并行電腦也有極大的關(guān)系,為什么呢?1.他們中的許多,
35、如德州儀器 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=ti/ ti/TMS320和模擬安裝 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=analog/ analog/的SHARC DSP家族,被設(shè)計來利用小或者無“膠的邏輯來構(gòu)建并行機(jī)器。2.他們很廉價,特別是每MIP或MFLOP。包括根本邏輯支持在內(nèi)的本錢,DSP處置器的本錢僅僅是PC電腦本錢的非常之一,對于DSP來說這并不是聞所未聞。3.他們不需
36、求太多的電量,也不會帶來太多的熱量。這意味著,有能夠有這樣一些芯片的一切的功率都是有傳統(tǒng)的PC電腦來提供,在封鎖的情況下他的PC電腦就不會變成一個烤箱。4.大多數(shù)DSP指令集里都具有看起來奇異的東西,那些高級例如,C編譯器好似是用得并不怎樣好,例如,“反向位是用一個附加的并行系統(tǒng),它可以最直接地編譯和運(yùn)轉(zhuǎn)主機(jī)的代碼,同時能在DSP上仔細(xì)手工調(diào)整代碼一樣運(yùn)轉(zhuǎn)最耗時算法。5.這些DSP處置器并不是真正設(shè)計于運(yùn)轉(zhuǎn)類UNIX操作系統(tǒng),而且普通都不是很便于作為獨(dú)立的通用計算機(jī)處置器。例如,許多處置器沒有內(nèi)存管理硬件。換句話說,他們能任務(wù)得到更好,當(dāng)他們被當(dāng)作一個更通用目的的電腦主機(jī)來運(yùn)用時如Linux電
37、腦。雖然有些聲卡和調(diào)制解調(diào)器包括DSP處置器的Linux驅(qū)動程序可以訪問,大收益運(yùn)用一個附加的有四個或更多的DSP處置器的并行系統(tǒng)。由于德州儀器TMS320系列, HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=ti/sc/docs/dsps/dsphome.htm ti/sc/docs/dsps/dsphome.htm,曾經(jīng)流行了非常久,但這僅僅是微缺乏道的建立TMS320,曾經(jīng)有好一些這樣的系統(tǒng)可用。如今曾經(jīng)有僅整型和浮點(diǎn)才干的TMS320版本,點(diǎn)格式舊的設(shè)計采用了不同尋常的單精度浮點(diǎn),但新機(jī)型支
38、持IEEE格式。老TMS320C4x又名C4x到達(dá)80 MFLOPS運(yùn)用TI的公用單精度浮點(diǎn)格式,相反,一個C67x將提供高達(dá)1 GFLOPS的單精度或420 MFLOPS雙精度為IEEE浮點(diǎn)運(yùn)算,運(yùn)用一個VLIW的芯片架構(gòu)稱為VelociTI。它不僅是易于配置多處置器集團(tuán)作為這些芯片,但在一個單一芯片中,C8x多處置器將提供100 MFLOPS IEEE浮點(diǎn)DSP的主從處置器的RISC隨著兩個或四個整數(shù)。 其他的DSP處置器家族最近曾經(jīng)被用于銜接并行系統(tǒng),有ADI公司的SHARC又名,ADSP-2106x HYPERLINK translate.google/translate?hl=zh-
39、CN&sl=en&tl=zh-CN&prev=_t&u=analog/ analog/ 。這些芯片可以配置為一個六處置器共享內(nèi)存多處置器技術(shù)而不需求額外的膠邏輯,而且更大的系統(tǒng)也可以配置運(yùn)用6個4位鏈接/芯片。大多數(shù)規(guī)模較大的系統(tǒng)似乎針對軍事運(yùn)用,但是有點(diǎn)昂貴。然而,綜合計算引擎公司 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=iced/ iced/,制造了一個有趣的小雙板PCI卡組,稱為GreenICE。本單元包含一個16SHARC處置器陣列,并可以提供格式精度IEEE峰值速度大約為190 GF
40、LOPS的處置器。GreenICE本錢還不到5000美圓。在我看來,并行DSP處置器真的值得在Linux并行操作社區(qū)里引起極大的關(guān)注。5.3 FPGA可重構(gòu)邏輯運(yùn)算假設(shè)并行處置是一切關(guān)于獲得最高的提速,那么為什么不建立定制的硬件? 好吧,我們都知道答案,它的本錢太大,開發(fā)時間太長,當(dāng)我們略微改動算法時便變得無用等。但是,最近進(jìn)展中的電可編程FPGA現(xiàn)場可編程門陣列已廢止了那些反對。如今,門密度足夠高,使整個simple FPGA的內(nèi)置處置器可以在一個單一,時間來重新配置重新設(shè)定的FPGA也曾經(jīng)下降到一個合理程度,這是重新配置,甚至是從一個挪動算法的一個階段到下一個。這東西不適宜心臟虛弱的人:他
41、必需運(yùn)用硬件描畫言語如VHDL的FPGA配置,主機(jī)系統(tǒng),以及寫作的低級別的代碼到Linux上的程序接口。但是FPGA本錢低,尤其是算法操作在低精度的整數(shù)數(shù)據(jù)實踐上,還擅長于SWAR的小超集,F(xiàn)PGA執(zhí)行復(fù)雜的操作系統(tǒng)時的速度可以和他輸入的數(shù)據(jù)速度一樣快。例如,簡單的基于FPGA的系統(tǒng)曾經(jīng)在基因數(shù)據(jù)庫搜索時間上曾經(jīng)優(yōu)于超級計算機(jī)系統(tǒng)。還有其他公司在制造適宜的基于FPGA的硬件,但下面的兩家公司做了一個很好的示范。虛擬電腦公司提供各種產(chǎn)品的運(yùn)用動態(tài)可重構(gòu)SRAM為根底的賽靈思FPGA。他們的8/16位的“虛擬的ISA樣機(jī)板 HYPERLINK vcc/products/isa.html vcc/p
42、roducts/isa.html,價錢低于2000美圓。Altera的ARC的PCIAltera的可重構(gòu)計算機(jī),PCI總線 HYPERLINK translate.google/translate?hl=zh-CN&sl=en&tl=zh-CN&prev=_t&u=altera/html/new/pressrel/pr_arc-pci.html altera/html/new/pressrel/pr_arc-pci.html,是同類型的卡,但是運(yùn)用的是Altera FPGA和一個PCI總線,而不是ISA總線。許多工具的設(shè)計,硬件描畫言語,編譯器,路由器,映射器等,作為對象的代碼只運(yùn)轉(zhuǎn)在Wind
43、ows和/或DOS下。任何時候當(dāng)您需求運(yùn)用它們時,他可以簡單地堅持并重新啟動您主機(jī)PC上的磁盤分區(qū)為DOS / Windows,然而,許多這些軟件包可以在Linux下運(yùn)用dosemu或像wine一樣的Windows模擬器。6. 普遍感興趣本節(jié)中所包含的資料,適用于一切四個并行處置模型的Linux。6.1 編程言語和編譯器我是一個比較知名的編譯器研討者,所以我想說,有很多非常棒的編譯器在為Linux系統(tǒng)自動產(chǎn)生有效的并行代碼。不幸的是,如今很難突破的一個現(xiàn)實是,經(jīng)過各種明確的溝通和帶有C代碼的并行操作普通都是有GCC來編譯的。下面的言語/編譯器工程,是指言語中的一些高級別盡了最大努力從消費(fèi)走向合
44、理高效的代碼。普通來說,每個目的都有各種各樣有效合理的義務(wù),但沒有一個強(qiáng)大的通用言語和編譯系統(tǒng),這將使他永遠(yuǎn)停頓編寫由GCC編譯的C程序哪個更好呢。出于他們的用途來運(yùn)用這些言語和編譯器,他會更更短的開發(fā)時間,更容易調(diào)試和維修等。下面列出了大量的言語和編譯器排名不分先后。下面這網(wǎng)站里有許多免費(fèi)提供的編譯器其中大部分與Linux并行處置無關(guān) HYPERLINK idiom/free-compilers/ idiom/free-compilers/。Fortran 66/77/PCF/90/HPF/95至少在科學(xué)計算社區(qū),總是會z有Fortran的存在。當(dāng)然,如今的Fortran并不意味著還是處置1
45、966年的ANSI規(guī)范一樣的事情,F(xiàn)ortran66是一個很簡單的東西。Fortran77添加了大量的圖像功能,其中最明顯的改良是支持字符數(shù)據(jù)和循環(huán)變化。PCF并行計算論壇Fortran試圖添加各種功能的支持圖像的并行處置于77型。HPF高性能的Fortran, HYPERLINK /HPFF/home.html /HPFF/home.html,這本身曾經(jīng)閱歷了兩個版本HPF-1和HPF-2,根本上是加強(qiáng),規(guī)范的,版本很多的東西。如我們以前認(rèn)識的CM Fortran言語,MasPar Fortran,或者Fortran D;它延伸的Fortran90具有加強(qiáng)的并行處置的規(guī)劃,主要集中在制定的數(shù)
46、據(jù)。最后,F(xiàn)ortran95是一個相對次要的和提高完善的90。就像能運(yùn)轉(zhuǎn)C程序的普通也能運(yùn)動f2c,g77一個不錯的Linux公用概述, HYPERLINK linux.uni-regensburg.de/psi_linux/gcc/html_g77/g77_91.html linux.uni-regensburg.de/psi_linux/gcc/html_g77/g77_91.html,是商業(yè)的Fortran90/95產(chǎn)品從 HYPERLINK extweb.nag.co.uk/nagware/NCNJNKNM.html extweb.nag.co.uk/nagware/NCNJNKNM.
47、html中可以獲得相關(guān)資料。這是由于一切的這些編譯器最終都?xì)w結(jié)為同一代碼生成GCC的運(yùn)用背景。商業(yè)的Fortran parallelizers,可以生成用于SMPS的代碼從現(xiàn)有的 HYPERLINK kai/ kai/和 HYPERLINK psrv/vast/vast_parallel.html psrv/vast/vast_parallel.html。如今尚不清楚,能否這些編譯器會用在SMP Linux上,但它有能夠會給出在SMP Linux下任務(wù)的規(guī)范POSIX線程即,LinuxThreads。波特蘭集團(tuán), HYPERLINK translate.google/translate?hl=
48、zh-CN&sl=en&tl=zh-CN&prev=_t&u=pgroup/ pgroup/,具有商業(yè)并行的可以為SMP Linux生成代碼的HPF Fortran和C,C+編譯器;他們也有一個針對運(yùn)用MPI或PVM的集群。這些在 HYPERLINK %20httpapri/ apri/ 的FORGR/spf/xHPF產(chǎn)品有能夠?qū)MP或集群有用。免費(fèi)提供的并行Fortrans能夠任務(wù)于的并行Linux系統(tǒng)包括:1.ADAPTOR自動數(shù)據(jù)并行翻譯, HYPERLINK gmd.de/SCAI/lab/adaptor/adaptor_home.html gmd.de/SCAI/lab/adapt
49、or/adaptor_home.html,它們可以利用MPC或PVM將HPF翻譯成77/90代碼,但沒有提及到Linux。2.FX HYPERLINK /fx/Fx /fx/Fx在卡內(nèi)基梅隆有一些目的任務(wù)站集群,能否有Linux?3.HPFCHPF的原型編譯器, HYPERLINK cri.ensmp.fr/coelho/hpfc.html cri.ensmp.fr/coelho/hpfc.html利用PVM可以生成Fortran77代碼。它在Linux集群中可用么?4.PARADIGM以分布式內(nèi)存通用途置機(jī)為目的的并行化, HYPERLINK /Paradigm/ /Paradigm/能和L
50、inux一同運(yùn)用么?5.北極星編譯器, HYPERLINK /eigenman/polaris/ /eigenman/polaris/,能為共享內(nèi)存處置器生 成Fortran代碼,并有能夠很快被重定向于Linux集群。6.PREPARE, HYPERLINK irisa.fr/EXTERNE/projet/pampa/PREPARE/prepare.html irisa.fr/EXTERNE/projet/pampa/PREPARE/prepare.html,目的MPI集群.如今還不明確它能否能生成在IA32處置器上運(yùn)轉(zhuǎn)的代碼。7.集合AD APT和ADLIB,shpf子集高性能Fortran
51、編譯系統(tǒng), HYPERLINK ccg.ecs.soton.ac.uk/Projects/shpf/shpf.html ccg.ecs.soton.ac.uk/Projects/shpf/shpf.html是公共域的,并能利用MPI產(chǎn)生Fortran90調(diào)用所以,假設(shè)他有一個Linux下的Fortran90編譯器.8.SUIF斯坦福大學(xué)中間形狀,請參閱 HYPERLINK / /具有C和Fortran的并行編譯器。這也是國家重點(diǎn)工程的編譯器根底設(shè)備那么,一切人都會來關(guān)注并行Linux系統(tǒng)么?我敢一定,我脫漏了各種方言的Fortran編譯器,許多潛在的有用的,但有這么多確實難以跟蹤。今后,我寧愿
52、只列出那些運(yùn)轉(zhuǎn)在Linux上鮮為人知的編譯器。請電子郵件您珍貴的意見或建議到 HYPERLINK /HOWTO/hankd hankd。GLU明晰的粒狀構(gòu)造GLU明晰的粒狀構(gòu)造是一個非常高層次的建立在混合編程模型上的編程系統(tǒng),結(jié)合了內(nèi)涵和必要的模型。它同時支持PVM和TCP套接字。它能否在Linux下運(yùn)轉(zhuǎn)呢?更多的信息可以見 HYPERLINK csl.sri/GLU.html csl.sri/GLU.html。Jade和SAMJade是一種并行編程言語,擴(kuò)展了C的功能來順應(yīng)延續(xù)的和必要的程序。它假定一個分布式共享存儲模型,這是Sam實施集群任務(wù)站PVM的運(yùn)用。 更多信息可在 HYPERLIN
53、K /scales/sam.html /scales/sam.html。Mentat和LegionMentat是一個可與任務(wù)站集群一同運(yùn)轉(zhuǎn)的面向?qū)ο蟮牟⑿刑幹孟到y(tǒng),并且已被移植到Linux。Mentat編程言語MPL是一種建立在C+根底之上的面向?qū)ο蟮木幊萄哉Z。Mentat執(zhí)行系統(tǒng)運(yùn)用類似于非阻塞遠(yuǎn)程調(diào)用技術(shù)。更多的信息可以見 HYPERLINK /mentat/ /mentat/Legion HYPERLINK /legion/ /legion/建立在Mentat之上,提供了單個虛擬機(jī)在廣域網(wǎng)機(jī)器的表現(xiàn)。MPL (MasPar 編程言語)為了不與Mentat的MPL混淆,這種言語最初被開展為
54、公用于MasPar SMID超級計算機(jī)的本地并行C言語。然而,MasPar曾經(jīng)不再從事這方面的業(yè)務(wù)了它們?nèi)缃袷荖eoVista Solutions, HYPERLINK neovista neovista,一個數(shù)據(jù)采集公司,但他們的MPL建成運(yùn)用GCC編譯器,所以它依然是免費(fèi)提供。在亨茨維爾和普渡大學(xué)的共同努力下,MarPar的MPL曾經(jīng)可以利用AFAPI實現(xiàn)重定向生成C代碼,因此可以再Linux SMP和集群上運(yùn)轉(zhuǎn)。然而,編譯器還存在一些問題,請見 HYPERLINK /laufer/mspls/papers/cohen.ps /laufer/mspls/papers/cohen.ps。PA
55、MS(并行運(yùn)用管理系統(tǒng))Myrias是一家銷售軟件產(chǎn)品的公司,稱為PAMS并行運(yùn)用管理系統(tǒng)。PAMS為虛擬內(nèi)存并行處置提供了非常簡單的指令。網(wǎng)絡(luò)版Linux機(jī)組還未被支持。參見 HYPERLINK myrias/ myrias/可獲取更多相關(guān)知識。Parallaxis-IIIParallaxis - III是一個構(gòu)造化編程言語,它為數(shù)據(jù)并行一個SIMD模型擴(kuò)展了Modula 2和“虛擬處置器和銜接。該P(yáng)arallaxis軟件包含了運(yùn)用于順序和并行電腦系統(tǒng)的編譯器,調(diào)試器gdb和xgbd調(diào)試器,和不同領(lǐng)域的各種例子算法,尤其是圖像處置方面。這將運(yùn)轉(zhuǎn)在順序的Linux系統(tǒng)上舊版本支持各種并行目的,
56、新版本也將會例如,配置了PVM集群。更多的信息可見 HYPERLINK informatik.uni-stuttgart.de/ipvr/bv/p3/p3.html informatik.uni-stuttgart.de/ipvr/bv/p3/p3.html。pC+/Sage+pC+/Sage+是一種擴(kuò)展到C+言語,它允許經(jīng)過運(yùn)用于根底元素族的“收藏對象來實現(xiàn)數(shù)據(jù)并行操作。這是一個預(yù)處置生成可運(yùn)轉(zhuǎn)于PVM的C+代碼。它能否運(yùn)轉(zhuǎn)于Linux ?更多的信息可見 HYPERLINK /sage/ /sage/。SR (同步資源)SR同步資源是一個并行編程言語封裝過程中的資源和變量;提供了過程相互作用
57、的主要機(jī)制。SR提供了用于調(diào)用效力操作的機(jī)制和一種新的交融了。因此一切本地和遠(yuǎn)程過程調(diào)用,教導(dǎo),音訊傳送,動態(tài)進(jìn)程創(chuàng)建,和組播與支持。SR同樣還支持共享全局變量和操作。它曾經(jīng)被移植到Linux但目前尚不清楚怎樣樣的并行可被執(zhí)行。更多的信息可見 HYPERLINK /sr/www/index.html /sr/www/index.html。ZPL和IronManZPL是一個數(shù)組為根底的編程言語,用于支持工程和科學(xué)運(yùn)用。它生成調(diào)用一個簡單的音訊傳送接口,稱為鐵人,并經(jīng)過系一致些功能,構(gòu)成這個接口可以很容易地實現(xiàn)運(yùn)用幾乎任何音訊。然而,它主要是針對在任務(wù)站集群的MPI和PVM的,并支持Linux。更
58、多的信息可見 HYPERLINK /research/projects/orca3/zpl/www/ /research/projects/orca3/zpl/www/。6.2 性能問題曾經(jīng)有很多人花了很多時間去基準(zhǔn)特定主機(jī)板,網(wǎng)卡等等,試圖確定哪個是最好的。這個方法還存在一個問題,那就是當(dāng)他可以基準(zhǔn)一些東西的時候,它能夠曾經(jīng)不再是最好的了,甚至能夠曾經(jīng)被撤下,取而代之的是市場和屬性完全不同的一個修正模型。購買PC硬件就像買橙汁。 通常,它是用非常好的東西,無論什么公司名字的標(biāo)簽上。 很少人知道,也不關(guān)懷,那里的組件或濃縮橙汁來源。雖然如此,有一些硬件差別他還是應(yīng)該留意的。我的建議很簡單,就是
59、他可以從運(yùn)轉(zhuǎn)于Linux下的這個硬件或者怎樣的預(yù)期效果,然后集中他的留意力在獲取快速的驅(qū)動,良好的價錢和合理的政策。一個很好的概括各種PC處置器的不同在 HYPERLINK pcguide/ref/cpu/fam/ pcguide/ref/cpu/fam/;現(xiàn)實上,整個WWW網(wǎng)站 HYPERLINK pcguide/ pcguide/在PC硬件上有技術(shù)全面的概括。它也有必要了解一個位的硬件配置有關(guān)的詳細(xì)表現(xiàn),以及Linux的標(biāo)桿HOWTO HYPERLINK /LDP/HOWTO/Benchmarking-HOWTO.html /LDP/HOWTO/Benchmarking-HOWTO.htm
60、l是一個很好的開端。英特爾IA32的處置器有許多精致的細(xì)節(jié)特殊存放器,可用于丈量正在運(yùn)轉(zhuǎn)的系統(tǒng)性能。英特爾VTune, HYPERLINK el/design/perftool/vtune/ el/design/perftool/vtune/運(yùn)用用途廣發(fā)的性能存放器在一個非常完好的代碼微調(diào)系統(tǒng)不行的是不能再Linux下運(yùn)轉(zhuǎn)。一個可加載模塊的設(shè)備驅(qū)動程序和庫例程存放器,訪問現(xiàn)有的奔騰性能從 HYPERLINK /users/akinlar/driver.html /users/akinlar/driver.html請記住,這些存放器是處置器的性能在不同的IA32上的不同;此代碼僅適宜奔騰,而不是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 竣工結(jié)算審計服務(wù) 投標(biāo)方案(技術(shù)方案)
- 五年級綜合實踐總結(jié)
- 壁掛爐采暖系統(tǒng)
- 城鎮(zhèn)公共場所秩序維護(hù)規(guī)定
- 宿舍周邊環(huán)境整治計劃
- 財務(wù)報告分析與解讀指導(dǎo)
- 商業(yè)促銷活動臨時租賃協(xié)議
- 科幻主題餐廳墻繪施工合同
- 知識產(chǎn)權(quán)質(zhì)押貸款申請指南范本
- 建筑設(shè)計招標(biāo)規(guī)則
- 新鄉(xiāng)事業(yè)單位工作人員平時考核實施方案
- 文獻(xiàn)綜述無刷直流電機(jī)
- XX區(qū)畜禽養(yǎng)殖屠宰無害化處理企業(yè)洗消中心建設(shè)項目實施方案.docx
- 科創(chuàng)板知識測評含答案
- 超薄切片技術(shù)應(yīng)用
- 帶電作業(yè)規(guī)程PPT
- 公司清產(chǎn)核資基礎(chǔ)工作表
- 休息與活動練習(xí)題
- 《時間在流逝》說課材料
- 北京市海淀區(qū)2021-2022學(xué)年七年級上學(xué)期期末考試語文試卷(word版含答案)
- 電氣試驗作業(yè)指導(dǎo)書
評論
0/150
提交評論