多核程序設計課程實驗報告之三_第1頁
多核程序設計課程實驗報告之三_第2頁
多核程序設計課程實驗報告之三_第3頁
多核程序設計課程實驗報告之三_第4頁
多核程序設計課程實驗報告之三_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

root登陸到該操作系統(tǒng):打開SSH客戶端單擊QuickConnectroot192.168.28.128IPifconfig重新使用SSH 下新建一個文件夾,命名為workspace3。將左邊 中。程序拷貝完成后,在NBody ,執(zhí)行../run_gui命利 在截圖過程中虛擬機死了所以我重新啟動電腦,載入鏡像文件,導入NBody在截圖過程中虛擬機死了所以我重新啟動電腦,載入鏡像文件,導入NBody,繼續(xù)試驗,所以文件路徑有些不一樣(NBody2/NBody2,NBody24,6,8)(相關截圖在實驗結(jié)果中vi利 時程序會出現(xiàn)“Valueforxshouldbe%fbutwasfoundtobe%f。vi OD命令給拷貝過來的可執(zhí)行文件有運行的權(quán)利,然后運行這個文件多次改變天體數(shù)量不斷精確數(shù)值,開始以32遞增找到區(qū)間范圍,再采用二分法不斷8,以及不同天體數(shù)CYCLEvi OD命令給拷貝過來的可執(zhí)行文件有運行的權(quán)利,然后運行這個文件多次修改12次每次改變SPE和天體數(shù)目,測試執(zhí)行時間(相關截圖見思考題)三、實驗結(jié)FedoraCroe6四、思考1:FAST3210線程數(shù)(24,6,8)SPE確實在并發(fā)運行。SPE=2時:loop2SPESPE=4時:loop4SPESPE=6SPE=6時:loop6SPESPE=8SPE=8時:loop8SPESPE線程數(shù)=2,loop中,2SPE816268–743502=72766usSPE線程數(shù)=4,loop中,4SPESPE線程數(shù)=6,loop中,6SPE164356-866502=197854usSPE線程數(shù)=8,loop中,8SPE4核,模擬器本身在模擬性能時內(nèi)存需求很大,F(xiàn)AST4SPE線程時的性能還不如單個SPECycle模式進行運算法的問題:SPE數(shù)目的增加雖然使得每個SEP分配的天體數(shù)減小了,但是SPE越多,為了得到除自己以外的所有天體的信息SPE要進行更頻繁的MESSAGE的數(shù)據(jù)傳送,其 還要計算其它SPE傳遞過來的數(shù)據(jù),還要等待所有的SPE都結(jié)整了才能確定已經(jīng)計算完的情況(此時程序會出現(xiàn)“Valueforxshouldbe%fbutwasfoundtobe。并分析74時會出現(xiàn)誤差過大的情況(截圖見下646496969688888884848882828273737374主要是SPEPPE上,PPE負責對SPE進行調(diào)度,SPEPPESPESPE之間進行協(xié)同工作。在每個core_bodiesbuffer_bodies進行初始化。在每個時間步上,執(zhí)行下列循1Mcore_bodiesbuffer_bodies中各個粒子對buffer_bodies中的內(nèi)容發(fā)送給它的左鄰居;從右鄰居接收消息,把消息數(shù)據(jù)8, 天體數(shù)目=32運行時間=20531 天體數(shù)目 運行時間 天體數(shù)目 運行時間 天體數(shù)目 運行時間 天體數(shù)目 運行時間 天體數(shù)目 運行時間 天體數(shù)目=32運行時間 天體數(shù)目=64運行時間SPE=6天體數(shù)目=128運行時間SPE=8天體數(shù)目=32運行時間SPE=8天體數(shù)目=64運行時間SPE=8天體數(shù)目=128運行時間8,不同天體數(shù)天 2468結(jié)果分析:1CycleFast模式下運行時間要長的多SPE=48原因:1)FastCycle下要測試的多,這樣也會引起時間與機題的問題。但是卻保證了在當SPE的數(shù)目的增加時,運行時間會相對減少減小。隨SPE數(shù)目的增加,SPE和PPE以及SPE間的交互會 多用于期間的交互和等待過程,導致有時SPE增加運行時間反而增加的現(xiàn)象。PPESPEPPESPEPPE是系統(tǒng)的資源管理器負責處理操作系統(tǒng)任務、管理對內(nèi)存 并控制PPE則負責創(chuàng)建,管理 SPE線程,而SPE則執(zhí)行相應的子程序on-chipcache。保護了系統(tǒng)全局的數(shù)據(jù)一致性;PPE還能包含VMX對 PPE具備硬件細密化多線程,支持以“輪訊”方式進行線程調(diào)度實現(xiàn)“細密化”劣勢:PPE的VMX64位數(shù)據(jù)(雙精度浮點優(yōu)勢:1)SPESPEPPESPE的分支結(jié)構(gòu)允許使用一條分支暗示指令來覆蓋原來默認的分支預測策略。SPE8163232位(單精度)64位(雙精度)浮點數(shù)SPEPPESPE編程時注意事項1)PPE中代碼包含頭文altivec.h,SPEspu_intrinsics.h。性能指令級的并行處理,在每條指令中,盡可能執(zhí)行SIMDPPESPESPEPPE,SPE線程之間的同MakefilePPE和SPEPPE和SPEPPESPE上分配任務的一般原則PPE指派控制任務,應用程序相關的線程運算任務分配給SPEPPE則負責創(chuàng)建,管理 SPE線程,而SPE則執(zhí)行相應的子程序PPE是是否調(diào)用async_spu_run(void*arg)運行SPUSPE端流程圖開定定粒子狀態(tài)信的變利利用spu_mfcdma64從SPE發(fā)出請求以從主存中獲取指針所指向的數(shù)利用函數(shù)spu_mfcdma64將這個變量初始申申請一個新的緩沖區(qū) 將得到的結(jié)果通過DMA寫到內(nèi)存中結(jié)CELL并行編程的原理CellPPE和SPE分別進行編程,NBody的處理分集合劃分為NCPU只負責計算一個子集中的天體的受力及運動情況。在計算時需要共些信息,如第m個子集在計算受力時,需要其他所有天體的空間位CELL8個SPE作為運算單元,用主存所有天體的位置信息,這樣SPE在計算子集的那集時就可以共享地其他天體的位置信息。PPE適合作為控制和任務調(diào)度處理器,SPE則用于處理計算任務。PPE則負責創(chuàng)建,管理和SPESPE則執(zhí)行相應的子程序。PPE中執(zhí)行的主程序劃分多個SPE的任務,數(shù)據(jù)及順序,然后將分配好的各個部分給相應SPESPE執(zhí)行子程序。當子程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論