矩陣乘法MPI并行程序報(bào)告_第1頁
矩陣乘法MPI并行程序報(bào)告_第2頁
矩陣乘法MPI并行程序報(bào)告_第3頁
矩陣乘法MPI并行程序報(bào)告_第4頁
矩陣乘法MPI并行程序報(bào)告_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1.實(shí)驗(yàn)?zāi)康?.1掌握集群的使用方法。1.2掌握以并行的方式分析問題、設(shè)計(jì)并行程序的方法。1.3掌握如何對(duì)并行程序進(jìn)行簡單的性能分析2. 實(shí)驗(yàn)要求2.1使用MPI、OpenMp等并行程序設(shè)計(jì)方法設(shè)計(jì)矩陣乘法的并行程序。2.2隨機(jī)產(chǎn)生所需的矩陣元素,數(shù)據(jù)項(xiàng)不得少于1000*1000。2.3盡量設(shè)計(jì)較高的加速比3. 實(shí)驗(yàn)環(huán)境3.1硬件環(huán)境:兩個(gè)集群節(jié)點(diǎn)blade13、blade15。3.2 軟件環(huán)境:Linux、gcc、Win7、VC+6.0。3.3 連接方式:Xmanager Enterprise 4.0 遠(yuǎn)程桌面連接 211.69.198.203。4. 實(shí)驗(yàn)程序4.1隨機(jī)算法產(chǎn)生矩陣:sran

2、 d( un sig ned in t)time(NULL);for (i=0; iN; i+)for (j=0; jN; j+)Aij = ran d() % 10;Bij = ran d() % 10;Cik = 0;4.2串行程序設(shè)計(jì)time( &start);for (i=0; iM; i+)for (k=0; kM; k+)Cik = 0;for (j=0; jM; j+)Cik += Aij*Bjk; time( &en d);4.3并行程序設(shè)計(jì)MPI_I nit (&argc,&argv) 和MPI_Fi nalize()MPI I nit用來初始化MPI執(zhí)行環(huán)境,建立多個(gè) MP

3、I 進(jìn)程之間的聯(lián)系,為后續(xù)通信做準(zhǔn)備。而 MPI_Finalize 則是結(jié)束MPI執(zhí)行環(huán)境。這兩個(gè)函數(shù) 就是定義MPI程序的并行區(qū)的,除了檢測是否初始 化的函數(shù)之外,不應(yīng)該在這兩個(gè)函數(shù)定義的區(qū)域外 調(diào)用其它MPI函數(shù)。這兩個(gè)函數(shù)都返回整型值,標(biāo) 識(shí)函數(shù)是否調(diào)用成功。intMPI_Comm_ra nk(MPI_Comm com m, int *rank)MPI Comm rank函數(shù)用來標(biāo)識(shí)各個(gè) MPI進(jìn)程,獲取 調(diào)用亥函數(shù)進(jìn)程的進(jìn)程號(hào),將自身與其他進(jìn)程區(qū)分。MPI Comm rank返回整型的錯(cuò)誤值,需要提供兩個(gè) 參數(shù):MPI_Comn類型的通信域,標(biāo)識(shí)參與計(jì)算的 MPI進(jìn)程 組。)面例子中使

4、用的是 MPI COMM WORL這個(gè)進(jìn) 程組是MPI實(shí)現(xiàn)預(yù)先定義好的進(jìn)程組,指的是所有MPI進(jìn)程所在的進(jìn)程組。如果想要申請(qǐng)自己的特殊 的進(jìn)程組,則需要通過MPI Comm定義并通過其它MPI函數(shù)生成。&rank返回調(diào)用進(jìn)程中的標(biāo)識(shí)號(hào)。intMPI_Comm_size( MPI_Comm com m, int *size)MPI_Comm_size函數(shù)用來獲取指定通信域的進(jìn)程個(gè) 數(shù),確疋自身需要元成的任務(wù)數(shù)。MPI_Comn類型的通信域,標(biāo)識(shí)參與計(jì)算的MPI進(jìn)程組。上面的例子中用的是MPI COMM WORLD&size返回相應(yīng)進(jìn)程組中的進(jìn)程數(shù)。int MPI_Send(void *buf,

5、int count, MPI_Datatype datatype, int dest, i nt tag, MPI_Comm comm)MPI_Se nd函數(shù)用于發(fā)送一個(gè)消息到目標(biāo)進(jìn)程。 通信域中的dest進(jìn)程發(fā)送數(shù)據(jù),數(shù)據(jù)存放在buf中, 類型是datatype,個(gè)數(shù)是count,這個(gè)消息的標(biāo)志 是tag,用以和本進(jìn)程向同一目的進(jìn)程發(fā)送的其它 消息區(qū)別開來。int MPI_Recv(void *buf, int count, MPI_Datatype datatype,int source,int tag, MPI_Comm comm, MPI Status *status)MPI_Recv

6、函數(shù)用于從指定進(jìn)程接收一個(gè)消息。 它的含義是進(jìn)程從 comm域中source進(jìn)程接收標(biāo)簽 號(hào)為tag的數(shù)據(jù),并保存到buf中。接收緩沖區(qū)buf 的大小不能小于發(fā)送過來的消息的長度。否則會(huì)由 于數(shù)組越界導(dǎo)致程序出錯(cuò)。主進(jìn)程if(process_id =0)row_aver =N / slave_ num;rema in der=N % slave_ num;offset = 0;for(dest=1; dest=slave_ num; dest+)rows = (dest = rema in der) ? row_aver+1 : row_aver;prin tf(se nding %d row

7、s to process %dn, rows, dest);MPI_Se nd(&o ffset,1,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD);MPI_Se nd(&rows,1,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD);MPI_Se nd(&Aoffset0,rows*N,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD); MPI_Se nd(&B,N*N,MPI_INT,dest,FROM_MASTER,MPI_COMM_WORLD);offset += rows;star

8、t_time = MPI_Wtime();for(source=1; source 0)MPI_Recv(&o ffset,1,MPI_INT,O,FROM_MASTER,MPI_COMM_WORLD,& status);MPI_Recv(&rows,1,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,& status);MPI_Recv(&A,rows*N,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,& status);MPI_Recv(&B,N*N,MPI_INT,O,FROM_MASTER,MPI_COMM_WORLD, &stat

9、us);/矩陣乘法for(i=0; irows; i+)for (k=0; kN; k+)int tmp = Aik;for (j=0; jN; j+)Cij += tmp*Bkj;/ 禾U用MPI_Se nd(&ofset,1,MPI_INT,0,FROM_SLAVE,MPI_COMM_WORLD);MPI_Se nd(&rows,1,MPI_INT,0, FROM_SLAVE, MPI_COMM_WORLD);MPI_Se nd(&C,rows*N,MPI_UNSIGNED_LONG_LONG,0,FROM_SLAVE,MPI_COMM_WORLD); MPI_Fi nalize();re

10、turn 0;5. 性能分析分析公式:加速比=串行執(zhí)行時(shí)間/并行執(zhí)行時(shí)間效率=加速比/節(jié)點(diǎn)數(shù)5.1串行程序的執(zhí)行時(shí)間(秒)、矩陣規(guī) 模X1000200030004000實(shí)驗(yàn)結(jié)果 第1次11.00099.000372.000799.000第2次11.000r 98.000376.000 1799.000第3次11.00099.000373.000802.000平均值11.00098.667373.667800.000不同矩陣規(guī)模F串彳f程庁的執(zhí)行時(shí)間oozooooeqoooqodoo9876-54321800,0001000200030004000執(zhí)行時(shí)間執(zhí)行時(shí)間趨勢線圖1.不同矩陣規(guī)模下串行程

11、序的執(zhí)行時(shí)間5.2八個(gè)節(jié)點(diǎn)時(shí),不同矩陣規(guī)模并行程序的執(zhí)行時(shí)間(秒)矩陣規(guī)1000200030004000實(shí)驗(yàn)結(jié)果第i次0.8296.83323.37255.422第2次0.8326.83823.31555.786第3次:0.8376.82023.56055.732平均值0.8336.83023.416 155.647加速比13.20514.44615.95814.376效率1.6511.8061.9951.797不同矩陳規(guī)模下幷行程序的執(zhí)行時(shí)間1000?00030004000o o nu u O4 3 z 1抱行時(shí)間執(zhí)行時(shí)冋趨勢線矩陣規(guī)樣圖2.八個(gè)節(jié)點(diǎn)時(shí),不同矩陣規(guī)模下并行程序的執(zhí)行時(shí)間8節(jié)點(diǎn)

12、下,不同矩陣規(guī)模的加速比15.95814.44614.3761000200030004000加速比加速比趨勢線8 6 4 2 000 6 4 2 0 TT T T T比速加矩陣規(guī)模圖3.八個(gè)節(jié)點(diǎn)時(shí),不同矩陣規(guī)模下并行程序的加速比8節(jié)點(diǎn)下,不同矩陣規(guī)模的效率圖4.八個(gè)節(jié)點(diǎn)時(shí),不同矩陣規(guī)模下并行程序的效率分析隨著矩陣規(guī)模的增加執(zhí)行時(shí)間程序的執(zhí)行時(shí)間急劇增加。加速比程序的加速比基本保持不變。效率程序的效率基本保持不變。5.3矩陣規(guī)模為1000*1000時(shí),不同節(jié)點(diǎn)數(shù)下并行程序的執(zhí)行時(shí)間(秒)節(jié)點(diǎn)個(gè)數(shù)、2345678實(shí)驗(yàn)結(jié)果、x第1次5.7922.9171.9451.4551.1700.9730.82

13、91第2次5.7932.8991.9441.4741.1670.9710.832第3次5.8382.9151.9351.4531.1690.9750.837平均值5.8082.9101.9411.4611.1690.9730.833加速比1.9843.7805.6677.2599.41011.30513.205效率0.9921.2601.4171.4521.5681.6151.651SBffitl000*1000時(shí),不同節(jié)原下期5程J*的執(zhí)行聘間節(jié)點(diǎn)個(gè)歆井仃執(zhí)行時(shí)間執(zhí)行時(shí)可務(wù)勢線7 6 5 4 5 2 10 (診)醪 Byfi圖5.矩陣規(guī)模1000*1000時(shí),不同節(jié)點(diǎn)下的并行程序的執(zhí)行時(shí)間1

14、000*1000時(shí),不同節(jié)點(diǎn)下的加速比13.205加速比力:!許比為礙民節(jié)點(diǎn)個(gè)敢圖6.矩陣規(guī)模1000*1000時(shí),不同節(jié)點(diǎn)下的并行程序的加速比分析隨著計(jì)算節(jié)點(diǎn)數(shù)的增加,執(zhí)行時(shí)間程序的執(zhí)行時(shí)間迅速減少,然后趨于平穩(wěn)。加速比程序的加速比基本呈線性增長,公式趨y-1.8374x+0.022 。效率程序的效率逐步增長,然后趨于平緩。6. 用戶手冊(cè)6.1 連接:ssh pppusr211.69.168.203 密碼:*6.2 登陸:sudo ssh blade13 或者 blade156.3 切換至工作目錄:cd /home/pppusr/*6.4編譯:mpicc -o matrix matrix m

15、ulti.c6.5運(yùn)行:mpirun -np 8 ./matrix#in clude #in clude #in clude #defi ne N 1000#defi ne FROM_MASTER 1#defi ne FROM_SLAVE 2int ANN, BNN;un sig ned long long CNN;MPI_Status status;/消息接收狀態(tài)變量,存儲(chǔ)也是分布的int main (i nt argc, char *argv)int process_num; /進(jìn)程數(shù),該變量為各處理器中的同名變量,存儲(chǔ)是分布的int process id;int slave_ num;i

16、nt dest; /目的進(jìn)程標(biāo)識(shí)號(hào)int source; /發(fā)送數(shù)據(jù)進(jìn)程的標(biāo)識(shí)號(hào)int rows;int row_aver;int rema in der;in t offset;/行偏移量int i, j, k;double start_time, en d_time;sran d( un sig ned in t)time(NULL);for (i=0; iN; i+)for (j=0; jN; j+)Aij = ran d() % 10;Bij = ran d() % 10;Cik = 0;MPI_Init(&argc, &argv);初始化 MPI/*該函數(shù)被各進(jìn)程各調(diào)用一次,得到各自

17、的進(jìn)程id值*/MPI_Comm_ra nk(MPI_COMM_WORLD, &process_id);/*該函數(shù)被各進(jìn)程各調(diào)用一次,得到進(jìn)程數(shù)*/MPI_Comm_size(MPI_COMM_WORLD, & process_ num);slave_ num = process_ num - 1;if(process_id = 0)row_aver = N / slave_ num;rema in der = N % slave_ num; offset = 0;/有的程序是將時(shí)間函數(shù)放在這個(gè)for循環(huán)的兩邊f(xié)or(dest=1; dest=slave_ num; dest+)rows =

18、(dest = rema in der) ? row_aver+1 : row_aver;prin tf(se nding %d rows to process %dn, rows, dest);MPI_Se nd(&offset,1, MPINT, dest, FROM_MASTER, MPI_COMM_WORLD);MPI Send(&rows,1, MPI INT, dest, FROM MASTER, MPI COMM WORLD);MPI_Se nd(&Aoffset0, rows*N, MPINT, dest, FROM_MASTER, MPI_COMM_WORLD);MPI_Se nd(&B,N*N, MPINT, dest, FROM_MASTER, MPI_COMM_WORLD);offset += rows;start_time = MPI_Wtime();for(source=1; source 0)MPI_Recv(&

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論