C程序優(yōu)化方案

上傳人：y*** IP屬地：天津上傳時間：2021-10-12 格式：DOCX 頁數(shù)：22 大小：97.17KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩17頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選范本 C 代碼優(yōu)化方案 1、選擇合適的算法和數(shù)據(jù)結(jié)構(gòu) 選擇一種合適的數(shù)據(jù)結(jié)構(gòu)很重要，如果在一堆隨機存放的數(shù)中使用了大量的插入和刪除指令，那使用鏈表要快得多。數(shù)組與指針語句具有十分密切的關(guān)系，一般來說，指針比較靈活簡潔，而數(shù)組則比較直觀，容易理解。對于大部分的編譯器，使用指針比使用數(shù)組生成的代碼更短，執(zhí)行效率更高。在許多種情況下，可以用指針運算代替數(shù)組索引，這樣做常常能產(chǎn)生又快又短的代碼。與數(shù) 組索引相比，指針一般能使代碼速度更快，占用空間更少。使用多維數(shù)組時差異更明顯。下面的代碼作用是相同的，但是效率不一樣 ? 數(shù)組索引指針運算 For(;)p=array A=ar

2、rayt+;for(;) a=*(p+); 指針方法的優(yōu)點是， array 的地址每次裝入地址 p 后，在每次循環(huán)中只需對 p 增量操作。在數(shù)組索引方法中，每次循環(huán)中都必須根據(jù) t 值求數(shù)組下標(biāo)的復(fù)雜運算。 2、使用盡量小的數(shù)據(jù)類型能夠使用字符型（char）定義的變量，就不要使用整型（int）變量來定義；能夠使用整型變量定義的變量就不要用長整型（Io ng int）,能不使用浮點型（float）變量就不要使用浮點型變量。當(dāng)然，在定義變量后不要超過變量的作用范圍，如果超過變量的范圍賦值， C 編譯器并不報錯，但程序運行結(jié)果卻錯了,而且這樣的錯誤很難發(fā)現(xiàn)。在 ICCAVR 中, 可以

3、在 Options 中設(shè)定使用 printf 參數(shù), 盡量使用基本型參數(shù) （%c、d、x、%X、%u和%s格式說明符），少用長整型參數(shù)（ld、%lu、%lx和%IX格式說明符），至于浮點型的參數(shù)（%f）則盡量不要使用，其它C編譯器也一樣。在其它條件不變的情況下,使用 %f 參數(shù),會使生成的代碼的數(shù)量增加很多,執(zhí)行速度降低。 3、減少運算的強度（1）、查表（游戲程序員必修課）一個聰明的游戲大蝦,基本上不會在自己的主循環(huán)里搞什么運算工作,絕對是先計算好了, 再到循環(huán)里查表。看下面的例子：舊代碼： long factorial(int i) if (i = 0) return 1; e

4、lse return i * factorial(i - 1); 新代碼： static long factorial_table = 1， 1， 2， 6， 24， 120， 720 /* etc */ ; long factorial（int i） return factorial_tablei; 如果表很大，不好寫，就寫一個 init 函數(shù)，在循環(huán)外臨時生成表格。（2）、求余運算 a=a%8; 可以改為： a=a 說明：位操作只需一個指令周期即可完成，而大部分的 C 編譯器的“ %”運算均是調(diào)用子程序來完成，代碼長、執(zhí)行速度慢。通常，只要求是求 2n 方的余數(shù)，均可使用位操作的方法

5、來代替。（3）、平方運算 a=pow（a, 2.0）; 可以改為： a=a*a; 說明：在有內(nèi)置硬件乘法器的單片機中（如 51系列），乘法運算比求平方運算快得多，因為浮點數(shù)的求平方是通過調(diào)用子程序來實現(xiàn)的，在自帶硬件乘法器的 AVR 單片機中，如 ATMega163 中，乘法運算只需 2 個時鐘周期就可以完成。既使是在沒有內(nèi)置硬件乘法器的 AVR 單片機中，乘法運算的子程序比平方運算的子程序代碼短，執(zhí)行速度快。如果是求 3 次方，如： a=pow（a， 3。 0）; 更改為： a=a*a*a；則效率的改善更明顯。（4）、用移位實現(xiàn)乘除法運算 a=a*4; b=b/4; 可以改為：

6、 a=a2; 通常如果需要乘以或除以 2n,都可以用移位的方法代替。在ICCAVR中，如果乘以2n,都可以生成左移的代碼，而乘以其它的整數(shù)或除以任何數(shù)，均調(diào)用乘除法子程序。用移位的方法得到代碼比調(diào)用乘除法子程序生成的代碼效率高。實際上，只要是乘以或除以一個整數(shù)，均可以用移位的方法得到結(jié)果，如： a=a*9 可以改為： a=(a3)+a 采用運算量更小的表達式替換原來的表達式，下面是一個經(jīng)典例子舊代碼 : x = w % 8; y = pow(x ， 2.0); z = y * 33; for (i = 0;i MAX;i+) h = 14 * i; printf(%d ，新代碼

7、 : x = w y = x * x; z = (y 5) + y; for (i = h = 0; i 0) while (*q (*r = a / *q) *q = (*q + *r) 1 ； *r = a - *q * *q ；推薦的代碼： / 假設(shè) q != r void isqrt(unsigned long a， unsigned long* q， unsigned long* r) unsigned long qq， rr ； qq = a； if (a 0) while (qq (rr = a / qq) qq = (qq + rr) 1 ； rr = a - qq * qq

8、； *q = qq ； *r = rr ； 5、循環(huán)優(yōu)化（1）、充分分解小的循環(huán) 要充分利用 CPU 的指令緩存，就要充分分解小的循環(huán)。特別是當(dāng)循環(huán)體本身很小的時候，分解循環(huán)可以提高性能。注意 :很多編譯器并不能自動分解循環(huán)。不好的代碼： / 3D 轉(zhuǎn)化：把矢量 V 和 4x4 矩陣 M 相乘 for (i = 0 ； i 4； i +) ri = 0； for (j = 0 ； j 4； j +) ri += Mji*Vj ；推薦的代碼： r0 = M00*V0 + M10*V1 + M20*V2 + M30*V3； r1 = M01*V0 + M11*V1 + M21*V2 + M

9、31*V3； r2 = M02*V0 + M12*V1 + M22*V2 + M32*V3； r3 = M03*V0 + M13*V1 + M23*V2 + M33*v3； (2) 、提取公共部分對于一些不需要循環(huán)變量參加運算的任務(wù)可以把它們放到循環(huán)外面，這里的任務(wù)包括表達式、函數(shù)的調(diào)用、指針運算、數(shù)組訪問等，應(yīng)該將沒有必要執(zhí)行多次的操作全部集合在一起，放到一個 init 的初始化程序中進行。 (3) 、延時函數(shù) 通常使用的延時函數(shù)均采用自加的形式： void delay (void) unsigned int i; for (i=0;i0;i-) ; 兩個函數(shù)的延時效果相似，但幾

10、乎所有的 C 編譯對后一種函數(shù)生成的代碼均比前一種代碼少 13 個字節(jié)，因為幾乎所有的 MCU 均有為 0 轉(zhuǎn)移的指令，采用后一種方式能夠生成這類指令。在使用 while 循環(huán)時也一樣，使用自減指令控制循環(huán)會比使用自加指令控制循環(huán)生成的代碼更少13個字母。但是在循環(huán)中有通過循環(huán)變量“i”讀寫數(shù)組的指令時，使用預(yù)減循環(huán)有可能使數(shù)組超界，要引起注意。 (4) 、while循環(huán)和dowhile循環(huán) 用 while 循環(huán)時有以下兩種循環(huán)形式： unsigned int i; i=0; while (i0）; 在這兩種循環(huán)中，使用dowhile循環(huán)編譯后生成的代碼的長度短于while循環(huán)。（6

11、）、循環(huán)展開這是經(jīng)典的速度優(yōu)化，但許多編譯程序（如 gcc -funroll-loops）能自動完成這個事，所以現(xiàn)在你自己來優(yōu)化這個顯得效果不明顯。舊代碼 : for (i = 0; i 100; i+) do_stuff(i); 新代碼 : for (i = 0; i 100; ) do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+; do_stuff(i); i+;

12、do_stuff（i）; i+; 可以看出，新代碼里比較指令由 100次降低為 10 次，循環(huán)時間節(jié)約了 90%。不過注意 :對于中間變量或結(jié)果被更改的循環(huán)，編譯程序往往拒絕展開，（怕?lián)?zé)任唄），這時候就需要你自己來做展開工作了。還有一點請注意，在有內(nèi)部指令cache的CPU上（如MMX芯片），因為循環(huán)展開的代碼很大, 往往cache溢出，這時展開的代碼會頻繁地在 CPU的cache和內(nèi)存之間調(diào)來調(diào)去，又因為 cache速度很高，所以此時循環(huán)展開反而會變慢。還有就是循環(huán)展開會影響矢量運算優(yōu)化。（6）、循環(huán)嵌套把相關(guān)循環(huán)放到一個循環(huán)里，也會加快速度。舊代碼 : for (i = 0

13、; i MAX; i+) for (j = 0; j MAX; j+) aij = 0.0; for (i = 0; i MAX; i+) aii = 1.0; 新代碼 : for (i = 0; i MAX; i+) /* initialize 2d array to 0s */ /* put 1s along the diagonal */ /* initialize 2d array to 0s */ for (j = 0; j MAX; j+) aij = 0.0; aii = 1.0; /* put 1s along the diagonal */ (7)、Switch語句中根據(jù)發(fā)生

14、頻率來進行case排序 Switch可能轉(zhuǎn)化成多種不同算法的代碼。其中最常見的是跳轉(zhuǎn)表和比較鏈/樹。當(dāng)switch用比較鏈的方式轉(zhuǎn)化時，編譯器會產(chǎn)生 if-else-if 的嵌套代碼，并按照順序進行比較，匹配時就跳轉(zhuǎn)到滿足條件的語句執(zhí)行。所以可以對case的值依照發(fā)生的可能性進行排序，把最有可能的放在第一位，這樣可以提高性能。此外，在case中推薦使用小的連續(xù)的整數(shù)，因為在這種情況下，所有的編譯器都可以把 switch 轉(zhuǎn)化成跳轉(zhuǎn)表。不好的代碼： int days_in_month ， short_months， normal_months ， long_months；。 swit

15、ch (days_in_month) case 28: case 29: short_months + ； break； case 30: normal_months + ； break； case 31: long_months + ； break； default: cout month has fewer than 28 or more than 31 days endl ； break；推薦的代碼： int days_in_month ， short_months， normal_months ， long_months；。 switch (days_in_month) case

16、31: long_months + ； break； case 30: normal_months + ； break； case 28: case 29: short_months + ； break； default: cout month has fewer than 28 or more than 31 days type) case FREQUENT_MSG1: handleFrequentMsg(); break; case FREQUENT_MSG2: handleFrequentMsg2(); break; 。 case FREQUENT_MSGn: handleFrequen

17、tMsgn(); break; default:/ 嵌套部分用來處理不經(jīng)常發(fā)生的消息 switch (pMsg-type) case INFREQUENT_MSG1: handleInfrequentMsg1(); break; case INFREQUENT_MSG2: handleInfrequentMsg2(); break; 。 case INFREQUENT_MSGm: handleInfrequentMsgm(); break; 如果 switch 中每一種情況下都有很多的工作要做，那么把整個 switch 語句用一個指向函數(shù)指針的表來替換會更加有效，比如下面的 switch

18、語句，有三種情況： enum MsgTypeMsg1， Msg2， Msg3 switch (ReceiveMessage() case Msg1; case Msg2; 。 case Msg3; 。為了提高執(zhí)行速度，用下面這段代碼來替換這個上面的switch 語句。 /* 準(zhǔn)備工作 */ int handleMsg1(void); int handleMsg2(void); int handleMsg3(void); /* 創(chuàng)建一個函數(shù)指針數(shù)組 */ int (*MsgFunction )()=handleMsg1 ， handleMsg2， handleMsg3; /* 用下面這行更有效

19、的代碼來替換 switch 語句 */ status=MsgFunctionReceiveMessage()(); (9) 、循環(huán)轉(zhuǎn)置有些機器對JNZ(為0轉(zhuǎn)移)有特別的指令處理，速度非常快，如果你的循環(huán)對方向不敏感, 可以由大向小循環(huán)。舊代碼 : for (i = 1; i = MAX; i+) 新代碼 : i = MAX+1; while (-i) 不過千萬注意，如果指針操作使用了 i 值，這種方法可能引起指針越界的嚴(yán)重錯誤 (i = MAX+1;) 。當(dāng)然你可以通過對 i 做加減運算來糾正，但是這樣就起不到加速的作用，除非類似于以下情況：舊代碼 : char aMAX+5; fo

20、r (i = 1; i = MAX; i+) *(a+i+4)=0; 新代碼 : i = MAX+1; while (-i) *(a+i+4)=0; (10) 、公用代碼塊一些公用處理模塊，為了滿足各種不同的調(diào)用需要，往往在內(nèi)部采用了大量的 if-then-else 結(jié) 構(gòu)，這樣很不好，判斷語句如果太復(fù)雜，會消耗大量的時間的，應(yīng)該盡量減少公用代碼塊的使用。 (任何情況下，空間優(yōu)化和時間優(yōu)化都是對立的-東樓)。當(dāng)然，如果僅僅是一個 (3=x) 之類的簡單判斷，適當(dāng)使用一下，也還是允許的。記住，優(yōu)化永遠(yuǎn)是追求一種平衡，而不是走極端。 (11) 提升循環(huán)的性能要提升循環(huán)的性能，減少

21、多余的常量計算非常有用(比如，不隨循環(huán)變化的計算) 。不好的代碼 (在 for() 中包含不變的 if() ： for( i 。 ) if( CONSTANT0 ) DoWork0( i ) ； / 假設(shè)這里不改變 CONSTANT0 的值 else DoWork1( i ) ； / 假設(shè)這里不改變 CONSTANT0 的值推薦的代碼： if( CONSTANT0 ) for( i 。 ) DoWork0( i ) ； else for( i 。 ) DoWork1( i ) ；如果已經(jīng)知道if()的值，這樣可以避免重復(fù)計算。雖然不好的代碼中的分支可以簡單地預(yù)測，但是由于推薦的代碼在進

22、入循環(huán)前分支已經(jīng)確定，就可以減少對分支預(yù)測的依賴。 (12) 、選擇好的無限循環(huán) 在編程中，我們常常需要用到無限循環(huán)，常用的兩種方法是 while (1) 和 for (；)。這兩種方法效果完全一樣，但那一種更好呢？然我們看看它們編譯后的代碼：編譯前： while (1)；編譯后： mov eax， 1 test eax， eax je foo+23h jmp foo+18h 編譯前： for （；）；編譯后： jmp foo+23h 顯然， for （；）指令少，不占用寄存器，而且沒有判斷、跳轉(zhuǎn)，比while （1）好。 6、提高 CPU 的并行性（1）使用并行代碼盡可能把長的

23、有依賴的代碼鏈分解成幾個可以在流水線執(zhí)行單元中并行執(zhí)行的沒有依賴的代碼鏈。很多高級語言，包括 C+ ，并不對產(chǎn)生的浮點表達式重新排序，因為那是一個相當(dāng)復(fù)雜的過程。需要注意的是，重排序的代碼和原來的代碼在代碼上一致并不等價于計算結(jié) 果一致，因為浮點操作缺乏精確度。在一些情況下，這些優(yōu)化可能導(dǎo)致意料之外的結(jié)果。幸運的是，在大部分情況下，最后結(jié)果可能只有最不重要的位（即最低位）是錯誤的。不好的代碼： double a100， sum； int i ； sum = 0.0f ； for （i=0 ； i100； i+） sum += ai ；推薦的代碼： double a100， su

24、m1， sum2， sum3， sum4， sum； int i ； sum1 = sum2 = sum3 = sum4 = 0.0 ； for （i = 0 ； i 100 ； i += 4） sum1 += ai ； sum2 += ai+1 ； sum3 += ai+2 ； sum4 += ai+3 ； sum = （sum4+sum3）+（sum1+sum2）；要注意的是：使用 4路分解是因為這樣使用了 4 段流水線浮點加法，浮點加法的每一個段占用一個時鐘周期，保證了最大的資源利用率。（2）避免沒有必要的讀寫依賴當(dāng)數(shù)據(jù)保存到內(nèi)存時存在讀寫依賴，即數(shù)據(jù)必須在正確寫入后才能再

25、次讀取。雖然 AMD Athlon 等 CPU 有加速讀寫依賴延遲的硬件，允許在要保存的數(shù)據(jù)被寫入內(nèi)存前讀取出來，但是，如果避免了讀寫依賴并把數(shù)據(jù)保存在內(nèi)部寄存器中，速度會更快。在一段很長的又互相依賴的代碼鏈中，避免讀寫依賴顯得尤其重要。如果讀寫依賴發(fā)生在操作數(shù)組時，許多編譯器不能自動優(yōu)化代碼以避免讀寫依賴。所以推薦程序員手動去消除讀寫依賴，舉例來說，引進一個可以保存在寄存器中的臨時變量。這樣可以有很大的性能提升。下面一段代碼是一個例子：不好的代碼： float xVECLEN ， yVECLEN ， zVECLEN ；。 for (unsigned int k =

26、 1 ； k VECLEN ； k +) xk = xk-1 + yk ； for (k = 1 ； k VECLEN ； k+) xk = zk * (yk - xk-1) ；推薦的代碼： float xVECLEN ， yVECLEN ， zVECLEN ；。 float t(x0) ； for (unsigned int k = 1 ； k VECLEN ； k +) t = t + yk ； xk = t ； t = x0 ； for (k = 1； k b-c4-aardvark + a-b-c4-baboon + a-b-c4-cheetah + a-b-c4-dog; 新代碼

27、 : struct animals * temp = a-b-c4; total = temp-aardvark + temp-baboon + temp-cheetah + temp-dog; 一些老的 C 語言編譯器不做聚合優(yōu)化，而符合 ANSI 規(guī)范的新的編譯器可以自動完成這個優(yōu) 化，看例子 : float a， b， c， d， f， g; 。 a = b / c * d; f = b * g / c; 這種寫法當(dāng)然要得，但是沒有優(yōu)化 float a， b， c， d， f， g; 。 a = b / c * d; f = b / c * g; 如果這么寫的話，一個符合 ANSI 規(guī)

28、范的新的編譯器可以只計算 b/c 一次，然后將結(jié)果代入第二個式子，節(jié)約了一次除法運算。 8、函數(shù)優(yōu)化（1）Inline 函數(shù) 在 C+ 中，關(guān)鍵字 Inline 可以被加入到任何函數(shù)的聲明中。這個關(guān)鍵字請求編譯器用函數(shù)內(nèi) 部的代碼替換所有對于指出的函數(shù)的調(diào)用。這樣做在兩個方面快于函數(shù)調(diào)用：第一，省去了調(diào)用指令需要的執(zhí)行時間；第二，省去了傳遞變元和傳遞過程需要的時間。但是使用這種方法在優(yōu)化程序速度的同時，程序長度變大了，因此需要更多的 ROM 。使用這種優(yōu)化在 Inline 函數(shù)頻繁調(diào)用并且只包含幾行代碼的時候是最有效的。（2）不定義不使用的返回值函數(shù)定義并不知道函數(shù)返

29、回值是否被使用，假如返回值從來不會被用到，應(yīng)該使用 void 來明確聲明函數(shù)不返回任何值。（3）減少函數(shù)調(diào)用參數(shù) 使用全局變量比函數(shù)傳遞參數(shù)更加有效率。這樣做去除了函數(shù)調(diào)用參數(shù)入棧和函數(shù)完成后參數(shù)出棧所需要的時間。然而決定使用全局變量會影響程序的模塊化和重入，故要慎重使用。（4）所有函數(shù)都應(yīng)該有原型定義一般來說，所有函數(shù)都應(yīng)該有原型定義。原型定義可以傳達給編譯器更多的可能用于優(yōu)化的信息。（ 5）盡可能使用常量（const）盡可能使用常量（const）。 C+ 標(biāo)準(zhǔn)規(guī)定，如果一個 const 聲明的對象的地址不被獲取，允許編譯器不對它分配儲存空間。這樣可以使代碼

30、更有效率，而且可以生成更好的代碼。（6）把本地函數(shù)聲明為靜態(tài)的（static）如果一個函數(shù)只在實現(xiàn)它的文件中被使用，把它聲明為靜態(tài)的（static ）以強制使用內(nèi)部連接。否則，默認(rèn)的情況下會把函數(shù)定義為外部連接。這樣可能會影響某些編譯器的優(yōu)化比如，自動內(nèi)聯(lián)。 9、采用遞歸與 LISP 之類的語言不同， C 語言一開始就病態(tài)地喜歡用重復(fù)代碼循環(huán)，許多C 程序員都是除非算法要求，堅決不用遞歸。事實上， C 編譯器們對優(yōu)化遞歸調(diào)用一點都不反感，相反，它們還很喜歡干這件事。只有在遞歸函數(shù)需要傳遞大量參數(shù)，可能造成瓶頸的時候，才應(yīng)該使用循環(huán)代碼，其他時候，還是用遞歸好些。 10

31、、變量（1） register 變量在聲明局部變量的時候可以使用 register 關(guān)鍵字。這就使得編譯器把變量放入一個多用途的寄存器中，而不是在堆棧中，合理使用這種方法可以提高執(zhí)行速度。函數(shù)調(diào)用越是頻繁，越是可能提高代碼的速度。在最內(nèi)層循環(huán)避免使用全局變量和靜態(tài)變量，除非你能確定它在循環(huán)周期中不會動態(tài)變化，大多數(shù)編譯器優(yōu)化變量都只有一個辦法，就是將他們置成寄存器變量，而對于動態(tài)變量，它們干脆放棄對整個表達式的優(yōu)化。盡量避免把一個變量地址傳遞給另一個函數(shù)，雖然這個還很常用。 C 語言的編譯器們總是先假定每一個函數(shù)的變量都是內(nèi)部變量，這是由它的機制決定的，在這種情況

32、下，它們的優(yōu)化完成得最好。但是，一旦一個變量有可能被別的函數(shù)改變，這幫兄弟就再也不敢把變量放到寄存器里了，嚴(yán)重影響速度?？蠢樱?a = b（）; c（因為 d 的地址被 c 函數(shù)使用，有可能被改變，編譯器不敢把它長時間的放在寄存器里，一旦運行到 c（或；f;為后綴(比如：2.718f)的浮點常量才是 float型，否則默認(rèn)是 double 型。為了避免float型參數(shù)自動轉(zhuǎn)化為double，請在函數(shù)聲明時使用float。使用 32 位的數(shù)據(jù)類型編譯器有很多種，但它們都包含的典型的 32 位類型是： int， signed， signed int， unsigned，

33、unsigned int，long，signed long, long int， signed long int，unsigned long, unsigned long int。盡量使用 32位的數(shù)據(jù)類型，因為它們比 16位的數(shù)據(jù)甚至 8位的數(shù)據(jù)更有效率。明智使用有符號整型變量在很多情況下，你需要考慮整型變量是有符號還是無符號類型的。在許多地方，考慮是否使用有符號的變量是必要的。在一些情況下，有符號的運算比較快；但在一些情況下卻相反。比如：整型到浮點轉(zhuǎn)化時，使用大于16位的有符號整型比較快。因為 X86構(gòu)架中提供了從有符號整型轉(zhuǎn)化到浮點型的指令，但沒有提供從無符號整型轉(zhuǎn)化

34、到浮點的指令。在整數(shù)運算中計算商和余數(shù)時，使用無符號類型比較快。 Instruction flow optimization 指令流優(yōu)化第三層優(yōu)化的目標(biāo)是低級指令流。比較常見的技術(shù)是循環(huán)合并(loop merging)，循環(huán)展開 (unrolling),軟件流水(software pipelining)。循環(huán)合并如果兩個循環(huán)計數(shù)差不多、循環(huán)執(zhí)行互不相同的操作，可以把它們合并在一起組成一個循環(huán)。當(dāng)兩個循環(huán)的負(fù)荷都不滿時，這是非常有用的。循環(huán)展開循環(huán)展開就是把循環(huán)計數(shù)小的循環(huán)展開，成為非循環(huán)形式的串行程序，或者把循環(huán)計數(shù)大的循環(huán)部分展開，減少循環(huán)迭代次數(shù)，這樣可以節(jié)省

35、了用于循環(huán)設(shè)置、初始化、增加和校對循環(huán)計數(shù)器的時間。大多數(shù)編譯器可以自動完成這項工作，手工編譯會出現(xiàn)錯例如： for( int i = 0 ； i 3 ；i+ ) arrayi = i ；邏輯上等同于： array0 = 0； array1 = 1, array2 = 2；軟件流水軟件流水是用來安排循環(huán)指令，使這個循環(huán)多次迭代并行執(zhí)行的一種技術(shù)。在嵌套循環(huán)中, 編譯器僅對最里面的循環(huán)執(zhí)行軟件流水，因此對執(zhí)行周期很少的內(nèi)循環(huán)作循環(huán)展開，外循環(huán) 進行軟件流水，這樣可以改進C代碼并行執(zhí)行的性能。使用軟件流水還應(yīng)當(dāng)注意：盡管軟件流水循環(huán)可以包含內(nèi)聯(lián)函數(shù)，但是不能包含函數(shù)調(diào)用；在循環(huán)中不可以有

36、條件終止指令；在循環(huán)體中不可以修改循環(huán)控制變量。 3、總結(jié)語現(xiàn)代的C和C+編譯器都提供了一定程度上的代碼優(yōu)化。然而，大部分由編譯器執(zhí)行的優(yōu) 化僅涉及執(zhí)行速度和代碼大小的一個平衡。你的程序能夠變得更快或者更小，但是不可能又變快又變小。上面介紹的方法主要是為了提高代碼的效率。但是事實上，在使用這些技術(shù)提高代碼運行速度的同時會相應(yīng)的產(chǎn)生一些負(fù)面的影響，比如增加代碼的大小、降低程序可讀性等。不過你可以讓C/C+編譯器來進行減少代碼大小的優(yōu)化，而手動利用編程來減少代碼的執(zhí)行時間。在嵌入式程序設(shè)計中合理地使用這幾種技術(shù)有時會達到很好的優(yōu)化效果。 C語言高效編程的四大絕招編寫高效簡潔的C語言代

37、碼，是許多軟件工程師追求的目標(biāo)。本文就是針對編程工作中的一些體會和經(jīng)驗做相關(guān)的闡述。第一招：以空間換時間計算機程序中最大的矛盾是空間和時間的矛盾，那么，從這個角度岀發(fā)逆向思維來考慮程序的效率問題，我們就有了解決問題的第1招-以空間換時間。比如說字符串的賦值：方法A :通常的辦法 #define LEN 32 char stringl LEN; memset (stringl, 0,L EN); strcpy (string1,This is a example!; 方法B： const char string2LEN =This is a example!; char * cp; c

38、p = string2 ; 使用的時候可以直接用指針來操作。從上面的例子可以看出， A和B的效率是不能比的。在同樣的存儲空間下，B直接使用指針就可以操作了，而A需要調(diào)用兩個字符函數(shù)才能完成。B的缺點在于靈活性沒有 A好。在需要頻繁更改一個字符串內(nèi)容的時候，A具有更好的靈活性；如果采用方法B,則需要預(yù)存許多字符串，雖然占用了大量的內(nèi)存，但是獲得了程序執(zhí)行的高效率。如果系統(tǒng)的實時性要求很高，內(nèi)存還有一些，那我推薦你使用該招數(shù)。該招數(shù)的變招-使用宏函數(shù)而不是函數(shù)。舉例如下：方法C : #define bwMCDR2_ADDRESS 4 #define bsMCDR2_ADDRESS 1

39、7 int BIT_MASK(int _bf) return (1U (bw # _bf) - 1) (bs # _bf); void SET_BITS(int _dst, int _bf, int _val) _dst = (_dst) 方法D : #define bwMCDR2_ADDRESS 4 #define bsMCDR2_ADDRESS 17 #define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS) #define BIT_MASK(_bf) (1U (bw # _bf) - 1) (bs # _bf) #define SET_BITS(_ds

40、t, _bf, _val) (_dst) = (_dst) 函數(shù)和宏函數(shù)的區(qū)別就在于，宏函數(shù)占用了大量的空間，而函數(shù)占用了時間。大家要知道的是，函數(shù) 調(diào)用是要使用系統(tǒng)的棧來保存數(shù)據(jù)的，如果編譯器里有棧檢查選項，一般在函數(shù)的頭會嵌入一些匯編語句對當(dāng)前棧進行檢查；同時，CPU也要在函數(shù)調(diào)用時保存和恢復(fù)當(dāng)前的現(xiàn)場，進行壓棧和彈棧操作，所以, 函數(shù)調(diào)用需要一些CPU時間。而宏函數(shù)不存在這個問題。宏函數(shù)僅僅作為預(yù)先寫好的代碼嵌入到當(dāng)前程序，不會產(chǎn)生函數(shù)調(diào)用，所以僅僅是占用了空間，在頻繁調(diào)用同一個宏函數(shù)的時候，該現(xiàn)象尤其突岀。 D方法是我看到的最好的置位操作函數(shù)，是ARM公司源碼的一部分，在短短的三行內(nèi)實現(xiàn)了很多功能，幾乎涵蓋了所有的位操作功能。C方法是其變體，其中滋味還需大家仔細(xì)體會。

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

C程序優(yōu)化方案

文檔簡介

溫馨提示

最新文檔

評論

C程序優(yōu)化方案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔