版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
9.1排序的基本概念9.2插入排序9.3交換排序9.4直接選擇排序9.5歸并排序9.6各種內(nèi)部排序方法的比較和選擇習(xí)題9第9章排序9.1排序的基本概念排序的定義如下:假設(shè)序列包含n個(gè)記錄{R1,R2,…,Rn},其對(duì)應(yīng)的關(guān)鍵字值序列為{k1,k2,…,kn},根據(jù)1,2,…,n的一種排列p1,p2,…,pn,將這n個(gè)記錄重排為有序序列{Rp1,Rp2,…,Rpn},滿足kp1≤kp2≤…≤kpn(或kp1≥kp2≥…≥kpn)。上述定義中,如果ki是主關(guān)鍵字,則排序結(jié)果是唯一的;如果ki是次關(guān)鍵字,則兩個(gè)關(guān)鍵字值可能相等,此時(shí)排序結(jié)果就不是唯一的。假設(shè)記錄Ri和Rj的關(guān)鍵字ki=kj,如果在原始序列中Ri排在Rj之前,而排序后的序列中Ri仍然排在Rj之前,則稱此排序是穩(wěn)定的;反之,如果排序后變成Ri排在Rj之后,則稱此排序是不穩(wěn)定的。根據(jù)排序過程中需要涉及的存儲(chǔ)器不同,可將排序分為內(nèi)部排序和外部排序。內(nèi)部排序是指整個(gè)排序過程都在內(nèi)存中進(jìn)行的排序;外部排序是指待排序記錄的數(shù)量很大,在排序過程中,除使用內(nèi)存外,還需對(duì)外存進(jìn)行訪問。顯然,內(nèi)部排序適用于記錄個(gè)數(shù)較少的序列,外部排序則適用于記錄個(gè)數(shù)太多、需同時(shí)使用內(nèi)存和外存的長序列。
本章只介紹內(nèi)部排序。根據(jù)不同算法所用的策略,內(nèi)部排序方法可分為插入排序、選擇排序、交換排序、歸并排序及基數(shù)排序等幾大類。每一種方法各有優(yōu)缺點(diǎn),適合于不同的應(yīng)用場合。因此,要想簡單地評(píng)價(jià)哪種方法最好且能夠普遍適用是很困難的。判斷排序算法好壞的標(biāo)準(zhǔn)主要有兩條:(1)算法執(zhí)行所需要的時(shí)間;(2)算法執(zhí)行所需要的附加空間。另外要考慮的一個(gè)因素是算法本身的復(fù)雜程度。排序算法所需的附加空間量一般都不大,所以排序算法的時(shí)間復(fù)雜度是衡量算法好壞的最重要的標(biāo)志。排序所需的時(shí)間主要是指算法執(zhí)行中關(guān)鍵字的比較次數(shù)和記錄的移動(dòng)次數(shù)。因此,后面的章節(jié)將會(huì)詳細(xì)討論排序算法中的比較次數(shù)和移動(dòng)次數(shù)。
待排序的記錄可有下列三種存儲(chǔ)結(jié)構(gòu):
(1)以一組連續(xù)的地址單元(如一維數(shù)組)作為存儲(chǔ)結(jié)構(gòu),待排序記錄的次序由其物理位置決定。在排序過程中,必須移動(dòng)記錄來進(jìn)行物理位置上的重排,即通過比較和判定把記錄移到合適的位置。
(2)以鏈表作為存儲(chǔ)結(jié)構(gòu),記錄之間的次序由指針決定。因此,在排序過程中僅需修改指針。
(3)待排序記錄存儲(chǔ)在一組連續(xù)的地址單元內(nèi),此時(shí)若要避免排序過程中記錄的移動(dòng),可以為該序列建立一個(gè)輔助表(如索引表),在排序過程中只需對(duì)這個(gè)輔助的表目進(jìn)行物理重排,而不移動(dòng)記錄本身。
為方便起見,本章假設(shè)記錄序列的存儲(chǔ)結(jié)構(gòu)為一維數(shù)組,關(guān)鍵字為整數(shù)。待排序記錄的數(shù)據(jù)類型說明如下:
typedefstruct //定義記錄為結(jié)構(gòu)類型
{intkey; //關(guān)鍵字域
datatypeother; //其他數(shù)據(jù)域
}rectype;
rectypeR[n+1];//n為記錄總數(shù),R[0]閑置或作為哨兵單元
9.2.1直接插入排序
直接插入排序(StraightInsertionSort)是一種最簡單的排序方法。其基本思路是把關(guān)鍵字ki依次與有序區(qū)的關(guān)鍵字ki-1,ki-2,
…,k1進(jìn)行比較,找到應(yīng)該插入的位置,然后將ki插入。給定待排序的記錄序列為R[1]~R[n],則初始有序區(qū)為{R[1]},直接插入排序可以從i=2開始,如算法9.1所示。9.2插入排序算法9.1中的基本操作是關(guān)鍵字比較和記錄移動(dòng)。記錄R[1]作為最初的有序區(qū),從i=2開始不斷將待插入記錄R[i]的關(guān)鍵字依次與有序區(qū)中記錄R[j](j=i
1,i
2,…,1)的關(guān)鍵字進(jìn)行比較。若R[j]的關(guān)鍵字大于R[i]的關(guān)鍵字,則將R[j]后移一個(gè)位置;若R[j]的關(guān)鍵字小于或等于R[i]的關(guān)鍵字,則查找過程結(jié)束,j+1即為R[i]的插入位置。數(shù)組單元R[0]預(yù)先對(duì)記錄R[i]進(jìn)行備份,使得在后移關(guān)鍵字比R[i]大的記錄時(shí)不致丟失R[i]中的內(nèi)容;R[0]在while循環(huán)中還可以作為“監(jiān)視哨”,以防下標(biāo)變量j越界。由于避免了每次while循環(huán)都要檢測j是否越界,測試循環(huán)條件的時(shí)間可以減少約一半。
根據(jù)算法9.1對(duì)待排序的一組記錄進(jìn)行排序,記錄的關(guān)鍵字分別為49,31,63,85,75,15,26,49
,直接插入排序過程如圖9.1所示。
直接插入排序的算法9.1非常簡潔,容易實(shí)現(xiàn),下面來分析它的效率。
從時(shí)間上看,整個(gè)排序過程只有兩種運(yùn)算,即比較關(guān)鍵字和移動(dòng)記錄。算法中的外循環(huán)表示要進(jìn)行n
1趟插入排序,內(nèi)循環(huán)的次數(shù)則取決于待排序關(guān)鍵字與有序區(qū)中i個(gè)關(guān)鍵字的關(guān)系。
圖9.1直接插入排序示例可以按兩種情況來考慮。當(dāng)一組記錄為正序時(shí)(這里按遞增有序),每趟排序的關(guān)鍵字比較次數(shù)為1,記錄移動(dòng)次數(shù)是2次,即總的比較次數(shù)Cmin=n
1,總的移動(dòng)次數(shù)Mmin=2(n
1);當(dāng)文件逆序時(shí),要插入的第i個(gè)記錄均要與前i
1個(gè)記錄及“監(jiān)視哨”的關(guān)鍵字進(jìn)行比較,即每趟要進(jìn)行i次比較;從記錄移動(dòng)的次數(shù)來說,每趟排序中除了上面提到的兩次移動(dòng)外,還需將關(guān)鍵字大于R[i]的記錄后移一個(gè)位置。這時(shí)關(guān)鍵字的比較次數(shù)和記錄的移動(dòng)次數(shù)均取最大值,總的比較次數(shù)和記錄的移動(dòng)次數(shù)為:綜上可知,記錄關(guān)鍵字的分布對(duì)算法執(zhí)行過程中的時(shí)間消耗是有影響的。若在隨機(jī)情況下,即關(guān)鍵字各種排列出現(xiàn)的概率相同,則可取上述兩種情況的平均值作為比較和記錄移動(dòng)的平均次數(shù),約為n2/4。由此,直接插入排序的時(shí)間復(fù)雜度為O(n2)。
從空間上看,直接插入排序只需要一個(gè)記錄的輔助空間R[0],空間復(fù)雜度即為O(1)。
直接插入排序是穩(wěn)定的排序方法。
9.2.2希爾排序
希爾排序(Shell’sSort)又稱為“縮小增量排序”(DiminishingIncrementSort),是一種改進(jìn)的插入排序方法。該方法是D.L.Shell于1959年提出的,故用他的名字命名。我們知道,直接插入排序算法的平均時(shí)間復(fù)雜度為O(n2)。但是,由于其算法簡單,當(dāng)n較小時(shí)效率較高;另外,當(dāng)一組記錄有序時(shí),其算法復(fù)雜度可以達(dá)到最優(yōu),即O(n)。希爾排序正是基于這兩點(diǎn)來對(duì)直接插入排序進(jìn)行改進(jìn)的。
希爾排序的基本思想是:設(shè)置t個(gè)整數(shù)增量(d1>d2>…>dt-1>dt),其中d1<n,dt=1;首先以d1為增量,將所有距離為d1倍數(shù)的記錄放在同一組中,可以得到d1個(gè)組,在各組內(nèi)進(jìn)行直接插入排序;然后取第二個(gè)增量d2,重復(fù)上述的分組和排序,直至增量dt=1。
設(shè)置增量序列時(shí),要使得增量值沒有除1之外的公因子,而且最后一個(gè)增量值必須為1。下面先看一個(gè)具體例子。設(shè)待排序文件共有10個(gè)記錄,其關(guān)鍵字分別為49,31,63,85,75,15,26,49
,53,03,增量序列取值依次為5,3,1。排序過程如圖9.2所示。
圖9.2希爾排序示例由圖9.2可見,希爾排序的每一趟就是直接插入排序。增量越大,則得到的子序列越短,此時(shí)直接插入排序效率很高;而當(dāng)增量逐漸減小時(shí),序列已逐漸有序,因此直接插入排序仍然很有效。當(dāng)增量為1時(shí),此時(shí)所有的記錄已經(jīng)基本有序,并放在同一組中進(jìn)行直接插入排序。由此,希爾排序的速度較直接插入排序有很大的提高。
要注意的是,希爾排序中的子序列不是逐段選取的,而是根據(jù)增量值跳躍性的抽取。這樣可以實(shí)現(xiàn)排序記錄在較大范圍內(nèi)進(jìn)行移動(dòng),從而提高了排序速度。但是由此導(dǎo)致了希爾排序是不穩(wěn)定的。
希爾排序的具體算法描述如算法9.2所示。
算法9.2中沒有設(shè)置“監(jiān)視哨”,單元R[0]僅作為暫存單元,在內(nèi)循環(huán)中增加了一個(gè)循環(huán)判定條件“j>0”,以防下標(biāo)越界。若要設(shè)置監(jiān)視哨,需要利用數(shù)組R的前t個(gè)單元作為監(jiān)視哨,待排序記錄則要從第t個(gè)單元開始存儲(chǔ)。讀者可以自行完成。
希爾排序的時(shí)間復(fù)雜度取決于增量序列的選取,但是如何選取增量序列才能產(chǎn)生最好的排序效果,這一問題至今沒有得到解決。希爾本人最初提出取d1=
n/2
,di+1=
di/2
,dt=1,t=
lb?n
,后來又有人提出其他選擇增量序列的方法,如di+1=
(di
1)/3
,dt=1,t=
log3n
1
以及di+1=
(di
1)/2
,dt=1,t=
lb?n
1
。大量實(shí)驗(yàn)表明,希爾排序所需的比較和移動(dòng)次數(shù)約為n1.3。
9.3.1起泡排序
起泡排序(BubbleSort)是最為人們所熟知的交換排序方法。它的過程非常簡單:對(duì)縱向排列的關(guān)鍵字序列,按照自下而上的掃描方向?qū)蓛上噜彽年P(guān)鍵字進(jìn)行比較,若為逆序(即kj
1>kj),則將兩個(gè)記錄交換位置;重復(fù)上述掃描排序過程,直至沒有記錄需要交換為止。
9.3交換排序第一趟掃描后,關(guān)鍵字最小的記錄將上升到第一個(gè)記錄的位置上;第二趟對(duì)后面的n
1個(gè)記錄重復(fù)同樣操作,把次小關(guān)鍵字的記錄安排在第二個(gè)記錄的位置上;重復(fù)上述過程,分析可知,在第n
1趟后,全部記錄都按關(guān)鍵字由小到大的順序排列完畢。在每一趟排序過程中,關(guān)鍵字最小的記錄通過比較和交換,會(huì)像氣泡一樣上浮至頂,而關(guān)鍵字較大的記錄則逐漸下沉,“起泡排序”的名稱由此而來。起泡排序的過程如圖9.3所示。
圖9.3從下向上掃描的起泡排序示例(實(shí)際只掃描了5趟)對(duì)任一組記錄進(jìn)行起泡排序時(shí),至多需要進(jìn)行n
1趟排序。但是,如果在排序過程中的某一趟掃描后,例如圖9.3中的第四趟排序后,待排序記錄已按關(guān)鍵字有序,因此起泡排序便可在此趟排序后終止。為了實(shí)現(xiàn)這一點(diǎn),可以在起泡排序算法(算法9.3)中引入一個(gè)布爾量swap,在每趟排序開始前,先將其置為FALSE,若排序過程中發(fā)生了交換,則將其置為TRUE。在一趟排序之后,如果swap仍為FALSE,則表示本趟未曾交換過記錄,此時(shí)可以終止算法。
下面分析起泡排序的性能。若記錄已按關(guān)鍵字有序排列,則只需進(jìn)行一趟掃描,而且比較次數(shù)和記錄移動(dòng)次數(shù)均為最小值:比較次數(shù)為n
1,記錄移動(dòng)次數(shù)為0。若記錄逆序排列,即按關(guān)鍵字遞減排列,則一共需進(jìn)行n
1趟掃描,比較次數(shù)和記錄移動(dòng)次數(shù)均達(dá)到最大值,分別為:
由此可知起泡排序的時(shí)間復(fù)雜度為O(n2)。
為提高起泡排序算法的效率,必須減少算法9.3中的比較和交換次數(shù)。除了設(shè)置交換標(biāo)志外,我們還可做如下的兩種改進(jìn):
(1)在算法9.3中,一次掃描可以把最輕的氣泡上升至頂,而最重的氣泡僅能“下沉”一個(gè)位置。由此分析可知,對(duì)于關(guān)鍵字序列2,3,7,8,9,1,僅需一趟掃描就可以完成排序;但是對(duì)于關(guān)鍵字序列9,1,2,3,7,8,卻需要從下到上掃描五趟才能完成排序。這兩個(gè)序列都是僅有一個(gè)元素需要重排,但是產(chǎn)生了完全不同的結(jié)果。究其原因,正是掃描的方向?qū)е铝藘煞N情況下的不對(duì)稱性。如果改變掃描方向?yàn)閺纳系较?,則序列9,1,2,3,7,8也僅需一趟掃描。基于上述分析,我們可在排序過程中交替改變掃描方向,形成雙向起泡算法。該算法的實(shí)現(xiàn)留做習(xí)題。
(2)在每趟掃描中,記住最后一次交換發(fā)生的位置k,因?yàn)樵撐恢弥暗挠涗浂家延行?,即R[1..k
1]是有序區(qū),R[k..n]是無序區(qū),所以下一趟沿該方向掃描時(shí)可提前終止于位置k+1,而不必進(jìn)行到預(yù)定的下界i+1,從而減少排序的趟數(shù)。例如,第一趟排序后的序列為1,2,3,9,8,7,最后一次交換的位置為k=4,那么下一趟掃描的下界可設(shè)為5,而不是3。改進(jìn)的算法見本章習(xí)題第四大題的第14小題。
9.3.2快速排序
快速排序是對(duì)起泡排序的一種改進(jìn),其基本思想是:通過一趟排序?qū)⒂涗浶蛄蟹殖蓛蓚€(gè)子序列,然后分別對(duì)這兩個(gè)子序列進(jìn)行排序以達(dá)到整個(gè)序列有序。
假設(shè)待排序記錄為R[s]~R[t],任取其中一個(gè)記錄R[p]作為比較的“基準(zhǔn)”(pivot),一般取p=s。用此基準(zhǔn)將當(dāng)前序列劃分為左、右兩個(gè)子序列:R[s]~R[i
1]和R[i+1]~R[t],使得左邊子序列的關(guān)鍵字均小于或等于基準(zhǔn)的關(guān)鍵字,右邊子序列的關(guān)鍵字均大于或等于基準(zhǔn)的關(guān)鍵字,即:
R[s]~R[i
1].key≤R[i].key≤R[i+1]~R[t].key(s≤i≤t)
此時(shí)基準(zhǔn)所處的位置為R[i],也即該記錄的最終排序位置。這是一趟快速排序的過程。
可以看出,快速排序中的比較都是與基準(zhǔn)進(jìn)行的,發(fā)生交換時(shí)記錄移動(dòng)的距離較大;而在起泡排序中,比較和交換是在相鄰兩記錄之間進(jìn)行的,每次交換記錄只能前移或后移一個(gè)位置,因此快速排序的效率得到提高。
快速排序是一種縮小規(guī)模算法。當(dāng)R[s]~R[i
1]和R[i+1]~R[t]均非空時(shí),還應(yīng)分別對(duì)它們進(jìn)行上述的劃分過程,直至所有記錄均已排好序?yàn)橹埂?/p>
下面給出對(duì)序列R[s]~R[t]進(jìn)行劃分的具體做法:基準(zhǔn)設(shè)置為序列中的第一個(gè)記錄R[s],并將它保存在pivot中;設(shè)置兩個(gè)指針low和high,它們的初值分別取為low=s和high=t。首先,令high自t起向左掃描,當(dāng)找到第一個(gè)關(guān)鍵字小于pivot.key的記錄R[high]時(shí),將記錄R[high]移至R[low](即空出數(shù)組單元R[high]);然后,令low=low+1并自左向右掃描,當(dāng)找到第一個(gè)關(guān)鍵字大于pivot.key的記錄R[low]時(shí),將記錄R[low]移至R[high](即空出數(shù)組單元R[low]);接著令high=high
1并從右向左掃描,如此交替改變掃描方向,從兩端各自往中間靠攏,直至low=high。此時(shí)low便是基準(zhǔn)的最終位置,最后將pivot放在此位置上就完成了一次劃分。
算法9.5中,數(shù)組R的下界s和上界t確定了待排序記錄的范圍。對(duì)整個(gè)序列進(jìn)行排序時(shí),則調(diào)用QuickSort(R,1,n)。
圖9.4給出了一次劃分的過程及整個(gè)快速排序的過程。
圖9.4快速排序示例下面分析快速排序算法的性能。可以證明,對(duì)n個(gè)記錄進(jìn)行快速排序的平均時(shí)間復(fù)雜度為O(n?lb?n)。在時(shí)間復(fù)雜度量級(jí)相同的算法中,快速排序也被公認(rèn)是最好的。假設(shè)對(duì)長度為n的序列進(jìn)行快速排序所需的比較次數(shù)為C(n),則
C(n)=Cp(n)+C(m)+C(n-m-1)
其中Cp(n)是進(jìn)行一次劃分所需的比較次數(shù),m為一個(gè)子序列的長度。顯然,Cp(n)與序列長度n有關(guān),設(shè)Cp(n)=cn,c為常數(shù),C(m)和C(n-m-1)分別是左、右兩個(gè)子序列進(jìn)行排序所需的比較次數(shù)。根據(jù)算法9.5,遞歸地對(duì)左、右兩個(gè)子序列進(jìn)行排序即可得到總的比較次數(shù)。在最好情況下,快速排序的每次劃分后基準(zhǔn)的左、右兩個(gè)子序列的長度大致相等,也即所取的基準(zhǔn)正好是待劃分序列的“中值”。這樣總的劃分結(jié)果類似于一棵左、右子樹結(jié)點(diǎn)個(gè)數(shù)基本相等的二叉樹。假設(shè)序列長度n=2k,那么總的比較次數(shù)為
C(n)≤Cp(n)+C(n/2)+C(n/2)=cn+2C(n/2)
≤cn+2[cn/2+2C(n/22)]=2cn+4C(n/22)
≤2cn+4[cn/4+2C(n/23)]=3cn+8C(n/23)
≤……
≤ckn+2kC(n/2k)=c(lb?n)O(n)+nC(1)
=O(n?lb?n)
式中C(1)是一常數(shù)。
當(dāng)待排序記錄已按關(guān)鍵字有序或基本有序時(shí),快速排序的效率反而降低。在最壞情況下,每次劃分后基準(zhǔn)左、右兩個(gè)子序列中有一個(gè)長度為0,這樣總的劃分結(jié)果類似于一棵單支的二叉樹。以有序序列為例,在第一趟快速排序中,經(jīng)過n
1次比較之后,第一個(gè)記錄仍定位在它原來的位置上,并得到一個(gè)包括n
1個(gè)記錄的子序列;第二次遞歸調(diào)用中,需經(jīng)過n
2次比較,第二個(gè)記錄仍定位在它原來的位置上,得到的子序列長度n
2;依次類推,最后得到總比較次數(shù)為
這種情況下,快速排序的時(shí)間復(fù)雜度為O(n2),蛻化為起泡排序。要改善此時(shí)的性能,通常采用“三者取中”的方法。也就是在進(jìn)行一趟快速排序之前,對(duì)R[s].key、R[t].key和R[
(s+t)/2
].key進(jìn)行比較,將三者中的“中值”記錄與R[s]交換。實(shí)驗(yàn)證明,這種方法可以大大改善快速排序在最壞情況下的性能。
綜上所述,快速排序的最壞時(shí)間復(fù)雜度為O(n2),最好時(shí)間復(fù)雜度為O(n?lb?n)。注意到,快速排序的記錄移動(dòng)次數(shù)不大于比較的次數(shù)??梢宰C明:平均情況下快速排序的時(shí)間復(fù)雜度也是O(n?lb?n)。從時(shí)間上看,它是目前基于比較的內(nèi)部排序方法中平均性能最好的,因而稱為快速排序。
從空間上看,快速排序算法雖然只需要一個(gè)臨時(shí)單元存放基準(zhǔn)記錄,但是其遞歸特性需要一個(gè)??臻g來實(shí)現(xiàn)。??臻g的大小取決于每次劃分后序列的長度。最好情況下,棧的最大深度為
lb?n
+1,所需??臻g為O(lb?n);最壞情況下,棧的最大深度為n,所需??臻g為O(n)。
快速排序是不穩(wěn)定的。
選擇排序(SelectSort)的基本思想是:每一趟從待排序記錄中選出關(guān)鍵字最小的記錄,依次放在已排序記錄的最后,直至全部記錄有序。直接選擇排序是其中最為簡單的一種方法。
9.4直接選擇排序直接選擇排序的具體做法是:第一趟排序?qū)⒋判蛴涗汻[1]~R[n]作為無序區(qū),從中選出關(guān)鍵字最小的記錄并與無序區(qū)中第1個(gè)記錄R[1]交換,此時(shí)得到有序區(qū)為R[1],無序區(qū)縮小為R[2]~R[n];第二趟排序則在無序區(qū)R[2]~R[n]中選關(guān)鍵字最小的記錄,將它與R[2]交換;第i趟排序時(shí),在當(dāng)前的無序區(qū)R[i]~R[n]中選出關(guān)鍵字最小的記錄R[k],并與無序區(qū)中第1個(gè)記錄R[i]交換,得到新的有序區(qū)R[1]~R[i]。注意到,每趟排序從無序區(qū)中選擇的記錄其關(guān)鍵字是有序區(qū)中的最大值。根據(jù)上述過程類推,進(jìn)行n
1趟排序后,無序區(qū)中只剩一個(gè)記錄,此時(shí)整個(gè)序列就是遞增有序的。其排序過程如圖9.5所示,相應(yīng)過程的c語言描述詳見算法9.6。
圖9.5直接選擇排序示例分析算法9.6可知,直接選擇排序需n
1趟排序,每一趟的比較次數(shù)與關(guān)鍵字的排列狀態(tài)無關(guān)。第一趟找出最小關(guān)鍵字需要進(jìn)行n
1次比較,第二趟找出次小關(guān)鍵字需要進(jìn)行n
2次比較,由此類推,總的比較次數(shù)為
每趟比較后要判斷是否進(jìn)行兩個(gè)記錄的交換,如要交換,則進(jìn)行三次記錄的移動(dòng)。因此直接選擇排序在最好情況下,記錄移動(dòng)次數(shù)的最小值為0,而在最壞情況下的最大值為3(n
1)。
綜上所述,直接選擇排序的時(shí)間復(fù)雜度為O(n2)。這種排序方法是不穩(wěn)定的。
歸并排序(MergeSort)的思路與前面介紹過的排序方法都不一樣?!皻w并”的含義是將兩個(gè)或兩個(gè)以上的有序表合并成一個(gè)新的有序表。歸并排序的基本思路是:假設(shè)初始表含有n個(gè)記錄,則可看成是n個(gè)有序的子表,每個(gè)子表的長度為1,然后兩兩歸并,得到
n/2
個(gè)長度為2或1的有序子表;再兩兩歸并,如此重復(fù),直至得到一個(gè)長度為n的有序子表為止。這種方法稱為“二路歸并排序”。
9.5歸并排序
1.二路歸并
假設(shè)R[low]~R[mid]和R[mid+1]~R[high]表示同一數(shù)組中相鄰的兩個(gè)有序表,現(xiàn)在要將它們合并為一個(gè)有序表R1[low]~R1[high],需要設(shè)置三個(gè)指示器i、j和k,其初值分別為這三個(gè)記錄區(qū)的起始位置。具體實(shí)現(xiàn)如算法9.7所示。
在算法9.7中,從兩個(gè)有序表R[low]~R[mid]和R[mid+1]~R[high]的左端開始,依次比較R[i]和R[j]的關(guān)鍵字,并將關(guān)鍵字較小的記錄復(fù)制到R1[k]中;然后,指向被復(fù)制記錄的指示器和指向復(fù)制位置的指示器k右移,重復(fù)這一過程,直至其中一個(gè)有序表中的全部記錄復(fù)制完畢;最后將另一個(gè)有序表的剩余記錄直接復(fù)制到數(shù)組R1[low]~R1[high]中。
2.一趟歸并
假設(shè)在待排序序列中,每個(gè)有序表的長度均為length(最后一個(gè)有序表的長度可能小于length),那么在歸并前R[1]~R[n]中共有
n/length
個(gè)有序的子文件:R[1]~R[length],R[length+1]~R[2
length],…,R[(
n/length
1)
length+1]~R[n]。一趟歸并所解決的問題是,調(diào)用二路歸并算法將相鄰的一對(duì)有序表進(jìn)行歸并。具體算法見算法9.8。
在算法9.8中要考慮三種情況:有序表的個(gè)數(shù)為偶數(shù)且長度均為length,有序表的個(gè)數(shù)為偶數(shù)但最后一個(gè)有序表的長度小于length,有序表的個(gè)數(shù)為奇數(shù)。
3.二路歸并排序
二路歸并排序如算法9.9所示,實(shí)際上就是對(duì)“一趟歸并”的重復(fù)調(diào)用過程。有序表的初始長度為1,每趟歸并后有序表長度增大一倍;若干趟歸并后,當(dāng)有序表的長度大于或等于n時(shí),排序結(jié)束。
要注意的是,算法9.9中每次循環(huán)調(diào)用函數(shù)MergePass兩次。若第一次調(diào)用后,條件length<n成立,則第二次調(diào)用MergePass仍實(shí)現(xiàn)排序功能,否則排序已完成,此時(shí)第二次調(diào)用MergePass的作用僅僅是把排序結(jié)果從R1復(fù)制到R中。
圖9.6所示為歸并排序的示例。對(duì)于一組待排序的記錄,其關(guān)鍵字分別為49,31,63,85,75,15,26,49
。根據(jù)算法9.9,首先將這8個(gè)記錄看做是長度為1的8個(gè)有序表,然后兩兩歸并,直至有序表的長度不小于8。圖9.6二路歸關(guān)排序示例分析算法9.9以及圖9.6可知,第i趟歸并后,有序表長度為2i。因此,對(duì)于長度為n的無序表,必須執(zhí)行
lb?n
趟歸并。由于每趟歸并的時(shí)間復(fù)雜度是O(n),二路歸并排序算法的時(shí)間復(fù)雜度為O(n?lb?n),算法中輔助空間即數(shù)組R1的最大長度為n,因此空間復(fù)雜度是O(n)。
與快速排序算法相比,二路歸并排序的最大特點(diǎn)是它是穩(wěn)定的。
實(shí)際應(yīng)用中并不提倡從長度為1的序列開始進(jìn)行二路歸并??梢韵壤弥苯硬迦肱判虻玫捷^長的有序表,然后再進(jìn)行兩兩歸并。二者的混合排序仍然是穩(wěn)定的。
內(nèi)部排序方法還有堆排序、分配排序、基數(shù)排序等多種,本章不做一一介紹。各種排序方法中沒有哪一種是絕對(duì)最優(yōu)的,不同排序方法各有其優(yōu)缺點(diǎn),因此,在不同的場合根據(jù)需要選擇適當(dāng)?shù)呐判蚍椒ㄊ鞘种匾摹>C合比較本章所討論的各種排序方法,大致有如表9.1所示的結(jié)果,其中簡單排序包括除希爾排序之外的所有插入排序、起泡排序和簡單選擇排序。
9.6各種內(nèi)部排序方法的比較和選擇具體選擇排序方法時(shí),應(yīng)考慮以下因素:
(1)平均時(shí)間:平均時(shí)間主要取決于算法的時(shí)間復(fù)雜度以及關(guān)鍵字的分布情況。一般應(yīng)采用時(shí)間復(fù)雜度為O(n?lb?n)的排序方法,例如快速排序、歸并排序。當(dāng)待排序的關(guān)鍵字隨機(jī)分布時(shí),快速排序所需運(yùn)行時(shí)間最短,但是在最壞情況下性能較差。歸并排序沒有所謂的最壞情況,當(dāng)n較大時(shí)可作為另一種較好的選擇。
(2)記錄數(shù)目n:若n比較小(如n≤50),則可采用簡單的排序方法,而直接插入排序最為簡單。當(dāng)序列中的記錄基本有序時(shí),直接插入排序或起泡排序是較好的選擇。當(dāng)n較大時(shí),可根據(jù)平均時(shí)間來考慮。
(3)記錄大?。号判蛩惴ㄖ械闹饕僮魇顷P(guān)鍵字的比較和記錄的移動(dòng)。當(dāng)記錄本身數(shù)據(jù)量較大時(shí),應(yīng)采用記錄移動(dòng)次數(shù)較少的排序方法,例如直接插入排序所需的記錄移動(dòng)次數(shù)要多于直接選擇排序。
(4)穩(wěn)定性:這一點(diǎn)取決于不同的應(yīng)用場合。當(dāng)穩(wěn)定性比較重要時(shí),較快的算法可以選擇歸并排序或基數(shù)排序,簡單排序中可以選擇直接插入排序、起泡排序等。必須注意的是,穩(wěn)定的排序方法與其具體的描述形式有關(guān),改變描述形式后,原本穩(wěn)定的排序方法也會(huì)變得不穩(wěn)定。
本章所討論的內(nèi)部排序算法都是在一維數(shù)組上實(shí)現(xiàn)的。當(dāng)記錄本身的信息量較大時(shí),采用鏈表結(jié)構(gòu)可以節(jié)約因大量移動(dòng)記錄所耗費(fèi)的時(shí)間。當(dāng)記錄很大時(shí),可以采用靜態(tài)鏈表作為存儲(chǔ)結(jié)構(gòu),以指針的修改替代記錄的移動(dòng)。另外,對(duì)于任何鏈表結(jié)構(gòu),我們還可以提取結(jié)點(diǎn)的地址信息存儲(chǔ)為地址向量,然后按照一位數(shù)組的方式對(duì)該地址向量進(jìn)行排序。
一、名詞解釋
排序,穩(wěn)定的排序,不穩(wěn)定的排序,內(nèi)部排序,外部排序
二、填空題
1.按照排序過程涉及的存儲(chǔ)設(shè)備的不同,排序可分為
排序和
排序。
2.在排序算法中,分析算法的時(shí)間復(fù)雜性時(shí),通常以
和
為標(biāo)準(zhǔn)操作。評(píng)價(jià)排序的另一個(gè)主要標(biāo)準(zhǔn)是執(zhí)行算法所需要的
。
3.直接插入排序是穩(wěn)定的,它的時(shí)間復(fù)雜性為
,空間復(fù)雜度為
。
習(xí)題9
4.對(duì)于n個(gè)記錄的集合進(jìn)行起泡排序,其最壞情況下所需的時(shí)間復(fù)雜度為
。
5.對(duì)于n個(gè)記錄的集合進(jìn)行歸并排序,所需的附加空間消耗是
。
6.以下為起泡排序的算法。請分析算法,并在
上填充適當(dāng)?shù)恼Z句。
7.對(duì)快速排序來講,其最好情況下的時(shí)間復(fù)雜度是
,其最壞情況下的時(shí)間復(fù)雜度是
。
8.歸并排序要求待排序列由若干個(gè)
的子序列組成。
三、選擇題
1.以下不穩(wěn)定的排序方法是()。
A.直接插入排序
B.起泡排序
D.直接選擇排序
D.二路歸并排序
2.以下時(shí)間復(fù)雜性不是O(n2)的排序方法是()。
A.直接插入排序
B.二路歸并排序
C.起泡排序
D.直接選擇排序
3.排序的目的是為了以后對(duì)已排序的數(shù)據(jù)元數(shù)進(jìn)行()操作。
A.打印輸出 B.分類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專業(yè)商品選購指導(dǎo)及售后服務(wù)合同
- 2025年度電力設(shè)施安全生產(chǎn)責(zé)任協(xié)議示范文本3篇
- 2024融資居間合同
- 2024年租賃雙方汽車租賃合同標(biāo)的明細(xì)
- 2024年豪華酒店室內(nèi)裝潢合同
- 2024施工勞務(wù)合同(含材料供應(yīng)管理)綜合版3篇
- 2025年度航空航天地面設(shè)備采購合同大全3篇
- 三院2024年度肉類配送業(yè)務(wù)合作協(xié)議版B版
- 《2024年協(xié)議失效確認(rèn):遺失協(xié)議補(bǔ)簽協(xié)議》一
- 罐裝大米知識(shí)培訓(xùn)課件
- 醫(yī)療科研數(shù)據(jù)管理制度
- 蘇教版三年級(jí)數(shù)學(xué)下冊全單元測試題(加答案)
- 副廠長競聘演講稿
- 《小學(xué)五年級(jí)期末家長會(huì)》課件模板(五套)
- 場地移交表完整版本
- 電影項(xiàng)目策劃書
- 供電公司應(yīng)急演練培訓(xùn)
- 產(chǎn)業(yè)園區(qū)金融綜合服務(wù)創(chuàng)新藍(lán)皮書(2024.1)
- 高一數(shù)學(xué)單元練習(xí)卷
- 年項(xiàng)目經(jīng)理講安全課
- 如何防范勒索軟件和網(wǎng)絡(luò)勒索攻擊
評(píng)論
0/150
提交評(píng)論