翻譯以.原文和在同一文件中前_第1頁
翻譯以.原文和在同一文件中前_第2頁
翻譯以.原文和在同一文件中前_第3頁
翻譯以.原文和在同一文件中前_第4頁
翻譯以.原文和在同一文件中前_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

作者:ChenTian,DanielWaddington,Jilong4微內(nèi)核在移動設(shè)備上已成功使用。然而,隨著單核處理器向多核,眾核處理器的迅速轉(zhuǎn)變,許多重要的操作系統(tǒng)功能如物理內(nèi)存分配(PMA)必linx的整體內(nèi)核中關(guān)于PM已44微內(nèi)核中的PMA是用戶層頁理的一分該理作為立服務(wù)以少(P)而不是正常的系統(tǒng)或內(nèi)4PMAfiaco.OC上下文的解決方法。我們也討論了如何利用4微內(nèi)核設(shè)計優(yōu)勢來實現(xiàn)一個具有更高級特性的PMA48AMD服務(wù)器上進行。L4微內(nèi)核之所以在移動設(shè)備上成功使用是因為它可以為其他移動應(yīng)用androidlinux提供虛擬化和安全性。例如,L4AandroidL4Linux工程已經(jīng)成功地將AandroidLinuxL4Fiasco.OC微內(nèi)核上。OKLabslinuxPMA已經(jīng)做了大量工作,但L4微內(nèi)核中卻很少見到。種物理內(nèi)存請求。當一個應(yīng)用程序最初觸發(fā)一個虛擬內(nèi)存地址(比如由malloc分配PMA來處理頁分配的請求。這PMAVMA和缺頁機制。因此,PMA也需要對來自內(nèi)核其他部分的直接請求進行處理。相比之下,L4微內(nèi)核中的PMA和整體內(nèi)核中的大不相同,因為操作系統(tǒng)設(shè)在內(nèi)核態(tài)的軟件)為其他軟件提供最基本的包括硬件中斷/異常處理,進程管理,戶態(tài)執(zhí)行。因此,PMA被分成兩部分,一部分仍然位于內(nèi)核態(tài),另一部分在用戶態(tài)作為服務(wù)器運行。內(nèi)核模式的PMA為各種內(nèi)核代碼產(chǎn)生的動態(tài)內(nèi)存分配請求提供服務(wù),用戶模式的PMA主要處理其他應(yīng)用程序的內(nèi)存請求。和linux相似,應(yīng)用程序的物理內(nèi)存請求也通過缺頁處理程序(也是一個服務(wù)器)被傳遞給PMA。處理與內(nèi)存分配有關(guān)的缺頁實際上減少了考慮碎片和cache錯誤的需要,因為這當一個操作系統(tǒng)在多核和眾核處理器上運行時,PMA的可擴展性就變得很于每個cpu的列表減少合并和的內(nèi)存單元內(nèi)容。盡管之前的研究文獻[3]說linux的內(nèi)存管理中仍然有可擴展性問題,但為了提高可擴展性,通常情況下需要執(zhí)行分散。在這篇里,證明,為每個核創(chuàng)建一個PMA才可以實這恰恰對微內(nèi)核的性能至關(guān)重要。應(yīng)該注意,這一工作關(guān)注用戶態(tài)PMA,它管非常?。ㄍǔI儆?%。2L4微內(nèi)核體系結(jié)構(gòu),描述了已經(jīng)1所示,因此稱作整體內(nèi)核。盡管他們已經(jīng)在不同的計算平臺上得以應(yīng)用,由于多樣性特點和可信問題造成的日益增長的復(fù)雜性已經(jīng)要求在和更新方面1同于幾百K字節(jié),這很容易適合許多處理器類型的L2Cache。20L4/Fiasco,L4Ka::Pistachio,和NICTA::L4-embedded等等。2近年來,有的關(guān)于進一步提高微內(nèi)核性能和豐富其特點的研究,促成了Fiasco.OC,NOVA,seL4OKL4。這些設(shè)計不僅進一步優(yōu)化了PMA,一個在內(nèi)核態(tài),使用伙伴分配算法,另一個在用戶態(tài),使用基于AVL樹的分配算法。圖 3Fiasco.OC中的物理內(nèi)存分配的請求是如何進行處理的。首先,PMA直接進行物理內(nèi)存8%。其余的內(nèi)存由用戶PMA管理,并由應(yīng)用程序使用。從圖中可以看出,我們描述了一個非常典程首先通過虛擬內(nèi)存分配器(malloc)分配一個棧變量或堆數(shù)據(jù)(1步。write處理器的執(zhí)行從用戶態(tài)代碼轉(zhuǎn)換到內(nèi)核態(tài)的缺頁處理程序(第2步,處理器進sigma0(pager,它L4微內(nèi)核設(shè)計中的所有頁故障(3步。在一個多核環(huán)境中,有多sigma0sigma0IPC收到一個缺缺頁處理器切換回故障指令,這樣應(yīng)用程序進程可以繼續(xù)(7步2,3,6,7步IPC調(diào)用(3,6步L4微內(nèi)核設(shè)計必須為安PMA必須能夠處理來自不同進程的并發(fā)進行的請求。于是,基于同步的鎖便成Linux2.6.24版本使用的伙伴分配器使用了每核列表,該列表由每個核的鎖保護,用來空白頁。在NUMA體系結(jié)構(gòu)的出現(xiàn)后,Linux內(nèi)核2.6.30版本使用了另外一種分配計劃,為每個NUMA域分配一個分配器。但在L4微內(nèi)核中還沒有進行充分研究。為了解決這一問題,我們首先測量內(nèi)存fiasco.OCL4Re4所示,隨著發(fā)送內(nèi)存分配和釋放請求的核的數(shù)目的增多,請求處理的時間也顯著增長。超過48核后,分配時間從25x開始下降,釋放時間從2x開始下降。圖 sigma0IPCPMA的不可擴展。默認情況下,sigma0是系統(tǒng)中僅有的頁表器。當來自不同核的多個請求需要同時被處理時,內(nèi)核的PF處理器需要將它們集成起來,一并發(fā)送給IPC(IPC的兩部分)PMA的可擴展性有很大的負影響。L4IPC機制對整個操作系統(tǒng)體系結(jié)構(gòu)而336步中,一個物理頁的請求需要和核內(nèi)的IPC(如同一個核上IPC的兩部分)10x20x。IPC要包含處理器間中斷(IPI)的處理,這引起了內(nèi)核模式核硬件上的一PMAL4PMA的可擴展性問題,如并發(fā)頁請求的N倍,NN個實現(xiàn)PMA圖 Fiasco.OC上實現(xiàn)每核一個頁表器和默認的頁表器,moe是默認的加載器(Linuxinit進程。為了實現(xiàn)每PFA來管理分配給其所在核的內(nèi)存區(qū)域。有許多適合物AVL樹在fiasco.OC中,一個進程(任務(wù))的內(nèi)核數(shù)據(jù)結(jié)構(gòu)包含了一塊可以指向任何合TLB問題在實現(xiàn)期間,我們注意到,當頁表器處理空閑請求時,TLBfiasco.OCTLB。由于刷新進實際上是讓頁表器進程重新形成TLB。然而,在我們的設(shè)計中,這一刷新可被TLBTLB相關(guān)的地址空間ID(ASID或支持單個TLB條目失效的指令。PMA的方案已經(jīng)實現(xiàn)了更好的性能,但利用微內(nèi)核一致體存取。如圖8所示。圖 一個具有更高級特性的可擴展的平衡方案來保持所有PMA的一個良好的負載平衡。如圖8所示,實現(xiàn)負載平衡特性的一個簡單的設(shè)計是讓每個PMA當前PMA中未使用內(nèi)存的平衡。詳細的實現(xiàn)如下。在對一個應(yīng)用程序的請求進行服PMAPMA應(yīng)當回復(fù)這些請求并且給請求者傳送要避免過量的IPC開銷。PMA的實現(xiàn)可以采用多種算法,比如基于樹的算法,伙伴算法,平板分配存模式而定。由于L4微內(nèi)核的設(shè)計,我們可以修改基本的每核一個PMA的實現(xiàn),這樣每個PMA就可以定制化了,如圖8中間所示。要使得一個應(yīng)用程序可以定制它的本地PMA,需要實現(xiàn)一系列現(xiàn)實的頁表IPCPMAAPI可以確定什么PMA算法有可能對正在運行的應(yīng)用程序產(chǎn)生更好的性能。由于應(yīng)用程序和頁表器存在于同一個核上,并且這些頁表器API被調(diào)用的頻率非常低,這一特點獲APIPMA重塑引起的額外的開銷。為了保證這點,開發(fā)者應(yīng)當通過剖析或編譯器分析了解或獲得應(yīng)用程序的性能和PMA算法的聯(lián)4.3非一致體存取的意隨著上核的個數(shù)的增加,非一致性體存?。∟UMA)的設(shè)計變得流行。在NUMA下,一個核對它本地內(nèi)存的大大快于偏遠內(nèi)存。因此,當收到一個頁分配請求時,PMA需要分配一個本地的頁,以實現(xiàn)更好的性NUMA域(7的第一步ACPI表中提取NUMANUMANUMA域中,內(nèi)存應(yīng)該被進為基礎(chǔ)的實現(xiàn)作為比較,其sigma0被所有進程使用。軟件L4Re僅僅理2GB虛擬內(nèi)存范圍。另外,調(diào)用不僅回收虛擬內(nèi)存,也給PMA硬件實驗運行在AMDMagnycours服務(wù)器上,配備有四個AMDOpteron6174由于32位地址空間的限制,使用了4GB的DRAM。PMAL4RePMA10000個頁。L4Re內(nèi)存分配benark也采取相同的配置。9PMA48核時,時間的下降也僅僅只有5%。而在使用L4Re原生PMA的例子中,性能的下降超過了240%。1010顯示了結(jié)果。盡管我們LR4ePMA(4所示)而言好得多,因L4RePMA中,分配和釋放的下降各自超過了2500%230%。性能敏感度意到,性能對于未解決的頁數(shù)很敏感,比如在開始前已經(jīng)分配的頁數(shù)。如圖1150頁(200KB的內(nèi)存)1000頁(4MB的內(nèi)存)PMA中內(nèi)存片的分配和回收。因此,顯著的頁數(shù)越多,樹中的節(jié)點越多,11L4微內(nèi)核一樣,物理分配器是在默認頁表程序,sigma0中實現(xiàn)的。正如可擴展性問題。本文的目標就是通過實現(xiàn)每核一個PMA,解決這一問題。L4GenodeLabsGenode的內(nèi)存分配器使用鎖來并行。這一設(shè)計也引起了可擴展性問題。和Fiasco.OC相似,幾個其他可擴展的微內(nèi)核設(shè)計也已經(jīng)被提出了。例如,服務(wù)配置多個服務(wù)器。由Research和ETHZurichSystemsGroup開發(fā)HeliOS也是有微軟開發(fā)的,目的是面向多樣平臺。這些工作中,物理內(nèi) 里提到的觀點不僅適合L4微內(nèi)核,而且也可以用于實現(xiàn)上述提CPU列表的伙伴分配器,但今后,我們計劃在如下兩方面繼續(xù)我們的研究。首先,在PMA中實L4微內(nèi)核中物理內(nèi)存分配器的可擴展性問題的根源。Fiasco.OCL4微內(nèi)核體系結(jié)構(gòu)的上下文中提出了一種可擴展的物理內(nèi)存48L4微內(nèi)核上每核一個PMA設(shè)計的可擴展性結(jié)果。M.Accetta,R.Baron,W.Bolosky,R.Golub,DavidandRashid,A.Tevanian,M.Young.Mach:Anewkernelfoundationforunixdevelopment.InProceedingsoftheUSENIXSummerConference,pages93–113,1986.A.Baumann,P.Barham,P.-E.Dagand,T.L.Harris,R.Isaacs,S.Peter,T.multicoresystems.InSOSP,pages29–44,2009.S.Boyd-Wickizer,A.T.Clements,Y.Mao,A.Pesterev,M.F.Kaashoek,R.Morris,andN.Zeldovich.Anysisoflinuxscalabilitytomanycores.InProceedingsofthe9thUSENIXconferenceonOperatingsystemsdesignandimplementation,OSDI’10,pages1–8,Berkeley,CA,USA,2010.USENIXAssociation.[4][5][6][7][8][9][10]G.C.HuntandJ.R.Larus.Singularity:rethinkingthesoftwarestack.SIGOPSOper.Syst.Rev.,41(2):37–49,Apr.2007.G.Klein,P.Derrin,andK.Elphinstone.Experiencereport:verifyingahigh-performancemicrokernel.InProceedingsofthe14thACMSIGNinternationalconferenceonFunctionalprogramming,ICFP’09,pages91–96,J.Liedtke.Onmicrokernelconstruction.InProceedingsoftheSymposiumonOperatingSystemPrinciples,pages237–250,1995.J.Liedtke,K.Elphinstone,S.Sch¨onberg,H.H¨artig,G.Heiser,N.andT.Jaeger.Achievedipcperformance(stillthefoundationforextensibility).InProceedingsofthe6thWorkshoponHotTopicsinOperatingSystems(HotOS-VI),CapeCod,MA,May5–61997.E.B.Nightingale,O.Hodson,R.McIlroy,C.Hawblitzel,andG.heterogeneousmultiprocessingwithsalitekernels.InProceedingsoftheACMSIGOPS22ndsymposiumonOperatingsystemsprinciples,SOSP’09,pages221–234,2009.U.SteinbergandB.Kauer.Nova:amicrohypervisor-basedsecur

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論