




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2021/5QCon11.副標(biāo)題方正蘭亭黑簡(jiǎn)體22磅1.副標(biāo)題方正蘭亭黑簡(jiǎn)體22磅2.副標(biāo)題方正蘭亭黑簡(jiǎn)體22磅3.副標(biāo)題方正蘭亭黑簡(jiǎn)體22磅4.副標(biāo)題方正蘭亭黑簡(jiǎn)體22磅?業(yè)務(wù)背景?虛擬化場(chǎng)景下的內(nèi)存故障處理?虛擬機(jī)的Crash監(jiān)控以及治理?延遲、性能的監(jiān)控和工具建設(shè)?取得的成果4化技術(shù)的場(chǎng)景和挑戰(zhàn)5用場(chǎng)景?云計(jì)算場(chǎng)景下,KVM虛擬化是最核心的技術(shù)?私有云場(chǎng)景下,虛擬化具有超強(qiáng)的隔離性,較好的解決多種業(yè)務(wù)的混合部署帶來的干擾問題?發(fā)揮I--s的資源編排能力,降低成本?..性的挑戰(zhàn)?虛擬化1:N的部署模型,導(dǎo)致了故障數(shù)量的絕對(duì)值增長(zhǎng)?虛擬化引入了軟件模擬、Host/Guest切換等,deaug的復(fù)雜度提升?虛擬化的部分監(jiān)控指標(biāo),缺乏工具鏈支持?..6場(chǎng)景下的內(nèi)存故障處理7CorrectableError(CE)?可修復(fù)的錯(cuò)誤,系統(tǒng)可以正確的運(yùn)行UncorrectedError(UE)?不可修復(fù)的錯(cuò)誤,內(nèi)核會(huì)嘗試盡量修復(fù)它FatalError?在系統(tǒng)的關(guān)鍵路徑上發(fā)生了UE,例如發(fā)生在映射內(nèi)核代碼的頁面上。內(nèi)核已經(jīng)沒有辦法繼續(xù)處理錯(cuò)誤了,只能重啟或者h(yuǎn)-ngNon.fatalError?UE發(fā)生在非關(guān)鍵的路徑上,系統(tǒng)還是可以繼續(xù)運(yùn)行。如UE發(fā)生在文件映射的非臟頁上,可以標(biāo)記頁面后重新加載磁盤的內(nèi)容;再如UE發(fā)生在用戶態(tài)進(jìn)程中,那么只需要kill掉單個(gè)進(jìn)程,而非整個(gè)系統(tǒng)重啟內(nèi)核RAs能力增強(qiáng)以及監(jiān)控8升級(jí)、配置BIOs?打開MCE上報(bào)Os處理能力?升級(jí)EDAC驅(qū)動(dòng),發(fā)揮新款CPU的硬件監(jiān)控能力監(jiān)控、分析/v-r/log/mcelog?根據(jù)log分析詳細(xì)的DIMM的故障errupts?THR中斷過高會(huì)影響業(yè)務(wù)性能eminfo?H-rdw-reCorrupted表示UE影響了多少內(nèi)存Kernel8QEMU對(duì)MCE的處理9QEMU進(jìn)程是一個(gè)虛擬機(jī),我們不希望因?yàn)槟骋粋€(gè)P-ge的錯(cuò)誤讓整個(gè)VM發(fā)生cr-sh!哪怕真的要發(fā)生cr-sh,我們需要知道它的詳細(xì)原因!prerr("Memoryf-ilure:%#lx:Killing%s:%dduetoh-rdw-rememorycorruption\n")?單純的依靠?jī)?nèi)核log監(jiān)控不靠譜!因?yàn)榇藭r(shí)發(fā)送的是sIGBUG信號(hào),并不會(huì)讓QEMU真的qemulogm-sk(CPULOGREsET)"Triplef-ult\n");?QEMU的這一行l(wèi)og也不足以說明QEMUreset的真實(shí)原因!QEMU8g"CPU%d:MCEc-p-ailityisnoten-aled)r-isingtriplef-ult";"CPU%d:PreviousMCEstillinprogress)r-isingtriplef-ult";QEMUmonitorevent{'event':'MEMORYFAILURE')'d-t-':{'recipient':'MemoryF-ilureRecipient')'-ction':'MemoryF-ilureAction')'fl-gs':'MemoryF-ilureFl-gs'}}MemoryF-ilureRecipient:hypervisor/guestMemoryF-ilureAction:ignore/inject/f-t-l/resetMemoryF-ilureFl-gs:-ction-required/及調(diào)度的改進(jìn)?調(diào)度層記錄memoryf-ilure事件?CE較頻繁的情況下提前遷移VM?UE的情況下,重新分配大頁?UE過多,在健康的節(jié)點(diǎn)上啟動(dòng)VMcfpvp-nic是什么??pvp-nic是QEMU模擬一個(gè)虛擬化設(shè)備,通常接在IsA0x505的ioport上。在GuestVM發(fā)生cr-sh的時(shí)候,會(huì)觸發(fā)PIO操作。QEMU通過a-ckend的寫入操作可以知道在Guest中發(fā)生了Cr-shpvp-nic有怎樣的局限性??通常情況下,pvp-nic可以監(jiān)控到GuestVM的Cr-sh。但是在Guest中如果配置了Kdump,就會(huì)出現(xiàn)二者不能同時(shí)工作的情況:a.kdump會(huì)觸發(fā)kexec重新加載內(nèi)核,跳過通知pvpanic的過程b.如果先通知pvpanic,會(huì)觸發(fā)QEMU執(zhí)行reset,不再繼續(xù)執(zhí)行kexec?ait0:-guestp-nich-sh-ppened-ndshouldaeprocessedaythehost.?ait1:-guestp-nich-sh-ppened-ndwillaeh-ndledaytheguest;thehostshouldrecorditorreportit)autshouldnot-ffecttheexecutionoftheguest.?Guest自動(dòng)判斷是否需要執(zhí)行Kdump?既可以執(zhí)行Kdump,也可以通知QEMU!/qemu/qemu/bIob/master/docs/specs/pvpanic.txtcba改進(jìn)后的pvp-nic通過Host上的-gent監(jiān)控P-nic/Cr-shlo-ded事件,可以準(zhǔn)確監(jiān)控到GuestVM的Cr-sh。同時(shí),Guestkernellog通過ttys0模擬寫入到host上的文件中,-gent通過OOB的方式把Guestkernellog推送到Oss存儲(chǔ)上,使用大數(shù)據(jù)分析。得到各個(gè)tr-ce的數(shù)量和百分比,始終優(yōu)先解決比例最高的Kernelp-nic。使用4.14、4.19以及5.4較高版本內(nèi)核,能使用新fe-ture的同時(shí),把Kernelp-nic的比例控制在萬分之一左右!機(jī)一鍵健康檢查使用OOB的方式獲取到CR0寄存器的數(shù)值:?CR0.PE:ProtectionEn-ale(ait0ofCR0),如果是0,大概率卡在了BIOs里面?CR0.PG:P-ging(ait31ofCR0),如果是0,大概率卡在了GRUB里面使用MemoryB-lloon獲取Guestmemoryst-t:?Guest完全內(nèi)核態(tài)執(zhí)行,判斷guestkernel是否響應(yīng)使用GuestAgent執(zhí)行g(shù)uest-ping:?用來判斷guestuser是不是能響應(yīng)watch.d.n1“cat/proc/interrupts|grepLoC“簡(jiǎn)直就是災(zāi)難l?簡(jiǎn)潔、易讀的展示?支持多種排序?支持Delt-的增量展示?支持softirq展示-top會(huì)默認(rèn)使用perfevent采集IPC(instructionspercycle),收集IPC會(huì)觸發(fā)Linux使用dpmc在KVM虛擬化場(chǎng)景下,wrmsr/rdpmc指令會(huì)造成vm-exit,影響虛擬機(jī)的性能。改進(jìn)方法是增加配置項(xiàng):-uto/en-ale/dis-ae。?en-ale,始終啟動(dòng)ipc收集?dis-ae,始終關(guān)閉ipc收集?-uto,判斷執(zhí)行環(huán)境,物理機(jī)上自動(dòng)打開;虛擬機(jī)中自動(dòng)關(guān)閉虛擬機(jī)的vCPU線程可能被搶占CPU時(shí)間,例如IRQ、workqueue或者其他的t-sk。那么反應(yīng)在虛擬機(jī)里面就是ste-ltime!且ste-ltime的監(jiān)控需要精細(xì)化處理,例如40C的虛擬機(jī),平均2.5%的ste-ltime似乎影響不大,但是單獨(dú)發(fā)生在某一個(gè)vCPU上就是100%!在Host上,讓-top支持per-thre-d級(jí)別的rundel-y監(jiān)控:?收集虛擬機(jī)的所有的vCPU線程的Rundel-y時(shí)間,更加細(xì)致?默認(rèn)10s的收集間隔,精度更高虛擬機(jī)的遠(yuǎn)程盤延遲發(fā)生了抖動(dòng),那么是網(wǎng)絡(luò)的問題?還是處理的慢?亦或是..例如存儲(chǔ)節(jié)點(diǎn)使用3260提供存儲(chǔ)服務(wù),使用tcprtt本地3260端口的所有連接的/iovisor/bcc/commit/e42ac4176998a6dcf0dbf3b6befeaad0a69cb98a/iovisor/bcc/commit/4cb
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《屈原列傳》《蘇武傳》聯(lián)讀教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版高中語文選擇性必修中冊(cè)
- 第1課時(shí) 加、減混合(教學(xué)設(shè)計(jì))-2024-2025學(xué)年一年級(jí)上冊(cè)數(shù)學(xué)人教版
- Module 11 Unit 1教學(xué)設(shè)計(jì) 2024-2025學(xué)年外研版九年級(jí)英語上冊(cè)
- 2024年中核湖南礦業(yè)招聘筆試參考題庫附帶答案詳解
- 第二單元第一課 電腦的大管家 操作系統(tǒng) 教學(xué)設(shè)計(jì) 2024-2025學(xué)年新世紀(jì)版(2018)初中信息技術(shù)七年級(jí)上冊(cè)
- 4《竇娥冤》節(jié)選(教學(xué)設(shè)計(jì))-2024-2025學(xué)年高一語文下學(xué)期同步教學(xué)教學(xué)設(shè)計(jì)專輯(統(tǒng)編版必修下冊(cè))
- 第12課 從明朝建立到清軍入關(guān) 教學(xué)設(shè)計(jì)-2024-2025學(xué)年高一歷史上學(xué)期統(tǒng)編版(2019)必修中外歷史綱要上
- 2024年12月中國獸醫(yī)協(xié)會(huì)公開招聘2人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 第四單元《 參考活動(dòng)1 制作風(fēng)力發(fā)電機(jī)》教學(xué)設(shè)計(jì) 2024-2025學(xué)年初中綜合實(shí)踐活動(dòng)蘇少版八年級(jí)上冊(cè)
- 第15課《閱讀材料 不可不知的放映快捷鍵》教學(xué)設(shè)計(jì) 2023-2024學(xué)年青島版(2018)初中信息技術(shù)八年級(jí)下冊(cè)
- 出租共享菜園合同范例
- 八年級(jí)班主任學(xué)生心理健康計(jì)劃
- 整體施工勞務(wù)服務(wù)方案
- 傳統(tǒng)節(jié)日端午節(jié)模板37
- 2024 貴州公務(wù)員考試行測(cè)真題(省直)
- 2025年泰山職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 2025春季開學(xué)第一次全體教師會(huì)上校長(zhǎng)講話稿
- 2025年三方買賣協(xié)議標(biāo)準(zhǔn)版本(2篇)
- 2025年南京旅游職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 《小腦梗死護(hù)理查房》課件
- 江西專業(yè)紅娘培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論