版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
最近一宜在思考一個問題:如何為一個數(shù)據(jù)庫建立性能模型?作為一名DBA來說,我們面臨的一個巨大挑戰(zhàn)是:如何保證數(shù)據(jù)庫的性能可以滿足快速變化的應用的需求,如何在數(shù)據(jù)量和訪問量持續(xù)增長的情況下,保證應用的響應時間和數(shù)據(jù)庫的負載處在合理的水平下。我們可能會經(jīng)常面對以下的問題:某個SQL每秒要執(zhí)行100次,響應時間是多少?某個應用發(fā)布后,對數(shù)據(jù)庫的影響如何?所以,評估應用對數(shù)據(jù)庫所產(chǎn)生的影響,優(yōu)化應用并預測風險,保證數(shù)據(jù)庫的可用性和穩(wěn)定性,這是應用DBA真正有價值的地方。響應時間為中心:如果要選擇一個評價系統(tǒng)優(yōu)劣的性能指標,亳無疑問應該是響應時間。響應時間是客戶體驗的第一要素,所有的優(yōu)化都應該為降低響應時間而努力。對于數(shù)據(jù)庫系統(tǒng)也是如此,我們優(yōu)化系統(tǒng),優(yōu)化SQL,最終目標都是為了降低響應時間,單位時間內(nèi)可以處理更多的請求。數(shù)據(jù)庫時間模型:響應時間一般分為服務時間(Servicetime)和等待時間(Waittime),服務時間指進程占用CPU的時間,包括前臺進程(Serverprocess)和后臺進程(Backgroudprocess),我們一般只關注前臺進程占用的CPLltimeo等待時間包括很多類型,一般最常見的是10等待和并發(fā)等待,10等待包括sequentialread,scatteredread和logfilesync等等,而并發(fā)等待主要是latch和enqueueoSQLexecuteelapsedtime指用戶進程執(zhí)行SQL的響應時問,包含CPUtime和waittime。以下是Oracle數(shù)據(jù)庫的時間模型:ServicetimeWaittimeBackgroupprocessServerprocessIOwailConcurrencyDBCPULatchLockSequentialread
Scatteredread
LogfiBesyncDBCPULatchLock在Oracle系統(tǒng)中,我們可以利用AWR或Statspack報告,看到數(shù)據(jù)庫的時間信息:sqlexecutee1apsodtime3.062.1791.52DBCPU2.842.0884.95parsetimeelapsed25.870.77PL/SQLexecutione1apsedtimo11.750.35sequenceloade1apsedtime7.550.23hardparsee1apsedtime5.060.15connectionmanagementcal1e1apsedtime3.130.09hardparse(sharingcriteria)elapsedtime0.010.00repeatedbindelapsedtime0.010.00PL/SQI.pilationelapsedtime0.000.00DBtime3?345?74backgrounde1apsedtime201.91backgroundcputime72.30DBtime是整個數(shù)據(jù)庫用戶進程消耗的總時間,是從第一項到第十項時間的總和(從sqlexecuteelapsedtime到PL/SQLpilationelapsedtime),但是我們會發(fā)現(xiàn)這十項時間的總和比DBTime要大一些,這是因為部分時間信息有重疊的部分,比如SQLexecuteelapsedtime就包括了很大一部分DBcpu的時間。而backgroundelapsedtime和backgroundcputime則是Oracle后臺進程消耗的時間和cputime。數(shù)據(jù)庫響應時間分析:數(shù)據(jù)庫系統(tǒng)的響應時間由四個要素決定:CPU,10,內(nèi)存和網(wǎng)絡,其中CPU和10長最重要的因素。與之相比,內(nèi)存與網(wǎng)絡則簡單很多,因為通常情況下,對于一個調優(yōu)的系統(tǒng)來說,內(nèi)存訪問的延遲時間非常?。?00ns以下,1ms二1000000ns)相比較CPU和10幾乎可以忽略。而網(wǎng)絡延遲則通常是一個常數(shù),比如在一個數(shù)據(jù)中心的情況下,網(wǎng)絡的延遲一般在3ms以下,如果存在多數(shù)據(jù)中心的情況,網(wǎng)絡延遲可能會超過20ms,所以對于一個分布式系統(tǒng)來說,網(wǎng)絡延遲是必須要考慮的問題。在這里,我們不考慮分布式系統(tǒng),并且忽略內(nèi)存的訪問延遲,重點分析CPU和10,我們看以下數(shù)據(jù)庫的AWR片段:WaitClassWaitsQ4)TimG-outsTotalWaitTime(s)Avgwait(ms)忱DBtimeDBCPU3,35187.21UserI/O257,450035019.12Commit127,672□9012.35Cluster53,77001000.27Concurrency25z6527900.24SystemI/O3.,6230620.15Network2.-069,0010500.14Application6790570.13Other20z82878400.10Configuration23530210.06我們看到這個系統(tǒng)中DBCPU占整個DBtime的87.21%,UserI/O占整個DBtime的9.12%,mit相關的10等待占2.35%(主要是logfilesync).CPU和10占用了整個DBtime的96.68%。由于DBCPU所占的比例很高,所以這個數(shù)據(jù)庫系統(tǒng)是CPUintensive類型,這里的DBCPU主要是執(zhí)行SQL的服務時間。我們再看另外的一個數(shù)據(jù)庫的AWR片段:
WaitClassWaits%Time-outsTotalWaitTime(s)Avgwait(ms)%DBtimeCommit817r47005f232667.49UserI/O238,8500lz083513.97DBCPUlz07113.82Configuration4,1501403975.20Concurrency42,626273110.40SystemI/O23J420600.07Network1,838,0620200.03Application1250020.00Other2,02682000.00我們看到,mit和UserI/O占DBtime的81.46%,而DBCPU只占13.82%,所以這個數(shù)據(jù)庫系統(tǒng)是IOinstensive類型的。PhysicalreadPhysicalread是指Oracle在buffercache中沒有找到相應的block,需要從10子系統(tǒng)讀取相應的block的過程,對應的10稱為物理10,物理讀數(shù)量代表物理10讀取的block數(shù)量。因為一般10子系統(tǒng)都是慢速的磁盤,所以物理10對整體響應時間的影響非常大,如果發(fā)生大量的物理10,整個系統(tǒng)的響應時間會變得很差。系統(tǒng)的10子系統(tǒng)可能是文件系統(tǒng),裸設備或者ASM,底層硬件可能是SAN存儲,NAS存儲或者普通SAS磁盤等等。為了提高響應時間,通常在物理磁盤與0racle之間增加cache層,對于0racle來說,物理10并不一定是真正訪問磁盤,很可能是訪問文件系統(tǒng)cache,存儲的cache等等。不管10subsystem是什么,Orscle只關心物理10的響應時間。通過AWR報告,我們可以看到物理10的響應時間:EventWaitsQ^TimG-outsTotalWaitTime(s)Avgwait(ms)Waits/txn%DBtimedbfilesequentialread4z215z803Ollr202329.6553.06dbfilescattArpdread320,14801,43442.206.79directpathread683..70701,23924.705.87SQL^N^tmoredatafromclient145,678079151.003.75logfilesync145,656043931.002.08dbfilesequentialread(單塊讀,隨機IO)的平均響應時間為3ms,dbfilescatteredread(多塊讀,連續(xù)IO)的平均響應時間是4ms,logfilefilesync的平均響應時間是3ms,前兩者的Waitclass是UserI/O,代表用戶進程讀操作的響應時間,logfilesync的waitclass是mit,代表lgwr進程寫redo的響應時間,因為用戶mit必須完成logfilesync的操作,所以它也會直接影響用戶進程寫操作的響應時間。關于物理10的響應時間,我們有一個經(jīng)驗值。對于Sequentialread和Scatteredread,我們認為小于10ms屬于正?!鰻顟B(tài),而大于10ms則認為10subsystem的響應延遲過大。所以我們在衡量存儲系統(tǒng)的性能時,只有響應時間在10ms以下的10我們認為是有效的。這里有一個有趣的現(xiàn)象,就是sequentialread和scatteredread的響應時間幾乎相差無幾,也就是說隨機10讀取8K數(shù)據(jù)和連續(xù)10讀取128K數(shù)據(jù),響應時間差別很小,這是由磁盤的機械特性造成的,延遲時間二尋道時間+對于logf訂esync的響應時間,因為用戶mit必須完成logfilesync,所以整個系統(tǒng)的寫操作的響應時間都取決于它的響應時間,而且從整個數(shù)據(jù)庫系統(tǒng)的角度去看,logfilesync幾乎是串行的,所以這個響應時間對寫操作影響非常大,我們的經(jīng)驗值是必須保證在5ms以下,如果超過5ms整個系統(tǒng)的寫操作都會受到嚴重的影響。LogicalreadLogicalread是Orac1e從buffercache中讀取block的過程,對應的10稱為邏輯10,邏輯讀數(shù)量代表邏輯10讀取的block數(shù)量。因為Oracle必須首先將block讀入buffercache中(directpathread除外),所以邏輯讀數(shù)量包含了物理讀數(shù)量。對于一個SQL來說,邏輯讀數(shù)量是衡量其性能的標準,而不是物理讀。雖然物理10的響應延遲比邏輯10大很多,但是物理讀數(shù)量會隨著執(zhí)行次數(shù)而變化(頻繁讀取導致block被緩存在buffercache中)。對于一個系統(tǒng)也是如此,邏輯讀應該是數(shù)據(jù)庫性能評估模型的核心,我們需要建立邏輯讀與響應時間的對應關系。每個邏輯讀的響應時間是多少,這是一個巨大的挑戰(zhàn)。因為每個邏輯讀背后隱藏了很多動作,可能包括物理讀,等待事件,CPUtime等等。我對很多數(shù)據(jù)庫的AWR報告做了分析,期望根據(jù)經(jīng)驗值建立一個簡化的模型。我們假設一個數(shù)據(jù)庫如果是充分調優(yōu)的,除CPUtime和10以外的等待時間應該盡可能少(應小于DBtime10%)。在這個前提下,我們只關心CPUtime和10的影響,并將系統(tǒng)分為三類:CPU密集型,10密集型和混合型:10密集型User10 85%DBCPU 5%每邏輯讀響應時間0.1-0.5msCPU密集型DBCPU 85%UserIO 10%每邏輯讀響應時間小于0.01ms混合型UserI/O 60%DBCPU 20%每邏輯讀響應時間0.05-0.1ms以上數(shù)據(jù)是根據(jù)很多個典型數(shù)據(jù)庫的AWR報告計算出來的經(jīng)驗值,計算公式很簡單:DBtime/邏輯讀二每邏輯讀響應時間。因為并沒有考慮硬件和OS上的差異,所以這個數(shù)值并不是特別準確,但我們還是可以發(fā)現(xiàn)一些規(guī)律:隨著10所占比例從10%增加到85%,響應時間也從小于0.01ms到0.5mso預測系統(tǒng)瓶頸對于數(shù)據(jù)庫來說,10子系統(tǒng)對性能影響非常大,必須保證在一定的10的壓力下,響應延遲控制在合理的X圍內(nèi)(前面說的10ms和5ms)。因為每塊磁盤可以承受的IOPS是基本確定的,比如15K的SAS磁盤,在響應延遲不超過10ms的前提下,可以提供150個IOPS,如果不考慮cache的影響,整個存儲子系統(tǒng)的IOPS是比較容易計算的。我們可以在系統(tǒng)上線前,進行大量充分的測試,建立存儲IOPS與響應延遲的模型,這樣我們就可以預測出性能出現(xiàn)拐點的風險,提前做出擴容的判斷。在AWR報告中,我們可以得到每秒的物理10的數(shù)量和響應時間,可以方便的實現(xiàn)性能監(jiān)控和趨勢預警。評估CPU的容量瓶頸相對簡單.Oracle中CPUtime的計算是每個CPU耗費時間的總和,如果有16顆(核)CPU,1個小時理論上可以提供3600X16二57600sCPUtime,不超過57600sCPUtime我們可以認為不會在CPU上排隊,系統(tǒng)不會出現(xiàn)CPU瓶頸。但是需要注意的是,除了用戶進程使用CPU以外,操作系統(tǒng)也需要占用CPU資源,用來管理內(nèi)存和進程調度等。我們在0S上看到的CPU使用率中的sys部分就是系統(tǒng)占用的CPU資源,所以應該考慮至少保留10-20%的CPU資源給OS使用。并發(fā)訪問對數(shù)據(jù)庫的影響Oracle是一個Disk-baseddatabase,設計的出發(fā)點就是大部分數(shù)據(jù)在外部存儲中,而只有小部分數(shù)據(jù)被cache在buffer中,它既不同于Memcache這類KVcache,也不同于timesten這類In-memorydatabase。所以,就算是所有的數(shù)據(jù)都可以被cache在buffer中,在高并發(fā)訪問的情況下,也可能會出現(xiàn)大量的latch等待,最常見的情況就是cachebufferchain0當大量并發(fā)訪問同一塊數(shù)據(jù)時,就很可能會出現(xiàn)cachebufferchain的latch爭用,也就是我們常說的"熱點"。需要注意的是:Oracle中的latch等待分為spin和sleep兩個部分,spin消耗cputime,而sleep則是等待時間。所以大量的latch等待不僅僅會產(chǎn)生大量的等待時間,而且會消耗大量的CPUtime。Oracle是一個為并發(fā)操作而設計的數(shù)據(jù)庫,大量的并發(fā)讀寫請求,可能會帶來額外的性能消耗。比如讀取一部分頻繁修改的數(shù)據(jù),Oracle為了保證一致性讀的需要,會利用undo信息構造產(chǎn)生大量CRblock,同時會產(chǎn)生大疑的邏輯讀,這樣會消耗額外的CPU和響應時間。存儲也可能存在熱點的問題,需要前期對存儲系統(tǒng)充分的優(yōu)化,常見的手段是利用RAID技術,將數(shù)據(jù)分散在不同的磁盤上,防止出現(xiàn)“熱點”盤。OracleASM提供了Rebalance的功能,允許DBA將存儲中的的數(shù)據(jù)重新分布,達到消除熱點的目的??傊?,Oracle是一個可以提供大量并發(fā)讀寫訪問的數(shù)據(jù)庫系統(tǒng),但是在很多地方,Oracle又不得采用一些串行的控制手段,比如latch,enqueue和mutex,我們要做的就是盡量降低這些串行控制對數(shù)據(jù)庫整體性能的影響。數(shù)據(jù)庫優(yōu)化原則基于響應時間的Oracle優(yōu)化原則:盡量減少等待時間(Waittime),提高服務時間(Servicetime)。這也是基于0racle等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新媒體運營活動策劃方案
- 內(nèi)部控制成果培訓
- 腹部外科術后早期活動
- 食藥局餐飲監(jiān)管培訓
- 數(shù)控車削加工技術 課件 項目八 內(nèi)孔切削工藝及編程
- 山東省青島第十九中學2024-2025學年高一上學期10月月考地理試題(含答案)
- 河北省保定市唐縣2024-2025學年一年級上學期期中數(shù)學試題
- 2024-2025學年黑龍江省哈爾濱市道里區(qū)松南學校九年級(上)月考物理試卷(10月份)(含答案)
- 高中語文第2單元良知與悲憫群文閱讀二良知與悲憫課件新人教版必修下冊
- 高中語文第1單元論語蚜第7課好仁不好學其蔽也愚課件新人教版選修先秦諸子蚜
- 堆載預壓施工工藝
- 金屬探測器檢測與使用標準操作規(guī)范SOP
- 《項鏈》課本劇
- 電梯井操作平臺22548
- 開料檢驗規(guī)范
- 中考數(shù)學新定義題型專題復習
- 石工安全技術操作規(guī)程
- 百種英語課堂互動小游戲(課堂PPT)
- 《國際采購》ppt課件
- POCT的質量控制(共40頁).ppt
- 人教版小學三年級加減法豎式計算題
評論
0/150
提交評論