版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1. 大型分布式數(shù)據(jù)庫(kù)解決方案 企業(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)量很大時(shí)候,即使服務(wù)器在沒有任何壓力的情況下,某些復(fù)雜的查詢操作都會(huì)非常緩慢, 影響最終用戶的體驗(yàn);當(dāng)數(shù)據(jù)量很大的時(shí)候,對(duì)數(shù)據(jù)庫(kù)的裝載與導(dǎo)岀,備份與恢復(fù),結(jié)構(gòu)的調(diào)整,索引的 調(diào)整等都會(huì)讓數(shù)據(jù)庫(kù)停止服務(wù)或者高負(fù)荷運(yùn)轉(zhuǎn)很長(zhǎng)時(shí)間,影響數(shù)據(jù)庫(kù)的可用性和易管理性。 分區(qū)表技術(shù) 讓用戶能夠把數(shù)據(jù)分散存放到不同的物理磁盤中,提高這些磁盤的并行處理能力,達(dá)到優(yōu)化查詢性能的目 的。但是分區(qū)表只能把數(shù)據(jù)分散到同一機(jī)器的不同磁盤中,也就是還是依賴于一個(gè)機(jī)器的硬件資源,不能 從根本上解決問題。 分布式分區(qū)視圖 分布式分區(qū)視圖允許用戶將大型表中的數(shù)據(jù)分散到不同機(jī)器的數(shù)據(jù)庫(kù)
2、上,用戶不需要知道直接訪問哪個(gè)基 礎(chǔ)表而是通過視圖訪問數(shù)據(jù),在開發(fā)上有一定的透明性。但是并沒有簡(jiǎn)化分區(qū)數(shù)據(jù)集的管理、設(shè)計(jì)。用戶 ,而且必須單獨(dú)為每個(gè)表管理數(shù) 使用分區(qū)視圖時(shí),必須單獨(dú)創(chuàng)建、管理每個(gè)基礎(chǔ)表(在其中定義視圖的表)據(jù)完整性約束,管理工作變得非常復(fù)雜。而且還有一些限制,比如不能使用自增列,不能有大數(shù)據(jù)對(duì)象。 對(duì)于全局查詢并不是并行計(jì)算,有時(shí)還不如不分區(qū)的響應(yīng)快。 Databasel 月份 Database3 Databasel 庫(kù)表散列 在開發(fā)基于庫(kù)表散列的數(shù)據(jù)庫(kù)架構(gòu),經(jīng)過數(shù)次數(shù)據(jù)庫(kù)升級(jí),最終采用按照用戶進(jìn)行的庫(kù)表散列,但是這些 都是基于自己業(yè)務(wù)邏輯進(jìn)行的,沒有一個(gè)通用的實(shí)現(xiàn)??蛻粼趯?shí)
3、際應(yīng)用中要投入很大的研發(fā)成本,面臨很 大的風(fēng)險(xiǎn)。 面對(duì)海量數(shù)據(jù)庫(kù)在高并發(fā)的應(yīng)用環(huán)境下,僅僅靠提升服務(wù)器的硬件配置是不能從根本上解決問題的,分布 式網(wǎng)格集群通過數(shù)據(jù)分區(qū)把數(shù)據(jù)拆分成更小的部分,分配到不同的服務(wù)器中。查詢可以由多個(gè)服務(wù)器上的 CPU、I/O來共同負(fù)載,通過各節(jié)點(diǎn)并行處理數(shù)據(jù)來提高性能;寫入時(shí),可以在多個(gè)分區(qū)數(shù)據(jù)庫(kù)中并行寫 入,顯著提升數(shù)據(jù)庫(kù)的寫入速度。 管理工具 ( 甲童佟唱申福主 在訪問層掘坯庫(kù) 里聞* WtffSQL 語句 0 衛(wèi)用發(fā)務(wù)熬 1.ED i r ect cr5ij 訪問層 (調(diào)度 數(shù)撫展 (執(zhí)行 價(jià)值所在 通過分區(qū)把數(shù)據(jù)放到不同的機(jī)器中,每次查詢可以由多個(gè)機(jī)器上的C
4、PU,I/O來共同負(fù)載,通過各 節(jié)點(diǎn)并行處理數(shù)據(jù)來提高性能。 4 冗余的數(shù)據(jù)結(jié)構(gòu)(矩陣列)消除了單點(diǎn)故障,任何一個(gè)機(jī)器岀現(xiàn)故障后都不會(huì)影響系統(tǒng)的正常 運(yùn)行,數(shù)據(jù)庫(kù)集群能提供不中斷的服務(wù)。 無共享磁盤架構(gòu)節(jié)省了硬件,利用中小型的服務(wù)器取代大型服務(wù)器大幅降低了硬件的成本,系統(tǒng) 中不再有閑置的資源,降低了系統(tǒng) TCO (總體擁有成本)。 * 分區(qū)把數(shù)據(jù)分成更小的部分,提高了數(shù)據(jù)庫(kù)的可用性和可管理性。 * 根據(jù)業(yè)務(wù)的需要,訪問層和數(shù)據(jù)層都可以增加,集群具有良好的擴(kuò)展性。 *中間件宿主在數(shù)據(jù)庫(kù)中的創(chuàng)新使集群變得更透明,數(shù)據(jù)庫(kù)的管理成本,以及面向數(shù)據(jù)庫(kù)的開發(fā)成 本都最小化。 2. 數(shù)據(jù)實(shí)時(shí)復(fù)制解決方案 經(jīng)
5、過分析,大多數(shù)應(yīng)用系統(tǒng)以查詢操作為主,造成數(shù)據(jù)庫(kù)壓力迅速增加的主要因素也是復(fù)雜的查詢操 作,為了能夠得到同一份數(shù)據(jù)的多個(gè)副本來響應(yīng)用戶的查詢,SQL Server提供了復(fù)制技術(shù)(Replication), 主要有合并復(fù)制、事務(wù)復(fù)制、快照復(fù)制等,這些技術(shù)可以有效緩解查詢的壓力。伴隨著企業(yè)發(fā)展的需要, 企業(yè)對(duì)信息實(shí)時(shí)性要求越來越高,如股票、航空票務(wù)、連鎖店甚至是一些服務(wù)系統(tǒng)等等,這些系統(tǒng)的用戶 希望更新的數(shù)據(jù)馬上就可以查詢到。 SQL Server數(shù)據(jù)庫(kù)的復(fù)制/訂閱技術(shù) 復(fù)制/訂閱數(shù)技術(shù)可以實(shí)現(xiàn)讀、寫分離,數(shù)據(jù)先寫到中心數(shù)據(jù)庫(kù)上,寫成功即返回給應(yīng)用程序;通過復(fù)制將 數(shù)據(jù)復(fù)制到只讀服務(wù)器,查詢時(shí)從只
6、讀服務(wù)器查 OU ft V Utttl曲肯用 F自己在賤用罠序 實(shí)境時(shí)多亍只讀垃 據(jù)咋的負(fù)做均襯 MSCS 意味著訂閱端的數(shù)據(jù)和中心數(shù)據(jù)庫(kù)的數(shù)據(jù)不同步,是個(gè)異步的過程,所以數(shù)據(jù)滯后嚴(yán)重,數(shù)據(jù)同步的實(shí)時(shí) 性得不到保障,中心數(shù)據(jù)庫(kù)在正常的壓力下 10秒左右。當(dāng)訪問負(fù)荷很高或者中心數(shù)據(jù)庫(kù)在整理數(shù)據(jù)時(shí),將 岀現(xiàn)大量DML操作延遲時(shí)間比較長(zhǎng)或者岀現(xiàn)堵塞的情況; 某些修改操作需要重新建立復(fù)制關(guān)系并初始化,這期間需要停止數(shù)據(jù)庫(kù)的讀取服務(wù),規(guī)模越大的應(yīng)用停止 的時(shí)間越長(zhǎng),嚴(yán)重影響了數(shù)據(jù)庫(kù)的可用性。結(jié)論:復(fù)制訂閱技術(shù)的實(shí)時(shí)性差,初始化時(shí)對(duì)系統(tǒng)的影響非常大;在數(shù)據(jù)復(fù)制過程中沒有采用智能的策略, 數(shù)據(jù)的復(fù)制速度慢;
7、中心數(shù)據(jù)庫(kù)仍然為失敗轉(zhuǎn)移集群模式 構(gòu)建數(shù)據(jù)庫(kù)集群,節(jié)點(diǎn)間數(shù)據(jù)同步都是實(shí)時(shí)的,數(shù)據(jù)是一致性的,可以部署為讀、寫分離,也可以部署為 所有節(jié)點(diǎn)可讀可寫;中間件監(jiān)測(cè)到數(shù)據(jù)庫(kù)變化并同步數(shù)據(jù),數(shù)據(jù)同步完成后客戶端才會(huì)得到響應(yīng),同步過 程是并發(fā)完成的,所以同步到多個(gè)數(shù)據(jù)庫(kù)和同步到一個(gè)數(shù)據(jù)庫(kù)的時(shí)間基本相等;另外同步的過程是在事務(wù) 的環(huán)境下完成的,保證了多份數(shù)據(jù)在任何時(shí)刻數(shù)據(jù)的一致性。中間件在同步數(shù)據(jù)時(shí)采用了多項(xiàng)智能同步策 略,滿足了不同類型的應(yīng)用模式,可以同步數(shù)據(jù),同步SQL語句,并行執(zhí)行SQL語句,升級(jí)數(shù)據(jù)庫(kù)的鎖, 啟用數(shù)據(jù)壓縮等。 覲均嶺JT廷. 通過虛擬掙描 節(jié)點(diǎn) H 戌劃SAL Ssi vsr 200
8、8 Htnagewfl Siudio中 同步過程是在SQL Server的執(zhí)行環(huán)境中進(jìn)行的,整個(gè)操作是在事務(wù)的環(huán)境下完成的,解決了數(shù)據(jù)實(shí)時(shí)性 問題,滿足了用戶對(duì)數(shù)據(jù)實(shí)時(shí)性的要求。 中間件在同步數(shù)據(jù)時(shí)采取了智能同步策略,同步速度更快;提供了多種人工干預(yù)的機(jī)制,對(duì)數(shù)據(jù)庫(kù)表結(jié)構(gòu) 的調(diào)整、批量更改數(shù)據(jù)等操的時(shí)間大幅縮減 無需搭建失敗轉(zhuǎn)移集群,中心數(shù)據(jù)庫(kù)Cluster中閑置的一臺(tái)機(jī)器被利用起來,提高了整個(gè)系統(tǒng)的使用率; 系統(tǒng)支持無共享磁盤架構(gòu),可以節(jié)省共享的存儲(chǔ)設(shè)備。 連接數(shù)據(jù)庫(kù),提供專門針對(duì)數(shù)據(jù)庫(kù)系統(tǒng)的負(fù)載均衡軟件,無需使用昂貴的均衡硬件,無需程序員自己實(shí)現(xiàn)。 提供故障檢測(cè)及失敗轉(zhuǎn)移功能。 3. 數(shù)據(jù)
9、庫(kù)選擇 在SQL中使用Oracle鏈接服務(wù)器,因?yàn)槭钱惖財(cái)?shù)據(jù),在SQL中的更新,刪除等是隱式事務(wù),而在Oracle 中是顯示的,所以直接調(diào)用速度是很慢的并且很容易崩掉。 4. 數(shù)據(jù)查詢 1秒鐘時(shí)間,在幾千億條話單數(shù)據(jù)中找到用戶想要的數(shù)據(jù),在分區(qū)、并行查詢、列存、集群等技術(shù)統(tǒng) 統(tǒng)粉墨登場(chǎng)仍無法滿足響應(yīng)要求時(shí),數(shù)據(jù)壓縮和索引技術(shù)成為了致勝的關(guān)鍵。無論是使用傳統(tǒng)的 B樹索引, 或通用的壓縮算法,都不是問題的正解,在如此大的數(shù)據(jù)量下,需要使用更加專業(yè)高效的技術(shù)方法。 基于特定條件(產(chǎn)品型號(hào)、產(chǎn)品名稱、起止時(shí)間等)組合的詳單查詢,絕大多數(shù)查詢只會(huì)返回少量的結(jié) 按列壓縮 -規(guī)則列內(nèi)十列間)和后 端兩層壓縮
10、 后端支持使用第三方的 逋用壓縮模塊 行列混合存儲(chǔ) 9支持多壓縮級(jí)別 壓縮總體結(jié)構(gòu) 壓縮的主要目的不是減少空間占用,而是提高查詢性能 CPU平均處理帶寬3.6GB/秒(7000萬行/秒/核),I/O平均處理帶寬300MB/秒,通過壓縮提升I/O帶寬, 實(shí)現(xiàn)CPU與I/O處理均衡,提高查詢性能 宛曲 讒間翻道語卜濮.5 RATE ID 最基酣的編碼方法 1M1 創(chuàng) 7 叭適用于中低密度的屈 性列.大大減少空間 咄字典有潯組織. 提離查詢性能 列內(nèi)規(guī)則 他WIT 1鮒1倔 1如討6 1鮒l鉗E 使用通用壓縮算法 LZMA : CPU處理帶寬太低 壓縮比18.9 : 1,解碼速度171MB/秒/核
11、(折算后)CPU處理帶寬991MB/秒,I/O處理帶寬5.7GB/秒 LZOP :壓縮率太低 壓縮比7.2 : 1,解碼速度891Mb/秒/核 (折算后)CPU處理帶寬2.4GB/秒,I/O處理帶寬2.2GB/秒 一 適用干近似)常量的屬性列 r實(shí)際應(yīng)用中大量存在 列內(nèi)規(guī)則 對(duì)壓縮的要求 壓縮率不低于15 : 1 CPU處理帶寬不低于5GB/秒 索引 查詢高選擇率的特點(diǎn)適合選擇索引 傳統(tǒng)索引 空間占用大 維護(hù)成本高,對(duì)裝載速度影響大 對(duì)索引的要求 占用空間對(duì)壓縮率貢獻(xiàn)可忽略不計(jì) 維護(hù)開銷對(duì)裝載速度無明顯影響 選擇率接近于數(shù)據(jù)的實(shí)際選擇率,遠(yuǎn)快于表掃描 J適用干兩列(近似1相等的場(chǎng)合 對(duì)于高密度
12、列之間存在的相等關(guān)系非常有效 CALLED閣0惦0尺 THlRDNUMBEft CALLEDuNUMBR Exception TUHD NCMBER 列內(nèi)規(guī)則 傳統(tǒng)索引的不足 維護(hù)成本高 對(duì)數(shù)據(jù)裝載速度影響極大 先建模式下:索引需要同步維護(hù),隨機(jī)插入影響性能,插入過程中無法引入壓縮 后建模式下:需要大規(guī)模的排序,創(chuàng)建成本高 空間占用大 以B樹為例,鍵值,ROWID二元組,按照鍵值順序排列,按列壓縮 ROWID隨機(jī)性強(qiáng),難以被壓縮,整體空間成本 6字節(jié)/ 分片索引 技術(shù)要點(diǎn): 將表按照一定行數(shù)據(jù)分成多個(gè)數(shù)據(jù)包 為每個(gè)壓縮包建立其中各列的摘要信息(如最大值、最小值),所有數(shù)據(jù)包上的屬于特定列的全部摘要 信息,構(gòu)成該列的分片索引 禾U用摘要信息,來判定對(duì)應(yīng)的數(shù)據(jù)包中是否包含滿足特定的查詢條件的行,如確定不存在這樣的行, 則整個(gè)數(shù)據(jù)包無須
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合伙人撤資合同
- 2024年甘肅客運(yùn)從業(yè)資格證實(shí)操考試題庫(kù)及答案
- 論電子商務(wù)的發(fā)展論文
- 追加訴訟請(qǐng)求申請(qǐng)書4篇
- 2024中山市勞動(dòng)合同范文
- 2024個(gè)人貸款抵押房屋保險(xiǎn)合同
- 2024勞務(wù)合同范本樣本勞務(wù)合同范本大全
- 2024的國(guó)際貨物買賣合同解釋與分析
- 規(guī)劃課題申報(bào)范例:“三教”改革背景下教材改革的實(shí)踐研究(附可修改技術(shù)路線圖)
- 深圳大學(xué)《游泳俱樂部》2021-2022學(xué)年第一學(xué)期期末試卷
- 野獸派 beast 花店 調(diào)研 設(shè)計(jì)-文檔資料
- 水泵房每日巡視檢查表
- 杭州市區(qū)汽車客運(yùn)站臨時(shí)加班管理規(guī)定
- 墊片沖壓模具設(shè)計(jì)畢業(yè)設(shè)計(jì)論文
- 常見矩形管規(guī)格表
- 冷庫(kù)工程特點(diǎn)施工難點(diǎn)分析及對(duì)策
- Python-Django開發(fā)實(shí)戰(zhàn)
- 小學(xué)道法小學(xué)道法1我們的好朋友--第一課時(shí)ppt課件
- 路由和波長(zhǎng)分配PPT課件
- 光伏組件開路電壓測(cè)試記錄
- 配電箱安裝規(guī)范
評(píng)論
0/150
提交評(píng)論