分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案

上傳人：y*** IP屬地：天津上傳時(shí)間：2021-05-23 格式：DOCX 頁(yè)數(shù)：12 大?。?13.36KB 積分：18 舉報(bào) 版權(quán)申訴

分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案_第2頁(yè)

分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案_第3頁(yè)

分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案_第4頁(yè)

分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案_第5頁(yè)

已閱讀5頁(yè)，還剩7頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1. 大型分布式數(shù)據(jù)庫(kù)解決方案企業(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)量很大時(shí)候，即使服務(wù)器在沒(méi)有任何壓力的情況下，某些復(fù)雜的查詢(xún)操作都會(huì)非常緩慢, 影響最終用戶(hù)的體驗(yàn)；當(dāng)數(shù)據(jù)量很大的時(shí)候，對(duì)數(shù)據(jù)庫(kù)的裝載與導(dǎo)岀，備份與恢復(fù)，結(jié)構(gòu)的調(diào)整，索引的調(diào)整等都會(huì)讓數(shù)據(jù)庫(kù)停止服務(wù)或者高負(fù)荷運(yùn)轉(zhuǎn)很長(zhǎng)時(shí)間，影響數(shù)據(jù)庫(kù)的可用性和易管理性。分區(qū)表技術(shù) 讓用戶(hù)能夠把數(shù)據(jù)分散存放到不同的物理磁盤(pán)中，提高這些磁盤(pán)的并行處理能力，達(dá)到優(yōu)化查詢(xún)性能的目的。但是分區(qū)表只能把數(shù)據(jù)分散到同一機(jī)器的不同磁盤(pán)中，也就是還是依賴(lài)于一個(gè)機(jī)器的硬件資源，不能從根本上解決問(wèn)題。分布式分區(qū)視圖分布式分區(qū)視圖允許用戶(hù)將大型表中的數(shù)據(jù)分散到不同機(jī)器的數(shù)據(jù)庫(kù)

2、上，用戶(hù)不需要知道直接訪(fǎng)問(wèn)哪個(gè)基礎(chǔ)表而是通過(guò)視圖訪(fǎng)問(wèn)數(shù)據(jù)，在開(kāi)發(fā)上有一定的透明性。但是并沒(méi)有簡(jiǎn)化分區(qū)數(shù)據(jù)集的管理、設(shè)計(jì)。用戶(hù) ，而且必須單獨(dú)為每個(gè)表管理數(shù) 使用分區(qū)視圖時(shí)，必須單獨(dú)創(chuàng)建、管理每個(gè)基礎(chǔ)表（在其中定義視圖的表）據(jù)完整性約束，管理工作變得非常復(fù)雜。而且還有一些限制，比如不能使用自增列，不能有大數(shù)據(jù)對(duì)象。對(duì)于全局查詢(xún)并不是并行計(jì)算，有時(shí)還不如不分區(qū)的響應(yīng)快。 Databasel 月份 Database3 Databasel 庫(kù)表散列在開(kāi)發(fā)基于庫(kù)表散列的數(shù)據(jù)庫(kù)架構(gòu)，經(jīng)過(guò)數(shù)次數(shù)據(jù)庫(kù)升級(jí)，最終采用按照用戶(hù)進(jìn)行的庫(kù)表散列，但是這些都是基于自己業(yè)務(wù)邏輯進(jìn)行的，沒(méi)有一個(gè)通用的實(shí)現(xiàn)。客戶(hù)在實(shí)

3、際應(yīng)用中要投入很大的研發(fā)成本，面臨很大的風(fēng)險(xiǎn)。面對(duì)海量數(shù)據(jù)庫(kù)在高并發(fā)的應(yīng)用環(huán)境下，僅僅靠提升服務(wù)器的硬件配置是不能從根本上解決問(wèn)題的，分布式網(wǎng)格集群通過(guò)數(shù)據(jù)分區(qū)把數(shù)據(jù)拆分成更小的部分，分配到不同的服務(wù)器中。查詢(xún)可以由多個(gè)服務(wù)器上的 CPU、I/O來(lái)共同負(fù)載，通過(guò)各節(jié)點(diǎn)并行處理數(shù)據(jù)來(lái)提高性能；寫(xiě)入時(shí)，可以在多個(gè)分區(qū)數(shù)據(jù)庫(kù)中并行寫(xiě) 入，顯著提升數(shù)據(jù)庫(kù)的寫(xiě)入速度。管理工具（甲童佟唱申福主在訪(fǎng)問(wèn)層掘坯庫(kù) 里聞* WtffSQL 語(yǔ)句 0 衛(wèi)用發(fā)務(wù)熬 1.ED i r ect cr5ij 訪(fǎng)問(wèn)層（調(diào)度數(shù)撫展（執(zhí)行價(jià)值所在通過(guò)分區(qū)把數(shù)據(jù)放到不同的機(jī)器中，每次查詢(xún)可以由多個(gè)機(jī)器上的C

4、PU,I/O來(lái)共同負(fù)載，通過(guò)各節(jié)點(diǎn)并行處理數(shù)據(jù)來(lái)提高性能。 4 冗余的數(shù)據(jù)結(jié)構(gòu)（矩陣列）消除了單點(diǎn)故障，任何一個(gè)機(jī)器岀現(xiàn)故障后都不會(huì)影響系統(tǒng)的正常運(yùn)行，數(shù)據(jù)庫(kù)集群能提供不中斷的服務(wù)。無(wú)共享磁盤(pán)架構(gòu)節(jié)省了硬件，利用中小型的服務(wù)器取代大型服務(wù)器大幅降低了硬件的成本，系統(tǒng) 中不再有閑置的資源，降低了系統(tǒng) TCO （總體擁有成本）。 * 分區(qū)把數(shù)據(jù)分成更小的部分，提高了數(shù)據(jù)庫(kù)的可用性和可管理性。 * 根據(jù)業(yè)務(wù)的需要，訪(fǎng)問(wèn)層和數(shù)據(jù)層都可以增加，集群具有良好的擴(kuò)展性。 *中間件宿主在數(shù)據(jù)庫(kù)中的創(chuàng)新使集群變得更透明，數(shù)據(jù)庫(kù)的管理成本，以及面向數(shù)據(jù)庫(kù)的開(kāi)發(fā)成本都最小化。 2. 數(shù)據(jù)實(shí)時(shí)復(fù)制解決方案經(jīng)

5、過(guò)分析，大多數(shù)應(yīng)用系統(tǒng)以查詢(xún)操作為主，造成數(shù)據(jù)庫(kù)壓力迅速增加的主要因素也是復(fù)雜的查詢(xún)操作，為了能夠得到同一份數(shù)據(jù)的多個(gè)副本來(lái)響應(yīng)用戶(hù)的查詢(xún)，SQL Server提供了復(fù)制技術(shù)(Replication)，主要有合并復(fù)制、事務(wù)復(fù)制、快照復(fù)制等，這些技術(shù)可以有效緩解查詢(xún)的壓力。伴隨著企業(yè)發(fā)展的需要，企業(yè)對(duì)信息實(shí)時(shí)性要求越來(lái)越高，如股票、航空票務(wù)、連鎖店甚至是一些服務(wù)系統(tǒng)等等，這些系統(tǒng)的用戶(hù) 希望更新的數(shù)據(jù)馬上就可以查詢(xún)到。 SQL Server數(shù)據(jù)庫(kù)的復(fù)制/訂閱技術(shù) 復(fù)制/訂閱數(shù)技術(shù)可以實(shí)現(xiàn)讀、寫(xiě)分離，數(shù)據(jù)先寫(xiě)到中心數(shù)據(jù)庫(kù)上，寫(xiě)成功即返回給應(yīng)用程序；通過(guò)復(fù)制將數(shù)據(jù)復(fù)制到只讀服務(wù)器，查詢(xún)時(shí)從只

6、讀服務(wù)器查 OU ft V Utttl曲肯用 F自己在賤用罠序實(shí)境時(shí)多亍只讀垃據(jù)咋的負(fù)做均襯 MSCS 意味著訂閱端的數(shù)據(jù)和中心數(shù)據(jù)庫(kù)的數(shù)據(jù)不同步，是個(gè)異步的過(guò)程，所以數(shù)據(jù)滯后嚴(yán)重，數(shù)據(jù)同步的實(shí)時(shí) 性得不到保障，中心數(shù)據(jù)庫(kù)在正常的壓力下 10秒左右。當(dāng)訪(fǎng)問(wèn)負(fù)荷很高或者中心數(shù)據(jù)庫(kù)在整理數(shù)據(jù)時(shí)，將岀現(xiàn)大量DML操作延遲時(shí)間比較長(zhǎng)或者岀現(xiàn)堵塞的情況；某些修改操作需要重新建立復(fù)制關(guān)系并初始化，這期間需要停止數(shù)據(jù)庫(kù)的讀取服務(wù)，規(guī)模越大的應(yīng)用停止的時(shí)間越長(zhǎng)，嚴(yán)重影響了數(shù)據(jù)庫(kù)的可用性。結(jié)論：復(fù)制訂閱技術(shù)的實(shí)時(shí)性差，初始化時(shí)對(duì)系統(tǒng)的影響非常大；在數(shù)據(jù)復(fù)制過(guò)程中沒(méi)有采用智能的策略, 數(shù)據(jù)的復(fù)制速度慢；

7、中心數(shù)據(jù)庫(kù)仍然為失敗轉(zhuǎn)移集群模式構(gòu)建數(shù)據(jù)庫(kù)集群，節(jié)點(diǎn)間數(shù)據(jù)同步都是實(shí)時(shí)的，數(shù)據(jù)是一致性的，可以部署為讀、寫(xiě)分離，也可以部署為所有節(jié)點(diǎn)可讀可寫(xiě)；中間件監(jiān)測(cè)到數(shù)據(jù)庫(kù)變化并同步數(shù)據(jù)，數(shù)據(jù)同步完成后客戶(hù)端才會(huì)得到響應(yīng)，同步過(guò) 程是并發(fā)完成的，所以同步到多個(gè)數(shù)據(jù)庫(kù)和同步到一個(gè)數(shù)據(jù)庫(kù)的時(shí)間基本相等；另外同步的過(guò)程是在事務(wù) 的環(huán)境下完成的，保證了多份數(shù)據(jù)在任何時(shí)刻數(shù)據(jù)的一致性。中間件在同步數(shù)據(jù)時(shí)采用了多項(xiàng)智能同步策略，滿(mǎn)足了不同類(lèi)型的應(yīng)用模式，可以同步數(shù)據(jù)，同步SQL語(yǔ)句，并行執(zhí)行SQL語(yǔ)句，升級(jí)數(shù)據(jù)庫(kù)的鎖, 啟用數(shù)據(jù)壓縮等。覲均嶺JT廷. 通過(guò)虛擬掙描節(jié)點(diǎn) H 戌劃SAL Ssi vsr 200

8、8 Htnagewfl Siudio中同步過(guò)程是在SQL Server的執(zhí)行環(huán)境中進(jìn)行的，整個(gè)操作是在事務(wù)的環(huán)境下完成的，解決了數(shù)據(jù)實(shí)時(shí)性問(wèn)題，滿(mǎn)足了用戶(hù)對(duì)數(shù)據(jù)實(shí)時(shí)性的要求。中間件在同步數(shù)據(jù)時(shí)采取了智能同步策略，同步速度更快；提供了多種人工干預(yù)的機(jī)制，對(duì)數(shù)據(jù)庫(kù)表結(jié)構(gòu) 的調(diào)整、批量更改數(shù)據(jù)等操的時(shí)間大幅縮減無(wú)需搭建失敗轉(zhuǎn)移集群，中心數(shù)據(jù)庫(kù)Cluster中閑置的一臺(tái)機(jī)器被利用起來(lái)，提高了整個(gè)系統(tǒng)的使用率; 系統(tǒng)支持無(wú)共享磁盤(pán)架構(gòu)，可以節(jié)省共享的存儲(chǔ)設(shè)備。連接數(shù)據(jù)庫(kù)，提供專(zhuān)門(mén)針對(duì)數(shù)據(jù)庫(kù)系統(tǒng)的負(fù)載均衡軟件，無(wú)需使用昂貴的均衡硬件，無(wú)需程序員自己實(shí)現(xiàn)。提供故障檢測(cè)及失敗轉(zhuǎn)移功能。 3. 數(shù)據(jù)

9、庫(kù)選擇在SQL中使用Oracle鏈接服務(wù)器，因?yàn)槭钱惖財(cái)?shù)據(jù)，在SQL中的更新，刪除等是隱式事務(wù)，而在Oracle 中是顯示的，所以直接調(diào)用速度是很慢的并且很容易崩掉。 4. 數(shù)據(jù)查詢(xún) 1秒鐘時(shí)間，在幾千億條話(huà)單數(shù)據(jù)中找到用戶(hù)想要的數(shù)據(jù)，在分區(qū)、并行查詢(xún)、列存、集群等技術(shù)統(tǒng) 統(tǒng)粉墨登場(chǎng)仍無(wú)法滿(mǎn)足響應(yīng)要求時(shí)，數(shù)據(jù)壓縮和索引技術(shù)成為了致勝的關(guān)鍵。無(wú)論是使用傳統(tǒng)的 B樹(shù)索引, 或通用的壓縮算法，都不是問(wèn)題的正解，在如此大的數(shù)據(jù)量下，需要使用更加專(zhuān)業(yè)高效的技術(shù)方法。基于特定條件（產(chǎn)品型號(hào)、產(chǎn)品名稱(chēng)、起止時(shí)間等）組合的詳單查詢(xún)，絕大多數(shù)查詢(xún)只會(huì)返回少量的結(jié) 按列壓縮 -規(guī)則列內(nèi)十列間）和后端兩層壓縮

10、后端支持使用第三方的逋用壓縮模塊行列混合存儲(chǔ) 9支持多壓縮級(jí)別壓縮總體結(jié)構(gòu) 壓縮的主要目的不是減少空間占用，而是提高查詢(xún)性能 CPU平均處理帶寬3.6GB/秒（7000萬(wàn)行/秒/核），I/O平均處理帶寬300MB/秒，通過(guò)壓縮提升I/O帶寬, 實(shí)現(xiàn)CPU與I/O處理均衡，提高查詢(xún)性能宛曲讒間翻道語(yǔ)卜濮.5 RATE ID 最基酣的編碼方法 1M1 創(chuàng) 7 叭適用于中低密度的屈性列.大大減少空間咄字典有潯組織. 提離查詢(xún)性能列內(nèi)規(guī)則他WIT 1鮒1倔 1如討6 1鮒l鉗E 使用通用壓縮算法 LZMA : CPU處理帶寬太低壓縮比18.9 : 1，解碼速度171MB/秒/核

11、（折算后）CPU處理帶寬991MB/秒，I/O處理帶寬5.7GB/秒 LZOP :壓縮率太低壓縮比7.2 : 1，解碼速度891Mb/秒/核（折算后）CPU處理帶寬2.4GB/秒，I/O處理帶寬2.2GB/秒一適用干近似）常量的屬性列 r實(shí)際應(yīng)用中大量存在列內(nèi)規(guī)則對(duì)壓縮的要求壓縮率不低于15 : 1 CPU處理帶寬不低于5GB/秒索引查詢(xún)高選擇率的特點(diǎn)適合選擇索引傳統(tǒng)索引空間占用大維護(hù)成本高，對(duì)裝載速度影響大對(duì)索引的要求占用空間對(duì)壓縮率貢獻(xiàn)可忽略不計(jì) 維護(hù)開(kāi)銷(xiāo)對(duì)裝載速度無(wú)明顯影響選擇率接近于數(shù)據(jù)的實(shí)際選擇率，遠(yuǎn)快于表掃描 J適用干兩列（近似1相等的場(chǎng)合對(duì)于高密度

12、列之間存在的相等關(guān)系非常有效 CALLED閣0惦0尺 THlRDNUMBEft CALLEDuNUMBR Exception TUHD NCMBER 列內(nèi)規(guī)則傳統(tǒng)索引的不足維護(hù)成本高對(duì)數(shù)據(jù)裝載速度影響極大先建模式下：索引需要同步維護(hù)，隨機(jī)插入影響性能，插入過(guò)程中無(wú)法引入壓縮后建模式下：需要大規(guī)模的排序，創(chuàng)建成本高空間占用大以B樹(shù)為例，鍵值，ROWID二元組，按照鍵值順序排列，按列壓縮 ROWID隨機(jī)性強(qiáng)，難以被壓縮，整體空間成本 6字節(jié)/ 分片索引技術(shù)要點(diǎn)：將表按照一定行數(shù)據(jù)分成多個(gè)數(shù)據(jù)包為每個(gè)壓縮包建立其中各列的摘要信息（如最大值、最小值），所有數(shù)據(jù)包上的屬于特定列的全部摘要信息，構(gòu)成該列的分片索引禾U用摘要信息，來(lái)判定對(duì)應(yīng)的數(shù)據(jù)包中是否包含滿(mǎn)足特定的查詢(xún)條件的行，如確定不存在這樣的行，則整個(gè)數(shù)據(jù)包無(wú)須

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

分布式數(shù)據(jù)庫(kù)設(shè)計(jì)方案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔