5.2.2大數(shù)據(jù)存儲(chǔ)技術(shù)-NOSQL數(shù)據(jù)庫(kù)_第1頁(yè)
5.2.2大數(shù)據(jù)存儲(chǔ)技術(shù)-NOSQL數(shù)據(jù)庫(kù)_第2頁(yè)
5.2.2大數(shù)據(jù)存儲(chǔ)技術(shù)-NOSQL數(shù)據(jù)庫(kù)_第3頁(yè)
5.2.2大數(shù)據(jù)存儲(chǔ)技術(shù)-NOSQL數(shù)據(jù)庫(kù)_第4頁(yè)
5.2.2大數(shù)據(jù)存儲(chǔ)技術(shù)-NOSQL數(shù)據(jù)庫(kù)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《大數(shù)據(jù)導(dǎo)論》NOSQL數(shù)據(jù)庫(kù)NoSQL數(shù)據(jù)庫(kù)無(wú)模式的數(shù)據(jù)模型數(shù)據(jù)可以以它的原始形式存在橫向擴(kuò)展而不是縱向擴(kuò)展NoSQL可以增加更多的節(jié)點(diǎn)高可用性NoSQL建立在提供開箱即用的容錯(cuò)性的基于集群的技術(shù)之上較低的運(yùn)營(yíng)成本開源最終一致性跨節(jié)點(diǎn)的數(shù)據(jù)讀取可能在寫入后短時(shí)間內(nèi)不一致。但是,最終所有的節(jié)點(diǎn)會(huì)處于一致的狀態(tài)BASE兼容而不是ACID兼容數(shù)據(jù)庫(kù)可以處于不一致狀態(tài)直到最后獲得一致性NoSQL(Not-onlySQL)特征:NoSQL數(shù)據(jù)庫(kù)API驅(qū)動(dòng)的數(shù)據(jù)訪問(wèn)數(shù)據(jù)的訪問(wèn)通常支持基于API的查詢,包括REST(RepresentationalStateTransfer,表述性狀態(tài)轉(zhuǎn)移)類型的API自動(dòng)分片和復(fù)制運(yùn)用分片和復(fù)制技術(shù)集成緩存沒(méi)有必要加入第三方分布式緩存層分布式查詢支持NoSQL存儲(chǔ)設(shè)備通過(guò)多重分片來(lái)維持一致性查詢不同類型設(shè)備同時(shí)使用NoSQL存儲(chǔ)的使用并沒(méi)有淘汰傳統(tǒng)的RDBMS,支持不同類型的存儲(chǔ)設(shè)備可以同時(shí)使用注重聚集數(shù)據(jù)NoSQL存儲(chǔ)設(shè)備存儲(chǔ)非規(guī)范化的聚集數(shù)據(jù)(一個(gè)實(shí)體為一個(gè)對(duì)象)NoSQL(Not-onlySQL)特征:NoSQL數(shù)據(jù)庫(kù)NoSQL出現(xiàn)的原因容量速度多樣性NoSQL數(shù)據(jù)庫(kù)鍵-值存儲(chǔ)文檔存儲(chǔ)列簇存儲(chǔ)圖存儲(chǔ)NoSQL類型:NoSQL數(shù)據(jù)庫(kù)鍵-值存儲(chǔ):鍵-值存儲(chǔ)設(shè)備適用于:·需要存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)?!ば枰哂懈咝У淖x寫性能?!ぶ悼梢酝耆涉I確定?!ぶ凳遣灰蕾嚻渌档莫?dú)立實(shí)體?!ぶ涤兄喈?dāng)簡(jiǎn)單的結(jié)果或是二進(jìn)制的?!げ樵兡J胶?jiǎn)單,只包括插入、查找和刪除操作。·存儲(chǔ)的值在應(yīng)用層被操作。鍵-值存儲(chǔ)設(shè)備的實(shí)例包括:Riak、Redis和AmazonDynamoDB鍵-值存儲(chǔ)設(shè)備不適用于:·應(yīng)用需要通過(guò)值的屬性來(lái)查找或者過(guò)濾數(shù)據(jù)?!げ煌逆I-值項(xiàng)之間存在關(guān)聯(lián)?!ひ唤M鍵的值需要在單個(gè)事務(wù)中被更新?!ぴ趩蝹€(gè)操作中需要操控多個(gè)鍵?!ぴ诓煌抵行枰心J揭恢滦??!ば枰轮档膯蝹€(gè)屬性。NoSQL數(shù)據(jù)庫(kù)文檔存儲(chǔ):NoSQL數(shù)據(jù)庫(kù)文檔存儲(chǔ)和鍵-值存儲(chǔ)設(shè)備之間的區(qū)別文檔存儲(chǔ)設(shè)備是值可感知的存儲(chǔ)的值是自描述的選擇操作可以引用集合值內(nèi)的一個(gè)字段選擇操作可以檢索集合的部分值支持部分更新,所以集合的子集可以被更新通常支持用于加速查找的索引NoSQL數(shù)據(jù)庫(kù)文檔存儲(chǔ)(JSON):文檔存儲(chǔ)設(shè)備適用于:·存儲(chǔ)包含平面或嵌套模式的面向文檔的半結(jié)構(gòu)化數(shù)據(jù)?!つJ降倪M(jìn)化由于文檔結(jié)構(gòu)的未知性或者易變性而成為必然?!?yīng)用需要對(duì)存儲(chǔ)的文檔進(jìn)行部分更新?!ば枰谖臋n的不同屬性上進(jìn)行查找?!ひ孕蛄谢瘜?duì)象的形式存儲(chǔ)應(yīng)用領(lǐng)域中的對(duì)象,例如顧客?!げ樵兡J桨迦?、選擇、更新和刪除操作。文檔存儲(chǔ)設(shè)備不適用于:·單個(gè)事務(wù)中需要更新多個(gè)文檔?!ば枰獙?duì)歸一化后的多個(gè)數(shù)據(jù)或文檔之間執(zhí)行連接操作。·由于文檔結(jié)構(gòu)在連續(xù)的查詢操作之后會(huì)發(fā)生改變,為了實(shí)現(xiàn)一致的查詢?cè)O(shè)計(jì)需要使用強(qiáng)制模式來(lái)重構(gòu)查詢語(yǔ)句。·存儲(chǔ)的值不是自描述的,并且不包含對(duì)模式的引用?!ば枰鎯?chǔ)二進(jìn)制值。文檔存儲(chǔ)設(shè)備的例子包括MongoDB、CouchDB和TerrastoreNoSQL數(shù)據(jù)庫(kù)列簇存儲(chǔ):列簇存儲(chǔ)設(shè)備適用于:·需要實(shí)時(shí)的隨機(jī)讀寫能力,并且數(shù)據(jù)以已定義的結(jié)構(gòu)存儲(chǔ)。·數(shù)據(jù)表示的是表的結(jié)構(gòu),每行包含著大量列,并且存在著相互關(guān)聯(lián)的數(shù)據(jù)形成的嵌套組?!ば枰獙?duì)模式的進(jìn)化提供支持,因?yàn)榱写氐脑黾踊蛘邉h除不需要在系統(tǒng)停機(jī)時(shí)間進(jìn)行。·某些字段大多數(shù)情況下可以一起訪問(wèn),并且搜索需要利用字段的值?!ぎ?dāng)數(shù)據(jù)包含稀疏的行而需要有效地使用存儲(chǔ)空間時(shí),因?yàn)榱写財(cái)?shù)據(jù)庫(kù)只為存在列的行分配存儲(chǔ)空間。如果沒(méi)有列,將不會(huì)分配任何空間?!げ樵兡J桨迦?、選擇、更新和刪除操作。列簇不適用于:·需要對(duì)數(shù)據(jù)進(jìn)行關(guān)系型操作,例如連接操作?!ば枰С諥CID事務(wù)。·需要存儲(chǔ)二進(jìn)制數(shù)據(jù)?!ば枰獔?zhí)行SQL兼容查詢。·查詢模式經(jīng)常改變,因?yàn)檫@樣將會(huì)重構(gòu)列簇的組織。列簇存儲(chǔ)設(shè)備包括Cassandra、HBase和AmazonSimpleDBNoSQL數(shù)據(jù)庫(kù)圖存儲(chǔ):圖存儲(chǔ)設(shè)備適用于:·需要存儲(chǔ)互聯(lián)的實(shí)體?!ば枰鶕?jù)關(guān)系的類型查詢實(shí)體,而不是實(shí)體的屬性?!げ檎一ヂ?lián)的實(shí)體組?!ぞ凸?jié)點(diǎn)遍歷距離來(lái)查找實(shí)體之間的距離?!榱藢ふ夷J蕉M(jìn)行的數(shù)據(jù)挖掘。圖存儲(chǔ)設(shè)備不適用于:·需要更新大量的節(jié)點(diǎn)屬性或邊屬性,這包括對(duì)節(jié)點(diǎn)或邊的查詢,相對(duì)于節(jié)點(diǎn)的遍歷是非常費(fèi)時(shí)的操作?!?shí)體擁有大量的屬性或嵌套數(shù)據(jù),最好在圖存儲(chǔ)設(shè)備中存儲(chǔ)輕量實(shí)體,而在另外的非圖NoSQL存儲(chǔ)設(shè)備中存儲(chǔ)額外的屬性數(shù)據(jù)?!ば枰鎯?chǔ)二進(jìn)制數(shù)據(jù)?!せ诠?jié)點(diǎn)或邊的屬性的查詢操作占據(jù)大部分的節(jié)點(diǎn)遍歷查詢。NoSQL與RDBMS的主要區(qū)別

RDBMSNoSQL數(shù)據(jù)類型結(jié)構(gòu)化數(shù)據(jù)主要是非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)庫(kù)結(jié)構(gòu)需要事先定義,是固定的不需要事先定義,并可以靈活改變數(shù)據(jù)一致性通過(guò)ACIO特性保持嚴(yán)密的一致性存在臨時(shí)的不保持嚴(yán)密一致性的狀態(tài)(結(jié)果匹配性)擴(kuò)展性基本是向上擴(kuò)展。由于需要保持?jǐn)?shù)據(jù)的一致性,因此性能下降明顯通過(guò)橫向擴(kuò)展可以在不降低性能的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論