大數(shù)據(jù)與NOSql概述PPT課件.ppt_第1頁
大數(shù)據(jù)與NOSql概述PPT課件.ppt_第2頁
大數(shù)據(jù)與NOSql概述PPT課件.ppt_第3頁
大數(shù)據(jù)與NOSql概述PPT課件.ppt_第4頁
大數(shù)據(jù)與NOSql概述PPT課件.ppt_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、信息技術(shù)部,大數(shù)據(jù)與NOSql概述 (2016年12月18日),主要內(nèi)容,大數(shù)據(jù)概述 大數(shù)據(jù)的定義 大數(shù)據(jù)的4V特征 大數(shù)據(jù)的系統(tǒng)要求 大數(shù)據(jù)的典型架構(gòu) 大數(shù)據(jù)的應(yīng)用 大數(shù)據(jù)的發(fā)展,主要內(nèi)容,Nosql概述 什么是NoSQL NoSQL的優(yōu)勢和不足 NoSQL的CAP理論實(shí)現(xiàn) NoSQL數(shù)據(jù)模型及分類,大數(shù)據(jù)的定義,大數(shù)據(jù)(big data),指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。 在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的大數(shù)據(jù)時(shí)代2 中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣

2、調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。,大數(shù)據(jù)的4V特征,Volume(海量)、Variety(多樣)、Velocity(實(shí)時(shí))、Value(價(jià)值) 海量數(shù)據(jù)量巨大,對(duì)TB、PB數(shù)據(jù)級(jí)的處理, 已經(jīng)成為基本配置。 多樣處理多樣性的數(shù)據(jù)類型,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),能處理Web數(shù)據(jù),能處理語音數(shù)據(jù)甚至是圖像、視頻數(shù)據(jù)。 實(shí)時(shí)在客戶每次瀏覽頁面,每次下訂單的過程中都存在,都會(huì)需要對(duì)用戶進(jìn)行實(shí)時(shí)的推薦,決策已經(jīng)變得實(shí)時(shí) 價(jià)值價(jià)值密度低,商業(yè)價(jià)值高。一條數(shù)小時(shí)的監(jiān)控視頻,可能有用的數(shù)據(jù)僅有一兩秒。能從海量數(shù)據(jù)中發(fā)掘出這些數(shù)據(jù),將成為企業(yè)競爭力的重要來源。,大數(shù)據(jù)的系統(tǒng)需求,高新能( High

3、performance ) 高并發(fā)讀寫 實(shí)時(shí)動(dòng)態(tài)獲取和更新數(shù)據(jù) 海量存儲(chǔ)(Huge Storage ) 海量數(shù)據(jù)的高效率存儲(chǔ)和訪問 類似SNS網(wǎng)站 高可擴(kuò)展性和高可用性 ( High Scalability & High Availability ) 需要擁有快速橫向擴(kuò)展能力 能提供7*24小時(shí)不間斷服務(wù),大數(shù)據(jù)典型架構(gòu),大數(shù)據(jù)典型架構(gòu),大數(shù)據(jù)典型架構(gòu),數(shù)據(jù)計(jì)算用時(shí)對(duì)比 離線計(jì)算 流式計(jì)算 實(shí)時(shí)計(jì)算,大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與互聯(lián)網(wǎng) 大交易數(shù)據(jù):來自電商的數(shù)據(jù),包括B2B、B2C、C2C、團(tuán)購等 大交互數(shù)據(jù):來自社交網(wǎng)絡(luò)的數(shù)據(jù),SNS、微博等 兩類數(shù)據(jù)有效融合將是大勢所趨,更能增強(qiáng)企業(yè)的商業(yè)洞察力

4、,大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與金融銀行,大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與金融保險(xiǎn),大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)與金融證券 股價(jià)預(yù)測 客戶關(guān)系管理 投資景氣指數(shù)分析,大數(shù)據(jù)的發(fā)展,NOSql的概念,什么是NoSQL? NoSQL是Not Only SQL的縮寫,而不是Not SQL; 它不一定遵循傳統(tǒng)數(shù)據(jù)庫的一些基本要求,比如SQL標(biāo)準(zhǔn)、ACID屬性、表結(jié)構(gòu)等等。 相比傳統(tǒng)數(shù)據(jù)庫,叫它分布式數(shù)據(jù)管理系統(tǒng)更貼切,數(shù)據(jù)存儲(chǔ)被簡化更靈活,重點(diǎn)被放在了分布式數(shù)據(jù)管理上。 NoSQL數(shù)據(jù)庫主要應(yīng)用于web2.0的大規(guī)模系統(tǒng),具有模式靈活、最終一致性、面向海量數(shù)據(jù)、分布式、開源、水平可擴(kuò)展、配置簡單、非關(guān)系型等特點(diǎn)。,NOSql的

5、優(yōu)勢,易擴(kuò)展 NoSQL數(shù)據(jù)庫種類繁多; 共同的特點(diǎn)都是去掉系型特性; 數(shù)據(jù)之間無關(guān)系,容易橫向擴(kuò)展; 甚至可以NoSQL之間的整合。 數(shù)據(jù)模型靈活 無需事先為要存儲(chǔ)的數(shù)據(jù)建立字段 隨時(shí)可以存儲(chǔ)自定義的數(shù)據(jù)格式 高可用 NoSQL在不太影響性能的情況,就可以方便的實(shí)現(xiàn)高可用的架構(gòu)。比如Cassandra,HBase模型,通過復(fù)制模型也能實(shí)現(xiàn)高可用。 大數(shù)據(jù)量,高性能 NoSQL數(shù)據(jù)庫都具有非常高的讀寫性能,尤其在大數(shù)據(jù)量下,同樣表現(xiàn)優(yōu)秀。這得益于它的無關(guān)系性,數(shù)據(jù)結(jié)構(gòu)簡單。,NOSql的CAP原理實(shí)現(xiàn),分布式數(shù)據(jù)系統(tǒng)的CAP原理的三要素: 一致性 (Consistency) 可用性 (Avai

6、lability) 分區(qū)容忍性 (Partition tolerance) NOSql的CAP原理實(shí)現(xiàn): 在分布式系統(tǒng)中,三個(gè)要素最多只能同時(shí)實(shí)現(xiàn)兩點(diǎn) 考慮CP,主要是一些Key-Value數(shù)據(jù)庫,典型代表為Google的Big Table,將各列數(shù)據(jù)進(jìn)行排序存儲(chǔ)。數(shù)據(jù)值按范圍分布在多臺(tái)機(jī)器,數(shù)據(jù)更新操作有嚴(yán)格的一致性保證。 考慮AP,主要是一些面向文檔的適用于分布式系統(tǒng)的數(shù)據(jù)庫,如Amazon的Dynamo,Dynamo將數(shù)據(jù)按key進(jìn)行Hash存儲(chǔ)。其數(shù)據(jù)分片模型有比較強(qiáng)的容災(zāi)性,因此它實(shí)現(xiàn)的是相對(duì)松散的弱一致性最終一致性,NOSql數(shù)據(jù)模型及分類,NoSQL的兩個(gè)核心理論基礎(chǔ): Google的BigTable BigTable將各列數(shù)據(jù)進(jìn)行排序存儲(chǔ); 數(shù)據(jù)值按范圍分布在多臺(tái)機(jī)器; 數(shù)據(jù)更新操作有嚴(yán)格的一致性保證。 Amazon的Dynamo Dynamo使用的是另外一種分布式模型; 模型更簡單,將數(shù)據(jù)按key進(jìn)行hash存儲(chǔ); 其數(shù)據(jù)分片模型有比較強(qiáng)的容災(zāi)性; 實(shí)現(xiàn)的是相對(duì)松散的弱一致性(最終一致性)。,NOSql數(shù)據(jù)模型及分類,NOSql數(shù)據(jù)模型及分類,NOSql使用情況,NOSql數(shù)據(jù)模型及分類,DB-Engines 發(fā)布了 2016 年 12 月份的數(shù)據(jù)庫排名,NOSql數(shù)據(jù)模型及分類,綜合來看,NoSQL數(shù)據(jù)庫正在逐漸地成為數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論