版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、列式數(shù)據(jù)庫(kù)u列式數(shù)據(jù)庫(kù)的發(fā)展歷史u列式數(shù)據(jù)庫(kù)GBase 8auGbase 8a成功案例 1、項(xiàng)目背景 2、需求分析 3、解決方案u列式數(shù)據(jù)庫(kù)的存儲(chǔ)原理u列式數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)u列式數(shù)據(jù)庫(kù)的缺陷u列式數(shù)據(jù)庫(kù)適合存儲(chǔ)的數(shù)據(jù) 1994年10月Sybase收購(gòu)了Expressway Technologies,該公司只是做提高Sybase數(shù)據(jù)庫(kù)報(bào)表查詢方面的技術(shù),其中使用的技術(shù)便是一種按列存儲(chǔ)的技術(shù)。該公司被購(gòu)買后更名為Sybase IQ Accelerator。 最早的商業(yè)列式數(shù)據(jù)庫(kù)是1996年發(fā)布的Sybase IQ,但是直到1999年左右才慢慢穩(wěn)定到投入生產(chǎn)環(huán)境。列式數(shù)據(jù)庫(kù)的發(fā)展歷史 GBase 8a是
2、南大通用公司自主研發(fā),面向海量數(shù)據(jù)查詢分析應(yīng)用領(lǐng)域的一款高性能國(guó)產(chǎn)新型數(shù)據(jù)庫(kù)產(chǎn)品,用于滿足各個(gè)數(shù)據(jù)密集型行業(yè)日益增大的數(shù)據(jù)查詢、數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)分析、數(shù)據(jù)挖掘和數(shù)據(jù)備份等數(shù)據(jù)存儲(chǔ)、管理和處理需求,可用做數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)、BI系統(tǒng)和決策支持系統(tǒng)的承載數(shù)據(jù)庫(kù)。 GBase 8a采用了列存儲(chǔ)、自適應(yīng)壓縮、智能索引等核心技術(shù),GBase 8a集群基于Shared Nothing架構(gòu),采用MPP(大規(guī)模并行處理)等關(guān)鍵技術(shù),并內(nèi)嵌了高性能的全文檢索和分布式文件系統(tǒng),實(shí)現(xiàn)了高效的大數(shù)據(jù)存儲(chǔ)管理和查詢分析。列式數(shù)據(jù)庫(kù)GBase 8a 項(xiàng)目背景 現(xiàn)場(chǎng)檢查是銀監(jiān)會(huì)對(duì)金融機(jī)構(gòu)業(yè)務(wù)活動(dòng)及其風(fēng)險(xiǎn)狀況進(jìn)行評(píng)估的重要手段,當(dāng)前
3、現(xiàn)場(chǎng)檢查工作存在很大問題:銀行業(yè)務(wù)量急劇膨脹,復(fù)雜程度大大提高,傳統(tǒng)的手工檢查方式效率低下,難以保證現(xiàn)場(chǎng)檢查工作的質(zhì)量和全面性,使用高效的分析型數(shù)據(jù)庫(kù)系統(tǒng)對(duì)銀行海量數(shù)據(jù)進(jìn)行分析成為現(xiàn)場(chǎng)檢查工作的必然選擇。在這種背景下,迫切需要一套高效、實(shí)用的數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)用平臺(tái)對(duì)金融機(jī)構(gòu)海量業(yè)務(wù)數(shù)據(jù)實(shí)現(xiàn)安全存儲(chǔ)、高效分析、準(zhǔn)確評(píng)估,改進(jìn)傳統(tǒng)現(xiàn)場(chǎng)檢查模式,全面提高現(xiàn)場(chǎng)檢查工作的質(zhì)量和效率。Gbase 8a案例-銀監(jiān)會(huì)現(xiàn)場(chǎng)檢查系統(tǒng)項(xiàng)目 需求分析 本項(xiàng)目需求主要包括:對(duì)10TB數(shù)據(jù)進(jìn)行高效存儲(chǔ);提高對(duì)金融數(shù)據(jù)的查詢、分析效率;金融數(shù)據(jù)屬國(guó)家敏感數(shù)據(jù),系統(tǒng)要滿足高安全的要求;替換費(fèi)用高昂的小型機(jī)+磁陣系統(tǒng),控制系統(tǒng)建設(shè)
4、成本。Gbase 8a案例-銀監(jiān)會(huì)現(xiàn)場(chǎng)檢查系統(tǒng)項(xiàng)目 解決方案 GBase 8a采用列存儲(chǔ)、先進(jìn)壓縮算法,對(duì)金融數(shù)據(jù)進(jìn)行高效壓縮存儲(chǔ),同時(shí)結(jié)合智能索引等技術(shù)大大提升系統(tǒng)查詢、分析效率。通過采用基于X86癿PC-Server大大降低了建設(shè)成本。本系統(tǒng)架構(gòu)如下圖所示,以國(guó)產(chǎn)高容錯(cuò)計(jì)算機(jī)為硬件基礎(chǔ)平臺(tái)承載了GBase 8a,業(yè)務(wù)數(shù)據(jù)存儲(chǔ)管理系統(tǒng)通過接口平臺(tái)對(duì)銀行業(yè)務(wù)數(shù)據(jù)進(jìn)行訪問、抽取和加載。在GBase 8a的數(shù)據(jù)支撐下,數(shù)據(jù)分析平臺(tái)及軟件工具包通過Web UI向用戶提供業(yè)務(wù)模型、數(shù)據(jù)分析挖掘、數(shù)據(jù)提取、標(biāo)準(zhǔn)化數(shù)據(jù)和數(shù)據(jù)存儲(chǔ)等服務(wù)。Gbase 8a案例-銀監(jiān)會(huì)現(xiàn)場(chǎng)檢查系統(tǒng)項(xiàng)目 解決方案 Gbase 8
5、a案例-銀監(jiān)會(huì)現(xiàn)場(chǎng)檢查系統(tǒng)項(xiàng)目EmpldLastnameFirstnameSalary1SmithJoe400002JonesMary500003JohosonCathy44000列式數(shù)據(jù)庫(kù)的存儲(chǔ)原理數(shù)據(jù)庫(kù)以行、列的二維表的形式存儲(chǔ)數(shù)據(jù),但是卻以一維字符串的方式存儲(chǔ),例如以下的一個(gè)表:這個(gè)簡(jiǎn)單的表包括員工代碼,姓名字段,工資。這個(gè)表存儲(chǔ)在電腦的內(nèi)存和硬盤中。雖然內(nèi)存和硬盤在機(jī)制上不同,電腦的操作系統(tǒng)是以同樣的方式存儲(chǔ)的。數(shù)據(jù)庫(kù)必須把這個(gè)二維表存儲(chǔ)在一系列一維的“字節(jié)”中,操作系統(tǒng)再寫到內(nèi)存或硬盤中。行式數(shù)據(jù)庫(kù)把一行中的數(shù)據(jù)值串在一起存儲(chǔ)起來,然后再存儲(chǔ)下一行的數(shù)據(jù),以此類推。1,Smith,J
6、oe,40000;2,Jones,Mary,50000;3,Johnson,Cathy,44000;列式數(shù)據(jù)庫(kù)把一列中的數(shù)據(jù)值串在一起存儲(chǔ)起來,然后再存儲(chǔ)下一列的數(shù)據(jù),以此類推。1,2,3;Smith,Jones,Johnson;Joe,Mary,Cathy;40000,50000,44000;這是對(duì)列式數(shù)據(jù)庫(kù)的一個(gè)簡(jiǎn)化的說法。 極高的裝載速度(最高可以等于所有硬盤IO 的總和,基本是極限了) 適合大量的數(shù)據(jù)而不是小數(shù)據(jù) 實(shí)時(shí)加載數(shù)據(jù)僅限于增加(刪除和更新需要解壓縮Block 然后計(jì)算然后重新壓縮儲(chǔ)存) 高效的壓縮率,不僅節(jié)省儲(chǔ)存空間也節(jié)省計(jì)算內(nèi)存和CPU。 非常適合做聚合操作。列式數(shù)據(jù)庫(kù)的優(yōu)
7、點(diǎn) 不適合掃描小量的數(shù)據(jù) 不適合隨機(jī)的更新 不適合做含有刪除和更新的實(shí)時(shí)操作 只適合做聯(lián)機(jī)分析處理(OLAP),不適合做聯(lián)機(jī)事務(wù)處理(OLTP) 對(duì)中文的支持較差 比較復(fù)雜,安裝、部署和管理需要專門的精通它的數(shù)據(jù)庫(kù)管理專家來做列式數(shù)據(jù)庫(kù)的缺點(diǎn) 列式數(shù)據(jù)庫(kù)適合存儲(chǔ)的數(shù)據(jù)特點(diǎn) 1、在進(jìn)行大數(shù)據(jù)處理時(shí),查詢性能要高于處理性能。(運(yùn)營(yíng)商的數(shù)據(jù)是一直在生成的,所以處理性能要高于查詢性能)。 2、數(shù)據(jù)處理完畢后最好不要對(duì)已完成處理的數(shù)據(jù)進(jìn)行更改(運(yùn)營(yíng)商的數(shù)據(jù)是有延時(shí)的,所以有時(shí)必須要修改已經(jīng)處理完成的數(shù)據(jù))。列式數(shù)據(jù)庫(kù)適合存儲(chǔ)的數(shù)據(jù) 相同點(diǎn): 1、都適合處理大數(shù)據(jù),不適合小數(shù)據(jù)。 2、都具有高效的數(shù)據(jù)處理能力。 不同點(diǎn): 1、Hadoop具有高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省濟(jì)寧市2023-2024學(xué)年六年級(jí)下學(xué)期期末考試英語試卷
- 第一中學(xué)學(xué)校安全管理制度
- 24.1.2 垂直于弦的直徑 人教版數(shù)學(xué)九年級(jí)上冊(cè)堂堂練(含答案)
- 貴州省2023-2024學(xué)年高三下學(xué)期高考模擬預(yù)測(cè)信息卷語文一(解析版)
- 關(guān)于民族特色酒館的問卷調(diào)查
- 電商行業(yè)的消費(fèi)者滿意度影響因素實(shí)踐研究
- 股權(quán)結(jié)構(gòu)對(duì)公司財(cái)務(wù)透明度的提升作用研究分析
- 江蘇省南京市鼓樓實(shí)驗(yàn)中學(xué)2024屆中考數(shù)學(xué)考試模擬沖刺卷含解析
- 綠色建筑科技行業(yè)經(jīng)營(yíng)模式分析
- 廢舊橡膠回收利用行業(yè)的消費(fèi)市場(chǎng)分析
- 三 《聯(lián)系生活實(shí)際 弘揚(yáng)工匠精神》(教學(xué)課件)-【中職專用】高二語文精講課堂(高教版2023·職業(yè)模塊)
- 初中數(shù)學(xué)中心對(duì)稱圖形訓(xùn)練50題(含參考答案)
- 大數(shù)據(jù)公開課 - Scala基礎(chǔ)課件
- 椎管內(nèi)占位課件
- DB13-T 5834-2023 化工建設(shè)項(xiàng)目安裝工程質(zhì)量技術(shù)資料管理規(guī)范
- 介入鞘管脫出應(yīng)急預(yù)案腳本
- 共振波簡(jiǎn)介介紹
- 醫(yī)德醫(yī)風(fēng)一票否決制度醫(yī)德醫(yī)風(fēng)一票否決制度
- 造口袋更換流程
- 報(bào)名統(tǒng)計(jì)表格
- 作文格子稿紙800字-A4打印版
評(píng)論
0/150
提交評(píng)論