




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)科學(xué)與工程導(dǎo)論IntroductiontoDataScienceandEngineering開篇實(shí)例從圖書館找一本書……100年前50年前今天數(shù)據(jù)庫的起源與發(fā)展關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫與OLAP123第7章
數(shù)據(jù)庫系統(tǒng)SQL語言47.1數(shù)據(jù)庫的起源與發(fā)展什么是數(shù)據(jù)管理維基百科:數(shù)據(jù)管理,即對(duì)數(shù)據(jù)資源的管理。而數(shù)據(jù)資源管理,致力于發(fā)展處理企業(yè)數(shù)據(jù)生命周期的適當(dāng)?shù)慕?gòu)、策略、實(shí)踐和程序。百度百科:數(shù)據(jù)管理是利用計(jì)算機(jī)硬件和軟件技術(shù)對(duì)數(shù)據(jù)進(jìn)行有效的收集、存儲(chǔ)、處理和應(yīng)用的過程。其目的在于充分有效地發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)管理經(jīng)歷了四個(gè)發(fā)展階段:人工管理、文件系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、大數(shù)據(jù)管理7.1數(shù)據(jù)庫的起源與發(fā)展數(shù)據(jù)管理系統(tǒng)的演變穿孔紙帶文件系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(DBMS)網(wǎng)狀數(shù)據(jù)庫、層次數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫面向?qū)ο髷?shù)據(jù)庫決策支持系統(tǒng)和數(shù)據(jù)倉庫MPP數(shù)據(jù)庫Hadoop/Spark生態(tài)系統(tǒng)數(shù)據(jù)管理歷程7.1數(shù)據(jù)庫的起源與發(fā)展人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)大數(shù)據(jù)管理系統(tǒng)數(shù)據(jù)不保存數(shù)據(jù)不共享數(shù)據(jù)不獨(dú)立應(yīng)用程序管理數(shù)據(jù)數(shù)據(jù)管理歷程7.1數(shù)據(jù)庫的起源與發(fā)展人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)大數(shù)據(jù)管理系統(tǒng)數(shù)據(jù)長(zhǎng)期儲(chǔ)存由文件系統(tǒng)管理數(shù)據(jù)數(shù)據(jù)共享性差且冗余度大文件面向應(yīng)用數(shù)據(jù)管理歷程7.1數(shù)據(jù)庫的起源與發(fā)展人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)大數(shù)據(jù)管理系統(tǒng)DBMS出現(xiàn)數(shù)據(jù)冗余度減少數(shù)據(jù)充分共享數(shù)據(jù)管理歷程7.1數(shù)據(jù)庫的起源與發(fā)展人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)大數(shù)據(jù)管理系統(tǒng)硬件基礎(chǔ)設(shè)施數(shù)據(jù)庫服務(wù)器數(shù)據(jù)庫管理軟件DBMS數(shù)據(jù)管理歷程7.1數(shù)據(jù)庫的起源與發(fā)展人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)大數(shù)據(jù)管理系統(tǒng)數(shù)據(jù)庫和數(shù)據(jù)倉庫的挑戰(zhàn)數(shù)據(jù)增長(zhǎng)速度非常迅速難以滿足高并發(fā)讀寫的需求難以滿足對(duì)海量數(shù)據(jù)高效率存儲(chǔ)和訪問的需求難以滿足對(duì)數(shù)據(jù)庫高可擴(kuò)展性和高可用性的需求數(shù)據(jù)管理歷程7.1數(shù)據(jù)庫的起源與發(fā)展人工管理文件系統(tǒng)數(shù)據(jù)庫系統(tǒng)大數(shù)據(jù)管理系統(tǒng)由于大數(shù)據(jù)要處理大量、非結(jié)構(gòu)化的數(shù)據(jù),所以在各處理環(huán)節(jié)中都可以采用并行處理。目前,Hadoop、MapReduce和Spark等分布式處理方式已經(jīng)成為大數(shù)據(jù)處理各環(huán)節(jié)的通用處理方法。大數(shù)據(jù)技術(shù)生態(tài)數(shù)據(jù)庫的起源與發(fā)展關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫與OLAP123第7章
數(shù)據(jù)庫系統(tǒng)SQL語言47.2關(guān)系數(shù)據(jù)庫數(shù)據(jù)庫系統(tǒng)的類型Codd十二條法則7.2關(guān)系數(shù)據(jù)庫1,信息準(zhǔn)則:關(guān)系數(shù)據(jù)庫中的所有信息都應(yīng)在邏輯層上用表中的值顯式的表示。2,保證訪問準(zhǔn)則:依于表名,主鍵和列名,保證能以邏輯方式訪問數(shù)據(jù)庫中的每個(gè)數(shù)據(jù)項(xiàng)。3,空值的系統(tǒng)化處理:RDBMS支持空值(不同于空的字符串或空白字符串,并且不為0)系統(tǒng)化的表示缺少的信息,且與數(shù)據(jù)類型無關(guān)。4,基于關(guān)系模型的聯(lián)機(jī)目錄:數(shù)據(jù)庫的描述在邏輯上應(yīng)該和一般數(shù)據(jù)采用同樣的方式,使得授權(quán)用戶可以使用查詢一般數(shù)據(jù)所用的關(guān)系語言來查詢數(shù)據(jù)庫的描述信息。5,合理廣泛的子語言準(zhǔn)則:一個(gè)關(guān)系系統(tǒng)可以具有幾種語言和多種終端使用方式(表格填空方式,命令方式等)。6,視圖更新準(zhǔn)則:所有理論上可更新的視圖也應(yīng)該允許由系統(tǒng)更新。Codd十二條法則7.2關(guān)系數(shù)據(jù)庫7,高階的插入,更新和刪除:把一個(gè)基本關(guān)系或?qū)С鲫P(guān)系作為一個(gè)操作對(duì)象進(jìn)行數(shù)據(jù)的檢索以及插入,更新和刪除。8,數(shù)據(jù)的物理獨(dú)立性:無論數(shù)據(jù)庫的數(shù)據(jù)在存儲(chǔ)表示上或存取方法上做任何變化,應(yīng)用程序和終端活動(dòng)要都保持邏輯上的不變性。9,數(shù)據(jù)的邏輯獨(dú)立性:當(dāng)基本表中進(jìn)行理論上信息不受損害的任何變化時(shí),應(yīng)用程序和終端和終端活動(dòng)都要保持邏輯上的不變性。10,數(shù)據(jù)完整的獨(dú)立性:關(guān)系數(shù)據(jù)庫的完整性約束必須是用數(shù)據(jù)子語言定義并存貯在目錄中的,而不是在應(yīng)用程序中加以定義的。11,分布的獨(dú)立性:一個(gè)RDBMS應(yīng)該具有分布獨(dú)立性。用戶不必了解數(shù)據(jù)庫是否是分布式的。12,無破壞準(zhǔn)則:若RDBMS有某種低級(jí)語言,這一低級(jí)語言不能違背或繞過完整性準(zhǔn)則以及高級(jí)關(guān)系語言表達(dá)的約束。數(shù)據(jù)庫的事務(wù)處理7.2關(guān)系數(shù)據(jù)庫一致性前后一致隔離性并發(fā)持久性永久原子性不可分割數(shù)據(jù)庫的事務(wù)處理7.2關(guān)系數(shù)據(jù)庫原子性一致性獨(dú)立性持久性原子性很容易理解,就是說事務(wù)里的所有操作要么全部做完,要么都不做,事務(wù)成功的條件是事務(wù)里的所有操作都成功,只要有一個(gè)操作失敗,整個(gè)事務(wù)就失敗,需要回滾。A¥1572.35B¥122.71A¥1562.35Step1:-¥100B¥132.71Step2:+¥100A¥1562.35Step1:-¥100A¥1572.35數(shù)據(jù)庫的事務(wù)處理7.2關(guān)系數(shù)據(jù)庫原子性一致性獨(dú)立性持久性一致性就是說數(shù)據(jù)庫要一直處于一致的狀態(tài),事務(wù)的運(yùn)行不會(huì)改變數(shù)據(jù)庫原本的一致性約束。a+b=10UPDATEATO3……UPDATEBTO7UPDATEATO4……UPDATEBTO7UPDATEATO4……數(shù)據(jù)庫的事務(wù)處理7.2關(guān)系數(shù)據(jù)庫原子性一致性獨(dú)立性持久性所謂的獨(dú)立性是指并發(fā)的事務(wù)之間不會(huì)互相影響,如果一個(gè)事務(wù)要訪問的數(shù)據(jù)正在被另外一個(gè)事務(wù)修改,只要另外一個(gè)事務(wù)未提交,它所訪問的數(shù)據(jù)就不受未提交事務(wù)的影響。A¥1562.35Step1:-¥100B¥132.71Step2:+¥100B¥122.71B¥122.71B¥132.71數(shù)據(jù)庫的事務(wù)處理7.2關(guān)系數(shù)據(jù)庫原子性一致性獨(dú)立性持久性持久性是指一旦事務(wù)提交后,它所做的修改將會(huì)永久保存在數(shù)據(jù)庫上,即使出現(xiàn)宕機(jī)也不會(huì)丟失??偨Y(jié):這些原則解決了數(shù)據(jù)的一致性、系統(tǒng)的可靠性等關(guān)鍵問題,為關(guān)系數(shù)據(jù)庫技術(shù)的成熟以及在不同領(lǐng)域的大規(guī)模應(yīng)用創(chuàng)造了必要的條件。關(guān)系7.2關(guān)系數(shù)據(jù)庫學(xué)號(hào)姓名班級(jí)年齡性別住址課號(hào)電話100張三計(jì)9120男上海楊浦上海89150200李四計(jì)9219男上海徐匯上海88888300王五計(jì)9318女上海浦東上海77777400趙六計(jì)9419女上海靜安上海99999500劉七計(jì)9521男上海普陀上海88666課號(hào)課程名地點(diǎn)教師1DB5101周老師2DB5102錢老師3DM5103金老師ID學(xué)號(hào)課號(hào)分?jǐn)?shù)110019922001983300297studentcoursegrade主鍵主鍵主鍵關(guān)系代數(shù)7.2關(guān)系數(shù)據(jù)庫關(guān)系代數(shù)是一種抽象的查詢語言,用對(duì)關(guān)系的運(yùn)算來表達(dá)查詢,作為研究關(guān)系數(shù)據(jù)語言的數(shù)學(xué)工具。集合運(yùn)算并、交、差、廣義笛卡爾積關(guān)系運(yùn)算選擇(Selection)投影(Projection)連接(Join)除(Division)索引7.2關(guān)系數(shù)據(jù)庫DBMS為每個(gè)主鍵建立一個(gè)索引為具有唯一約束性的字段自動(dòng)建立索引對(duì)于經(jīng)常檢索的字段,可為其建立額外的索引快速查詢對(duì)排序數(shù)據(jù)的即時(shí)訪問數(shù)據(jù)庫的起源與發(fā)展關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫與OLAP123第7章
數(shù)據(jù)庫系統(tǒng)SQL語言4什么是數(shù)據(jù)倉庫7.3數(shù)據(jù)倉庫與OLAP數(shù)據(jù)倉庫一詞最早是在1990年,由BillInmon提出的。數(shù)據(jù)倉庫的四個(gè)基本特征:數(shù)據(jù)倉庫的數(shù)據(jù)是面向主題的(SubjectOriented)數(shù)據(jù)倉庫的數(shù)據(jù)時(shí)集成的(Integrate)數(shù)據(jù)倉庫的數(shù)據(jù)不可更新(Non-Volatile)數(shù)據(jù)倉庫的數(shù)據(jù)時(shí)隨時(shí)間不斷變化(TimeVariant)的什么是數(shù)據(jù)倉庫7.3數(shù)據(jù)倉庫與OLAP數(shù)據(jù)倉庫是是一個(gè)面向主題的、集成的、相對(duì)穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉庫的四種類型傳統(tǒng)數(shù)據(jù)倉庫實(shí)時(shí)處理數(shù)據(jù)倉庫關(guān)聯(lián)發(fā)現(xiàn)數(shù)據(jù)倉庫數(shù)據(jù)集市數(shù)據(jù)倉庫產(chǎn)生的原因7.3數(shù)據(jù)倉庫與OLAP數(shù)據(jù)處理的類型操作型處理(OLTP):數(shù)據(jù)的收集、整理、存儲(chǔ)、查詢和增、刪、改操作。分析型處理(OLAP):數(shù)據(jù)的再加工,往往要訪問大量的歷史數(shù)據(jù),進(jìn)行復(fù)雜的統(tǒng)計(jì)分析。與傳統(tǒng)數(shù)據(jù)庫的區(qū)別7.3數(shù)據(jù)倉庫與OLAP是數(shù)據(jù)庫系統(tǒng)的主要應(yīng)用特點(diǎn):數(shù)據(jù)存取頻率高、響應(yīng)時(shí)間要快、存取數(shù)據(jù)量小、數(shù)據(jù)存儲(chǔ)正確可靠。為了有效地對(duì)事務(wù)進(jìn)行處理,數(shù)據(jù)庫管理系統(tǒng)在技術(shù)和管理上采取了很多措施:提出了事務(wù)的概念采用日志、備份等恢復(fù)技術(shù)和并發(fā)控制技術(shù)采用索引技術(shù)快速定位數(shù)據(jù)操作型數(shù)據(jù)處理與傳統(tǒng)數(shù)據(jù)庫的區(qū)別7.3數(shù)據(jù)倉庫與OLAP典型的分析型應(yīng)用就是決策支持系統(tǒng)。需要具備的基本功能是:建立各種數(shù)學(xué)模型,對(duì)數(shù)據(jù)統(tǒng)計(jì)分析,得出有用的信息作為決策的依據(jù)。常規(guī)應(yīng)用實(shí)例:某產(chǎn)品的銷售經(jīng)理希望通過調(diào)整該產(chǎn)品在各零售店的分配數(shù)量來擴(kuò)大其銷售量。需要查詢歷史數(shù)據(jù)庫中各類零售店最近若干年(例如5年)內(nèi)每天的銷售記錄。統(tǒng)計(jì)運(yùn)算計(jì)算出近5年來各店的年度銷售量。比較確定銷售量增長(zhǎng)較快的零售店。決策支持系統(tǒng):需要花數(shù)小時(shí)甚至更長(zhǎng)時(shí)間的處理、需要遍歷數(shù)據(jù)庫中的大部分?jǐn)?shù)據(jù),進(jìn)行復(fù)雜的計(jì)算,需要消耗大量的系統(tǒng)資源。分析型數(shù)據(jù)處理與傳統(tǒng)數(shù)據(jù)庫的區(qū)別7.3數(shù)據(jù)倉庫與OLAPOLTP和OLAP的對(duì)比操作型數(shù)據(jù)分析型數(shù)據(jù)細(xì)節(jié)的綜合的,或提煉的當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)更新的不可更新,只讀的生命周期符合軟件開發(fā)生命周期以數(shù)據(jù)為中心的生命周期對(duì)性能要求高對(duì)性能要求寬松一個(gè)時(shí)刻操作一個(gè)單元一個(gè)時(shí)刻操作一個(gè)集合事務(wù)驅(qū)動(dòng)分析驅(qū)動(dòng)面向應(yīng)用面向分析一次操作數(shù)據(jù)量小,計(jì)算簡(jiǎn)單一次操作數(shù)據(jù)量大,計(jì)算復(fù)雜支持日常操作 支持管理需求傳統(tǒng)數(shù)據(jù)倉庫的架構(gòu)7.3數(shù)據(jù)倉庫與OLAPERPCRMHRFinanceMiscSOURCEDATAOperationalSystemsPull/pushRDBMSEBCDICFlatfilesXMLSpreadSheetsLegacydataStagingAreaTransformationAndloadprocessesCRMREVENUESALESAggregationEDWOtherReferencedataExternalSourcesDataWarehouseArchitectureDataMiningPortalMetadataInfoTacticalReportingBusinessIntelligenceAnalyticsForecasting傳統(tǒng)數(shù)據(jù)倉庫的架構(gòu)7.3數(shù)據(jù)倉庫與OLAPERPCRMHRFinanceMiscSOURCEDATAOperationalSystemsPull/pushRDBMSEBCDICFlatfilesXMLSpreadSheetsLegacydataStagingAreaTransformationAndloadprocessesCRMREVENUESALESAggregationEDWOtherReferencedataExternalSourcesDataWarehouseArchitectureDataMiningPortalMetadataInfoTacticalReportingBusinessIntelligenceAnalyticsForecasting面臨的挑戰(zhàn):數(shù)據(jù)量增長(zhǎng)過快,導(dǎo)致運(yùn)算效率下降數(shù)據(jù)抽取處理的代價(jià)過高,無法在統(tǒng)一的視圖下處理無法處理多種類型的數(shù)據(jù)不具備進(jìn)行搜索或關(guān)聯(lián)分析以發(fā)現(xiàn)隱藏關(guān)系的能力不具備數(shù)據(jù)挖掘等高級(jí)分析的能力數(shù)據(jù)倉庫架構(gòu)的挑戰(zhàn)7.3數(shù)據(jù)倉庫與OLAP數(shù)據(jù)增長(zhǎng)速度迅速數(shù)據(jù)源類型眾多需要數(shù)據(jù)庫虛擬化技術(shù)需要數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的支持基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)倉庫架構(gòu)7.3數(shù)據(jù)倉庫與OLAP核心系統(tǒng)信用卡系統(tǒng)網(wǎng)銀現(xiàn)有業(yè)務(wù)系統(tǒng)ETL調(diào)度客服系統(tǒng)Flume宏觀政策/經(jīng)濟(jì)社交網(wǎng)絡(luò)自然環(huán)境FTP定期加載非/半結(jié)構(gòu)化數(shù)據(jù)ECIF-MDM其他系統(tǒng)……國際業(yè)務(wù)平臺(tái)實(shí)時(shí)交易數(shù)據(jù)Kafka實(shí)時(shí)接收實(shí)時(shí)決策平臺(tái)(StreamSQL)流式處理實(shí)時(shí)監(jiān)測(cè)自助分析平臺(tái)(SQL)自助報(bào)表交互分析數(shù)據(jù)探索平臺(tái)(R)分析預(yù)測(cè)量化模型非結(jié)構(gòu)化處理平臺(tái)(Hadoop/HBase)日志處理影像存儲(chǔ)語音分析視頻識(shí)別數(shù)據(jù)倉庫平臺(tái)(Hadoop)貼源區(qū)基礎(chǔ)區(qū)主題區(qū)元數(shù)據(jù)區(qū)計(jì)算資源管理平臺(tái)
(Virtualization,Multi-tenantSLA,Audit)離線批處理(SQL)數(shù)據(jù)加工主題模型Operational
DW
Traditional
DW
Data
MartContext-independentDW關(guān)系型數(shù)據(jù)庫與NoSQL數(shù)據(jù)存儲(chǔ)7.3數(shù)據(jù)倉庫與OLAP關(guān)系型數(shù)據(jù)庫的局限性難以滿足高并發(fā)讀寫的需求難以滿足對(duì)海量數(shù)據(jù)高效率存儲(chǔ)和訪問的需求難以滿足對(duì)數(shù)據(jù)庫高可擴(kuò)展性和高可用性的需求NoSQL數(shù)據(jù)存儲(chǔ)不需要固定的表結(jié)構(gòu),通常也不存在連接操作。在大數(shù)據(jù)存取上具備關(guān)系型數(shù)據(jù)庫無法比擬的性能優(yōu)勢(shì)。非關(guān)系型數(shù)據(jù)庫以鍵值對(duì)存儲(chǔ),它的結(jié)構(gòu)不固定,每一個(gè)元組可以有不一樣的字段,每個(gè)元組可以根據(jù)需要增加一些自己的鍵值對(duì),這樣就不會(huì)局限于固定的結(jié)構(gòu),可以減少一些時(shí)間和空間的開銷。NoSQL
/NewSQL…7.3數(shù)據(jù)倉庫與OLAP大數(shù)據(jù)管理技術(shù)的四維象限7.3數(shù)據(jù)倉庫與OLAP根據(jù)應(yīng)用的需求,可以從兩個(gè)維度入手。應(yīng)用類型維度操作型應(yīng)用分析型應(yīng)用數(shù)據(jù)模型維度關(guān)系模型NoSQL數(shù)據(jù)模型大數(shù)據(jù)管理技術(shù)的新格局7.3數(shù)據(jù)倉庫與OLAP大數(shù)據(jù)管理技術(shù)的新格局7.3數(shù)據(jù)倉庫與OLAP面向操作型應(yīng)用的關(guān)系數(shù)據(jù)庫技術(shù)傳統(tǒng)的基于行存儲(chǔ)的關(guān)系數(shù)據(jù)庫系統(tǒng)IBM的DB2、Oracle、微軟的SQLServer等面向?qū)崟r(shí)計(jì)算的內(nèi)存數(shù)據(jù)庫系統(tǒng)Altibase,Timesten,Hana等面向OLTP應(yīng)用的newSQLVoltDB、Clustrix、NuoDB等大數(shù)據(jù)管理技術(shù)的新格局7.3數(shù)據(jù)倉庫與OLAP面向分析型應(yīng)用的關(guān)系數(shù)據(jù)庫技術(shù)數(shù)據(jù)倉庫領(lǐng)頭羊TeraData列存儲(chǔ)數(shù)據(jù)庫系統(tǒng)MonetDB、InfiniDB、LucidDB,Vertica,SybaseIQ等基于列存儲(chǔ)技術(shù)的內(nèi)存數(shù)據(jù)庫MonetDB和Vertica大數(shù)據(jù)管理技術(shù)的新格局7.3數(shù)據(jù)倉庫與OLAP面向操作型應(yīng)用的
NoSQL
技術(shù)NoSQL數(shù)據(jù)庫系統(tǒng)相對(duì)于關(guān)系數(shù)據(jù)庫系統(tǒng)具有的優(yōu)勢(shì):數(shù)據(jù)模型靈活、支持多樣的數(shù)據(jù)類型高度的擴(kuò)展性。NoSQL數(shù)據(jù)庫系統(tǒng)鍵值(key-value)存儲(chǔ)數(shù)據(jù)庫:Dynamo列式存儲(chǔ)數(shù)據(jù)庫:BigTable、HBase文檔存儲(chǔ)數(shù)據(jù)庫:MongoDB大數(shù)據(jù)管理技術(shù)的新格局7.3數(shù)據(jù)倉庫與OLAP面向分析型應(yīng)用的
NoSQL
技術(shù)MapReduce技術(shù)以其創(chuàng)新的設(shè)計(jì)理念、高度的擴(kuò)展性和容錯(cuò)性,獲得了學(xué)術(shù)界和工業(yè)界的青睞,圍繞MapReduce的數(shù)據(jù)分析生態(tài)系統(tǒng)已經(jīng)在幾年前形成。為了進(jìn)一步提升計(jì)算性能和數(shù)據(jù)的實(shí)時(shí)分析能力,Hadoop與內(nèi)存計(jì)算模式進(jìn)行混合,目前已經(jīng)成為實(shí)現(xiàn)高實(shí)時(shí)性的大數(shù)據(jù)查詢和計(jì)算分析新的趨勢(shì)。這種混合計(jì)算模式之集大成者當(dāng)屬UCBerkeleyAMPLab開發(fā)的Spark生態(tài)系統(tǒng)。數(shù)據(jù)倉庫的應(yīng)用7.3數(shù)據(jù)倉庫與OLAP數(shù)據(jù)庫的起源與發(fā)展關(guān)系數(shù)據(jù)庫數(shù)據(jù)倉庫與OLAP123第7章
數(shù)據(jù)庫系統(tǒng)SQL語言4結(jié)構(gòu)性查詢語言(SQL)7.4SQL語言1974年,IBM的Boyce和Chamberlin將Codd關(guān)系數(shù)據(jù)庫的12條準(zhǔn)則的數(shù)學(xué)定義以簡(jiǎn)單的關(guān)鍵字語法表現(xiàn)出來,里程碑式地提出了SQL(StructuredQueryLanguage)語言。1976年IBM的Codd發(fā)表了一篇里程碑的論文“R系統(tǒng):數(shù)據(jù)庫關(guān)系理論”,介紹了關(guān)系數(shù)據(jù)庫理論和查詢語言SQL。隨后,Oracle的創(chuàng)始人LarryEllison仔細(xì)地閱讀了這篇文章,幾個(gè)月后,Ellison他們就開發(fā)了Oracle1.0。SQL的強(qiáng)大功能7.4SQL語言適用于數(shù)據(jù)分析的自然語言基于關(guān)系代數(shù)、面向集合高效的語言聲明式語言:直接表述想要的結(jié)果,而非獲得方式優(yōu)化的處理將結(jié)果與方式脫鉤有助于持續(xù)優(yōu)化SQL引擎持續(xù)創(chuàng)新內(nèi)部處理、語言結(jié)構(gòu)和數(shù)據(jù)訪問一直在增強(qiáng)SQL的強(qiáng)大功能7.4SQL語言SQL廣受歡迎7.4SQL語言描述數(shù)據(jù)的方法:數(shù)據(jù)模型7.4SQL語言Adatamodel
isacollectionofconceptsfordescribingdata.Aschemaisadescriptionofaparticularcollectionofdata,usingagivendatamodel.Therelationalmodelofdataisthemostwidelyusedmodeltoday.Mainconcept:relation,basicallyatablewithrowsandcolumns.Everyrelationhasaschema,whichdescribesthecolumns,orfields.關(guān)系數(shù)據(jù)模型7.4SQL語言屬性(表格的列)元組(表格的行)關(guān)系(二維表格)抽象級(jí)別7.4SQL語言Viewsdescribehowusersseethedata.ConceptualschemadefineslogicalstructurePhysicalschemadescribesthefilesandindexesused.(sometimescalledtheANSI/SPARCmodel)抽象級(jí)別7.4SQL語言PhysicalSchemaConceptualSchemaView1View2View3DBExample:UniversityDatabaseConceptualschema:
Students(sid:string,name:string,login:string,age:integer,gpa:real)
Courses(cid:string,cname:string,credits:integer)
Enrolled(sid:string,cid:string,grade:string)ExternalSchema(View):Course_info(cid:string,enro
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司物資大比拼活動(dòng)方案
- 公司新年猜謎語活動(dòng)方案
- 公司氣氛活動(dòng)方案
- 公司茶點(diǎn)活動(dòng)方案
- 公司旅游北京策劃方案
- 公司線上抽獎(jiǎng)活動(dòng)方案
- 公司節(jié)日策劃方案
- 公司自助聚餐活動(dòng)方案
- 公司甜點(diǎn)活動(dòng)方案
- 公司百人以上團(tuán)建活動(dòng)方案
- 大學(xué)生心理健康教育知到智慧樹章節(jié)測(cè)試課后答案2024年秋寧波大學(xué)
- 臨床路徑變異分析
- 突破思維定勢(shì)課件
- 家具類項(xiàng)目安裝調(diào)試方案
- 前程無憂測(cè)評(píng)題庫及答案
- 激光治療黃褐斑課件
- 瓶裝液化石油氣送氣工應(yīng)知應(yīng)會(huì)手冊(cè)
- 頌缽療愈師培訓(xùn)
- 2024年吉林省中考化學(xué)真題含解析
- DB65-T 4747-2024 地表水自壓滴灌工程設(shè)計(jì)規(guī)范
- 2024中秋國慶零售新趨勢(shì)報(bào)告-尼爾森iq
評(píng)論
0/150
提交評(píng)論