數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)_第1頁(yè)
數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)_第2頁(yè)
數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)_第3頁(yè)
數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)_第4頁(yè)
數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)第1頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù):構(gòu)造企業(yè)商務(wù)智能P51商務(wù)智能關(guān)系數(shù)據(jù)庫(kù)模型數(shù)據(jù)庫(kù)管理系統(tǒng)工具數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘企業(yè)數(shù)據(jù)資源的管理先行案例:櫻桃為什么少了Ben&Jerry’s公司每天生產(chǎn)19萬(wàn)品脫冰淇淋。產(chǎn)品及時(shí)輸入oracle數(shù)據(jù)庫(kù),并采用數(shù)據(jù)挖掘工具。每周收到的電話(huà)投訴與產(chǎn)品關(guān)聯(lián)。在收到大量投訴某品種櫻桃不足的投訴后,使用智能工具數(shù)據(jù)挖掘,排除了生產(chǎn)流程,進(jìn)一步,找到最終問(wèn)題,包裝盒圖片貼錯(cuò)了。第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)第2頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)互聯(lián)網(wǎng)行業(yè)BI解決方案ProClarity公司介紹:普科(ProClarity)公司總部在美國(guó),是微軟商業(yè)智能平臺(tái)的全球首選搭檔,其產(chǎn)品在BI客戶(hù)端領(lǐng)域連續(xù)兩年市場(chǎng)占有率(基于微軟OLAP)排名世界第一。自從1995年開(kāi)始,普科公司就開(kāi)始為世界3000強(qiáng)企業(yè)提供革命性的分析解決方案。普科公司的總部位于美國(guó)BoiseIdaho,產(chǎn)品和服務(wù)遍及歐亞大陸。普科公司目前支持著全球1600多家大中型客戶(hù),包括AT&T,CompUSA,愛(ài)立信,通用電氣,惠普,TheHomeDepot,PennzoilQuakerState,ReckittBenckiser,Roche,西門(mén)子,USDA,Verizon和富國(guó)銀行等。普科公司是微軟公司長(zhǎng)期的戰(zhàn)略伙伴。普科系列產(chǎn)品完全支持微軟SQLServer2000分析服務(wù)的全部功能。同時(shí)也支持SQL2005Beta版,目前ProClarity最新的版本是6.0。

第3頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品名稱(chēng):互聯(lián)網(wǎng)行業(yè)BI解決方案。版本:V2.0

發(fā)布時(shí)間:2004年3月方案介紹用戶(hù)問(wèn)題——互聯(lián)網(wǎng)行業(yè)商務(wù)智能分析,如網(wǎng)絡(luò)游戲分析:一個(gè)游戲在初期,需要好的創(chuàng)意、策劃、美工、程序等等,但是到了一定的階段后,主要的挑戰(zhàn)將會(huì)是游戲的平衡性。不論是網(wǎng)絡(luò)游戲還是網(wǎng)絡(luò)競(jìng)技,平衡性都是至關(guān)重要的。為什么游戲中總有玩家抱怨不平衡?為什么某些群體的玩家因?yàn)椴黄胶獬膳顺鲇螒??所以游戲的運(yùn)營(yíng)商和廠商需要時(shí)刻監(jiān)控游戲中各個(gè)玩家的行為,防止玩家利用游戲Bug或舞弊來(lái)投機(jī)取巧??梢哉f(shuō)一個(gè)游戲到了后期,平衡性是決定能否成功的關(guān)鍵因素之一。而怎樣才能達(dá)到平衡性呢?這就需要游戲商積極地、動(dòng)態(tài)地、精心地調(diào)整游戲各個(gè)參數(shù)。為了做到這些,游戲商需要時(shí)刻監(jiān)控游戲的運(yùn)行情況。但是隨著玩家十萬(wàn)、百萬(wàn)的增長(zhǎng),我們?cè)鯓觼?lái)監(jiān)控呢?如果發(fā)現(xiàn)游戲中某些異常表現(xiàn),某比如些個(gè)別玩家的成長(zhǎng)、行為與絕大多數(shù)玩家有較大差異。那么其原因可能是利用游戲中的Bug或者某些游戲管理員利用個(gè)人關(guān)系舞弊,上述任何一種情況都是成功游戲的大敵。此外玩家是游戲中真正的“上帝”。玩家的行為、趨勢(shì)也是游戲商最關(guān)心的。但問(wèn)題的難點(diǎn)是如何掌握絕大多數(shù)玩家的趨勢(shì)?特別是這些趨勢(shì)隨時(shí)都可能變化!可以說(shuō)只要掌握了趨勢(shì),就可以預(yù)見(jiàn)未來(lái),就可以贏得未來(lái)。方案特點(diǎn):·客觀分析,隨時(shí)了解游戲的平衡性,使運(yùn)營(yíng)商和廠商進(jìn)行調(diào)整。監(jiān)控游戲運(yùn)行情況,發(fā)現(xiàn)異常情況,最大限度地減少損失。·掌握絕大多數(shù)玩家的趨勢(shì),提前預(yù)測(cè)可能出現(xiàn)的情況。第4頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)案例演示在實(shí)際案例中,邁思奇網(wǎng)游數(shù)據(jù)提取器定期(例如每天)收集游戲中玩家的歷史數(shù)據(jù)。把歷史數(shù)據(jù)經(jīng)過(guò)抽取、轉(zhuǎn)換,導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)(SQLServer2000)。然后進(jìn)一步導(dǎo)入多維數(shù)據(jù)庫(kù)(AnalysisService)。我們用ProClarity(普科的商務(wù)智能工具)搭建分析平臺(tái)。通過(guò)網(wǎng)絡(luò),游戲廠商或運(yùn)營(yíng)商可以隨時(shí)察看分析結(jié)果,從而獲得游戲平衡性的統(tǒng)計(jì),監(jiān)控游戲中的行為,掌握玩家動(dòng)態(tài)。第5頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)SQLServer2005方案:從活躍玩家的統(tǒng)計(jì)情況可看出,各門(mén)派玩家的數(shù)目是不平衡的。桃花島遠(yuǎn)遠(yuǎn)高出一些。同時(shí),桃花島100級(jí)以上的玩家比例較高。如何定義活躍玩家?這是游戲商可以根據(jù)自己的商務(wù)規(guī)則可以靈活定制的。例如,最近一個(gè)月上線超過(guò)3天的游戲者。第6頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)各門(mén)派級(jí)別升級(jí)速度的統(tǒng)計(jì)情況,首先,可以發(fā)現(xiàn),各玩家的級(jí)別增長(zhǎng)不是線性的。由入門(mén)到中層較快,由中層到高手漲速較緩。這是合理的。但是,在同一級(jí)別,往往是桃花島的玩家先到達(dá)這個(gè)高度,可見(jiàn)桃花島的玩家比較容易升級(jí),這是游戲平衡性設(shè)計(jì)的失誤,必須進(jìn)行調(diào)整。第7頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)玩家級(jí)別每日增長(zhǎng)的統(tǒng)計(jì)情況,并且把每日級(jí)別增長(zhǎng)超過(guò)6級(jí)進(jìn)行報(bào)警,可以看出有的玩家一天增長(zhǎng)了194級(jí)或者89級(jí),明顯不正常,很有可能這些玩家在利用游戲中的bug,或者是某管理員的同學(xué)。企業(yè)的規(guī)模越大,越需要自動(dòng)化的監(jiān)控措施。因此,定義一系列的KPI(關(guān)鍵性能指標(biāo))非常重要。所有的KPI都是不需要任何編程,業(yè)務(wù)人員就可以定制的。第8頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)活躍玩家門(mén)派統(tǒng)計(jì)情況的樹(shù)型結(jié)構(gòu)。這種分析方法叫做分解樹(shù),可以從宏觀到具體,一層層了解運(yùn)營(yíng)中的狀況,是非常有效的新型分析手段。本解決方案除了具有上述的各種分析功能外,還有權(quán)限管理控制、各種報(bào)表導(dǎo)出格式、基于Internet的Thin-Client版本,以及個(gè)性化的定制、總經(jīng)理儀表盤(pán)等等。用戶(hù)可以在任何時(shí)間,任何地點(diǎn),不需要安裝任何特殊的軟件,只要通過(guò)瀏覽器,就可以看到全部的分析結(jié)果,還可以在此基礎(chǔ)之上進(jìn)行深層分析。總而言之,邁思奇網(wǎng)游BI解決方案的最大特點(diǎn)就是:將游戲中瞬息萬(wàn)變的海量數(shù)據(jù)轉(zhuǎn)化為每一個(gè)業(yè)務(wù)人員都需要的信息。由此帶來(lái)的決策支持,風(fēng)險(xiǎn)預(yù)警等效益直接為游戲商帶來(lái)商業(yè)價(jià)值。本方案基于Microsoft的主要產(chǎn)品及平臺(tái)技術(shù)·MicrosoftSQLServer2000·MicrosoftSQLServer2000AnalysisService此外,使用了美國(guó)ProClarity公司的產(chǎn)品作為前端工具以及商務(wù)邏輯定制器。第9頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.1引言各個(gè)領(lǐng)域大量的數(shù)據(jù)(如銀行每天巨額的交易數(shù)據(jù))蘊(yùn)藏著豐富信息,如何處理這些數(shù)據(jù)得到有益的信息,人們進(jìn)行了探索,推動(dòng)了數(shù)據(jù)庫(kù)技術(shù)的發(fā)展。數(shù)據(jù)庫(kù)的定義:數(shù)據(jù)是數(shù)據(jù)的集合,由具有統(tǒng)一形式存放在外存中,并可被應(yīng)用所共享。面對(duì)潮水般的數(shù)據(jù),人們不滿(mǎn)足數(shù)據(jù)庫(kù)查詢(xún),提出了深層次問(wèn)題。能不能從數(shù)據(jù)挖掘中提取信息或知識(shí)為決策服務(wù)。數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)綜合的解決方案,主要用來(lái)幫助企業(yè)有關(guān)部門(mén)和業(yè)務(wù)人員做出更符合業(yè)務(wù)發(fā)展規(guī)律的決策。數(shù)據(jù)倉(cāng)庫(kù)的定義:數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用于支持管理決策過(guò)程。第10頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)第11頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.1.1商務(wù)智能商務(wù)智能商務(wù)智能是企業(yè)利用現(xiàn)代信息技術(shù)收集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累計(jì)商務(wù)知識(shí)和見(jiàn)解,改善商務(wù)決策水平,采取有效的商務(wù)行動(dòng),完善各種商務(wù)流程,提升各方面商務(wù)績(jī)效,增強(qiáng)綜合競(jìng)爭(zhēng)力的智慧和能力。數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)是組織處理信息及實(shí)現(xiàn)商務(wù)智能最常用的方法(不同點(diǎn))數(shù)據(jù)庫(kù)管理系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)挖掘工具是完成信息處理和商務(wù)智能的常用工具??赡苌婕暗募夹g(shù)有:MIS、DSS、數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、數(shù)據(jù)整合與清洗工具、查詢(xún)和報(bào)告工具、在線分析處理工具、數(shù)據(jù)挖掘等。第12頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)第13頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.1.2兩種信息處理類(lèi)型:P521.聯(lián)機(jī)事務(wù)處理(OLTP)–OLTP的基礎(chǔ)是數(shù)據(jù)庫(kù),完成對(duì)基本數(shù)據(jù)的增刪改查。2.聯(lián)機(jī)分析處理(OLAP)–OLAP的基礎(chǔ)是數(shù)據(jù)倉(cāng)庫(kù),完成對(duì)數(shù)據(jù)的分析處理,用于支持決策。第14頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.2關(guān)系數(shù)據(jù)庫(kù)模型P53數(shù)據(jù)庫(kù)–是存儲(chǔ)在外存上的可共享的信息集合。能夠按照信息的邏輯結(jié)構(gòu)對(duì)其進(jìn)行組織存取.關(guān)系型數(shù)據(jù)庫(kù)–采用一系列二維表或文件來(lái)存儲(chǔ)信息.關(guān)系–實(shí)際上一個(gè)關(guān)系就是一張二維表.關(guān)系數(shù)據(jù)庫(kù)由兩部分組成:1.信息的邏輯結(jié)構(gòu),相當(dāng)于日常填的表格。2.信息的具體內(nèi)容,基本的數(shù)據(jù),相當(dāng)于表格填寫(xiě)的內(nèi)容。第15頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)是有序數(shù)據(jù)的集合學(xué)號(hào) 姓名 班級(jí) 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男學(xué)生信息第16頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)一個(gè)關(guān)系就是一個(gè)二維表格,也叫表。學(xué)號(hào) 姓名 班級(jí)出生年月性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男學(xué)生信息行記錄列字段

第17頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)關(guān)鍵字是能夠惟一地決定一個(gè)記錄的字段或字段的集合。每個(gè)表至少有一個(gè)關(guān)鍵字,可以有多個(gè)。學(xué)號(hào) 姓名 班級(jí) 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男關(guān)鍵字

第18頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)外部關(guān)鍵字反映了表與表之間的關(guān)系編號(hào) 名稱(chēng) 專(zhuān)業(yè) 系別

8971 物理971 物理 物理系10971 應(yīng)數(shù)971 應(yīng)用數(shù)學(xué) 數(shù)學(xué)系10972 應(yīng)數(shù)972 應(yīng)用數(shù)學(xué) 數(shù)學(xué)系15951 電子951 應(yīng)用電子學(xué) 自動(dòng)化系學(xué)號(hào) 姓名 班級(jí) 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男外部關(guān)鍵字

第19頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)表是存放數(shù)據(jù)的對(duì)象表是記錄的集合記錄是一個(gè)完整的數(shù)據(jù),由字段組成一個(gè)字段對(duì)應(yīng)表的一列(字段名、字段值)學(xué)號(hào) 姓名 班級(jí) 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男記錄字段第20頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.2.0數(shù)據(jù)庫(kù)管理系統(tǒng)——從應(yīng)用的觀點(diǎn)理解P58基本組成:DBMS引擎、數(shù)據(jù)定義子系統(tǒng)、數(shù)據(jù)操作子系統(tǒng)、應(yīng)用程序生成子系統(tǒng)、數(shù)據(jù)管理子系統(tǒng)3.2.1信息收集(參P54)主要收集基本的業(yè)務(wù)數(shù)據(jù),并進(jìn)行分類(lèi)。為下面的建立數(shù)據(jù)庫(kù)表打下良好的基礎(chǔ)。第21頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.2.2建立數(shù)據(jù)庫(kù)的基本過(guò)程(參P55~59)創(chuàng)建數(shù)據(jù)庫(kù)表結(jié)構(gòu)(還可進(jìn)行修改)在建立數(shù)據(jù)庫(kù)時(shí),首先要?jiǎng)?chuàng)建數(shù)據(jù)字典.數(shù)據(jù)字典包括了信息的邏輯結(jié)構(gòu).實(shí)際上建立數(shù)據(jù)庫(kù)表的結(jié)構(gòu):數(shù)據(jù)庫(kù)庫(kù)結(jié)構(gòu)(數(shù)據(jù)庫(kù)名、表名、字段名、各項(xiàng)的定義)其它概念:記錄,為一行數(shù)據(jù)。輸入有關(guān)數(shù)據(jù)(增刪改查?。┑?2頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)文件菜單第23頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)創(chuàng)建空數(shù)據(jù)庫(kù)使用數(shù)據(jù)庫(kù)向?qū)д?qǐng)選擇……第24頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)表表向?qū)У?5頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)關(guān)鍵字索引插入行刪除行屬性生成器數(shù)據(jù)庫(kù)窗口新對(duì)象工具欄按鈕第26頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)格式工具表工具視圖編輯工具排序工具篩選工具查找新記錄刪除記錄記錄選定器字段選定器記錄定位按鈕記錄編號(hào)第27頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)視圖第28頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)表視圖第29頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.2.3信息內(nèi)部的邏輯聯(lián)系主鍵Primarykey–指能夠唯一確定一個(gè)記錄的字段名P55外鍵Foreignkey–是取自另一個(gè)文件的主鍵P563.2.4內(nèi)在的完整性約束(參P57)完整性約束有利于保證信息的合理性.采用數(shù)據(jù)庫(kù)管理系統(tǒng),如MicrosoftOffice的Access數(shù)據(jù)庫(kù),建立一個(gè)本班學(xué)生通訊數(shù)據(jù)庫(kù),你認(rèn)為主要步驟有幾步?主要文件應(yīng)該有哪些字段名,數(shù)據(jù)類(lèi)型是什么?第30頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)實(shí)施參照完整性約束關(guān)系類(lèi)型第31頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.3數(shù)據(jù)庫(kù)管理系統(tǒng)工具——P57書(shū)上觀點(diǎn)數(shù)據(jù)庫(kù)管理系統(tǒng)可以定義數(shù)據(jù)庫(kù)的邏輯結(jié)構(gòu),并對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行存取和應(yīng)用。數(shù)據(jù)庫(kù)管理系統(tǒng)包括以下組成:DBMS引擎數(shù)據(jù)定義子系統(tǒng)數(shù)據(jù)操作子系統(tǒng)應(yīng)用程序生成子系統(tǒng)數(shù)據(jù)管理子系統(tǒng)DBMS引擎-處理來(lái)自其它子系統(tǒng)的查詢(xún)等請(qǐng)求,并將其轉(zhuǎn)換為對(duì)應(yīng)的物理表達(dá)。物理視圖–是在存儲(chǔ)設(shè)備中如何將信息進(jìn)行物理安排、存儲(chǔ)、應(yīng)用的表現(xiàn)方法。邏輯視圖–重點(diǎn)是如何安排和存取信息,以滿(mǎn)足特定的業(yè)務(wù)需求。第32頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.3.1數(shù)據(jù)定義子系統(tǒng)數(shù)據(jù)定義子系統(tǒng)–幫助人們建立并維護(hù)數(shù)據(jù)庫(kù)中的文件結(jié)構(gòu)。幫助建立數(shù)據(jù)字典。信息的邏輯結(jié)構(gòu)——主要在建立數(shù)據(jù)庫(kù)文件結(jié)構(gòu)時(shí)考慮重點(diǎn):字段名、類(lèi)型、寬度、小數(shù)位

行業(yè)透視用數(shù)據(jù)庫(kù)技術(shù)建立客戶(hù)的個(gè)性化視圖如MetLife公司創(chuàng)建一個(gè)允許顧客通過(guò)Internet訪問(wèn)的數(shù)據(jù)庫(kù)環(huán)境。它們的銀行服務(wù)、投資服務(wù)、人壽保險(xiǎn)和金融策劃還未包含在個(gè)性化數(shù)據(jù)庫(kù)中。第33頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.3.2數(shù)據(jù)操作子系統(tǒng)P59數(shù)據(jù)操作子系統(tǒng)–提供數(shù)據(jù)庫(kù)中的記錄增加、修改和刪除功能,提供用戶(hù)的操作界面。主要工具有:視圖、報(bào)表生成器、查詢(xún)工具和SQL查詢(xún)語(yǔ)言。1視圖–查看數(shù)據(jù)庫(kù)文件的內(nèi)容,對(duì)其進(jìn)行必要的修改、分類(lèi)等。2報(bào)表生成器–快速定義報(bào)表格式,確定要發(fā)布的信息。3查詢(xún)工具QBE第34頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)單擊此外增加新記錄排序↓

↑,望遠(yuǎn)鏡查詢(xún)第35頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)查詢(xún)工具(QBE)-幫助用戶(hù)以圖表的方式設(shè)計(jì)問(wèn)題的答案。QBE格柵選擇標(biāo)準(zhǔn)第36頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)4結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)–是大多數(shù)數(shù)據(jù)庫(kù)環(huán)境下使用的標(biāo)準(zhǔn)的第四代查詢(xún)語(yǔ)言.基本語(yǔ)句格式:SELECT…FROM…WHERE(P92).SELECTPart.[PartNumber],Part.Cost,Employee.[Employee Name],Employee.[EmployeeNumber] FROMPart,Employee WHERE(((Part.Cost)>10));3.3.3應(yīng)用程序生成系統(tǒng)P63應(yīng)用程序生成系統(tǒng)是一種常用的開(kāi)發(fā)工具,幫助用戶(hù)建立面向?qū)ο笫聞?wù)的應(yīng)用程序。數(shù)據(jù)輸入界面DBMS定義管理公共程序編制語(yǔ)言第37頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.3.4數(shù)據(jù)管理子系統(tǒng)P63數(shù)據(jù)管理子系統(tǒng)-是數(shù)據(jù)庫(kù)管理環(huán)境,其功能:查詢(xún)優(yōu)化、數(shù)據(jù)備份恢復(fù)、并發(fā)控制和更新管理.備份和恢復(fù)工具:定期將數(shù)據(jù)庫(kù)保存的信息進(jìn)行備份.在信息被損環(huán)的情況下重新保存和恢復(fù).安全管理工具–提供用戶(hù)存取、查詢(xún)信息的權(quán)限管理.查詢(xún)優(yōu)化工具–提供給用戶(hù)查詢(xún)功能,以在最小時(shí)間內(nèi)響應(yīng).重組工具–在信息存取過(guò)程中進(jìn)行實(shí)時(shí)維護(hù).并發(fā)控制工具–保證多人同時(shí)存取、修改信息的合法性.第38頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.4數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘P643.4.1數(shù)據(jù)倉(cāng)庫(kù)引出:了解上月皮鞋銷(xiāo)售總收益額,簡(jiǎn)單查詢(xún)即可。但是“實(shí)際銷(xiāo)售額與預(yù)算額比較、與過(guò)去5年同期銷(xiāo)售比較,了解在東南和西南地區(qū)上月銷(xiāo)售了多少雙黑色的42號(hào)皮鞋”,需要更深入的設(shè)計(jì)。只利用數(shù)據(jù)庫(kù)不夠。數(shù)據(jù)倉(cāng)庫(kù)–信息的邏輯集合–來(lái)自不同的業(yè)務(wù)數(shù)據(jù)庫(kù),將創(chuàng)建商務(wù)智能,以便支持企業(yè)的分析活動(dòng)和決策任務(wù)。數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)綜合的解決方案,主要用來(lái)幫助企業(yè)有關(guān)部門(mén)和業(yè)務(wù)人員做出更符合業(yè)務(wù)發(fā)展規(guī)律的決策。數(shù)據(jù)倉(cāng)庫(kù)的定義:數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用于支持管理決策過(guò)程。1數(shù)據(jù)倉(cāng)庫(kù)具有多維性.2數(shù)據(jù)倉(cāng)庫(kù)支持決策而非事務(wù)處理。僅支持在線分析處理(OLAP).第39頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.4.2數(shù)據(jù)挖掘工具P66數(shù)據(jù)挖掘工具–是用戶(hù)對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行信息查詢(xún)的軟件工具查詢(xún)和報(bào)表工具–類(lèi)似于QBE工具,SQL語(yǔ)言和典型的報(bào)表生成器.智能代理–運(yùn)用人工智能工具以形成信息發(fā)現(xiàn)的信息基礎(chǔ),并創(chuàng)建商務(wù)智能。如華爾街股票分析軟件,結(jié)合神經(jīng)網(wǎng)絡(luò)為股票和交易制定規(guī)則。多維分析工具(MDA)–允許人們從不同的角度觀察多維信息,主要是切片和切塊技術(shù)。統(tǒng)計(jì)工具–利用各種數(shù)據(jù)模型將信息存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中。數(shù)據(jù)倉(cāng)庫(kù)工具技術(shù)基本查詢(xún)及報(bào)表前端工具在線分析處理(OLAP)數(shù)據(jù)挖掘(Datamining,DM)DSS等第40頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)3.4.3數(shù)據(jù)集市–小型的數(shù)據(jù)倉(cāng)庫(kù)P68數(shù)據(jù)集市是數(shù)據(jù)倉(cāng)庫(kù)的子集,僅聚集了部分?jǐn)?shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù).3.4.4數(shù)據(jù)挖掘?yàn)槁殬I(yè)生涯創(chuàng)造機(jī)會(huì)P69掌握工具為自已增加競(jìng)爭(zhēng)力。第41頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘與數(shù)據(jù)管理——補(bǔ)充數(shù)據(jù)倉(cāng)庫(kù)是以信息主題為核心,從不同功能性數(shù)據(jù)庫(kù)中直接取得可用的數(shù)據(jù)源。傳統(tǒng)的數(shù)據(jù)庫(kù)適全特定和例行的數(shù)據(jù)處理需求。但數(shù)據(jù)庫(kù)要同時(shí)滿(mǎn)足例行+復(fù)雜查詢(xún)處理要求。決策支持的數(shù)據(jù)庫(kù)。MCI電話(huà)公司:趨勢(shì)分析、估算銷(xiāo)售成本(電影市場(chǎng):20~50%銷(xiāo)售廣告成本,5000影幕,3年)、客戶(hù)維持率,以選擇更便宜有效的銷(xiāo)售方式。Wal-mart:分析顧客每次采購(gòu)物品、時(shí)間及擺放地點(diǎn)等,找出關(guān)聯(lián)性,以決定每一家店的進(jìn)貨方式、促銷(xiāo)戰(zhàn)略與店面貨物的最有效排列方式。美聯(lián)邦住宅局:數(shù)據(jù)倉(cāng)庫(kù)將10年來(lái)分散于70個(gè)系統(tǒng)中預(yù)算及會(huì)計(jì)數(shù)據(jù)整合起來(lái),供預(yù)算分析、支出分析、趨勢(shì)分析、方案評(píng)比和政策分析之用。Visa會(huì)員銀行:分析,發(fā)現(xiàn)欺詐的行為模式,減少16%偽造信息卡損失。思考:數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘主要利用什么數(shù)據(jù)?解決什么問(wèn)題?第42頁(yè),共47頁(yè),2023年,2月20日,星期五第三章數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)比較數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)無(wú)重復(fù)數(shù)據(jù)重復(fù)詳細(xì)、少量匯總(微觀)詳細(xì)、少量匯總(宏觀)數(shù)據(jù)處理量(數(shù)個(gè)月)數(shù)據(jù)處理量(5-10年)經(jīng)常異動(dòng)不常異動(dòng)提供作業(yè)層管理層服務(wù)每日交易的操作(增刪改查?。┲С止芾頉Q策需求(查詢(xún)打印)在線交易處理(OLTP)在線分析處理(OLAP)操作有效

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論