數(shù)據(jù)管理技術(shù)課件_第1頁
數(shù)據(jù)管理技術(shù)課件_第2頁
數(shù)據(jù)管理技術(shù)課件_第3頁
數(shù)據(jù)管理技術(shù)課件_第4頁
數(shù)據(jù)管理技術(shù)課件_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)管理技術(shù)管理信息系統(tǒng)數(shù)據(jù)管理技術(shù)管理信息系統(tǒng)12引例

舉一個簡單的例子,我們每個人都有不少親朋好友,為了保持與他們的聯(lián)系,我們常常用一個筆記本將他們的姓名、地址、電話等信息都記錄下來,這樣,要查誰的電話或地址就很方便了。這個“通訊錄”就是一個最簡單的“數(shù)據(jù)庫”,每個人的姓名、地址、電話等信息就是這個數(shù)據(jù)庫中的“數(shù)據(jù)”。我們可以在筆記本這個“數(shù)據(jù)庫”中添加新朋友的個人信息,也可以由于某個朋友的電話變動而修改他的電話號碼這個“數(shù)據(jù)”。當然,如果你沒有什么秘密的話,你的朋友也可以通過這個筆記本查找相關(guān)信息。1.1數(shù)據(jù)管理技術(shù)概述2引例舉一個簡單的例子,我們每個人都有不少親朋3

在我們的生活中這樣的“數(shù)據(jù)庫”隨處可見。圖書管理員在查找一本書時,首先要通過目錄檢索找到那本書的分類號和書號,然后在書庫找到那一類書的書架,并在那個書架上按照書號的大小次序查找,這樣很快就能找到我所需要的書。數(shù)據(jù)庫里的數(shù)據(jù)像圖書館里的圖書一樣,也要讓人能夠很方便地找到才行。如果所有的書都不按規(guī)則,胡亂堆在各個書架上,那么借書的人根本就沒有辦法找到他們想要的書。同樣的道理,如果把很多數(shù)據(jù)胡亂地堆放在一起,讓人無法查找,這種數(shù)據(jù)集合也不能稱為“數(shù)據(jù)庫”。1.1數(shù)據(jù)管理技術(shù)概述

存儲在計算機內(nèi)的、為實現(xiàn)一定目的而按某種規(guī)則組織起來的、可共享的“數(shù)據(jù)”的“集合”。數(shù)據(jù)庫3在我們的生活中這樣的“數(shù)據(jù)庫”隨處可見。圖書管理41.1數(shù)據(jù)管理技術(shù)概述

人工系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫管理數(shù)據(jù)管理技術(shù)的發(fā)展程序1數(shù)據(jù)集1程序2數(shù)據(jù)集2程序n數(shù)據(jù)集n……數(shù)據(jù)庫程序1程序2程序3DBMS文件1文件1文件1程序1程序2程序3文件系統(tǒng)41.1數(shù)據(jù)管理技術(shù)概述人工系統(tǒng)451.2數(shù)據(jù)庫的特點

數(shù)據(jù)結(jié)構(gòu)化是數(shù)據(jù)庫與文件系統(tǒng)的根本區(qū)別。數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)具有整體的結(jié)構(gòu)化。不僅數(shù)據(jù)是結(jié)構(gòu)化的,而且存取數(shù)據(jù)的方式也很靈活,可以存取數(shù)據(jù)庫中的某一個數(shù)據(jù)項、一組數(shù)據(jù)項。一個記錄或一組記錄。1.數(shù)據(jù)結(jié)構(gòu)化例如,一個學(xué)生人事記錄文件,每個記錄都有如圖的記錄格式。學(xué)號姓名性別系別年齡政治面貌……00001張三男管理19團員00002王東男經(jīng)濟18團員51.2數(shù)據(jù)庫的特點數(shù)據(jù)結(jié)構(gòu)化是數(shù)據(jù)庫561.2數(shù)據(jù)庫的特點

數(shù)據(jù)共享可以大大減少數(shù)據(jù)冗余,節(jié)約存儲空間。數(shù)據(jù)共享還能夠避免數(shù)據(jù)之間的不相容性與不一致性。2.數(shù)據(jù)的共享性高,冗余度低,易擴充包括數(shù)據(jù)的物理獨立性和數(shù)據(jù)的邏輯獨立性3.數(shù)據(jù)獨立性高

①數(shù)據(jù)的安全性保護②數(shù)據(jù)的完整性檢查

③并發(fā)控制④數(shù)據(jù)庫恢復(fù)4.數(shù)據(jù)由DBMS統(tǒng)一管理和控制61.2數(shù)據(jù)庫的特點數(shù)據(jù)共享可以大大減少67引語

當你聽到“數(shù)據(jù)倉庫(DataWarehousing)”這個詞時會想到什么呢?你會想到這也許是一個滿是貨架的房間,但貨架上的物品是很特殊的,它們是按一定次序存放的各種信息,等待用戶提取。1.3數(shù)據(jù)倉庫

假設(shè)你確實是這么想的,那么恭喜你已經(jīng)向數(shù)據(jù)倉庫邁進了一步。那到底數(shù)據(jù)倉庫和傳統(tǒng)倉庫相比有什么不同呢

7引語當你聽到“數(shù)據(jù)倉庫(DataWareh8

首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。1.3數(shù)據(jù)倉庫

是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉庫(DataWarehouse)8首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不91.3數(shù)據(jù)倉庫數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織1.面向主題的數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個企業(yè)的一致的全局信息2.集成的RDBMS的數(shù)據(jù)通常實時更新。數(shù)據(jù)倉庫中有大量的查詢操作,修改和刪除操作很少,只需要定期地加載和刷新。3.相對穩(wěn)定的

數(shù)據(jù)倉庫中通常包含歷史信息,記錄了企業(yè)從過去某一時點到目前的各個階段的信息。4.反映歷史變化的數(shù)據(jù)倉庫的特點91.3數(shù)據(jù)倉庫數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組910思考

為什么要建“數(shù)據(jù)倉庫(DataWarehousing)”?1.3數(shù)據(jù)倉庫

數(shù)據(jù)倉庫具有將信息轉(zhuǎn)換成知識的潛在能力,顧客的深層次信息可以潛在地傳送給經(jīng)理。1.管理中的問題

現(xiàn)有系統(tǒng)不合適,以及缺少商業(yè)信息。許多產(chǎn)品系統(tǒng)無法滿足商業(yè)用戶的需要。2.現(xiàn)有系統(tǒng)的現(xiàn)狀10思考為什么要建“數(shù)據(jù)倉庫(DataWar111.3數(shù)據(jù)倉庫

數(shù)據(jù)倉庫收集的只是那些進行決策所需的信息。比如MasterCard(萬事達)公司和它的數(shù)據(jù)倉庫,以及MasterCard的聯(lián)機系統(tǒng)。該公司的數(shù)據(jù)倉庫除了其是世界上最大的數(shù)據(jù)倉庫這一事實之外,還可以為與它合作的銀行、商店、飯店等合作伙伴挖掘有價值的信息。如果你正在為一家飯店工作,并想以贈機票的方式作為促銷活動的一部分,那么MasterCard的數(shù)據(jù)倉庫可以為顧客建立這樣的聯(lián)機分析查詢:“那些經(jīng)常最少一月兩次來往我們飯店的顧客,他們喜歡去的目的地是哪兒?”111.3數(shù)據(jù)倉庫數(shù)據(jù)倉庫收集12思考

為什么需要數(shù)據(jù)挖掘(DataMining)?1.4數(shù)據(jù)挖掘

當今數(shù)據(jù)庫的容量已經(jīng)達到上萬億(T)的水平——1,000,000,000,000個字節(jié)。在這些大量數(shù)據(jù)的背后隱藏了很多具有決策意義的信息,那么怎么得到這些“知識”呢?也就是怎樣通過一顆顆的樹木了解到整個森林的情況呢?12思考為什么需要數(shù)據(jù)挖掘(DataMini13人們在日常生活中經(jīng)常會遇到這樣的情況:超市的經(jīng)營者希望將經(jīng)常被同時購買的商品放在一起,以增加銷售;保險公司想知道購買保險的客戶一般具有哪些特征;醫(yī)學(xué)研究人員希望從已有的成千上萬份病歷中找出患某種疾病的病人的共同特征,從而為治愈這種疾病提供一些幫助;……1.4數(shù)據(jù)挖掘13人們在日常生活中經(jīng)常會遇到這樣的情況:1.4數(shù)據(jù)挖掘141.4數(shù)據(jù)挖掘如何在堆積如山的企業(yè)交易數(shù)據(jù)中發(fā)現(xiàn)具有商業(yè)價值的閃光點?如何使您的企業(yè)或組織在激烈的市場競爭中保持對客戶的吸引力?如何預(yù)先發(fā)現(xiàn)和避免企業(yè)運作過程中不易察覺的商業(yè)風險?141.4數(shù)據(jù)挖掘如何在堆積如山的企業(yè)交易數(shù)據(jù)中151.4數(shù)據(jù)挖掘

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,電子化數(shù)據(jù)越來越多,據(jù)估計,全球的信息量每20個月翻一番。人們正面臨著“數(shù)據(jù)豐富而知識貧乏”的狀況。然而,人們目前所使用的數(shù)據(jù)庫技術(shù)無法將隱藏在數(shù)據(jù)背后的重要信息挖掘出來利用。所以如何迅速、準確、有效但適量地提供用戶所需的信息,發(fā)現(xiàn)信息之間潛在的聯(lián)系,支持管理決策就是數(shù)據(jù)挖掘和數(shù)據(jù)倉庫要解決的課題。我們會淹死在數(shù)據(jù)中,但卻為信息、知識所餓!20年前因為數(shù)據(jù)太少而查不到數(shù)據(jù),20年后因為數(shù)據(jù)太多而查不到數(shù)據(jù)151.4數(shù)據(jù)挖掘隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,電子化數(shù)161.4數(shù)據(jù)挖掘

計算機科學(xué)對這個問題給出的最新回答就是:數(shù)據(jù)挖掘,在“數(shù)據(jù)礦山”中找到蘊藏的“知識金塊”,幫助企業(yè)減少不必要投資的同時提高資金回報。數(shù)據(jù)挖掘給企業(yè)帶來的潛在的投資回報幾乎是無止境的。世界范圍內(nèi)具有創(chuàng)新性的公司都開始采用數(shù)據(jù)挖掘技術(shù)來判斷哪些是他們的最有價值客戶,重新制定他們的產(chǎn)品推廣策略(把產(chǎn)品推廣給最需要他們的人),以用最小的花費得到最好的銷售。161.4數(shù)據(jù)挖掘計算機科學(xué)對17

在數(shù)據(jù)挖掘中發(fā)現(xiàn)的知識,并不是嶄新的自然科學(xué)定理或者數(shù)學(xué)公式,而是數(shù)據(jù)之間存在的某一種關(guān)聯(lián)。這種關(guān)聯(lián)對不同的人呈現(xiàn)出完全不同的價值,比如,購買果醬的人60%同時購買了面包,對超市經(jīng)營者是非常難得的商業(yè)信息,而對消費者而言,幾乎沒有任何意義。

從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的,人們事先難以預(yù)計的,潛在的有價值信息和知識的過程。數(shù)據(jù)挖掘(DataWarehouse)1.4數(shù)據(jù)挖掘17在數(shù)據(jù)挖掘中發(fā)現(xiàn)的知識,并不是嶄新的自然科學(xué)定理18

1.4數(shù)據(jù)挖掘案例閱讀

閱讀書中案例,體會什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘經(jīng)典案例——啤酒與尿布181.4數(shù)據(jù)挖掘案例閱讀閱讀書中案例,191.4數(shù)據(jù)挖掘啤酒與尿布的故事

某大型超市發(fā)現(xiàn)每到周末,啤酒與尿布的銷量就會同時大增,這是什么原因呢?經(jīng)過研究人員分析發(fā)現(xiàn),原來家里的太太們讓丈夫們?nèi)コ薪o孩子買尿布,而丈夫們在買尿布的時候往往順便買上幾瓶啤酒回去喝。這樣就產(chǎn)生了這個比較奇怪的現(xiàn)象。191.4數(shù)據(jù)挖掘啤酒與尿布的故事某201.4數(shù)據(jù)挖掘啤酒與尿布的故事

沃爾瑪早年利用NCR數(shù)據(jù)倉庫技術(shù),對商品進行市場類組分析,即分析哪些商品顧客最有希望一起購買。沃爾瑪利用NCR自動數(shù)據(jù)挖掘工具(模式識別軟件)對一年多詳細的原始交易數(shù)據(jù)進行分析和挖掘。一個意外的發(fā)現(xiàn)就是:跟尿布一起購買最多的商品竟是啤酒!沃爾瑪就在它的一個個商店里將它們并排擺放在一起,結(jié)果是尿布與啤酒的銷售量雙雙增長。201.4數(shù)據(jù)挖掘啤酒與尿布的故事211.4數(shù)據(jù)挖掘清晰地定義出業(yè)務(wù)問題1.確定業(yè)務(wù)對象取出一個問題相關(guān)的樣板數(shù)據(jù)子集2.數(shù)據(jù)的選擇數(shù)據(jù)集成和數(shù)據(jù)清理3.數(shù)據(jù)的預(yù)處理轉(zhuǎn)換成一個針對挖掘算法建立的分析模型4.數(shù)據(jù)的轉(zhuǎn)換進行關(guān)聯(lián)規(guī)則、序列模式、分類、聚集等各項分析5.數(shù)據(jù)挖掘用圖表、圖形曲線等為用戶提供清晰、直觀的結(jié)果描述6.結(jié)果的解釋及評價數(shù)據(jù)挖掘的過程211.4數(shù)據(jù)挖掘清晰地定義出業(yè)務(wù)問題1.確221.4數(shù)據(jù)挖掘在證券業(yè)的應(yīng)用:可處理客戶分析、帳戶分析、證券交易數(shù)據(jù)分析、非資金交易分析等多個業(yè)界關(guān)心的主題,為客戶提供針對其個人習(xí)慣、投資組合的投資建議,從而真正作到對客戶的貼心服務(wù)。在稅務(wù)領(lǐng)域的應(yīng)用:

可以解決三個方面的問題:一是查出應(yīng)稅未報者和瞞稅漏稅者,并對其進行跟蹤;二是對不同行業(yè)、產(chǎn)品和市場中納稅人的行為特性進行描述,找出普遍規(guī)律,謀求因勢利導(dǎo)的稅務(wù)征稽策略;三是對不同行業(yè)、產(chǎn)品和市場應(yīng)收稅款進行預(yù)測,制定最有效的征收計劃。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域221.4數(shù)據(jù)挖掘在證券業(yè)的應(yīng)用:數(shù)據(jù)挖掘的應(yīng)用231.4數(shù)據(jù)挖掘在銀行領(lǐng)域的應(yīng)用:

防范銀行的經(jīng)營風險、實現(xiàn)科學(xué)管理以及進行決策.

在保險業(yè)的應(yīng)用:

滿足保險行業(yè)日益增長的各種查詢、統(tǒng)計、報表以及分析的需求,提高防范和化解經(jīng)營風險的能力,有效利用這些數(shù)據(jù)來實現(xiàn)經(jīng)營目標,預(yù)測保險業(yè)的發(fā)展趨勢,甚至利用這些數(shù)據(jù)來設(shè)計保險企業(yè)的發(fā)展宏圖,在激烈的競爭中贏得先機.數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域231.4數(shù)據(jù)挖掘在銀行領(lǐng)域的應(yīng)用:數(shù)據(jù)挖掘的應(yīng)謝謝觀看!管理信息系統(tǒng)謝謝觀看!管理信息系統(tǒng)24數(shù)據(jù)管理技術(shù)管理信息系統(tǒng)數(shù)據(jù)管理技術(shù)管理信息系統(tǒng)2526引例

舉一個簡單的例子,我們每個人都有不少親朋好友,為了保持與他們的聯(lián)系,我們常常用一個筆記本將他們的姓名、地址、電話等信息都記錄下來,這樣,要查誰的電話或地址就很方便了。這個“通訊錄”就是一個最簡單的“數(shù)據(jù)庫”,每個人的姓名、地址、電話等信息就是這個數(shù)據(jù)庫中的“數(shù)據(jù)”。我們可以在筆記本這個“數(shù)據(jù)庫”中添加新朋友的個人信息,也可以由于某個朋友的電話變動而修改他的電話號碼這個“數(shù)據(jù)”。當然,如果你沒有什么秘密的話,你的朋友也可以通過這個筆記本查找相關(guān)信息。1.1數(shù)據(jù)管理技術(shù)概述2引例舉一個簡單的例子,我們每個人都有不少親朋27

在我們的生活中這樣的“數(shù)據(jù)庫”隨處可見。圖書管理員在查找一本書時,首先要通過目錄檢索找到那本書的分類號和書號,然后在書庫找到那一類書的書架,并在那個書架上按照書號的大小次序查找,這樣很快就能找到我所需要的書。數(shù)據(jù)庫里的數(shù)據(jù)像圖書館里的圖書一樣,也要讓人能夠很方便地找到才行。如果所有的書都不按規(guī)則,胡亂堆在各個書架上,那么借書的人根本就沒有辦法找到他們想要的書。同樣的道理,如果把很多數(shù)據(jù)胡亂地堆放在一起,讓人無法查找,這種數(shù)據(jù)集合也不能稱為“數(shù)據(jù)庫”。1.1數(shù)據(jù)管理技術(shù)概述

存儲在計算機內(nèi)的、為實現(xiàn)一定目的而按某種規(guī)則組織起來的、可共享的“數(shù)據(jù)”的“集合”。數(shù)據(jù)庫3在我們的生活中這樣的“數(shù)據(jù)庫”隨處可見。圖書管理281.1數(shù)據(jù)管理技術(shù)概述

人工系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫管理數(shù)據(jù)管理技術(shù)的發(fā)展程序1數(shù)據(jù)集1程序2數(shù)據(jù)集2程序n數(shù)據(jù)集n……數(shù)據(jù)庫程序1程序2程序3DBMS文件1文件1文件1程序1程序2程序3文件系統(tǒng)41.1數(shù)據(jù)管理技術(shù)概述人工系統(tǒng)28291.2數(shù)據(jù)庫的特點

數(shù)據(jù)結(jié)構(gòu)化是數(shù)據(jù)庫與文件系統(tǒng)的根本區(qū)別。數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)具有整體的結(jié)構(gòu)化。不僅數(shù)據(jù)是結(jié)構(gòu)化的,而且存取數(shù)據(jù)的方式也很靈活,可以存取數(shù)據(jù)庫中的某一個數(shù)據(jù)項、一組數(shù)據(jù)項。一個記錄或一組記錄。1.數(shù)據(jù)結(jié)構(gòu)化例如,一個學(xué)生人事記錄文件,每個記錄都有如圖的記錄格式。學(xué)號姓名性別系別年齡政治面貌……00001張三男管理19團員00002王東男經(jīng)濟18團員51.2數(shù)據(jù)庫的特點數(shù)據(jù)結(jié)構(gòu)化是數(shù)據(jù)庫29301.2數(shù)據(jù)庫的特點

數(shù)據(jù)共享可以大大減少數(shù)據(jù)冗余,節(jié)約存儲空間。數(shù)據(jù)共享還能夠避免數(shù)據(jù)之間的不相容性與不一致性。2.數(shù)據(jù)的共享性高,冗余度低,易擴充包括數(shù)據(jù)的物理獨立性和數(shù)據(jù)的邏輯獨立性3.數(shù)據(jù)獨立性高

①數(shù)據(jù)的安全性保護②數(shù)據(jù)的完整性檢查

③并發(fā)控制④數(shù)據(jù)庫恢復(fù)4.數(shù)據(jù)由DBMS統(tǒng)一管理和控制61.2數(shù)據(jù)庫的特點數(shù)據(jù)共享可以大大減少3031引語

當你聽到“數(shù)據(jù)倉庫(DataWarehousing)”這個詞時會想到什么呢?你會想到這也許是一個滿是貨架的房間,但貨架上的物品是很特殊的,它們是按一定次序存放的各種信息,等待用戶提取。1.3數(shù)據(jù)倉庫

假設(shè)你確實是這么想的,那么恭喜你已經(jīng)向數(shù)據(jù)倉庫邁進了一步。那到底數(shù)據(jù)倉庫和傳統(tǒng)倉庫相比有什么不同呢

7引語當你聽到“數(shù)據(jù)倉庫(DataWareh32

首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。1.3數(shù)據(jù)倉庫

是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉庫(DataWarehouse)8首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不331.3數(shù)據(jù)倉庫數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織1.面向主題的數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個企業(yè)的一致的全局信息2.集成的RDBMS的數(shù)據(jù)通常實時更新。數(shù)據(jù)倉庫中有大量的查詢操作,修改和刪除操作很少,只需要定期地加載和刷新。3.相對穩(wěn)定的

數(shù)據(jù)倉庫中通常包含歷史信息,記錄了企業(yè)從過去某一時點到目前的各個階段的信息。4.反映歷史變化的數(shù)據(jù)倉庫的特點91.3數(shù)據(jù)倉庫數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組3334思考

為什么要建“數(shù)據(jù)倉庫(DataWarehousing)”?1.3數(shù)據(jù)倉庫

數(shù)據(jù)倉庫具有將信息轉(zhuǎn)換成知識的潛在能力,顧客的深層次信息可以潛在地傳送給經(jīng)理。1.管理中的問題

現(xiàn)有系統(tǒng)不合適,以及缺少商業(yè)信息。許多產(chǎn)品系統(tǒng)無法滿足商業(yè)用戶的需要。2.現(xiàn)有系統(tǒng)的現(xiàn)狀10思考為什么要建“數(shù)據(jù)倉庫(DataWar351.3數(shù)據(jù)倉庫

數(shù)據(jù)倉庫收集的只是那些進行決策所需的信息。比如MasterCard(萬事達)公司和它的數(shù)據(jù)倉庫,以及MasterCard的聯(lián)機系統(tǒng)。該公司的數(shù)據(jù)倉庫除了其是世界上最大的數(shù)據(jù)倉庫這一事實之外,還可以為與它合作的銀行、商店、飯店等合作伙伴挖掘有價值的信息。如果你正在為一家飯店工作,并想以贈機票的方式作為促銷活動的一部分,那么MasterCard的數(shù)據(jù)倉庫可以為顧客建立這樣的聯(lián)機分析查詢:“那些經(jīng)常最少一月兩次來往我們飯店的顧客,他們喜歡去的目的地是哪兒?”111.3數(shù)據(jù)倉庫數(shù)據(jù)倉庫收集36思考

為什么需要數(shù)據(jù)挖掘(DataMining)?1.4數(shù)據(jù)挖掘

當今數(shù)據(jù)庫的容量已經(jīng)達到上萬億(T)的水平——1,000,000,000,000個字節(jié)。在這些大量數(shù)據(jù)的背后隱藏了很多具有決策意義的信息,那么怎么得到這些“知識”呢?也就是怎樣通過一顆顆的樹木了解到整個森林的情況呢?12思考為什么需要數(shù)據(jù)挖掘(DataMini37人們在日常生活中經(jīng)常會遇到這樣的情況:超市的經(jīng)營者希望將經(jīng)常被同時購買的商品放在一起,以增加銷售;保險公司想知道購買保險的客戶一般具有哪些特征;醫(yī)學(xué)研究人員希望從已有的成千上萬份病歷中找出患某種疾病的病人的共同特征,從而為治愈這種疾病提供一些幫助;……1.4數(shù)據(jù)挖掘13人們在日常生活中經(jīng)常會遇到這樣的情況:1.4數(shù)據(jù)挖掘381.4數(shù)據(jù)挖掘如何在堆積如山的企業(yè)交易數(shù)據(jù)中發(fā)現(xiàn)具有商業(yè)價值的閃光點?如何使您的企業(yè)或組織在激烈的市場競爭中保持對客戶的吸引力?如何預(yù)先發(fā)現(xiàn)和避免企業(yè)運作過程中不易察覺的商業(yè)風險?141.4數(shù)據(jù)挖掘如何在堆積如山的企業(yè)交易數(shù)據(jù)中391.4數(shù)據(jù)挖掘

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,電子化數(shù)據(jù)越來越多,據(jù)估計,全球的信息量每20個月翻一番。人們正面臨著“數(shù)據(jù)豐富而知識貧乏”的狀況。然而,人們目前所使用的數(shù)據(jù)庫技術(shù)無法將隱藏在數(shù)據(jù)背后的重要信息挖掘出來利用。所以如何迅速、準確、有效但適量地提供用戶所需的信息,發(fā)現(xiàn)信息之間潛在的聯(lián)系,支持管理決策就是數(shù)據(jù)挖掘和數(shù)據(jù)倉庫要解決的課題。我們會淹死在數(shù)據(jù)中,但卻為信息、知識所餓!20年前因為數(shù)據(jù)太少而查不到數(shù)據(jù),20年后因為數(shù)據(jù)太多而查不到數(shù)據(jù)151.4數(shù)據(jù)挖掘隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,電子化數(shù)401.4數(shù)據(jù)挖掘

計算機科學(xué)對這個問題給出的最新回答就是:數(shù)據(jù)挖掘,在“數(shù)據(jù)礦山”中找到蘊藏的“知識金塊”,幫助企業(yè)減少不必要投資的同時提高資金回報。數(shù)據(jù)挖掘給企業(yè)帶來的潛在的投資回報幾乎是無止境的。世界范圍內(nèi)具有創(chuàng)新性的公司都開始采用數(shù)據(jù)挖掘技術(shù)來判斷哪些是他們的最有價值客戶,重新制定他們的產(chǎn)品推廣策略(把產(chǎn)品推廣給最需要他們的人),以用最小的花費得到最好的銷售。161.4數(shù)據(jù)挖掘計算機科學(xué)對41

在數(shù)據(jù)挖掘中發(fā)現(xiàn)的知識,并不是嶄新的自然科學(xué)定理或者數(shù)學(xué)公式,而是數(shù)據(jù)之間存在的某一種關(guān)聯(lián)。這種關(guān)聯(lián)對不同的人呈現(xiàn)出完全不同的價值,比如,購買果醬的人60%同時購買了面包,對超市經(jīng)營者是非常難得的商業(yè)信息,而對消費者而言,幾乎沒有任何意義。

從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的,人們事先難以預(yù)計的,潛在的有價值信息和知識的過程。數(shù)據(jù)挖掘(DataWarehouse)1.4數(shù)據(jù)挖掘17在數(shù)據(jù)挖掘中發(fā)現(xiàn)的知識,并不是嶄新的自然科學(xué)定理42

1.4數(shù)據(jù)挖掘案例閱讀

閱讀書中案例,體會什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘經(jīng)典案例——啤酒與尿布181.4數(shù)據(jù)挖掘案例閱讀閱讀書中案例,431.4數(shù)據(jù)挖掘啤酒與尿布的故事

某大型超市發(fā)現(xiàn)每到周末,啤酒與尿布的銷量就會同時大增,這是什么原因呢?經(jīng)過研究人員分析發(fā)現(xiàn),原來家里的太太們讓丈夫們?nèi)コ薪o孩子買尿布,而丈夫們在買尿布的時候往往順便買上幾瓶啤酒回去喝。這樣就產(chǎn)生了這個比較

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論