第四講決策支持的新技術(shù)_第1頁
第四講決策支持的新技術(shù)_第2頁
第四講決策支持的新技術(shù)_第3頁
第四講決策支持的新技術(shù)_第4頁
第四講決策支持的新技術(shù)_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、西南民族大學(xué)計(jì)科學(xué)院第四講決策支持的新技術(shù)決策支持系統(tǒng)第四講 決策支持的新技術(shù)第一節(jié) 數(shù)據(jù)倉庫技術(shù) 4.1.1 數(shù)據(jù)倉庫的基本知識 4.1.2 數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu) 4.1.3 數(shù)據(jù)倉庫的運(yùn)行結(jié)構(gòu) 4.1.4 數(shù)據(jù)集市的結(jié)構(gòu)決策支持系統(tǒng)第四講 決策支持的新技術(shù)第二節(jié) 數(shù)據(jù)挖掘技術(shù) 4.2.1 數(shù)據(jù)挖掘概述 4.2.2 數(shù)據(jù)挖掘基本過程與步驟4.2.3 數(shù)據(jù)挖掘的任務(wù)與挖掘方法4.2.4 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的關(guān)系決策支持系統(tǒng)第四講 決策支持的新技術(shù)第三節(jié) 聯(lián)機(jī)分析處理技術(shù) 4.3.1 基本概念 4.3.2 olap的數(shù)據(jù)組織 4.3.3 olap的多維數(shù)據(jù)分析方法 4.3.4 olap的發(fā)展決策支

2、持系統(tǒng)第四講 決策支持的新技術(shù)4.1.1 數(shù)據(jù)倉庫的基本知識 一.從數(shù)據(jù)庫到數(shù)據(jù)倉庫事務(wù)處理環(huán)境不適宜決策應(yīng)用的主要原因:1.1.事務(wù)處理環(huán)境和分析處理的性能、特性不同事務(wù)處理環(huán)境和分析處理的性能、特性不同2.2.數(shù)據(jù)集成問題數(shù)據(jù)集成問題3.3.數(shù)據(jù)動態(tài)集成問題數(shù)據(jù)動態(tài)集成問題4.4.歷史數(shù)據(jù)問題歷史數(shù)據(jù)問題5.5.數(shù)據(jù)的綜合問題數(shù)據(jù)的綜合問題6.6.不同的使用對象不同的使用對象決策支持系統(tǒng)第四講 決策支持的新技術(shù)4.1.1 數(shù)據(jù)倉庫的基本知識 二.數(shù)據(jù)倉庫的概念 1.w.h.inmon是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用于支持經(jīng)營管理中的決策制定過程。面向主題集成穩(wěn)定隨時(shí)間

3、變化決策支持系統(tǒng)第四講 決策支持的新技術(shù) 2.sas軟件研究所的觀點(diǎn)db數(shù)據(jù)數(shù)據(jù)dw數(shù)據(jù)數(shù)據(jù)細(xì)節(jié)的在存取時(shí)準(zhǔn)確的可更新的操作需求事先可知道事務(wù)驅(qū)動面向應(yīng)用一次操作數(shù)據(jù)量小支持日常操作綜合或提煉的代保過去的數(shù)據(jù)不更新操作需求事先不知道分析驅(qū)動面向分析一次操作數(shù)據(jù)量大支持決策需求決策支持系統(tǒng)第四講 決策支持的新技術(shù) 3.dw 3.dw是作為是作為dssdss的基礎(chǔ)的分析型的基礎(chǔ)的分析型dbdb,用來存,用來存放大容量的只讀數(shù)據(jù),為制定決策提供所需放大容量的只讀數(shù)據(jù),為制定決策提供所需的信息。的信息。 4.dw4.dw是與操作型系統(tǒng)相分離的、基于標(biāo)準(zhǔn)是與操作型系統(tǒng)相分離的、基于標(biāo)準(zhǔn)企業(yè)模型集成的、帶

4、有時(shí)間屬性的,即與企企業(yè)模型集成的、帶有時(shí)間屬性的,即與企業(yè)定義的時(shí)間段相關(guān)的、面向主題且不可更業(yè)定義的時(shí)間段相關(guān)的、面向主題且不可更新的數(shù)據(jù)集合。新的數(shù)據(jù)集合。 5.5.決策支持系統(tǒng)第四講 決策支持的新技術(shù) 三.數(shù)據(jù)倉庫的特點(diǎn)1.數(shù)據(jù)倉庫是面向主題的。2. 數(shù)據(jù)倉庫是集成的。3.數(shù)據(jù)倉庫是穩(wěn)定的。4.數(shù)據(jù)倉庫是隨時(shí)間變化的。5.數(shù)據(jù)倉庫中的數(shù)據(jù)量很大。6.數(shù)據(jù)倉庫軟硬件要求較高。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 四.數(shù)據(jù)庫與數(shù)據(jù)倉庫的區(qū)別1.數(shù)據(jù)庫是面向業(yè)務(wù)的,使用者是企業(yè)的一般業(yè)務(wù)人員,進(jìn)行企業(yè)日常數(shù)據(jù)處理和維護(hù)工作。2.數(shù)據(jù)倉庫是面向決策的,使用者是企業(yè)的高層管理人員,它也是使用關(guān)系

5、數(shù)據(jù)庫,當(dāng)數(shù)據(jù)倉庫不負(fù)責(zé)處理業(yè)務(wù)。3.數(shù)據(jù)庫注重的是企業(yè)運(yùn)行的當(dāng)前數(shù)據(jù),任務(wù)是收集和記錄企業(yè)的原始業(yè)務(wù)數(shù)據(jù),而dw面對的是非即時(shí)性的歷史數(shù)據(jù),通過從業(yè)務(wù)數(shù)據(jù)中提取,加工處理后提供給決策人員。決策支持系統(tǒng)第四講 決策支持的新技術(shù)4.1.2 數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu)關(guān)系關(guān)系數(shù)據(jù)庫數(shù)據(jù)庫數(shù)據(jù)文件數(shù)據(jù)文件其他其他數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)倉庫數(shù)據(jù)倉庫管理工具管理工具抽取抽取轉(zhuǎn)換轉(zhuǎn)換轉(zhuǎn)載轉(zhuǎn)載元數(shù)據(jù)庫元數(shù)據(jù)庫數(shù)據(jù)建數(shù)據(jù)建模工具模工具綜合綜合數(shù)據(jù)數(shù)據(jù)當(dāng)前當(dāng)前數(shù)據(jù)數(shù)據(jù)歷史歷史數(shù)據(jù)數(shù)據(jù)用戶查用戶查詢工具詢工具c/s工具工具olap工具工具dm工具工具決策支持系統(tǒng)第四講 決策支持的新技術(shù)一.數(shù)據(jù)倉庫管理系統(tǒng) 1.定義部件 2.數(shù)據(jù)獲

6、取部件 3.管理部件 4.目錄部件(元數(shù)據(jù)) 5.dbms部件決策支持系統(tǒng)第四講 決策支持的新技術(shù)二.數(shù)據(jù)倉庫的結(jié)構(gòu)構(gòu)成 1.數(shù)據(jù)倉庫的構(gòu)成高度綜合數(shù)據(jù)層高度綜合數(shù)據(jù)層輕度綜合數(shù)據(jù)層輕度綜合數(shù)據(jù)層當(dāng)前基本數(shù)據(jù)層當(dāng)前基本數(shù)據(jù)層歷史基本數(shù)據(jù)層歷史基本數(shù)據(jù)層決策支持系統(tǒng)第四講 決策支持的新技術(shù)二.數(shù)據(jù)倉庫的結(jié)構(gòu)構(gòu)成 2.數(shù)據(jù)倉庫的元數(shù)據(jù)(1 1)關(guān)于數(shù)據(jù)源的元數(shù)據(jù))關(guān)于數(shù)據(jù)源的元數(shù)據(jù)數(shù)據(jù)源中所有的物理數(shù)據(jù)結(jié)構(gòu),包括所有的數(shù)據(jù)項(xiàng)和數(shù)據(jù)類型;所有數(shù)據(jù)項(xiàng)的業(yè)務(wù)定義;每個(gè)數(shù)據(jù)項(xiàng)更新頻率,以及由誰或哪個(gè)過程更新的說明;每個(gè)數(shù)據(jù)項(xiàng)的有效值;其他系統(tǒng)中具有相同業(yè)務(wù)含義的數(shù)據(jù)項(xiàng)的清單。決策支持系統(tǒng)第四講 決策支持的

7、新技術(shù) 2.數(shù)據(jù)倉庫的元數(shù)據(jù)(2 2)關(guān)于數(shù)據(jù)模型的元數(shù)據(jù)關(guān)于數(shù)據(jù)模型的元數(shù)據(jù)i/o對象:支持?jǐn)?shù)據(jù)倉庫i/o操作的各種對象;關(guān)系:兩個(gè)i/o對象之間的關(guān)聯(lián);關(guān)系成員:描述每個(gè)關(guān)系中兩個(gè)i/o對象的具體角色、關(guān)系度以及約束條件;關(guān)系關(guān)鍵字:描述兩個(gè)i/o對象如何建立關(guān)聯(lián)。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 2.數(shù)據(jù)倉庫的元數(shù)據(jù)(3 3)關(guān)于數(shù)據(jù)倉庫映射的元數(shù)據(jù)用該類元數(shù)據(jù)反映數(shù)據(jù)倉庫中的數(shù)據(jù)項(xiàng)是從哪個(gè)特定數(shù)據(jù)源填充的,經(jīng)過哪些轉(zhuǎn)換、變換和加載過程。這類數(shù)據(jù)可以用來生成程序,以完成數(shù)據(jù)的轉(zhuǎn)換工作,即實(shí)現(xiàn)操作型數(shù)據(jù)轉(zhuǎn)換為面向主體的數(shù)據(jù)倉庫的數(shù)據(jù)。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 2.數(shù)據(jù)倉庫的

8、元數(shù)據(jù)(4 4)關(guān)于數(shù)據(jù)倉庫使用的元數(shù)據(jù)元數(shù)據(jù)告訴數(shù)據(jù)倉庫中有什么數(shù)據(jù),它們是從哪兒來的,即如何按主題查看數(shù)據(jù)倉庫的內(nèi)容;元數(shù)據(jù)提供已有的可重復(fù)利用的查詢語言信息。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 2.數(shù)據(jù)倉庫的元數(shù)據(jù)(5 5)元數(shù)據(jù)的作用dw的核心定位數(shù)據(jù)倉庫的目錄作用;數(shù)據(jù)從業(yè)務(wù)環(huán)境向數(shù)據(jù)倉庫傳送時(shí)數(shù)據(jù)的目錄內(nèi)容;指導(dǎo)從當(dāng)前基本數(shù)據(jù)到輕度綜合數(shù)據(jù)、輕度綜合數(shù)據(jù)到高度綜合數(shù)據(jù)的綜合算法的選擇。決策支持系統(tǒng)第四講 決策支持的新技術(shù)三.數(shù)據(jù)倉庫的工具集 1.分析工具 (1 1)查詢工具)查詢工具 (2 2)可視化工具)可視化工具 2.挖掘工具決策支持系統(tǒng)第四講 決策支持的新技術(shù)四.數(shù)據(jù)進(jìn)入d

9、w的過程與建立dw的步驟 1.數(shù)據(jù)進(jìn)入dw的基本過程(教材(教材p221p221)提?。簭牟僮餍蛿?shù)據(jù)庫中選擇并提取所需要的字段;變換:為來自數(shù)據(jù)源的數(shù)據(jù)指定常用的格式和名稱;凈化:更正錯誤的數(shù)據(jù);加載:把凈化過的數(shù)據(jù)載入到dw數(shù)據(jù)里;匯總:提前計(jì)算出任何期待的dw數(shù)據(jù)的匯總供以后使用。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 2.建立dw的步驟收集和分析業(yè)務(wù)需求建立數(shù)據(jù)模型和數(shù)據(jù)倉庫的物理設(shè)計(jì)(包括劃分(包括劃分粒度和數(shù)據(jù)分割兩部分內(nèi)容)粒度和數(shù)據(jù)分割兩部分內(nèi)容)定義數(shù)據(jù)源選擇dw技術(shù)和平臺從操作型db中提取、轉(zhuǎn)換、凈化并加載到dw中選擇訪問和報(bào)表工具選擇db連接軟件選擇數(shù)據(jù)分析和數(shù)據(jù)展示軟件更新

10、dw決策支持系統(tǒng)第四講 決策支持的新技術(shù)4.1.3 數(shù)據(jù)倉庫的運(yùn)行結(jié)構(gòu)dw服務(wù)器服務(wù)器客服端客服端客服端客服端dw服務(wù)器服務(wù)器olap服務(wù)器服務(wù)器兩層c/s結(jié)構(gòu):三層c/s結(jié)構(gòu):決策支持系統(tǒng)第四講 決策支持的新技術(shù)4.1.4 數(shù)據(jù)集市的結(jié)構(gòu)一.數(shù)據(jù)集市的概念數(shù)據(jù)集市是指具有特定應(yīng)用的數(shù)據(jù)倉庫,主要數(shù)據(jù)集市是指具有特定應(yīng)用的數(shù)據(jù)倉庫,主要針對某個(gè)具體戰(zhàn)略意義的應(yīng)用或具體部門級的針對某個(gè)具體戰(zhàn)略意義的應(yīng)用或具體部門級的應(yīng)用,支持用戶利用已有的數(shù)據(jù)獲得重要的競應(yīng)用,支持用戶利用已有的數(shù)據(jù)獲得重要的競爭優(yōu)勢或找到進(jìn)入新市場的具體解決方案。爭優(yōu)勢或找到進(jìn)入新市場的具體解決方案。決策支持系統(tǒng)第四講 決策支

11、持的新技術(shù)二.數(shù)據(jù)集市的特點(diǎn)1.規(guī)模是小的; 2.特定的應(yīng)用;3.面向部門;4.由業(yè)務(wù)部門定義、設(shè)計(jì)、開發(fā)、管理和維護(hù);5.快速實(shí)現(xiàn); 6.購買較便宜;7.投資快速回收; 8.工具集的緊密集成;9.更詳細(xì)的、預(yù)先存在的數(shù)據(jù)倉庫的摘要子集;10.可升級到完整的數(shù)據(jù)倉庫。決策支持系統(tǒng)第四講 決策支持的新技術(shù)三.數(shù)據(jù)集市與數(shù)據(jù)倉庫的關(guān)系 1.數(shù)據(jù)集市不等于數(shù)據(jù)倉庫,多個(gè)數(shù)據(jù)集市合并起來不能成為數(shù)據(jù)倉庫。 各個(gè)數(shù)據(jù)集市之間對詳細(xì)數(shù)據(jù)和歷史數(shù)據(jù)的存儲存在大量冗余; 同一個(gè)問題在不同的數(shù)據(jù)集市的查詢結(jié)果可能不一致,甚至相互矛盾; 各數(shù)據(jù)集市之間以及與源數(shù)據(jù)庫系統(tǒng)之間難以管理。決策支持系統(tǒng)第四講 決策支持的

12、新技術(shù) 2.數(shù)據(jù)倉庫與數(shù)據(jù)集市的區(qū)別(1)dw是基于整個(gè)企業(yè)的數(shù)據(jù)模型建立的,它面向企業(yè)范圍內(nèi)的主題,而數(shù)據(jù)集市是按照某一特定部門的數(shù)據(jù)模型建立的,也稱為部門級別dw。(2)數(shù)據(jù)倉庫中存儲整個(gè)企業(yè)內(nèi)的詳細(xì)數(shù)據(jù),而數(shù)據(jù)集市中的數(shù)據(jù)的詳細(xì)程度要低一些,包含的概要和累加數(shù)據(jù)要多一些。(3)數(shù)據(jù)集市的數(shù)據(jù)組織一般采用星形模型,而大型數(shù)據(jù)倉庫的數(shù)據(jù)組織采用第三范式。決策支持系統(tǒng)第四講 決策支持的新技術(shù)計(jì)算機(jī)計(jì)算機(jī)計(jì)算機(jī)數(shù)據(jù)源數(shù)據(jù)倉庫數(shù)據(jù)分析四.數(shù)據(jù)集市的兩種結(jié)構(gòu)從屬數(shù)據(jù)集市從屬數(shù)據(jù)集市:數(shù)據(jù)來源于中央從屬數(shù)據(jù)集市:數(shù)據(jù)來源于中央dw,一般為那些,一般為那些訪問訪問dw頻繁的關(guān)鍵業(yè)務(wù)部門建立。頻繁的關(guān)鍵業(yè)

13、務(wù)部門建立。決策支持系統(tǒng)第四講 決策支持的新技術(shù)數(shù)據(jù)源計(jì)算機(jī)計(jì)算機(jī)計(jì)算機(jī)數(shù)據(jù)分析獨(dú)立數(shù)據(jù)集市獨(dú)立數(shù)據(jù)集市:數(shù)據(jù)直接來源與企業(yè)的業(yè)務(wù)功能獨(dú)立數(shù)據(jù)集市:數(shù)據(jù)直接來源與企業(yè)的業(yè)務(wù)功能系統(tǒng),與企業(yè)系統(tǒng),與企業(yè)dw在數(shù)據(jù)量和服務(wù)對象有所區(qū)別,在數(shù)據(jù)量和服務(wù)對象有所區(qū)別,邏輯結(jié)構(gòu)無區(qū)別。邏輯結(jié)構(gòu)無區(qū)別。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 4.2.1 數(shù)據(jù)挖掘概述 一一. .案例案例nbanba通過數(shù)據(jù)挖掘取得飛躍通過數(shù)據(jù)挖掘取得飛躍決策支持系統(tǒng)第四講 決策支持的新技術(shù) 二.數(shù)據(jù)挖掘的概念v dm dm也稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(也稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(kddkdd),是從大量),是從大量數(shù)據(jù)集中提取出隱

14、含的、非平凡的、潛在有用的信數(shù)據(jù)集中提取出隱含的、非平凡的、潛在有用的信息或模式的高級處理過程。息或模式的高級處理過程。v 數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的核心步驟。v dm的技術(shù)基礎(chǔ)是ai、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)。v 被提取的知識的類型可以是總結(jié)性知識、關(guān)聯(lián)性知識、分類模型知識、聚類模型知識,這些知識可表示為概念、規(guī)則、規(guī)律、模式等形式;知識的類型。決策支持系統(tǒng)第四講 決策支持的新技術(shù)集成集成目目標(biāo)標(biāo)數(shù)數(shù)據(jù)據(jù)預(yù)預(yù)處處理理數(shù)數(shù)據(jù)據(jù)模模式式數(shù)數(shù)據(jù)據(jù)知知識識源源數(shù)數(shù)據(jù)據(jù)預(yù)處理預(yù)處理數(shù)據(jù)挖掘數(shù)據(jù)挖掘評價(jià)與解釋評價(jià)與解釋數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備數(shù)據(jù)挖掘數(shù)據(jù)挖掘評價(jià)與解釋評價(jià)與解釋數(shù)數(shù)據(jù)據(jù)選擇選擇決策支持系統(tǒng)第四講 決策支持的新

15、技術(shù) 三.數(shù)據(jù)挖掘的優(yōu)點(diǎn)與缺點(diǎn) 1.優(yōu)點(diǎn)(1)減少了用戶的工作量。(2)使用戶得到意外的信息。(3)對數(shù)據(jù)的迅速變化可作出快速響應(yīng),以提供決策支持信息。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 三.數(shù)據(jù)挖掘的優(yōu)點(diǎn)與缺點(diǎn) 2.缺點(diǎn)(1)對計(jì)算機(jī)的性能要求高。 (2)意外的信息不可靠。 (3)即使發(fā)現(xiàn)一個(gè)潛在的可以利用的關(guān)系,其實(shí)際使用價(jià)值也可能不太明顯。 決策支持系統(tǒng)第四講 決策支持的新技術(shù) 4.2.2 數(shù)據(jù)挖掘基本過程與步驟 一一. .數(shù)據(jù)挖掘的基本過程數(shù)據(jù)挖掘的基本過程 1.數(shù)據(jù)準(zhǔn)備(1)數(shù)據(jù)集成:從操作型環(huán)境中提取并集成數(shù)據(jù),解決語義二義性問題。(2)數(shù)據(jù)選擇:確定發(fā)現(xiàn)任務(wù)的操作對象;(3)數(shù)

16、據(jù)預(yù)處理:消除噪音、推導(dǎo)計(jì)算缺值數(shù)據(jù)、完成數(shù)據(jù)類型的轉(zhuǎn)換,削減數(shù)據(jù)維數(shù)或降維。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 一一. .數(shù)據(jù)挖掘的基本過程數(shù)據(jù)挖掘的基本過程 2.數(shù)據(jù)挖掘(1)確定數(shù)據(jù)挖掘的任務(wù)或目的;(2)根據(jù)不同的數(shù)據(jù)的特點(diǎn),用戶和實(shí)際運(yùn)行系統(tǒng)的要求決定要使用的數(shù)據(jù)挖掘的算法;(3)實(shí)施數(shù)據(jù)挖掘,獲取有用的模式。 決策支持系統(tǒng)第四講 決策支持的新技術(shù) 一一. .數(shù)據(jù)挖掘的基本過程數(shù)據(jù)挖掘的基本過程 3.數(shù)據(jù)表述與評價(jià)(1)將獲取的信息以便于用戶理解和觀察的方式反映給用戶;(2)用評價(jià)指標(biāo)對獲取的信息評價(jià),發(fā)現(xiàn)不滿足用戶需求的模式,并返回到dm的前面階段,重新實(shí)施dm。決策支持系統(tǒng)第四

17、講 決策支持的新技術(shù) 二二. .進(jìn)行數(shù)據(jù)挖掘的步驟進(jìn)行數(shù)據(jù)挖掘的步驟 1.問題定義 2.發(fā)現(xiàn)信息 3.制定計(jì)劃 4.采取行動 5.檢測結(jié)果決策支持系統(tǒng)第四講 決策支持的新技術(shù) 4.2.3 數(shù)據(jù)挖掘的任務(wù)與挖掘方法 一一. .數(shù)據(jù)抽取:數(shù)據(jù)抽?。簩?shù)據(jù)進(jìn)行濃縮,給出它的緊湊描述。 1.多維數(shù)據(jù)分析方法:是一種數(shù)據(jù)倉庫技術(shù),它把匯集操作結(jié)果預(yù)先計(jì)算并存貯起來,供dss使用。 2.面向?qū)ο蟮臍w納方法:對用戶感興趣的數(shù)據(jù)視圖進(jìn)行泛化,從較高層次上總結(jié)了在低層次上的原始關(guān)系。決策支持系統(tǒng)第四講 決策支持的新技術(shù)二二. .分類發(fā)現(xiàn)分類發(fā)現(xiàn) 分類的目的是學(xué)會一個(gè)分類函數(shù)或分類模型(也常常稱作分類器),該模型

18、能把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè)。 要構(gòu)造分類器,需要有一個(gè)訓(xùn)練樣本數(shù)據(jù)集作為輸入。 決策支持系統(tǒng)第四講 決策支持的新技術(shù)三三. .聚類聚類聚類是把一組個(gè)體按照相似性歸成若干類別,即“物以類聚”。它的目的是使同一類別的個(gè)體之間的距離盡可能的小,而不同類別上的個(gè)體間的距離盡可能的大。聚類方法包括統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫的方法。決策支持系統(tǒng)第四講 決策支持的新技術(shù)四四. .關(guān)聯(lián)規(guī)則發(fā)現(xiàn)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)用于關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的主要對象是事務(wù)型數(shù)據(jù)庫,其中針對的應(yīng)用則是售貨數(shù)據(jù)。事實(shí)上人們一般只對滿足一定的支持度和可信度的關(guān)聯(lián)規(guī)則感興趣。為了發(fā)現(xiàn)出有意義的關(guān)聯(lián)規(guī)則,需要給定兩

19、個(gè)閥值:最小支持度和最小可信度。決策支持系統(tǒng)第四講 決策支持的新技術(shù) 4.2.4 數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的關(guān)系 1.dm比dw的匯總型分析處理要詳細(xì)和深入得多; 2.dw的發(fā)展是促進(jìn)dm發(fā)展的一個(gè)重要原因,dm經(jīng)常被看成是dw的后期市場產(chǎn)品,dw中具有最豐富的資源可供挖掘; 3.dw不是dm的必要條件,當(dāng)dw可為dm的數(shù)據(jù)集成和數(shù)據(jù)準(zhǔn)備提供一種好的方法; 4.dm可能是dw的一個(gè)邏輯上的子集,而非一定得是物理上單獨(dú)的數(shù)據(jù)庫。決策支持系統(tǒng)第四講 決策支持的新技術(shù)用戶查詢請求用戶查詢請求信息發(fā)布、查詢分類、解釋信息發(fā)布、查詢分類、解釋查詢協(xié)同管理查詢協(xié)同管理業(yè)務(wù)系統(tǒng)及業(yè)務(wù)系統(tǒng)及其他系統(tǒng)其他系統(tǒng)異構(gòu)數(shù)異

20、構(gòu)數(shù)據(jù)源據(jù)源dm技技術(shù)術(shù)模型庫模型庫管理管理方法庫方法庫管理管理kmdw數(shù)據(jù)導(dǎo)入、數(shù)據(jù)導(dǎo)入、轉(zhuǎn)移與質(zhì)量轉(zhuǎn)移與質(zhì)量保障工具保障工具其他信其他信息分析息分析工具工具kb知識共享平臺知識共享平臺決策支持系統(tǒng)第四講 決策支持的新技術(shù)4.3.1 基本概念一.olap的概念 1.olap理事會:理事會:一種軟件技術(shù),它是分析人員能迅速、一致、交互地從各個(gè)方面(維)觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。決策支持系統(tǒng)第四講 決策支持的新技術(shù)一.olap的概念 2.olap的簡單定義:的簡單定義: 是共享多維信息的快速分析。 (1)快速性 (2)可分析性 (3)多維性關(guān)鍵和核心屬性 (4)信息性決策支持系統(tǒng)第四講

21、 決策支持的新技術(shù)二.olap的其他基本概念1.變量2.維:觀察數(shù)據(jù)的特定角度。3.維的層次:從某個(gè)特定角度觀察數(shù)據(jù)時(shí)的不同細(xì)節(jié)程度。4.維成員:維的取值。5.多維數(shù)組6.數(shù)據(jù)單元(單元格):多維數(shù)據(jù)的取值就是數(shù)據(jù)單元。決策支持系統(tǒng)第四講 決策支持的新技術(shù)三.olap與oltp的關(guān)系與比較oltp數(shù)據(jù)庫數(shù)據(jù)細(xì)節(jié)性數(shù)據(jù)當(dāng)前數(shù)據(jù)經(jīng)常更新一次處理的數(shù)據(jù)量小對響應(yīng)時(shí)間的要求高用戶數(shù)量大面向操作人員,支持日常操作面向應(yīng)用,事物驅(qū)動olap數(shù)據(jù)庫或數(shù)據(jù)倉庫數(shù)據(jù)綜合性數(shù)據(jù)歷史數(shù)據(jù)不更新,但周期性刷新一次處理數(shù)據(jù)量大響應(yīng)時(shí)間合理用戶相對較少面向決策人員,支持管理需要面向分析,分析驅(qū)動決策支持系統(tǒng)第四講 決策支

22、持的新技術(shù)4.3.2 olap的數(shù)據(jù)組織一一.rolap (relation olap)基于關(guān)系數(shù)據(jù)庫存貯方式建立;將多維數(shù)據(jù)映像成平面型的關(guān)系表中的行。代表:星型模式。將基本信息存貯在一個(gè)單獨(dú)的“事實(shí)表”中,有關(guān)維的支持信息放在其他表中。特征:由一個(gè)很強(qiáng)的sql生成器,對應(yīng)目標(biāo)db,能對sql進(jìn)行優(yōu)化,通過元數(shù)據(jù)指導(dǎo)查詢,有區(qū)分客戶、服務(wù)器及中間件的能力。決策支持系統(tǒng)第四講 決策支持的新技術(shù)二二.molap (multi-dimension olap)基于多維數(shù)據(jù)庫存貯方式建立;多維數(shù)據(jù)庫由許多經(jīng)壓縮的、類似于數(shù)組的對象構(gòu)成;每個(gè)對象由聚集成組的單元塊組成,每個(gè)單元塊按類似于多維數(shù)組的結(jié)構(gòu)存貯,通過直接偏移計(jì)算進(jìn)行存取。決策支持系統(tǒng)第四講 決策支持的新技術(shù)三三.兩種組織方式的比較兩種組織方式的比較molap固定維維交叉計(jì)算行級計(jì)算讀、寫應(yīng)用數(shù)據(jù)集市rolap

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論