版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)倉庫、數(shù)據(jù)挖掘與商業(yè)智能BI同濟大學經(jīng)濟與管理學院黃立平教授數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第1頁!數(shù)據(jù)倉庫DW和數(shù)據(jù)挖掘DM講座內(nèi)容簡介數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術是近十年來,世界上廣泛應用的信息技術之一。其主要作用是幫助企業(yè)有效地使用企業(yè)積累的大量數(shù)據(jù);輔助管理層和決策層提高管理和決策的水平。講座的主要內(nèi)容如下:數(shù)據(jù)倉庫概要;數(shù)據(jù)倉庫的工作原理;聯(lián)系分析處理OLAP;數(shù)據(jù)挖掘概念、原由、發(fā)展;數(shù)據(jù)挖掘的技術分類;數(shù)據(jù)挖掘在電信行業(yè)的應用;數(shù)據(jù)挖掘與知識管理;數(shù)據(jù)挖掘國內(nèi)應用存在的問題;數(shù)據(jù)挖掘的未來發(fā)展。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第2頁!前言數(shù)據(jù)挖掘是近年來信息爆炸推動下的新興產(chǎn)物,是從海量數(shù)據(jù)中提取有用知識的熱門技術。傳統(tǒng)的信息系統(tǒng),1990年代興起的互連網(wǎng)技術及ERP系統(tǒng)在越來越廉價的存儲設備配合下,產(chǎn)生了大量的數(shù)據(jù)。與之相輔相成的數(shù)據(jù)分析和知識提取技術在相當長一段時間里沒有大的進展,使得存儲的大量原始數(shù)據(jù)沒有被充分利用,轉(zhuǎn)化成指導生產(chǎn)的“知識”,形成“數(shù)據(jù)的海洋,知識的荒漠”這樣一種奇怪的現(xiàn)象。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第3頁!數(shù)據(jù)庫技術的發(fā)展收集和數(shù)據(jù)庫創(chuàng)建(20世紀60年代以前)-原始文件處理數(shù)據(jù)庫管理系統(tǒng)(20世紀70年代)
-層次、網(wǎng)狀、關系數(shù)據(jù)庫系統(tǒng)-數(shù)據(jù)建模工具:實體-聯(lián)系(E-R)模型等-索引和數(shù)據(jù)組織技術-查詢語言:SQL、用戶界面:表單、報告等-查詢處理和查詢優(yōu)化、事務并發(fā)控制等-聯(lián)機事務處理(OLTP)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第4頁!
數(shù)據(jù)庫應用中存在的問題“數(shù)據(jù)豐富,信息貧乏”。存儲了大量數(shù)據(jù)的數(shù)據(jù)庫變成了“數(shù)據(jù)墳墓”——難以再訪問的數(shù)據(jù)檔案;在大型數(shù)據(jù)庫中快速增長著海量數(shù)據(jù),理解數(shù)據(jù)的含義已經(jīng)遠遠超出了人的能力;領導者的重要決策往往無法、及時獲得信息,因為缺乏從海量數(shù)據(jù)中提取有價值知識的工具;若在當前運行的操作數(shù)據(jù)庫中獲取信息,則影響數(shù)據(jù)庫的使用和性能。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第5頁!案例“啤酒與尿布”是一個發(fā)生在Wal★Mart的關于數(shù)據(jù)挖掘的經(jīng)典故事:它告訴人們:可以利用手中大量似乎沒有規(guī)律的數(shù)據(jù),找出未知的規(guī)律;沃爾瑪有先進的衛(wèi)星通訊網(wǎng)絡—1983年開始,用巨資建立的衛(wèi)星通訊網(wǎng)絡系統(tǒng)使其供貨系統(tǒng)更趨完美;
沃爾瑪有完整的數(shù)據(jù)記錄、存儲和分析系統(tǒng);如何獲得客戶的銷售記錄?數(shù)據(jù)挖掘由什么人來實現(xiàn)?是否每時每刻都可以進行數(shù)據(jù)挖掘?是否每次都能挖掘出理想的結果?我國在處理經(jīng)濟犯罪案件時,發(fā)現(xiàn)由于管理的落后以及數(shù)據(jù)分析應用技術的落后,不能及時發(fā)現(xiàn)問題……數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第6頁!數(shù)據(jù)倉庫的主要特征面向主題的(subject–oriented):(1)所謂主題(宏觀領域),如顧客、供應商、產(chǎn)品和銷售組織;是在高層次上將企業(yè)IS中的數(shù)據(jù)綜合、歸類并進行分析利用的抽象。面向主題,是指數(shù)據(jù)倉庫內(nèi)的信息是按主題進行組織的,為按決策的過程提供信息。
(2)DW關注決策者的數(shù)據(jù)建模與分析,而傳統(tǒng)數(shù)據(jù)庫是面向應用的,集中于組織機構的日常操作和事務處理。(3)DW排除對于決策無用的數(shù)據(jù),提供特定主題的簡明視圖。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第7頁!集成的(integrated):(1)構造數(shù)據(jù)倉庫是將多個不同的數(shù)據(jù)源,如關系數(shù)據(jù)庫、一般文件和聯(lián)機事務處理記錄,集成在一起。(2)將多個系統(tǒng)的數(shù)據(jù)進行計算和整理,保證DW的數(shù)據(jù)是關于整個系統(tǒng)的、一致的、全局的。使用數(shù)據(jù)清理和數(shù)據(jù)集成技術,確保命名約定、編碼結構、屬性等的數(shù)據(jù)結構一致性。
保證各數(shù)據(jù)源中數(shù)據(jù)的一致性。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第8頁!隨時間變化的(time-variant):(1)數(shù)據(jù)倉庫記錄了從過去某一時間到目前的各個階段的信息,通過這些信息,可以表明發(fā)展歷程并對未來的趨勢作出定量分析和預測。
(2)DW的數(shù)據(jù)結構,隱式或顯式地包含時間元素;其包含的大量綜合數(shù)據(jù)也與時間相關,例如:月產(chǎn)量。(3)DW隨時間變化不斷增加新的數(shù)據(jù)內(nèi)容;去掉超過時限(例如:5-10年)的數(shù)據(jù)。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第9頁!操作型數(shù)據(jù)庫系統(tǒng)與數(shù)據(jù)倉庫的區(qū)別
操作型數(shù)據(jù)庫系統(tǒng)的主要任務是執(zhí)行聯(lián)機事務和查詢處理,稱為聯(lián)機事務處理(OLTP)系統(tǒng)。它涵蓋了一個組織的大部分日常操作,如采購、制造、庫存、銷售、財務、銀行等事務。DW在數(shù)據(jù)分析和決策方面為決策者提供服務。可以用不同的格式去組織和提供數(shù)據(jù),以便滿足不同用戶的形形色色需求。這種系統(tǒng)稱為聯(lián)機分析處理(OLAP)系統(tǒng)。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第10頁!數(shù)據(jù)倉庫的體系結構數(shù)據(jù)倉庫的概念結構從數(shù)據(jù)倉庫的概念結構看,應該包含:數(shù)據(jù)源、數(shù)據(jù)準備區(qū)、數(shù)據(jù)倉庫、數(shù)據(jù)集市/知識挖掘庫以及各種管理工具和應用工具。
數(shù)據(jù)源業(yè)務系統(tǒng)外部數(shù)據(jù)源數(shù)據(jù)準備區(qū)數(shù)據(jù)倉庫應用工具管理工具數(shù)據(jù)集市/知識挖掘庫應用工具數(shù)據(jù)集市/知識挖掘庫數(shù)據(jù)倉庫的概念結構數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第11頁!4.多維數(shù)組一個多維數(shù)組可以表示為(維1,維2,維3,…維n,變量);
例如:(地區(qū)、時間、銷售渠道、銷售額)
5.數(shù)據(jù)單元
多維數(shù)組的取值是數(shù)據(jù)單元。例如:
(上海,2002年2月,批發(fā),2188)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第12頁!數(shù)據(jù)庫設計:OLTP系統(tǒng)采用E-R模型和面向應用的數(shù)據(jù)庫設計OLAP系統(tǒng)采用星型或雪花模型和面向主題的數(shù)據(jù)庫設計視圖:OLTP系統(tǒng)主要關注一個企業(yè)或部門內(nèi)部的當前數(shù)據(jù),而不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù)。OLAP系統(tǒng)由于組織的變化常常跨越數(shù)據(jù)庫模式的多個版本。OLAP系統(tǒng)也處理來自不同組織的信息,由多個數(shù)據(jù)存儲集成的信息。由于數(shù)據(jù)量巨大,OLAP數(shù)據(jù)也存放在多個存儲介質(zhì)上。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第13頁!OLTP系統(tǒng)和OLAP系統(tǒng)的比較表
特性
OLTP
OLAP特征操作處理信息處理面向事務分析用戶辦事員、客戶、數(shù)據(jù)庫專業(yè)人員經(jīng)理、主管、分析員功能日常操作長期信息需求,決策支持DB設計基于E-R,面向應用星型/雪花,面向主題數(shù)據(jù)當前的,確保最新歷史的,跨時間維護匯總原始的,高度詳細匯總的,統(tǒng)一的視圖詳細,一般關系匯總的,多維的工作單位短的,簡單事務復雜查詢存取讀/寫大多為讀關注數(shù)據(jù)輸入、存儲信息輸出操作主關鍵字上索引/散列大量掃描訪問記錄數(shù)量數(shù)十個數(shù)百萬用戶數(shù)數(shù)千數(shù)百DB規(guī)模100MB到GB100GB到TB優(yōu)先高性能,高可用性高靈活性,端點用戶自治度量事務吞吐量查詢吞吐量,響應時間數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第14頁!
操作型數(shù)據(jù)庫:
支持多事務的并行處理,需要加鎖和日志等并行控制和恢復機制,以確保數(shù)據(jù)的一致性和完整性。
數(shù)據(jù)倉庫:
對數(shù)據(jù)記錄進行只讀訪問,以進行匯總和聚集。
如果OLTP和OLAP都在操作型數(shù)據(jù)庫上運行,會大大降低數(shù)據(jù)庫系統(tǒng)的吞吐量。
總之,數(shù)據(jù)倉庫與操作數(shù)據(jù)庫分離是由于這兩種系統(tǒng)中數(shù)據(jù)的結構、內(nèi)容和用法都不相同。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第15頁!多維數(shù)據(jù)模型
數(shù)據(jù)倉庫和OLAP基于多維數(shù)據(jù)模型。該模型將數(shù)據(jù)看作數(shù)據(jù)立方體(datacube)形式。數(shù)據(jù)立方體允許以多維對數(shù)據(jù)建模和觀察。它由維和事實定義。維是關于一個組織想要記錄的視圖或?qū)嶓w。例如,商店可能創(chuàng)建一個數(shù)據(jù)倉庫sales,記錄商店的銷售,涉及維time,item(商品類),branch(分店)和location(地點)。這些維使得商店能夠記錄商品的月銷售,銷售商品的分店和地點。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第16頁!例:某連鎖商店的銷售數(shù)據(jù)按照維time季度,
item商品類的2-D視圖(其中銷售數(shù)據(jù)是取自Location=“Vancouver”的所有分店,銷售金額單位是1000美元)。
item(商品類)______________________________________季度
家庭娛樂計算機電話安全設備Q160582514400Q268095231512Q3812102330501Q4927103838580數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第17頁!多維數(shù)據(jù)庫模型:星型、雪花型關系數(shù)據(jù)庫設計廣泛使用E—R數(shù)據(jù)模型。數(shù)據(jù)庫模式由實體的集合和它們之間的聯(lián)系組成。這種數(shù)據(jù)模型適用于聯(lián)機事務處理。數(shù)據(jù)倉庫需要簡明的、面向主題的模型,便于聯(lián)機數(shù)據(jù)分析。數(shù)據(jù)倉庫數(shù)據(jù)模型是多維數(shù)據(jù)模型。這種模型有星型模式、雪花模式等。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第18頁!
在星型模式中,每一維只用一個表表示,每個表包含一組屬性。例如,location維表包含屬性集{location_key,street,city,province_or_state,country}。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第19頁!雪花模型(snowflakeschema)
雪花模型是星型模式的變種,其中某些維表是規(guī)范化的,因而把數(shù)據(jù)進一步分解到附加的表中。結果,模型圖形成類似于雪花的形狀。雪花模型和星型模型的主要不同在于,雪花模型的維表可能是規(guī)范化形式,以便減少冗余。這種表易于維護,并節(jié)省存儲空間,因為當維結構作為列包含在內(nèi)時,大維表可能非常大。由于執(zhí)行查詢需要更多的連接操作,雪花模型可能降低瀏覽的性能。數(shù)據(jù)倉庫系統(tǒng)的性能可能受到影響。在數(shù)據(jù)倉庫設計中,雪花模式不如星型模式使用廣泛。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第20頁!sales數(shù)據(jù)倉庫的雪花模式
timesalesitem
時間維表事實表商品維表time_key-----------time_keyitem_namedayitem_key-------item_keyday_of_the_weekunits_soldbrandmonthdollars_soldtype供應商維表quarterlocation_keysupplier_type---supplier_keyyearbranch_key|(規(guī)范化)supplier_type||
分店維表
地點維表(規(guī)范化)branch_keylocation_keybranch_namestreet城市維表branch_typecity---------------city_keyprovince_or_statecountry
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第21頁!當前數(shù)據(jù)挖掘能解決的典型問題:·數(shù)據(jù)庫營銷(DatabaseMarketing);·客戶群體劃分(CustomerSegmentation&Classification);·背景分析(ProfileAnalysis);·交叉銷售(Cross-selling)等市場分析行為?!た蛻袅魇苑治?ChurnAnalysis);·客戶信用記分(CreditScoring);·欺詐發(fā)現(xiàn)(FraudDetection)等;在許多領域得到了成功的應用。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第22頁!
數(shù)據(jù)挖掘在一些文獻中也有其他名稱,如數(shù)據(jù)開采、知識挖掘、知識抽取、知識考察等。
數(shù)據(jù)挖掘是知識發(fā)現(xiàn)KDD的一個關鍵步驟,它包括特定的數(shù)據(jù)挖掘算法,具有可接受的計算效率,生成特殊的模式。
KDD是利用數(shù)據(jù)挖掘算法,按指定方式和閾值抽取有價值的知識,包括數(shù)據(jù)挖掘前對數(shù)據(jù)的預處理、抽樣及轉(zhuǎn)換和數(shù)據(jù)挖掘后對知識的評價解釋過程。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第23頁!數(shù)據(jù)挖掘的分類
根據(jù)所開采的數(shù)據(jù)庫類型、發(fā)現(xiàn)的知識類型、采用的技術類型,數(shù)據(jù)挖掘有不同的分類方法。
(1)按數(shù)據(jù)庫類型分類從關系數(shù)據(jù)庫中發(fā)現(xiàn)知識;從面向?qū)ο髷?shù)據(jù)庫中發(fā)現(xiàn)知識;從多媒體數(shù)據(jù)庫、空間數(shù)據(jù)庫、歷史數(shù)據(jù)庫、Web數(shù)據(jù)庫中發(fā)現(xiàn)知識。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第24頁!(3)按利用的技術類型分類
根據(jù)開采方法分為自發(fā)知識開采、數(shù)據(jù)驅(qū)動開采、查詢驅(qū)動開采和交互式數(shù)據(jù)開采。根據(jù)開采途徑分為基于歸納的開采、基于模式的開采、基于統(tǒng)計和數(shù)學理論的開采及集成開采等。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第25頁!數(shù)據(jù)挖掘有兩種功能:
(1)預測/驗證功能。用數(shù)據(jù)庫的若干已知字段預測或驗證其他未知字段值;(2)描述功能指找到描述數(shù)據(jù)的可理解模式。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第26頁!如果你訪問著名的亞馬遜網(wǎng)上書店(.amazon.),會發(fā)現(xiàn)當你選中一本書后,會出現(xiàn)相關的推薦書目“Customerswhoboughtthisbookalsobought”,這背后就是數(shù)據(jù)挖掘技術在發(fā)揮作用。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第27頁!KDD的步驟:1熟悉應用領域、背景知識及用戶的KDD任務性質(zhì);2數(shù)據(jù)的選擇:確定與發(fā)現(xiàn)任務相關的數(shù)據(jù)集合;3數(shù)據(jù)清理和預處理,包括除去錯誤和冗余數(shù)據(jù)、處理丟失數(shù)據(jù)、更新數(shù)據(jù)和時序信息并將其準備成數(shù)據(jù)挖掘工具所需的表達式;4數(shù)據(jù)縮減和投影,尋找依賴于發(fā)現(xiàn)目標的、表達數(shù)據(jù)的有用特征,通過降低維數(shù)和數(shù)據(jù)轉(zhuǎn)換以縮減數(shù)據(jù)規(guī)模;降低數(shù)據(jù)復雜性;5確定KDD目標,選擇合適的算法如聚集、分類、線性回歸等;數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第28頁!1生物醫(yī)學和DNA數(shù)據(jù)分析的數(shù)據(jù)挖掘
人類有約10萬個基因。一個基因通常由成百個核苷按一定次序組織而成。核苷按不同的次序和序列可以形成不同的基因,幾乎是不計其數(shù)。
具有挑戰(zhàn)性的問題是從中找出導致各種疾病的特定基因序列模式。
由于在數(shù)據(jù)挖掘中己經(jīng)有許多有意義的序列模式分析和相似檢索技術,因此數(shù)據(jù)挖掘成為DNA分析中的強有力工具數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第29頁!(2)貸款償還預測和客戶信用政策分析:
有很多因素會對貸款償還效能和客戶信用等級計算產(chǎn)生不同程度的影響。
數(shù)據(jù)挖掘的方法,如特征選擇和屬性相關性計算,有助于識別重要因素,剔除非相關因素。例如,與貸款償還風險相關的因素包括貸款率,貸款期限,負債率,收入比率,客戶收入水平,受教育水平,居住地區(qū),信用歷史,等等。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第30頁!(4)金融犯罪的偵破:
把多個數(shù)據(jù)庫的信息(如銀行交易數(shù)據(jù)庫、聯(lián)邦或州的犯罪歷史數(shù)據(jù)庫等)集成起來。
然后可以采用多種數(shù)據(jù)分析工具來找出異常模式,如在某段時間內(nèi),通過某一組內(nèi)發(fā)生大量現(xiàn)金流量,等等。這些工具可以識別出一些重要的活動關系和模式,有助于調(diào)查人員聚焦可疑線索,做進一步的處理。
有用的工具包括:
數(shù)據(jù)可視化工具(用圖形方式按時間和一定人群顯示交易活動);
鏈接分析工具(識別不同人和活動之間的聯(lián)系),
分類工具(濾掉不相關的屬性,對高度相關屬性排級);
聚類分析工具(將不同案例分組);
孤立點分析工具(探測異常資金量的轉(zhuǎn)移或其他行為);
序列模式分析工具(分析異常訪問模式的特征)。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第31頁!企業(yè)知識管理的成功案例:
SPSS在英國電信的應用英國電信面臨問題:為了從市場營銷預算中獲得最大的價值,英國電信需要建立模型來確定潛在客戶的購買傾向和他們變?yōu)橛脩糁罂赡艿膬r值。建立精確的客戶特征以后,英國電信打算開發(fā)針對于特定客戶群的產(chǎn)品。預期結果是:更好的營銷活動回應率,增加產(chǎn)品收入,并取得更大的市場份額。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第32頁!曾經(jīng)是平安無事的電信行業(yè)現(xiàn)在已充滿了火藥味。以前是壟斷寡頭的英國電信,現(xiàn)在仍然是英國本地電話、國內(nèi)長途、國際長途和數(shù)據(jù)服務的領導者,年銷售額290億美元,但同時也面臨著160家電信公司的競爭。為保持其原有客戶,獲取新的客戶并最大化銷售,英國電信需要準確知道哪些人在購買它的產(chǎn)品和服務。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第33頁!有關客戶、產(chǎn)品、賬單和歷史數(shù)據(jù)分散在英國電信的不同部門。分析小組首先在一個新的數(shù)據(jù)集市(具有某一主題結構的數(shù)據(jù)倉庫)收集用于數(shù)據(jù)庫營銷的數(shù)據(jù)。數(shù)據(jù)準備需要相當多的時間,因為數(shù)據(jù)必須從它們所在的系統(tǒng)中抽取出來,然后進行匹配、清理和排序;此后,才能用Clementine對這些數(shù)據(jù)進行分析。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第34頁!過程:分析數(shù)據(jù)并建立模型。分析小組用Clementine進行數(shù)據(jù)分析和試驗建模在數(shù)據(jù)分析過程中,分析小組用Clementine識別出數(shù)據(jù)質(zhì)量問題,熟悉數(shù)據(jù)和數(shù)據(jù)分布,排除與購買“商業(yè)高速公路”關系不太密切的數(shù)據(jù)屬性。然后,對和客戶購買產(chǎn)品的傾向相關的單個數(shù)據(jù)屬性的預示力度進行測量。如,二位區(qū)號,作為地理指示器,清楚地和回應和購買數(shù)據(jù)相聯(lián)系。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第35頁!向銷售人員和營銷活動提供了“最佳客戶”清單“Clementine的主要輸出結果是對數(shù)據(jù)的洞察(數(shù)據(jù)挖掘的全部目的所在)和這些洞察結果的可視化展示;提供給銷售人員和營銷活動的是客戶清單和圖形,并表明了為什么他們應該向這些客戶推薦商業(yè)高速公路。商業(yè)高速公路項目的成功說明了如何在商業(yè)活動中通過數(shù)據(jù)挖掘獲利。有了Clementine,先前所作的探索性數(shù)據(jù)分析和可視化使英國電信可以開發(fā)出滿意的客戶選擇標準。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第36頁!知識不同于信息,其特征在信息要經(jīng)過學習與價值認知方能形成知識。知識也不同于技術,技術是產(chǎn)品與服務的具體組成部份,因此僅屬于有形知識的一部份,而知識還包括產(chǎn)品與服務的抽象組成部份,并作為驅(qū)動技術創(chuàng)新與產(chǎn)品創(chuàng)新的重要基礎。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第37頁!國內(nèi)零售行業(yè)IT發(fā)展的現(xiàn)狀與趨勢總體情況和趨勢
根據(jù)相關統(tǒng)計資料顯示,當前中國零售行業(yè)百強企業(yè)均不同程度地實施了企業(yè)信息管理系統(tǒng)。其中,與零售行業(yè)主營業(yè)務密切相關的MIS系統(tǒng)(主要有:財務管理、POS系統(tǒng)、物價管理等)系統(tǒng)應用較為廣泛。還有CRM、決策支持管理系統(tǒng)等正逐步成為商業(yè)企業(yè)當前信息化建設的重點和熱點。
商業(yè)零售企業(yè)領導均充分認識到企業(yè)信息化建設的重要性,并積極加大對企業(yè)信息化建設的投入,逐步擴大企業(yè)信息化建設在企業(yè)發(fā)展投資中所占的比重,但受訪企業(yè)沒有一家對本單位信息化現(xiàn)狀表示“非常滿意”。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第38頁!何為商業(yè)智能?說起商業(yè)智能,大家也許會想起啤酒與尿布的例子,其實那是商業(yè)智能在商品擺放分析方面的一個應用案例,商業(yè)智能是什么?狹義的解釋:能夠幫助用戶對自身業(yè)務經(jīng)營做出正確決策的工具。廣義的說商業(yè)智能是集數(shù)據(jù)倉庫技術、在線分析技術以及數(shù)據(jù)挖掘等于一體的經(jīng)營分析以及決策支持的數(shù)據(jù)應用體系。商業(yè)智能的技術體系主要有數(shù)據(jù)倉庫(DW)在線分析處理(OLAP)數(shù)據(jù)挖掘(DM)數(shù)據(jù)倉庫是商業(yè)智能的基礎,許多基本報表可以由此生成,但它更大的用處是作為進一步分析的數(shù)據(jù)源。所謂數(shù)據(jù)倉庫(DW)就是面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。多維分析和數(shù)據(jù)挖掘是最常聽到的例子,數(shù)據(jù)倉庫能供給它們所需要的、整齊一致的數(shù)據(jù)。在線分析處理(OLAP)技術則幫助分析人員、管理人員從多種角度把從原始數(shù)據(jù)中轉(zhuǎn)化出來、能夠真正為用戶所理解的、并真實反映數(shù)據(jù)維特性的信息,進行快速、一致、交互地訪問,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術。數(shù)據(jù)挖掘(DM)是一種決策支持過程,它主要基于AI、機器學習、統(tǒng)計學等技術,高度自動化地分析企業(yè)原有的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助企業(yè)的決策者調(diào)整市場策略,減少風險,做出正確的決策。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第39頁!零售企業(yè)上馬商業(yè)智能系統(tǒng)的條件及意義企業(yè)上商業(yè)智能系統(tǒng)的意義:整合業(yè)務系統(tǒng),提升企業(yè)管理水平建立企業(yè)數(shù)據(jù)中心
,挖掘企業(yè)信息價值建立企業(yè)綜合查詢以及決策支持中心統(tǒng)一數(shù)據(jù)定義統(tǒng)一處理要求統(tǒng)一系統(tǒng)指標POS系統(tǒng)MIS系統(tǒng)財務系統(tǒng)其他系統(tǒng)POS系統(tǒng)MIS系統(tǒng)財務系統(tǒng)其他系統(tǒng)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第40頁!商業(yè)智能系統(tǒng)所產(chǎn)生的效益短期效益
系統(tǒng)建設的短期效益就是通過對
商品銷售情況
庫存情況
采購情況
成本情況
費用情況等直接關系到企業(yè)效益的經(jīng)營業(yè)務數(shù)據(jù)進行分析,逐步優(yōu)化產(chǎn)品的結構來提高商品銷售金額、合理控制庫存降低庫存成本、對費用進行分析控制費用以及對現(xiàn)金流進行分析來控制安全的現(xiàn)金流。通過對以上經(jīng)營情況進行分析來提高銷售、降低成本以實現(xiàn)提高企業(yè)的經(jīng)營效益和經(jīng)營效率,增強企業(yè)的競爭優(yōu)勢的目的!數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第41頁!商業(yè)智能系統(tǒng)總體架構數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第42頁!商業(yè)智能系統(tǒng)建設主要存在的風險盡管零售業(yè)商業(yè)智能受到全球零售業(yè)的關注,熱衷程度也逐漸升高。但是對企業(yè)而言,因為涉及的范圍及層級甚廣,包括信息技術、投資金額、業(yè)務流程、資料完整性等,項目的風險性極高。綜觀國外,仍然不乏有成功案例;反觀國內(nèi),零售業(yè)者對于商業(yè)智能的信息技術與解決方案尚屬萌芽階段。
零售業(yè)商業(yè)智能一般包括:客戶關系管理、商店經(jīng)營管理、商品組合、商品推廣、財務分析與電子商務等分析范圍。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第43頁!商業(yè)智能系統(tǒng)主要分析手段及分析方法分析方法可進行的分析對比分析同比分析(去年同期)、環(huán)比分析(上月同期)、基比分析(與報告期進行比較)、類比分析(同類商品進行對比分析)。結構分析分析商品大類銷售結構、樓層結構、利潤貢獻主要構成情況、供應商主要構成情況等等,常見的分析主要有餅圖分析、帕雷托圖(ABC)分析相關分析主要分析商品的相關性,即商品之間的促進關系和競爭關系分析,常見于商品微觀分析。統(tǒng)計分析對商品價格區(qū)間和銷售區(qū)間等分析,主要對商品特征和消費群體的消費習慣進行分析。趨勢分析及預測對商品的銷售周期進行分析以及根據(jù)以往的銷售數(shù)據(jù)預測未來的銷售走勢進度分析主要分析計劃完成進度情況預警監(jiān)控預警監(jiān)控商品存貨情況以及對租戶的達成率等進行監(jiān)控數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第44頁!零售行業(yè)商業(yè)智能主要數(shù)據(jù)模型以商業(yè)銷售數(shù)據(jù)為分析對象,分析商業(yè)銷售情況,商品類型的銷售結構、廣場分布結構、供貨商銷售毛利貢獻排行情況、品種毛利貢獻情況、銷售金額增長趨勢、銷售毛利增長趨勢、銷售毛利率變化趨勢、主要商品銷售趨勢、供應商銷售金額區(qū)間分析、商品品種銷售金額區(qū)間分析、庫區(qū)銷售規(guī)模區(qū)間分析等。主要分析超市各項銷售指標,例如商品銷售數(shù)量、商品銷售金額、會員卡銷售金額、會員卡銷售比重、商品累計銷售金額、銷售金額同比、銷售金額同比增加、銷售金額同比增長、毛利、毛利同比、商品銷售單價、單價同比等銷售分析模型而分析維又可從管理架構(企業(yè)組織)、時間維度、商品屬性、經(jīng)營方式等維度進行分析。
類型的銷售結構廣場分布結構銷售分析供貨商銷售毛利貢獻排行情況商品品種毛利貢獻情況
銷售金額增長趨勢銷售毛利增長趨勢銷售毛利率變化趨勢主要商品銷售趨勢供應商銷售金額區(qū)間分析品種銷售金額區(qū)間分析主體品種區(qū)間分析會員卡消費趨勢經(jīng)營類型結構分析可進行的分析數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第45頁!零售行業(yè)商業(yè)智能主要數(shù)據(jù)模型促銷分析模型分析內(nèi)容:促銷前進行促銷效果預測促銷后進行促銷效果分析
指標設計:銷售金額、毛利、促銷對比期金額、促銷對比期毛利。
可進行的分析促銷可行性分析促銷情況分析促銷影響分析(對比)促銷商品的相關商品分析數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第46頁!零售行業(yè)商業(yè)智能主要數(shù)據(jù)模型其他分析模型經(jīng)營分析模型經(jīng)營分析模型財務分析模型采購分析模型客流以及銷售特征分析毛利貢獻分析會員卡分析價格趨勢分析經(jīng)營坪效分析人均經(jīng)營貢獻分析經(jīng)營計劃進度分析現(xiàn)金流分析成本分析費用分析應收應付賬款分析數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第47頁!在用MDDAS平臺實施項目的時候,發(fā)現(xiàn)查詢比較大的數(shù)據(jù)量的時候,效率總是很低,后來根據(jù)實際的需求,提出了菱形結構數(shù)據(jù)模型的概念,并迅速應用到實際項目中,菱形結構數(shù)據(jù)模型取得了巨大的成功,解決在項目實施過程中的數(shù)據(jù)壓力問題,MDDAS取名于多維數(shù)據(jù)分析系統(tǒng),其實就其功能和解決的問題來說,MDDAS已經(jīng)遠遠超出了多維數(shù)據(jù)分析的范圍,是一個名副其實的商業(yè)智能平臺產(chǎn)品。MDDAS提供的功能包括:
多維分析、即席查詢、企業(yè)報表、預警監(jiān)控、統(tǒng)計學模型、數(shù)據(jù)挖掘、信息發(fā)布7大主要功能,支持面向關系型數(shù)據(jù)倉庫和面向目前主流的OLAP多維數(shù)據(jù)倉庫(IBMOLAPServer)。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第48頁!MDDAS具備的主要功能簡介數(shù)據(jù)展開數(shù)據(jù)鉆取數(shù)據(jù)交叉一、靈活的數(shù)據(jù)展現(xiàn)功能數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第49頁!MDDAS具備的主要功能簡介三、專業(yè)的統(tǒng)計分析功能單變量統(tǒng)計分析回歸分析相關分析聚類分析時間序列分析進度分析及監(jiān)控預警
單變量分析是描述某個指標分布特征。計算出的測度值反映統(tǒng)計分布的集中趨勢。線性回歸分析是側(cè)重考慮變量之間的相互關系,并通過回歸方程,來描述這種關系,進而確定一個或幾個變量之間的變化對另一個變量的影響程度,為預測提供科學的理論依據(jù)。相關分析就是一種測度事物間統(tǒng)計關系強弱的一種手段和工具,衡量變量之間線性相關程度的強弱。聚類分析實質(zhì)是一種建立分類的方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù),在沒有先驗知識的情況下,按照它們在性質(zhì)上的親疏程度進行分類。時間序列分析法是依據(jù)預測對象過去的統(tǒng)計數(shù)據(jù),找到其隨時間變化的規(guī)律,建立時序模型,以推斷未來數(shù)值的預測方法。進度分析用于考核指標的完成情況。預警分析是根據(jù)經(jīng)濟運行數(shù)據(jù),為煙草行業(yè)的生產(chǎn)經(jīng)營及時提供預警信號。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第50頁!菱形數(shù)據(jù)降維技術構建數(shù)據(jù)模型K表體系設計每個分析主題均對應一個K層的基表,但是K層的基表的數(shù)據(jù)量龐大,不利于在線查詢分析。我們在K層基表的基礎上定義數(shù)據(jù)的維度、粒度屬性,建立數(shù)據(jù)匯集路徑,然后使用工具將建立好的模型自動生成數(shù)據(jù)立方體和數(shù)據(jù)管理中心,這樣將K層的基表衍生為一個菱形的K表體系,然后通過數(shù)據(jù)管理中心智能搜索數(shù)據(jù),數(shù)據(jù)管理中心就是將數(shù)據(jù)的維度、粒度和數(shù)據(jù)的定位做對應,即根據(jù)數(shù)據(jù)的維度和粒度智能搜索其最優(yōu)的數(shù)據(jù)定位,以提高查詢分析的效率。
K表體系圖如下:
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第51頁!基于二次開發(fā)思想的設計理念MDDAS是基于二次開發(fā)思想實現(xiàn)的平臺軟件,系統(tǒng)采用參數(shù)定制的方式,在系統(tǒng)實施過程中,實施人員無須編寫代碼,只需要配置模型參數(shù)就能實現(xiàn)分析模型,在系統(tǒng)實施過程中,也可以根據(jù)用戶的需求敏捷的修改配置參數(shù),快速適應用戶需求,用戶也可以通過修改配置文件來調(diào)整系統(tǒng),除此之外,用戶還可以自己根據(jù)需求情況來增加分析模型。其配置參數(shù)如下圖:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第52頁!系統(tǒng)擴展性
MDDAS的負責數(shù)據(jù)連接的是一個獨立的Class—MDDASDataManagerCenter,它的功能是與不同的數(shù)據(jù)連接服務器進行連接,將不同類型的數(shù)據(jù)倉庫的數(shù)據(jù)轉(zhuǎn)化成MDDAS能認識的標準的數(shù)據(jù)集合,如果有新的數(shù)據(jù)倉庫類型,只需要對該類進行編程就可以使MDDAS支持新的數(shù)據(jù)倉庫類型。數(shù)據(jù)中心不依賴于數(shù)據(jù)倉庫產(chǎn)品,用戶需要增加模型可以快速定制,從而保證了系統(tǒng)的擴展性。OLAPServerRDBMS其他數(shù)據(jù)倉庫OLAPConnectServerRemoteServer其他數(shù)據(jù)倉庫連接服務器
MDDASMDDASDataManagerCenter
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第53頁!成熟的應用案例二、廣東省粵東煙草公司營銷分析系統(tǒng)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第54頁!數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第55頁!高級數(shù)據(jù)庫系統(tǒng)(1980年代中期—現(xiàn)在)-高級數(shù)據(jù)模型:擴充關系、面向?qū)ο蟆ο?關系-面向應用:空間的、時間的、多媒體的、主動的、科學的、知識庫數(shù)據(jù)倉庫和數(shù)據(jù)挖掘
(1980年代后期—現(xiàn)在)-數(shù)據(jù)倉庫和OLAP技術-數(shù)據(jù)挖掘和知識發(fā)現(xiàn)
基于Web的數(shù)據(jù)庫系統(tǒng)(1990年代—現(xiàn)在)-基于XML的數(shù)據(jù)庫系統(tǒng)-Web挖掘數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第56頁!海量數(shù)據(jù)要求強有力的數(shù)據(jù)分析工具以前的專家系統(tǒng)依賴用戶或某領域的專家人工地將知識輸入知識庫;這一過程常常有偏差和錯誤,并且耗時、費用高;使用數(shù)據(jù)挖掘工具進行數(shù)據(jù)分析;可以發(fā)現(xiàn)重要的數(shù)據(jù)模式,對商務決策、知識庫、科學和醫(yī)學研究作出了巨大貢獻;數(shù)據(jù)和信息之間的差距,要求系統(tǒng)地開發(fā)數(shù)據(jù)挖掘工具,將沉寂的數(shù)據(jù)轉(zhuǎn)換成寶貴的知識。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第57頁!什么是數(shù)據(jù)倉庫DW(datawarehouse)?數(shù)據(jù)倉庫可以看作是一種特殊的關系數(shù)據(jù)庫。DW是一個面向主題的、集成的、不更新的、隨時間變化的數(shù)據(jù)集合,用于支持管理部門的決策過程”。DWS允許將各種應用系統(tǒng)集成在一起為統(tǒng)一的歷史數(shù)據(jù)分析提供堅實的平臺,對信息處理、決策提供支持。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第58頁!(4)傳統(tǒng)數(shù)據(jù)庫使用OLTP聯(lián)機事務處理方式,進行數(shù)據(jù)組織時考慮記錄每一筆業(yè)務的情況;數(shù)據(jù)倉庫使用OLAP聯(lián)機分析處理方式,進行數(shù)據(jù)分析處理,以主題為單位組織數(shù)據(jù),例如:供應商、商品、顧客等。(5)面向主題的數(shù)據(jù)組織方式要求將數(shù)據(jù)組織成主題域,各主題域之間有明確的界限(獨立性),在某一主題內(nèi)的數(shù)據(jù)應該包括分析處理所要求的一切數(shù)據(jù)(完備性)。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第59頁!不更新的(nonvolatile):(1)訪問數(shù)據(jù)倉庫主要是兩種方式:數(shù)據(jù)的插入和查詢。修改和刪除操作很少。(2)DW的數(shù)據(jù)與操作環(huán)境下的應用數(shù)據(jù)分開存放。因此,數(shù)據(jù)倉庫不需要在操作環(huán)境下事務處理、恢復和并發(fā)控制等機制。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第60頁!DW概念總結:數(shù)據(jù)倉庫是一種語義上一致的數(shù)據(jù)存儲體系結構;DW是決策支持數(shù)據(jù)模型的物理實現(xiàn),并存放企業(yè)戰(zhàn)略決策所需信息;DW通過將異種數(shù)據(jù)源中的數(shù)據(jù)集成在一起構造而成;完成各種數(shù)據(jù)查詢、信息分析報告和決策支持。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第61頁!數(shù)據(jù)倉庫的數(shù)據(jù)模型
數(shù)據(jù)倉庫和OLAP通常是基于多維數(shù)據(jù)模型。該模型將數(shù)據(jù)看作數(shù)據(jù)立方體(datacube)形式。數(shù)據(jù)立方體由維和事實來定義;以多維的形式對數(shù)據(jù)建模和觀察。
維是關于一個組織想要記錄的透視或?qū)嶓w。
事實是面向某一主題的數(shù)據(jù)度量,它表示了多個分析維之間的分析結果。
多維數(shù)據(jù)模型通常有星型和雪花型兩種形式。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第62頁!1.維
維是人們觀察數(shù)據(jù)的特定角度。例如:時間維是商品銷售隨時間推移發(fā)生的變化;地理維是商品在不同地區(qū)的銷售分布情況。
2.維的層次
某個維以下存在的對細節(jié)的多個描述方面,例如:時間維有年、季度、月、日等不同層次。
3.維成員
維的一個取值是該維的一個成員。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第63頁!OLTP和OLAP的主要區(qū)別
服務對象:
OLTP是面向顧客的,用于辦事員、客戶和信息技術專業(yè)人員的事務和查詢處理。
OLAP是面向市場的,用于經(jīng)理、主管和信息分析人員的數(shù)據(jù)分析。
數(shù)據(jù)內(nèi)容:OLTP系統(tǒng)管理當前數(shù)據(jù)。這種數(shù)據(jù)太瑣碎,難以用于決策。
OLAP系統(tǒng)管理大量歷史數(shù)據(jù),提供匯總和聚集機制,并在不同的粒度級別上存儲和管理信息。數(shù)據(jù)易于用作中、高層的決策過程。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第64頁!訪問模式:對OLTP系統(tǒng)的訪問主要由短的原子事務組成。這種系統(tǒng)需要并行控制和恢復機制。對OLAP系統(tǒng)的訪問大部分是只讀操作(由于大部分數(shù)據(jù)倉庫存放歷史數(shù)據(jù),而不是當前數(shù)據(jù)),盡管許多可能是復雜的查詢。OLTP和OLAP的其他區(qū)別:包括數(shù)據(jù)庫大小、操作的頻繁程度、性能度量等。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第65頁!數(shù)據(jù)倉庫為什么是分離的?
操作型數(shù)據(jù)庫存放了大量數(shù)據(jù),為什么不直接在這種數(shù)據(jù)庫上進行聯(lián)機分析處理,而是另外花費時間和資源去構造一個與之分離的數(shù)據(jù)倉庫?主要原因是提高兩個系統(tǒng)的性能。
操作數(shù)據(jù)庫是為已知的任務和負載設計的,如使用主關鍵字索引,檢索特定的記錄和優(yōu)化查詢;
數(shù)據(jù)倉庫的查詢通常是復雜的,涉及大量數(shù)據(jù)在匯總級的計算,可能需要特殊的數(shù)據(jù)組織、存取方法和基于多維視圖的實現(xiàn)方法。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第66頁!兩種系統(tǒng)的數(shù)據(jù)結構、內(nèi)容和用法都不相同
操作型數(shù)據(jù)庫一般不維護歷史數(shù)據(jù),其數(shù)據(jù)很多,但對于決策是遠遠不夠的。數(shù)據(jù)倉庫系統(tǒng)用于決策支持需要歷史數(shù)據(jù),將不同來源的數(shù)據(jù)統(tǒng)一(如聚集和匯總),產(chǎn)生高質(zhì)量、一致和集成的數(shù)據(jù)。操作型數(shù)據(jù)庫只維護詳細的原始數(shù)據(jù)(如事務),這些數(shù)據(jù)在進行分析之前需要統(tǒng)一。由于兩個系統(tǒng)提供很不相同的功能,需要不同類型的數(shù)據(jù),因此需要維護分離的數(shù)據(jù)庫。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第67頁!主題:多維數(shù)據(jù)模型圍繞中心主題(例如sales)組織。主題用事實表表示。事實是用數(shù)值度量的。根據(jù)它們分析維之間的關系。例如,sales銷售數(shù)據(jù)倉庫的事實包括dollars_sold(銷售的款項),units_sold(銷售量)和amount_budgeted(預銷量)。事實表包括事實的名稱,以及每個相關維表的關鍵字。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第68頁!
以三維角度觀察該連鎖商店的銷售數(shù)據(jù)。例如,根據(jù)time,item和location城市觀察數(shù)據(jù)。location是Chicago,NewYork,Toronto和Vancouver。location=“Chicago”;location=“NewYork”...(該市上述二維表略)(該市上述二維表略)…數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第69頁!星型模式(starschema):是數(shù)據(jù)倉庫最常見的數(shù)據(jù)模型,其中包括:(1)事實表:包含大批數(shù)據(jù)和不含冗余的中心表;(2)一組小的附屬表(維表),每一維一個。維表圍繞中心表顯示在連線上。例:某連鎖商店的星型模式如下圖所示。sales有四個維,分別是time,item,branch(分店)和location。該模式包含一個中心事實表sales,它包含四個維的關鍵字和兩個度量dollars_sold銷售的款項和units_sold銷售量。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第70頁!
sales數(shù)據(jù)倉庫的星型模式
time
sales
item
維表
事實表
維表time_key-------------time_keyitem_namedayitem_key--------item_keyday_of_the_weekunits_soldbrandmonthdollars_soldtypequarterlocation_keysupplier_type★yearbranch_key|||
branch維表
location維表branch_keylocation_keybranch_namestreetbranch_typecity★province_or_statecountry數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第71頁!該連鎖商店sales的雪花模型在下圖給出。這里,sales事實表與上面的星型模型相同。兩個模式的主要不同是維表。星型模型中的item的單個維表在雪花模型中被規(guī)范化,導致新的item表和supplier供應商表。例如,現(xiàn)在item維表包含屬性item_key,item_name,brand,type和supplier_key,supplier_key連接到supplier維表。而supplier維表包含信息supplier_key和supplier_type。類似地,星型模型中l(wèi)ocation的單個維表被規(guī)范化成兩個表:新的location和city。新的location表中的location_key現(xiàn)在連接到city維。根據(jù)需要雪花模型還可以進一步規(guī)范化。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第72頁!從1980年代末的初露頭角到1990年代末的廣泛應用,以數(shù)據(jù)挖掘為核心的商業(yè)智能(BI)已經(jīng)成為IT及其它行業(yè)中的一類新星。當前數(shù)據(jù)挖掘應用主要集中在電信業(yè)(客戶分析),零售業(yè)(銷售預測),銀行業(yè)(客戶欺詐),電力(客戶呼叫),生物(基因),天文(星體分類),化工,醫(yī)藥等方面。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第73頁!什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘DM(DataMining)是從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對決策有潛在價值的知識和規(guī)則。這些規(guī)則蘊含了數(shù)據(jù)庫中一組對象之間的特定關系,揭示出一些有用的信息,為經(jīng)營決策、市場策劃、金融預測等提供依據(jù)。通過數(shù)據(jù)挖掘,有價值的知識、規(guī)則或高層次的信息能就從數(shù)據(jù)庫的相關數(shù)據(jù)集合中抽取出來,并從不同角度顯示,從而使大型數(shù)據(jù)庫作為一個豐富可靠的資源為知識管理服務。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第74頁!數(shù)據(jù)挖掘的特點
所處理的數(shù)據(jù)規(guī)模巨大。尋找決策所需的信息。數(shù)據(jù)挖掘既要發(fā)現(xiàn)潛在規(guī)則,還要管理和維護規(guī)則。數(shù)據(jù)挖掘中規(guī)則的發(fā)現(xiàn)主要基于大樣本的統(tǒng)計規(guī)律,發(fā)現(xiàn)的規(guī)則不必適用于所有數(shù)據(jù),當達到某一閾值時便可認為有此規(guī)律。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第75頁!(2)
按挖掘的知識類型分類
按挖掘的知識類型可分為關聯(lián)規(guī)則、特征規(guī)則、分類規(guī)則、偏差規(guī)則、聚集規(guī)則、判別式規(guī)則及時序規(guī)則等。
按知識的抽象層次可分為歸納知識、原始級知識、多層次知識。一個靈活的規(guī)則挖掘系統(tǒng)能夠在多個層次上發(fā)現(xiàn)知識。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第76頁!(4)按挖掘的深度分類
在較淺的層次上,利用現(xiàn)有數(shù)據(jù)庫管理系統(tǒng)的查詢/檢索及報表功能,與多維分析、統(tǒng)計分析方法相結合,進行OLAP,從而得出可供決策參考的統(tǒng)計分析數(shù)據(jù)。在深層次上,從數(shù)據(jù)庫中發(fā)現(xiàn)前所未知的、隱含的知識。OLAP的出現(xiàn)早于數(shù)據(jù)挖掘,兩者都是從數(shù)據(jù)庫中抽取有用信息的方法,就決策支持的需要而言兩者可以起到相輔相承的作用。OLAP可以作為一種廣義的數(shù)據(jù)挖掘方法,它旨在簡化和支持聯(lián)機分析,而數(shù)據(jù)挖掘的目的是使這一過程盡可能自動化。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第77頁!數(shù)據(jù)挖掘的對象是某一專業(yè)領域中積累的數(shù)據(jù);挖掘過程是一個人機交互、多次反復的過程;挖掘的結果要應用于該專業(yè)。因此數(shù)據(jù)挖掘的整個過程都離不開應用領域的專業(yè)知識?!癇usinessFirst,techniquesecond”是數(shù)據(jù)挖掘的特點。因此學習數(shù)據(jù)挖掘不意味著丟棄原有專業(yè)知識和經(jīng)驗。相反,有其它行業(yè)背景是從事數(shù)據(jù)挖掘的一大優(yōu)勢。如有銷售,財務,機械,制造,callcenter等工作經(jīng)驗的,通過學習數(shù)據(jù)挖掘,可以提升個人職業(yè)層次,在不改變原專業(yè)的情況下,從原來的事務型角色向分析型角色轉(zhuǎn)變。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第78頁!數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的聯(lián)系
知識發(fā)現(xiàn)KDD(knowledge
discovery)是指識別出存在于數(shù)據(jù)庫中有效的、新穎的、具有潛在效用的、最終可理解的、模式的、非平凡過程。
KDD的整個過程包括在指定的數(shù)據(jù)庫中用數(shù)據(jù)挖掘算法提取模型,以及圍繞數(shù)據(jù)挖掘進行的預處理和結果表達等一系列的計算步驟。盡管數(shù)據(jù)挖掘是整個過程的中心,但它通常只占整個過程15%~25%的工作量。知識發(fā)現(xiàn)是從數(shù)據(jù)庫中發(fā)現(xiàn)知識的全部過程,而數(shù)據(jù)挖掘則是此全過程的一個特定的關鍵步驟
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第79頁!6選擇數(shù)據(jù)挖掘算法,選擇適當?shù)哪P秃蛥?shù);
7執(zhí)行數(shù)據(jù)挖掘過程,發(fā)現(xiàn)模式并表達成易理解的
形式如分類規(guī)則等;
8評價和解釋發(fā)現(xiàn)的模式,必要時反復執(zhí)行步驟
1到7;
9將模式提交給用戶或應用到系統(tǒng)中。
KDD整個過程是一個以知識工作者為中心、人機交互的探索過程。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第80頁!2針對金融數(shù)據(jù)分析的數(shù)據(jù)挖掘
(1)為銀行和金融數(shù)據(jù)構造其數(shù)據(jù)倉庫:多維數(shù)據(jù)分析用于分析這些數(shù)據(jù)的一般特性。例如,人們可能希望按月,按地區(qū),按部門,以及按其他因素,查看負債和收入的變化情況,同時希望能提供最大、最小、總和、平均和其他統(tǒng)計信息。
數(shù)據(jù)倉庫,數(shù)據(jù)立方體,多特征和發(fā)現(xiàn)驅(qū)動數(shù)據(jù)立方體,特征和比較分析,以及孤立點分析等,都會在金融數(shù)據(jù)分析和挖掘中發(fā)揮重要作用。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第81頁!
分析客戶償還的歷史信息,可以發(fā)現(xiàn),償還與收入比率可能是主導因素,而受教育水平和負債率則不是。銀行于是可以據(jù)此調(diào)整貸款發(fā)放政策,以便將貸款發(fā)放給那些以前曾被拒絕,但根據(jù)關鍵因素分析,其基本信息顯示是相對低風險的申請。
(3)對目標市場客戶的分類與聚類:
分類與聚類的方法可用于用戶群體的識別和目標市場分析。例如,通過多維聚類分析,可以將具有相同儲蓄和貸款償還行為的客戶分為一組。有效的聚類和協(xié)同過濾方法有助于識別客戶組,將新客戶關聯(lián)到適合的客戶組,以及推動目標市場。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第82頁!在傳統(tǒng)的決策支持系統(tǒng)中,數(shù)據(jù)庫、模型庫和知識庫往往被獨立地設計和實現(xiàn),因而缺乏內(nèi)在的統(tǒng)一性。數(shù)據(jù)倉庫、聯(lián)機分析和數(shù)據(jù)挖掘組成的新的決策支持系統(tǒng)構架解決了決策支持系統(tǒng)數(shù)據(jù)庫內(nèi)數(shù)據(jù)的不一致問題。由于內(nèi)在的統(tǒng)一性,這種新結構很好地解決了相互間的銜接問題,實現(xiàn)了設計觀念從處理驅(qū)動到數(shù)據(jù)驅(qū)動的轉(zhuǎn)變;從而使信息的使用重點將逐步從支持面向操作層的聯(lián)機事務處理、中間管理控制層的管理信息系統(tǒng)提高到數(shù)據(jù)模式分析,高層的決策支持和分析預測上來。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第83頁!英國電信選用了SPSS的數(shù)據(jù)挖掘產(chǎn)品Clementine,來為其“商業(yè)高速公路”活動分析數(shù)據(jù)和建立探索模型,“商業(yè)高速公路”的目標為小型商業(yè)客戶服務。如今,英國電信更好地了解了這些客戶和他們在電信市場的行為特征。英國電信將繼續(xù)使用Clementine快速可視化的建模環(huán)境為其未來的營銷活動指引道路。結果:向銷售人員和營銷活動提供了“最佳客戶”清單直郵活動回應率提高了100%數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第84頁!為了識別這些客戶,英國電信設立了客戶和營銷活動分析小組,由高級咨詢師領導,隸屬于商業(yè)聯(lián)系部門。這個小組的個任務是為英國電信的“商業(yè)高速公路”產(chǎn)品建立客戶特征模型,“商業(yè)高速公路”專門服務于一條線有三個電話號碼(一個是標準的,兩個是數(shù)字的)的小型商業(yè)客戶。1998年9月進行了一次直郵活動和全國媒體宣傳。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第85頁!用數(shù)據(jù)挖掘工具發(fā)現(xiàn)隱含的模式。為對樣本數(shù)據(jù)進行挖掘并從中發(fā)現(xiàn)潛在的模式和趨勢,英國電信選擇了SPSS的高速建模環(huán)境Clementine-數(shù)據(jù)挖掘工具包。因為它提供了大量的分析方法,如聚類、神經(jīng)網(wǎng)絡、關聯(lián)規(guī)則和決策樹。Clementine也可以輕松地處理常規(guī)數(shù)據(jù)問題,如異常值、缺失值和取值較小的數(shù)值。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第86頁!進行這些分析以后,分析小組用Clementine的決策樹快速地建立和檢驗了一系列試驗模型。Clementine最大的優(yōu)勢在于在數(shù)據(jù)挖掘過程中不會遺漏信息。Clementine可以快速地試驗多種想法,排除不合適的,這樣就減少了失敗造成的費用??梢栽趲滋靸?nèi)建立很多試驗模型。英國電信超越原始目標,并使活動的回應率提高了100%。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第87頁!下一步,分析小組計劃使用Clementine識別有最大潛在利潤的客戶和查詢了很多但不會購買的客戶。未來他們或許會嘗試確定客戶背叛的模式。建模:投資回報成功地建立客戶特征需要商業(yè)知識、合適的數(shù)據(jù)和合適的產(chǎn)品。英國電信新的建模方案使之可以在產(chǎn)品和活動的整個生命周期中定位目標客戶,確定不斷變化的市場的發(fā)展趨勢并加強在不同市場領域的滲透。Clementine作為SPSS的數(shù)據(jù)挖掘工作平臺,將為營銷活動提供快速、可靠的統(tǒng)計分析?;貓缶拖裼娦诺纳虡I(yè)高速公路案例所表明的:更好的客戶和更高的銷售。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第88頁!商務智能-以零售業(yè)為例參考深圳索迪科技有限公司夏華學二○○五年十月數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第89頁!國內(nèi)零售行業(yè)IT發(fā)展當前面臨的主要問題業(yè)務系統(tǒng)相互獨立
現(xiàn)行各業(yè)務系統(tǒng)各自獨立互不協(xié)調(diào);從而導致很多統(tǒng)計口徑和統(tǒng)計指標在不同的系統(tǒng)存在各自不同的表達,在統(tǒng)計上極易造成混亂。統(tǒng)計工作重復、分散
部門間的統(tǒng)計報表有交叉,有些同名統(tǒng)計指標的表達不一致。并且數(shù)據(jù)分布在不同的系統(tǒng)中,而業(yè)務決策部門的要求往往是全面的數(shù)據(jù)統(tǒng)計,致使信息中心疲于奔命,尚不能滿足業(yè)務決策部門的統(tǒng)計需要。無法有效地利用現(xiàn)有數(shù)據(jù)
一方面,業(yè)務決策部門不能及時掌握全面的業(yè)務信息;另一方面,信息中心完善了面向于操作的業(yè)務系統(tǒng),基本滿足業(yè)務操作的需要,積累了大量的基礎業(yè)務數(shù)據(jù);但由于數(shù)據(jù)過于零散而且分布在各個獨立的系統(tǒng)中,造成雖然有各種各樣的數(shù)據(jù)但不能集成到一起來滿足管理層決策的需要。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第90頁!零售企業(yè)使用商業(yè)智能系統(tǒng)的條件及意義企業(yè)上商業(yè)智能系統(tǒng)的條件:用戶面臨激烈的市場競爭
用戶的數(shù)據(jù)積累已達到一定規(guī)模用戶在系統(tǒng)建設的資金能得到保障用戶基礎業(yè)務信息化建設已經(jīng)完成數(shù)據(jù)積累面臨激烈的市場競爭基礎業(yè)務信息化建設已經(jīng)完成資金數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第91頁!商業(yè)智能系統(tǒng)建設目標建立企業(yè)數(shù)據(jù)中心建立企業(yè)績效考核中心建立企業(yè)綜合查詢中心建立企業(yè)決策支持中心數(shù)據(jù)整合數(shù)據(jù)應用數(shù)據(jù)應用數(shù)據(jù)應用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第92頁!商業(yè)智能系統(tǒng)所產(chǎn)生的效益通過對員工的績效、部門的計劃完成情況、用戶的達成率等績效的考核控制,逐步建立一套完成的企業(yè)績效考核體系,提升企業(yè)經(jīng)營管理水平,增強企業(yè)的競爭力。通過對商品的銷售趨勢分析、商品結構變化分析以及財務分析(如:成本分析、現(xiàn)金流分析)建立一套完整的監(jiān)控預警以及決策支持體系,及時調(diào)整企業(yè)經(jīng)營策略,增強企業(yè)抗風險能力。
系統(tǒng)建設的長期效益主要體現(xiàn)在如下兩個方面:
長期效益數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第93頁!商業(yè)智能系統(tǒng)應用層次體系第1層數(shù)據(jù)源各個部門的業(yè)務系統(tǒng)(業(yè)務數(shù)據(jù)與標準數(shù)據(jù)對照)第2層數(shù)據(jù)加工整理層數(shù)據(jù)抽取、數(shù)據(jù)清理、數(shù)據(jù)加工第3層數(shù)據(jù)中心層次數(shù)據(jù)存儲、數(shù)據(jù)匯總第5層企業(yè)應用層面向企業(yè)的應用服務(報告、郵件)權限、角色第4層商業(yè)應用層數(shù)據(jù)建模、數(shù)據(jù)分析、報表生成、數(shù)據(jù)查詢數(shù)據(jù)層企業(yè)應用層商業(yè)應用層數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第94頁!商業(yè)智能系統(tǒng)建設風險控制在項目實施過程中由于涉及到數(shù)據(jù)的完整性、應用的重視程度、分析模型的準確性等多方面因素,所以項目存在一定的風險,我們將通過以下手段來控制項目風險:
充分調(diào)研,充分了解企業(yè)管理以及績效管理的焦點,建設能滿足分析需求的數(shù)據(jù)分析模型。認真了解業(yè)務系統(tǒng),充分把握業(yè)務系統(tǒng)數(shù)據(jù),提高數(shù)據(jù)的準確性和完整性。企業(yè)領導親自負責,通過企業(yè)領導親自負責來提高系統(tǒng)的應用重視程度。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第95頁!零售行業(yè)商業(yè)智能主要功能模塊POS系統(tǒng)
采購系統(tǒng)
財務系統(tǒng)
人事系統(tǒng)
其他系統(tǒng)數(shù)據(jù)字典、外部信息信息應用(門戶、角色、權限)數(shù)據(jù)倉庫數(shù)據(jù)加工銷售模型庫存模型價格分析毛利分析客流分析績效模型經(jīng)營分析成本分析應用模型數(shù)據(jù)倉庫和數(shù)據(jù)挖掘同濟大學劉仲英教授共107頁,您現(xiàn)在瀏覽的是第96頁!零售行業(yè)商業(yè)智能主要數(shù)據(jù)模型分析內(nèi)容:庫存直接反映企業(yè)經(jīng)營狀況和資金周轉(zhuǎn)效率,所以對庫存進行分析能夠有效控制庫存、降低經(jīng)營風險、降低經(jīng)營成本和提高經(jīng)營效益。主要分析各項庫存指標,例如:商品庫存數(shù)量、庫存對比情況、庫存結構情況、庫存金額情況、庫存變化情況、商品存銷比、庫存銷售天數(shù)、庫存安全情況、庫存盤點情況、庫存損耗情況等;分析維度
管理架構(企業(yè)組織)時間維度商品
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學真題練習試卷B卷附答案
- 2024年交通運輸設備項目資金需求報告代可行性研究報告
- 一年級數(shù)學計算題專項練習1000題匯編
- 2024年個人房產(chǎn)抵押貸款協(xié)議范本
- 文書模板-《勞務用工合同》
- 2024年度安置性質(zhì)房產(chǎn)購買協(xié)議典范
- 2024老年專家返聘協(xié)議詳細條款
- 2024屆安徽省皖南八校聯(lián)盟高三4月(二診)調(diào)研測試卷(康德版)數(shù)學試題
- 2024年度建筑資產(chǎn)轉(zhuǎn)讓協(xié)議樣例
- 2024精簡型牛肉購銷協(xié)議文本
- 20以內(nèi)進位加法100題(精心整理6套-可打印A4)
- 陜西師范大學學位英語試題
- 中小學反恐風險評估報告
- 品牌營銷策略和品牌策略
- 視力矯正商業(yè)計劃書
- 醫(yī)學課件:臨床決策分析
- 幼兒園優(yōu)質(zhì)公開課:中班音樂韻律《打噴嚏的小老鼠》課件
- 質(zhì)量管理體系品質(zhì)保證體系圖
- 人教版(新插圖)三年級上冊數(shù)學 第9課時 用乘除兩步計算 解決-歸總問題 教學課件
- 《現(xiàn)代漢語》考試復習題庫及答案
- 13J104《蒸壓加氣混凝土砌塊、板材構造》
評論
0/150
提交評論