chapter4-數(shù)據(jù)資源.ppt_第1頁
chapter4-數(shù)據(jù)資源.ppt_第2頁
chapter4-數(shù)據(jù)資源.ppt_第3頁
chapter4-數(shù)據(jù)資源.ppt_第4頁
chapter4-數(shù)據(jù)資源.ppt_第5頁
已閱讀5頁,還剩86頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

UIBE,第4章 數(shù)據(jù)資源管理 創(chuàng)建商務(wù)智能 2019年7月10日,UIBE,主要內(nèi)容,商務(wù)智能 關(guān)系數(shù)據(jù)庫模型 數(shù)據(jù)庫管理工具 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘 組織中的數(shù)據(jù)資源管理,UIBE,商務(wù)智能關(guān)于客戶、競爭對手、合作者的,以及競爭環(huán)境和內(nèi)部環(huán)境的知識。 兩類信息(知識)處理工具: OLTP 事務(wù)信息的處理。 OLAP 支持決策制定的信息處理。,一、商務(wù)智能,UIBE,IBM 的 BI,知識就是力量。 BI 系統(tǒng)收集客戶的相關(guān)信息并加以分析,以幫助確定商機(jī)和創(chuàng)建可以滿足客戶需求的戰(zhàn)略。 數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和決策支持中的先進(jìn)技術(shù)創(chuàng)建大量的BI工具。,UIBE,商業(yè)智能解決方案的應(yīng)用,1 電子商務(wù) 分析商品銷售,協(xié)助改善網(wǎng)站經(jīng)營狀況;實(shí)時分析客戶行為、消費(fèi)傾向,從而實(shí)施更具針對性和高效的商業(yè)戰(zhàn)略;幫助決策者優(yōu)化經(jīng)營模式、發(fā)現(xiàn)新市場,提高用戶忠誠度。 2 稅務(wù)部門 查出應(yīng)稅未報者和瞞稅漏稅者,并對其進(jìn)行跟蹤;對不同行業(yè)、產(chǎn)品和市場中納稅人的行為特征進(jìn)行描述,找出普遍規(guī)律,謀求因勢利導(dǎo)的稅務(wù)征稽策略;對不同行業(yè)、產(chǎn)品和市場應(yīng)收稅款進(jìn)行預(yù)測,制定最有效的征收計劃。 3 零售業(yè) 按條目對每種商品、每個分店進(jìn)行銷售趨勢分析,購買趨勢、時令特點(diǎn)和定價策略都一目了然,幫助經(jīng)營者及時準(zhǔn)確地作出決策。 4 電信業(yè) 客戶呼叫行為分析,客戶信用分析(欺詐檢測),銷售和渠道的效益分析;市場競爭、營銷手段效果分析。 5 保險業(yè) 新保業(yè)務(wù)分析(預(yù)收、承保),保全業(yè)分析(續(xù)期、失效復(fù)效、保單變更、給付),理賠分析(賠付率),險種相關(guān)分析,分支機(jī)構(gòu)及代理點(diǎn)經(jīng)營分析,財務(wù)指標(biāo)分析等。,UIBE,舉例,1 銀行業(yè) 信貸業(yè)務(wù)分析管理,銀行資產(chǎn)分析,資金運(yùn)用管理等。 銀行商業(yè)智能系統(tǒng)提供豐富的經(jīng)濟(jì)數(shù)學(xué)模型,全面、直觀地分析銀行存貸款的分布和業(yè)務(wù)變動趨勢,展現(xiàn)業(yè)務(wù)發(fā)展、運(yùn)做成本與經(jīng)營利潤的增長曲線,通過總量控制、流動性、安全性贏利等指標(biāo)體系的數(shù)據(jù)反映促進(jìn)銀行業(yè)務(wù)的穩(wěn)健發(fā)展和最優(yōu)化運(yùn)做,幫助用戶識別風(fēng)險,預(yù)測業(yè)務(wù)發(fā)展情況。 2 保險商業(yè)智能系統(tǒng) 保險商業(yè)智能系統(tǒng)BI.INSURANCE幫助保險公司全面提高風(fēng)險控制能力和經(jīng)營決策能力,促進(jìn)業(yè)務(wù)和利潤的增長,提高市場競爭力,迎接以客戶為中心的經(jīng)營模式的轉(zhuǎn)變。BI.INSURANCE建立量化、動態(tài)的保險業(yè)務(wù)綜合考核體系和風(fēng)險控制體系。,UIBE,商業(yè)示例-Versace范思哲,品牌主要服務(wù)對象 是皇室貴族和明星。 設(shè)計風(fēng)格非常鮮明 獨(dú)特的美感極強(qiáng)的藝術(shù)先鋒 強(qiáng)調(diào)快樂與性感,領(lǐng)口常開到腰部以下 拮取了古典貴族風(fēng)格的豪華、奢麗,又能充分考慮穿著舒適及恰當(dāng)?shù)娘@示體型。 其他業(yè)務(wù) 經(jīng)營香水、眼鏡、絲巾、領(lǐng)帶、內(nèi)衣、包袋、皮件、床單、臺布、瓷器、玻璃器皿、羽絨制品、家具產(chǎn)品等 時尚產(chǎn)品已滲透到了生活的每個領(lǐng)域。,UIBE,UIBE,UIBE,Panorama NovaView,減少通過數(shù)據(jù)查找重要信息的時間 使用NovaView的交互智能和邏輯,揭示隱藏的、重要的信息 使所有者整體成本更低,UIBE,UIBE,UIBE,從2001年-2003年在上海恒隆廣場成功實(shí)施,Versace用戶問題 自動銷售規(guī)劃 在所有分店追蹤客戶購買行為 績效考核 多維度分析(按產(chǎn)品類別、生產(chǎn)線等) 解決方案- Panorama NovaView 3.0(BI的解決方案) 實(shí)施效果與客戶證言 實(shí)施效果 各級主管能透視公司的問題可以解決,而后使美洲及亞洲的業(yè)務(wù)快速發(fā)展 客戶證言 評估過多家BI解決方案公司后, 我們選擇了Panorama,因為他們能幫助我們提高生產(chǎn)力,提供最佳客戶關(guān)系管理方法。,UIBE,構(gòu)造商務(wù)智能技術(shù)平臺,UIBE,二、數(shù)據(jù)庫,一組相關(guān)數(shù)據(jù)的集合(DB); 由人操作軟件(DBMS)管理數(shù)據(jù); 目的:提供有用的商務(wù)信息和信息管理的一般方法。,UIBE,1、數(shù)據(jù)庫應(yīng)用舉例,商場的積分卡 銀行儲蓄記錄 售票系統(tǒng) 銷售記錄 客戶記錄 ,其中包括大批量數(shù)據(jù)嗎,?,UIBE,2、數(shù)據(jù)庫管理的優(yōu)點(diǎn),實(shí)現(xiàn)數(shù)據(jù)共享* 減少數(shù)據(jù)的冗余度* 數(shù)據(jù)的一致性和完整性好* 數(shù)據(jù)和程序之間的獨(dú)立性好* 有較高的數(shù)據(jù)安全性* 并發(fā)控制性好* 實(shí)現(xiàn)數(shù)據(jù)庫恢復(fù)*,UIBE,3、三個世界的概念,現(xiàn)實(shí)世界 現(xiàn)實(shí)世界的事物及事物之間存在著聯(lián)系 事物本身的性質(zhì) 概念世界 客觀事物及其聯(lián)系的一種抽象描述 實(shí)體 、屬性和聯(lián)系 數(shù)據(jù)世界 將概念世界中的事物數(shù)據(jù)轉(zhuǎn)化計算機(jī)中數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)庫、表、記錄,UIBE,不同世界概念的對應(yīng)關(guān)系,UIBE,不同世界概念的對應(yīng)關(guān)系(示例),UIBE,數(shù)據(jù)抽象的基本過程,UIBE,3、E-R方法 (Entity-Relationship Approach),實(shí)體-聯(lián)系方法:通過E-R圖表示信息世界中實(shí)體、屬性、關(guān)系的模型 反映客觀世界事物、事物的特征以及事物之間的關(guān)系 導(dǎo)出關(guān)系數(shù)據(jù)模型。,UIBE,E-R信息模型的設(shè)計,E-R圖中三要素:實(shí)體、屬性、聯(lián)系 實(shí)體用方框表示 屬性用橢圓框表示 聯(lián)系用菱形框表示 框內(nèi)填寫相應(yīng)的實(shí)體名、屬性名、聯(lián)系名,UIBE,E-R的使用方法,畫單個的實(shí)體圖(實(shí)體+屬性) 確定實(shí)體之間的聯(lián)系方式 聯(lián)系方式(1:1、1:m、m:n) 如果m:n,通過插入實(shí)體的方法改成 1:m n:1方式 畫出綜合的E-R圖,UIBE,訂購關(guān)系的屬性, , ,UIBE,4、關(guān)系數(shù)據(jù)庫模型,數(shù)據(jù)庫 是一個集合,在這個集合中可以按照數(shù)據(jù)的邏輯結(jié)構(gòu)對其進(jìn)行組織和存取。 關(guān)系數(shù)據(jù)庫模型- 二維表形式 關(guān)系 兩個二維表之間的聯(lián)系,UIBE,信息的組織,物理組織,技術(shù) 界面,邏輯組織,字節(jié),位,字Word,Character 字符,Field 字段,Record 記錄,File 文件,database 數(shù)據(jù)庫,data warehouse 數(shù)據(jù)倉庫,字節(jié)Byte,位Bit,UIBE,組成: 以二維表、文件、關(guān)系形式保存的具體信息 信息的邏輯結(jié)構(gòu)-數(shù)據(jù)的邏輯特征,關(guān)系型數(shù)據(jù)庫 -Todays Major Application,UIBE,關(guān)系型數(shù)據(jù)庫 收集信息,一個數(shù)據(jù)庫文件包含一個或更多的文件 文件之間有相關(guān)性或聯(lián)系,UIBE,關(guān)系數(shù)據(jù)庫構(gòu)成模塊,實(shí)體 Entity 與二維表名對應(yīng),代表客觀事物 屬性 Attribute 是用來描述實(shí)體的特征 實(shí)例 Instance 是實(shí)體的具體描述,實(shí)例的集合構(gòu)成實(shí)體,訂單、雇員、客戶等表,訂單(訂單ID、客戶、雇員、訂購日期),10987、中通、劉英玫、1996-3-4,UIBE,數(shù)據(jù)庫表及組件,數(shù)據(jù)庫表由交叉的行和列組成,其中表的行和列具有如下特征: 為每個屬性命名一個列,其中包含了該列所表 示的屬性的屬性值 每行由一個稱為主鍵的屬性唯一確定 主鍵: 能唯一確定一條記錄的的屬性或多個屬性的集合 外鍵: 兩個表之間的關(guān)系通過外鍵確定,一個表的外鍵是在表中與所指向的主鍵相匹配的屬性,UIBE,關(guān)系型數(shù)據(jù)庫舉例(ACCESS) 創(chuàng)建邏輯結(jié)構(gòu),客戶ID是主鍵,在字段屬性中可以定義每個字段的格式、有效性等,UIBE,列-字段,行-記錄,UIBE,再談關(guān)系類型,一對一(1:1):兩個實(shí)體是一一對應(yīng)的關(guān)系,例如員工號和員工。 一對多(1:M):一個表中的記錄可能與另一個表中多個記錄有對應(yīng)關(guān)系。如部門與雇員之間的關(guān)系。一對多是關(guān)系數(shù)據(jù)庫設(shè)計的標(biāo)準(zhǔn)。 多對多(N:M):兩個表中的記錄出現(xiàn)多對應(yīng)的關(guān)系。例如,訂單與產(chǎn)品。 多對多關(guān)系可以通過復(fù)合表的方法轉(zhuǎn)變?yōu)閮蓚€一對多的關(guān)系。,UIBE,關(guān)系型數(shù)據(jù)庫 關(guān)系圖例,UIBE,關(guān)系的轉(zhuǎn)化-減少數(shù)據(jù)冗余,訂單,產(chǎn)品,訂單,產(chǎn)品,M:N,M,1,1,M,訂單細(xì)節(jié),UIBE,5、數(shù)據(jù)庫管理系統(tǒng)DBMS,定義數(shù)據(jù)邏輯結(jié)構(gòu) DBMS引擎 數(shù)據(jù)定義子系統(tǒng):數(shù)據(jù)的邏輯結(jié)構(gòu) 數(shù)據(jù)操作子系統(tǒng):挖掘數(shù)據(jù)/更改信息 應(yīng)用程序生成子系統(tǒng):開發(fā)數(shù)據(jù)庫的應(yīng)用程序 數(shù)據(jù)管理子系統(tǒng):管理數(shù)據(jù)庫 例如ACCESS軟件、Oracle、informix、sysbase DB,UIBE,DBMS 構(gòu)成,數(shù)據(jù)庫,DBMS,工具,數(shù)據(jù)定義,數(shù)據(jù)處理,應(yīng)用系統(tǒng)生成,數(shù)據(jù)管理,建立并修改數(shù)據(jù)庫的邏輯結(jié)構(gòu),查詢以及編輯信息,生成菜單、窗體、報表等,使用者的權(quán)限、數(shù)據(jù)備份和恢復(fù)等,UIBE,DBMS 引擎- 接收來自其他子系統(tǒng)的邏輯查詢請求,并將邏輯請求換成其對應(yīng)的物理形式,數(shù)據(jù)庫管理系統(tǒng)工具,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具,數(shù)據(jù)定義子系統(tǒng) 幫助定義、維護(hù)數(shù)據(jù)字典,定義數(shù)據(jù)庫文件的結(jié)構(gòu) 數(shù)據(jù)操作子系統(tǒng) 幫助添加、更改、刪除數(shù)據(jù)庫中的信息,挖掘有用的數(shù)據(jù)庫信息 包括QBE和 SQL,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)定義子系統(tǒng),信息邏輯結(jié)構(gòu) 字段類型 類型 格式 缺省值 有效范圍 輸入約束 可否重復(fù),UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)操作子系統(tǒng)-視圖,使用望遠(yuǎn)鏡發(fā)現(xiàn)信息,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)操作子系統(tǒng)-報表生成器(打印),UIBE,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)操作子系統(tǒng)-范例查詢工具,Query-by-example (QBE)范例查詢工具 以圖表的方式設(shè)計問題的答案,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)操作子系統(tǒng)-范例查詢工具,QBE網(wǎng)格,查詢條件,UIBE,Structured query language (SQL) 在DBMS工具中經(jīng)常使用的第四代查詢語言. 格式 SELECT Part.Part Number, Part.Cost, Employee.Employee Name, Employee.Employee Number FROM Part, Employee WHERE (Part.Cost)10);,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)操作子系統(tǒng)-范例查詢工具,UIBE,select 語句示例,選擇表中的列 select from 表名; select peopcode,peopname,sex from people; 選擇表中的行 select from 表名 where 行所需要滿足的條件; select * from people where salary1700; select * from people order by salary; update 語句示例: update 表名 set 列名=, where 邏輯表達(dá)式; update people set award=award+500 where job=處長 or job=經(jīng)理;,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)生成子系統(tǒng),Application generation subsystem 幫助我們建立面向事物處理的應(yīng)用程序 數(shù)據(jù)輸入屏幕 DBMS-選擇特定的 程序設(shè)計語言 利用程序設(shè)計語言設(shè)計公共的交互界面,UIBE,數(shù)據(jù)庫管理系統(tǒng)工具 數(shù)據(jù)管理子系統(tǒng),Data administration subsystem 數(shù)據(jù)庫備份、數(shù)據(jù)恢復(fù)、優(yōu)化查詢功能,UIBE,6、數(shù)據(jù)庫管理系統(tǒng)與Excel比較,數(shù)據(jù)庫系統(tǒng)有邏輯結(jié)構(gòu)和物理結(jié)構(gòu) 數(shù)據(jù)庫文件中表之間有聯(lián)系 數(shù)據(jù)庫系統(tǒng)可以建立查詢、報表、窗體等幫助客戶 數(shù)據(jù)庫系統(tǒng)可以優(yōu)化、備份、恢復(fù),UIBE,數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)的關(guān)系,先購買和安裝數(shù)據(jù)庫管理系統(tǒng)DBMS; 使用這個DBMS去設(shè)計數(shù)據(jù)庫DB; 再用DBMS實(shí)現(xiàn)統(tǒng)計等應(yīng)用; 計算機(jī)、OS、用戶、管理員、DB、DBMS共同構(gòu)成DBS,UIBE,三層WEB體系結(jié)構(gòu),數(shù)據(jù),服務(wù)器,WEB SERVER,應(yīng)用SERVER,數(shù)據(jù)庫 SERVER,HTTP,Browser,UIBE,二層結(jié)構(gòu),數(shù)據(jù),服務(wù)器,WEB 和應(yīng)用SERVER,數(shù)據(jù)庫 SERVER,HTTP,Broser,UIBE,7、數(shù)據(jù)庫的應(yīng)用類型,事務(wù)處理(OLTP) 支持繁忙的事務(wù)信息處理,需要高的并發(fā)性及高讀率的處理好技術(shù); 決策支持(OLAP) 挖掘數(shù)據(jù)種的信息,需要好的查詢算法和查詢優(yōu)化技術(shù)。,UIBE,電子商務(wù)應(yīng)用(支持電子商務(wù)活動) 預(yù)售活動 銷售過程 銷售付款 交付產(chǎn)品及相關(guān)活動 客戶支持和售后服務(wù),UIBE,電子目錄:提供瀏覽和搜索功能(產(chǎn)品、供應(yīng)商、分銷商、零售商,運(yùn)貨商等) 市場(客戶、帳號、價格) 反向拍賣市場 拍賣 交易(例如股票、債券交易) 訂單結(jié)算(帳務(wù)、產(chǎn)品、服務(wù)),舉例,UIBE,UIBE,UIBE,UIBE,數(shù)據(jù)庫小結(jié),舉例,以Access為工具,建立小型數(shù)據(jù)庫管理系統(tǒng),參見NORTHWIND管理系統(tǒng) 引出三個概念 數(shù)據(jù)庫 數(shù)據(jù)庫管理系統(tǒng) 數(shù)據(jù)庫系統(tǒng)(人、硬件、軟件、數(shù)據(jù)庫),UIBE,四、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘 什么是數(shù)據(jù)倉庫,Data warehouse 是數(shù)據(jù)的邏輯集合,這個數(shù)據(jù)來自不同的業(yè)務(wù)數(shù)據(jù)庫和不同時期的數(shù)據(jù)庫。其中的數(shù)據(jù)用于建立商務(wù)智能,以便支持企業(yè)的業(yè)務(wù)活動和決策。 強(qiáng)調(diào): 來源:歷史的、多樣的 用途:支持決策制定,UIBE,1、數(shù)據(jù)倉庫的定義,數(shù)據(jù)倉庫之父W.H.Inmon將其定義為: 數(shù)據(jù)倉庫是支持管理決策過程的、面向主題的、集成的、隨時間而變化的、持久的數(shù)據(jù)集合 。,UIBE,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘 什么是數(shù)據(jù)倉庫,UIBE,數(shù)據(jù) 加載器,查詢/分析工具,數(shù)據(jù)倉庫,數(shù)據(jù)源3,數(shù)據(jù)源1,數(shù)據(jù)源2,2、數(shù)據(jù)倉庫體系結(jié)構(gòu),UIBE,查詢和 分析工具,數(shù)據(jù)倉庫,數(shù)據(jù)凈化過程,數(shù)據(jù)提取過程,關(guān)系數(shù)據(jù)庫,層次數(shù)據(jù)庫,網(wǎng)狀數(shù)據(jù)庫,扁平文件,電子表格,最終用戶訪問,UIBE,3、數(shù)據(jù)倉庫的關(guān)鍵要素,何時及如何收集數(shù)據(jù) 數(shù)據(jù)清理(糾正和預(yù)處理) 數(shù)據(jù)模式 數(shù)據(jù)源的更新 匯總何種數(shù)據(jù),UIBE,4、數(shù)據(jù)倉庫模式-星型結(jié)構(gòu),日期信息,商店信息,產(chǎn)品信息,客戶信息,銷售信息,UIBE,5、數(shù)據(jù)倉庫技術(shù)的特點(diǎn),數(shù)據(jù)倉庫將來自不同數(shù)據(jù)庫的數(shù)據(jù)集合在一起 數(shù)據(jù)倉庫是多維的,是一個超立體結(jié)構(gòu);例如:區(qū)域、年份、顧客、信譽(yù)度、生產(chǎn)線、商品等 數(shù)據(jù)倉庫是為決策服務(wù)的而不是為事務(wù)處理,UIBE,6、數(shù)據(jù)挖掘工具,Data mining tools 在數(shù)據(jù)倉庫中進(jìn)行信息查詢的軟件工具 包括 查詢和報告工具 - QBE tools, SQL, and report generators. 智能代理 - 模糊邏輯、神經(jīng)網(wǎng)絡(luò)形成OLAP的信息查詢基礎(chǔ).,UIBE,7、數(shù)據(jù)挖掘工具類型,多維分析 (MDA) tools : slice-and-dice (一片一層)techniques that allow you to view multidimensional information from different perspectives. 統(tǒng)計工具 : help you apply various mathematical models to the information stored in a data warehouse to discover new information.,UIBE,8、數(shù)據(jù)挖掘技術(shù)定義(Data Mining),數(shù)據(jù)挖掘(Data Mining)是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的以及最終可理解模式的高級處理過程。 從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。,UIBE,9、了解數(shù)據(jù)挖掘理論基礎(chǔ),數(shù)理統(tǒng)計 排序,計算最大值、最小值、平均值、局部匯總,同期比較、前期比較,比重分析,20/80分析。 頻數(shù)分布、累計頻率分布、樣本均值(標(biāo)準(zhǔn)差,變異系數(shù))、抽樣技術(shù)、區(qū)間估計與假設(shè)檢驗 。 多元統(tǒng)計 聚類分析、主成分分析、因子分析 、判別分析、 相關(guān)分析、典型相關(guān)分析、對應(yīng)分析、回歸分析。,有的財富掌握在的人的手里; 所有的的收入來自于去年在的時間里所付出的努力(所以你去年真正工作的時間只有) 一年當(dāng)中的快樂也是來自于的時間等等,UIBE,趨勢預(yù)測 移動平均法、一次指數(shù)平滑法、 二次指數(shù)平滑法、最小二乘法、自適應(yīng)過濾以及自動組合預(yù)測。 運(yùn)籌學(xué) 馬爾可夫、博奕理論、網(wǎng)絡(luò)計劃、統(tǒng)計決策、排隊模型、因果分析圖、反饋系統(tǒng)模型。 數(shù)學(xué)規(guī)劃 人工智能與專家系統(tǒng),數(shù)據(jù)挖掘理論基礎(chǔ)(續(xù)),UIBE,10、數(shù)據(jù)挖掘的應(yīng)用,DM應(yīng)用于金融業(yè)保險業(yè) 對客戶進(jìn)行信用等級評價 對金融市場預(yù)測和分析 信用卡模式、用戶分析 確定不同行業(yè)、不同年齡、處于不同社會層次的人的保險金 險種關(guān)聯(lián)分析 預(yù)測新險種的客戶群 ,UIBE,DM的應(yīng)用(續(xù)),DM應(yīng)用于商業(yè) 顧客購買習(xí)慣分析(尿布與啤酒) 銷售商品構(gòu)成分析(市場定位、商品定價) 商品銷售預(yù)測、零售店選擇等等 DM應(yīng)用于通信服務(wù)業(yè) 用戶細(xì)分 網(wǎng)絡(luò)規(guī)劃的用戶預(yù)測 資費(fèi)分析、新業(yè)務(wù)發(fā)展預(yù)測 客戶信用分析及反欺詐 ,UIBE,常用的數(shù)據(jù)挖掘技術(shù),人工神經(jīng)網(wǎng)絡(luò) 仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的非線形預(yù)測模型,通過學(xué)習(xí)進(jìn)行模式識別。 決策樹 代表著決策集的樹形結(jié)構(gòu)。通過將大量數(shù)據(jù)有目的分類,從中找到一些有價值的,潛在的信息。 遺傳算法 基于進(jìn)化理論,并采用遺傳結(jié)合、遺傳變異、以及自然選擇等設(shè)計方法的優(yōu)化技術(shù)。尋找最優(yōu)的算法。,UIBE,數(shù)據(jù)挖掘的任務(wù),關(guān)聯(lián)分析(association analysis) 關(guān)聯(lián)規(guī)則挖掘是由Rakesh Apwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的、可被發(fā)現(xiàn)的知識。關(guān)聯(lián)分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個閥值來度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引入興趣度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。 聚類分析(clustering) 聚類是把數(shù)據(jù)按照相似性歸納成若干類別,同一類中的數(shù)據(jù)彼此相似,不同類中的數(shù)據(jù)相異。聚類分析可以建立宏觀的概念,發(fā)現(xiàn)數(shù)據(jù)的分布模式,以及可能的數(shù)據(jù)屬性之間的相互關(guān)系。 分類(classification) 分類就是找出一個類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,并用這種描述來構(gòu)造模型,一般用規(guī)則或決策樹模式表示。分類是利用訓(xùn)練數(shù)據(jù)集通過一定的算法而求得分類規(guī)則。分類可被用于規(guī)則描述和預(yù)測。,UIBE,預(yù)測(predication) 預(yù)測是利用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并由此模型對未來數(shù)據(jù)的種類及特征進(jìn)行預(yù)測。預(yù)測關(guān)心的是精度和不確定性,通常用預(yù)測方差來度量。 時序模式(time-series pattern) 時序模式是指通過時間序列搜索出的重復(fù)發(fā)生概率較高的模式。與回歸一樣,它也是用己知的數(shù)據(jù)預(yù)測未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時間的不同。 偏差分析(deviation) 在偏差中包括很多有用的知識,數(shù)據(jù)庫中的數(shù)據(jù)存在很多異常情況,發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)存在的異常情況是非常重要的。偏差檢驗的基本方法就是尋找觀察結(jié)果與參照之間的差別。,UIBE,數(shù)據(jù)挖掘流程,定義問題:定義出業(yè)務(wù)問題,確定數(shù)據(jù)挖掘的目的。 數(shù)據(jù)準(zhǔn)備: 數(shù)據(jù)準(zhǔn)備包括:選擇數(shù)據(jù)-在大型數(shù)據(jù)庫和數(shù)據(jù)倉庫目標(biāo)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集; 數(shù)據(jù)預(yù)處理-進(jìn)行數(shù)據(jù)再加工,包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、去噪聲,填補(bǔ)丟失的域,刪除無效數(shù)據(jù)等。 數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)功能的類型和和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,在凈化和轉(zhuǎn)換過的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。 結(jié)果分析:對數(shù)據(jù)挖掘結(jié)果進(jìn)行解釋和評價,轉(zhuǎn)換成為能夠最終被用戶理解的知識。 知識的運(yùn)用:將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。,UIBE,五、企業(yè)信息資源的管理 誰來管理企業(yè)的信息資源,Chief information officer (CIO) 負(fù)責(zé)信息化戰(zhàn)略的制定、技術(shù)方向、信息資源的宏觀管理。 Chief knowledge officer(CKO)-是CIO的提升 Data administration 規(guī)劃、監(jiān)視和管理組織的信息資源。 Database administration 負(fù)責(zé)信息管理中偏技術(shù)方面的工作,例如建立何種數(shù)據(jù)庫、怎么加密、壓縮等。,UIBE,企業(yè)信息資源的管理 技術(shù)變化將對信息的組織和管理哪些影響?,技術(shù)改變? 查詢工具的集合? 信息所有權(quán)? 道德規(guī)范?,UIBE,Syntellects 在線事務(wù)處理系統(tǒng),UIBE,CASE-匯園ERP中的數(shù)據(jù)庫,公司情況: 創(chuàng)建于1992年6月,是目前國內(nèi)知名度很高的大型果汁飲料生產(chǎn)企業(yè)之一。 主要從事各種果蔬汁的開發(fā)、生產(chǎn)和銷售,年生產(chǎn)成品果蔬汁飲料50萬噸,產(chǎn)品有6大類、90多個品種,果汁飲料生產(chǎn)規(guī)模位居全國第一。 據(jù)中國飲料協(xié)會提供的數(shù)據(jù):2000年全國果汁飲料的總產(chǎn)量為97萬噸,其中匯源果汁占了22萬噸左右,以23%的市場份額雄居第一。 從1998年開始就已經(jīng)選用了浪潮通軟公司基于Sybase數(shù)據(jù)庫系統(tǒng)的Windows版財務(wù)管理軟件,并且取得了良好的效果,UIBE,財務(wù)到ERP,2001年,技術(shù)人員對匯源果汁財務(wù)、競爭力、管理、組織結(jié)構(gòu)及市場環(huán)境等狀況進(jìn)行了認(rèn)真的調(diào)查研究,并與匯源公司的各層人員進(jìn)行了溝通,對該公司各方面狀況有了比較深入的了解。在放眼全局、把握行業(yè)和公司特色的基礎(chǔ)上,IT公司為匯源果汁量身定制

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論