版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
商務(wù)智能方法與應(yīng)用北京信息科技大學(xué)胡敏minmin516@商務(wù)智能方法與應(yīng)用北京信息科技大學(xué)第一章導(dǎo)言Lecture1:Introduction第一章導(dǎo)言思維導(dǎo)圖上課內(nèi)容:whattorememberinclass?
whattounderstandinclass?
whattoexerciseafterclass?
whattowidenyoursights?
whattogodeepintoresearch?思維導(dǎo)圖主要內(nèi)容1.1商務(wù)智能的基本概念1.2商務(wù)智能的過程1.3商務(wù)智能的系統(tǒng)構(gòu)成1.4商務(wù)智能的發(fā)展歷史主要內(nèi)容1.1商務(wù)智能的基本概念1.1商務(wù)智能的基本概念商務(wù)智能數(shù)據(jù)信息和知識1.1商務(wù)智能的基本概念商務(wù)智能商務(wù)智能商務(wù)智能(Businessintelligence)1996年GartnerGroup
HowardDresner數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的、以輔助企業(yè)決策為目的一類技術(shù)及其應(yīng)用商務(wù)智能商務(wù)智能(Businessintelligence商務(wù)智能商務(wù)智能(Businessintelligence)工業(yè)界商務(wù)智能可以被看作是一類技術(shù)或工具,利用它們可以對大量的數(shù)據(jù)進(jìn)行收集、管理、分析和挖掘,以改善業(yè)務(wù)決策水平,增強(qiáng)企業(yè)的競爭力學(xué)術(shù)界商務(wù)智能是一套理論、方法和應(yīng)用,通過它們可以快速地發(fā)現(xiàn)海量數(shù)據(jù)中隱含的各種知識,有效地解決企業(yè)面臨的管理和決策問題,支持企業(yè)的戰(zhàn)略實施。商務(wù)智能商務(wù)智能(Businessintelligence商務(wù)智能的概念
商務(wù)智能指收集、轉(zhuǎn)換、分析和發(fā)布數(shù)據(jù)的過程,目的是為了更好的決策。商務(wù)智能是指將數(shù)據(jù)轉(zhuǎn)化為知識的過程。它包括捕獲和分析信息,交流信息,以及利用這些信息開發(fā)市場。商務(wù)智能是企業(yè)利用現(xiàn)代信息技術(shù)收集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累計商務(wù)知識和見解,改善商務(wù)決策水平,采取有效的商務(wù)行動,完善各種商務(wù)流程,提升商務(wù)績效,增強(qiáng)綜合競爭力的智慧和能力。BusinessIntelligenceisaprocessofturningdataintoknowledgeandknowledgeintoactionforbusinessgain
—DataWarehouseInstitute商務(wù)智能的概念商務(wù)智能指收集、轉(zhuǎn)換、分析和發(fā)布數(shù)據(jù)的過程,商務(wù)智能是融合了先進(jìn)信息技術(shù)與創(chuàng)新管理理念的結(jié)合體,集成企業(yè)內(nèi)外數(shù)據(jù),進(jìn)行加工并從中提取能夠創(chuàng)造商業(yè)價值的知識,面向企業(yè)戰(zhàn)略并服務(wù)于管理層、業(yè)務(wù)層,指導(dǎo)企業(yè)經(jīng)營決策,提升企業(yè)競爭力。商務(wù)智能的概念商務(wù)智能是融合了先進(jìn)信息技術(shù)與創(chuàng)新管理理念的結(jié)合體,集成企業(yè)商務(wù)智能的概念數(shù)據(jù)ETL數(shù)據(jù)倉庫數(shù)據(jù)挖掘可視化OLAP數(shù)據(jù)知識決策模式趨勢事實關(guān)系模型關(guān)聯(lián)規(guī)則序列目標(biāo)市場資金分配貿(mào)易選擇在哪兒做廣告銷售的地理位置金融經(jīng)濟(jì)POS人口統(tǒng)計生命周期商務(wù)智能的概念數(shù)據(jù)ETL數(shù)據(jù)倉庫數(shù)據(jù)挖掘可視化OLAP數(shù)據(jù)知1111第1章商務(wù)智能導(dǎo)言課件商務(wù)智能在行業(yè)的應(yīng)用銀行客戶利潤分析分支行利潤分析交叉銷售信用風(fēng)險管理新產(chǎn)品推銷收費(fèi)策略保險欺詐管理收費(fèi)策略目標(biāo)市場活動客戶挽留客戶利潤分析零售地區(qū)/商店各種貨物(品牌,分類等)銷售業(yè)績定價和減價市場籃子關(guān)系市場需求預(yù)測倉儲規(guī)劃通訊客戶忠實客戶流失模式客戶利潤分析競爭分析欺詐管理商務(wù)智能在行業(yè)的應(yīng)用銀行保險零售通訊1414各行業(yè)電子商務(wù)網(wǎng)站算法層商業(yè)邏輯層行業(yè)應(yīng)用層商業(yè)應(yīng)用商業(yè)模型挖掘算法CRM產(chǎn)品推薦客戶細(xì)分客戶流失客戶利潤客戶響應(yīng)關(guān)聯(lián)規(guī)則、序列模式、分類、聚集、偏差分析…WEB挖掘網(wǎng)站結(jié)構(gòu)優(yōu)化網(wǎng)頁推薦商品推薦……基因挖掘基因表達(dá)路徑分析基因表達(dá)相似性分析基因表達(dá)共發(fā)生分析……銀行電信零售保險制藥生物信息科學(xué)研究……相關(guān)行業(yè)商務(wù)應(yīng)用需求的推動神經(jīng)網(wǎng)絡(luò)、決策樹、回歸分析、粗集、遺傳算法各行業(yè)電子商務(wù)網(wǎng)站算法商行商業(yè)應(yīng)用商業(yè)模型挖掘算法CRM關(guān)聯(lián)商務(wù)智能應(yīng)用領(lǐng)域銀行美國銀行家協(xié)會(ABA)預(yù)測數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在美國商業(yè)銀行的應(yīng)用增長率是14.9%。分析客戶使用分銷渠道的情況和分銷渠道的容量;建立利潤評測模型;客戶關(guān)系優(yōu)化;風(fēng)險控制等電子商務(wù)網(wǎng)上商品推薦;個性化網(wǎng)頁;自適應(yīng)網(wǎng)站…生物制藥、基因研究DNA序列查詢和匹配;識別基因序列的共發(fā)生性…電信欺詐甄別;客戶流失…保險、零售……政府部門、教育機(jī)構(gòu)、醫(yī)療機(jī)構(gòu)和公用事業(yè)等。利用商務(wù)智能的企業(yè)現(xiàn)在已越來越多,遍及各行各業(yè)。商務(wù)智能應(yīng)用領(lǐng)域銀行數(shù)據(jù)倉庫理解業(yè)務(wù):網(wǎng)絡(luò)資源分析產(chǎn)品結(jié)構(gòu)及組合分析服務(wù)質(zhì)量分析業(yè)務(wù)發(fā)展分析理解客戶:客戶貢獻(xiàn)度分析客戶群體劃分客戶行為分析制訂市場營銷策略風(fēng)險分析:客戶流失的測算信用分析欺詐分析內(nèi)部績效考核:產(chǎn)品、部門利潤分析資源分配資源成本分析誰是最好的客戶?如何擴(kuò)大利潤?如何避免風(fēng)險?收入/成本如何分配?商務(wù)智能對企業(yè)的作用和價值理解業(yè)務(wù):理解客戶:風(fēng)險分析:內(nèi)部績效考核:誰是最好的客戶?不同層次的商務(wù)智能應(yīng)用以前發(fā)生了什么為什么發(fā)生了現(xiàn)在發(fā)生著什么將來會發(fā)生什么業(yè)務(wù)活動管理不同層次的商務(wù)智能應(yīng)用以前發(fā)生了什么為什么發(fā)生了現(xiàn)在發(fā)生著什不同層次的商務(wù)智能應(yīng)用不同層次的商務(wù)智能應(yīng)用商務(wù)智能用戶商務(wù)智能用戶數(shù)據(jù)(data)數(shù)據(jù)是對事物描述的符號。在計算機(jī)科學(xué)中,數(shù)據(jù)是數(shù)字、文字、圖像、聲音等可以輸入到計算機(jī)被識別的符號企業(yè)運(yùn)營離不開數(shù)據(jù)。企業(yè)運(yùn)營的各個環(huán)節(jié)每天都在積累數(shù)據(jù),如供應(yīng)商、客戶的數(shù)據(jù),銷售、生產(chǎn)以及庫存數(shù)據(jù)等。用戶生成數(shù)據(jù)(usergenerateddata,UGD)社會化媒體、智能化手機(jī)等使得全世界不計其數(shù)的個體也在不斷產(chǎn)生數(shù)據(jù)。數(shù)據(jù)(data)數(shù)據(jù)是對事物描述的符號。在計算機(jī)科學(xué)中,數(shù)結(jié)構(gòu)化數(shù)據(jù)(structureddata)通常二維表格的形式存儲在關(guān)系數(shù)據(jù)庫中交易細(xì)節(jié)表交易號商品號單價折扣數(shù)量005872051337922.99010058720514677520100587205000700104.500587206147525105.900587206113838107.5結(jié)構(gòu)化數(shù)據(jù)(structureddata)通常二維表格的形非結(jié)構(gòu)化數(shù)據(jù)(unstructureddata)文本數(shù)據(jù)iphone4s,目前最大的問題,感覺還是電量,充滿一次,用兩天,不過,我還沒怎么玩游戲,都是開瀏覽器之類的應(yīng)用,和聽歌,但是想想,畢竟手機(jī)的電池和ipad的還是沒法比。非結(jié)構(gòu)化數(shù)據(jù)(unstructureddata)文本數(shù)據(jù)i信息(information)通過一定的技術(shù)和方法,對數(shù)據(jù)進(jìn)行集成、分析,挖掘其潛在的規(guī)律和內(nèi)涵,得到的結(jié)果是信息。信息是具有商務(wù)意義的數(shù)據(jù)例如,通過對零售信息的集成和分析發(fā)現(xiàn),某超市的客戶群根據(jù)其消費(fèi)行為可以分為若干個群體,每個群體具有一些明顯的特征。例如,其中一個群體是單身女性,喜歡經(jīng)常購買化妝品,消費(fèi)金額高。信息(information)通過一定的技術(shù)和方法,對數(shù)據(jù)進(jìn)知識(knowledge)當(dāng)信息用于商務(wù)決策,并基于決策開展相應(yīng)的商務(wù)活動時,信息就上升為知識信息轉(zhuǎn)化為知識的過程不僅需要信息,而且需要結(jié)合決策者的經(jīng)驗和能力,用以解決實際的問題。例如,某連鎖超市的經(jīng)理發(fā)現(xiàn),近期化妝品的銷售業(yè)績下降了,為了解決該問題,決定采取促銷措施,根據(jù)對數(shù)據(jù)的分析得到的客戶分群的信息,銷售經(jīng)理鎖定了促銷的目標(biāo)客戶群,最終開展了為這部分客戶郵寄優(yōu)惠券的促銷活動。知識(knowledge)當(dāng)信息用于商務(wù)決策,并基于決策開展1.2商務(wù)智能過程1.2.1知識發(fā)現(xiàn)知識發(fā)現(xiàn)的特征知識模式是使用一種形式化語言來進(jìn)行的表達(dá),表達(dá)描述了事實集合的子集中的一種顯著的事實。通過某種知識發(fā)現(xiàn)方法得到一個顧客細(xì)分的結(jié)果子集為{41歲顧客,42歲顧客,48歲顧客,43歲顧客,64歲顧客…},可以歸納為“40歲之上的顧客”或者“中年以上的顧客”等。知識發(fā)現(xiàn)強(qiáng)調(diào)模式的有效性、新穎性、潛在有用性以及最終能被理解。261.2商務(wù)智能過程1.2.1知識發(fā)現(xiàn)261.2商務(wù)智能過程1.2.2知識發(fā)現(xiàn)過程1、理解所要進(jìn)行研究的領(lǐng)域、與之相關(guān)的以前的知識、以及用戶的目標(biāo);2、創(chuàng)建/選擇目標(biāo)數(shù)據(jù)集合;3、數(shù)據(jù)清理和預(yù)處理;4、數(shù)據(jù)縮減和投影;5、選定數(shù)據(jù)挖掘任務(wù);6、選擇數(shù)據(jù)挖掘算法;7、數(shù)據(jù)挖掘過程;8、對挖掘出來的模式進(jìn)行解釋;9、完善和鞏固所發(fā)現(xiàn)的知識。271.2商務(wù)智能過程1.2.2知識發(fā)現(xiàn)過程272828信息管理學(xué)院1.2.2知識發(fā)現(xiàn)過程——7個步驟如下:1)數(shù)據(jù)清理:消除噪聲或不一致2)數(shù)據(jù)集成:多種數(shù)據(jù)源組合在一起3)數(shù)據(jù)選擇:從數(shù)據(jù)庫中檢索與分析任務(wù)相關(guān)的數(shù)據(jù)。4)數(shù)據(jù)變換:數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式,如匯總或聚集操作5)數(shù)據(jù)挖掘:使用智能方法提取數(shù)據(jù)模式6)模式評估:根據(jù)某種興趣度量,識別表示知識的真正有趣的模式7)知識表示:使用可視化和知識表示技術(shù),向用戶提供挖掘的知識1.2商務(wù)智能過程信息管理學(xué)院1.2.2知識發(fā)現(xiàn)過程——7個步驟如下:1.2信息管理學(xué)院知識發(fā)現(xiàn)過程7個步驟如下:數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)庫數(shù)據(jù)倉庫知識任務(wù)相關(guān)的數(shù)據(jù)選擇與轉(zhuǎn)換數(shù)據(jù)挖掘模式評估與知識表示1.2商務(wù)智能過程信息管理學(xué)院知識發(fā)現(xiàn)過程7個步驟如下:數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)庫商務(wù)智能流程1
Identifybusinessissue2Formulatebusinessquestion3Whatinfo.doIneed4WheredoIfindtheinfo.5Retrieveinfo.6
Analyse
Info.7
Report
answers8
Take
actions商務(wù)智能流程1
Identifybusinessissu1.3商務(wù)智能的系統(tǒng)構(gòu)成六個主要組成部分?jǐn)?shù)據(jù)源數(shù)據(jù)倉庫在線分析處理數(shù)據(jù)探查數(shù)據(jù)挖掘業(yè)務(wù)性能管理1.3商務(wù)智能的系統(tǒng)構(gòu)成六個主要組成部分?jǐn)?shù)據(jù)源企業(yè)內(nèi)部的操作型系統(tǒng),即支持各業(yè)務(wù)部分日常運(yùn)營的信息系統(tǒng)企業(yè)的外部,如人口統(tǒng)計信息、競爭對手信息等數(shù)據(jù)源企業(yè)內(nèi)部的操作型系統(tǒng),即支持各業(yè)務(wù)部分日常運(yùn)營的信息系數(shù)據(jù)倉庫(datawarehouse)各種數(shù)據(jù)源的數(shù)據(jù)經(jīng)過抽取、轉(zhuǎn)換之后需要放到一個供分析使用的環(huán)境,以便對數(shù)據(jù)進(jìn)行管理,這就是數(shù)據(jù)倉庫數(shù)據(jù)集市(datamart):通常針對單個部門的數(shù)據(jù)倉庫,區(qū)別于企業(yè)范圍內(nèi)的數(shù)據(jù)倉庫。數(shù)據(jù)倉庫可以將分析數(shù)據(jù)與實現(xiàn)業(yè)務(wù)處理的操作型數(shù)據(jù)隔離,一方面不影響業(yè)務(wù)處理系統(tǒng)的性能,另一方面為數(shù)據(jù)的分析提供了一個綜合的、集成的、統(tǒng)一的數(shù)據(jù)管理平臺。詳細(xì)信息在第8章介紹數(shù)據(jù)倉庫(datawarehouse)各種數(shù)據(jù)源的數(shù)據(jù)經(jīng)過在線分析處理(onlineanalyticalprocessing)在線分析處理:業(yè)務(wù)性能度量可以通過多個維度、多個層次進(jìn)行多種聚集匯總,通過交互的方式發(fā)現(xiàn)業(yè)務(wù)運(yùn)行的關(guān)鍵性能指標(biāo)的異常之處。多維數(shù)據(jù)可以進(jìn)行多種操作如切片、切塊、下鉆、上卷等詳細(xì)信息在第9章介紹在線分析處理(onlineanalyticalproce數(shù)據(jù)探查(exploration)包括靈活的查詢、即時報表以及統(tǒng)計方法等該類方法屬于被動分析方法探查數(shù)據(jù)的方法可以借助統(tǒng)計上的中心性、發(fā)散性以及相關(guān)性的統(tǒng)計量分析,多變量分析時也可以借助可視化技術(shù)。詳細(xì)信息在第7、10章介紹。數(shù)據(jù)探查(exploration)包括靈活的查詢、即時報表以數(shù)據(jù)挖掘(datamining)數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動發(fā)現(xiàn)隱含的信息和知識的過程,屬于主動分析方法,不需要分析者的先驗假設(shè),可以發(fā)現(xiàn)未知的知識常用的分析方法包括分類、聚類、關(guān)聯(lián)分析、數(shù)值預(yù)測、序列分析、社會網(wǎng)絡(luò)分析等數(shù)據(jù)挖掘(datamining)數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動數(shù)據(jù)挖掘:分類分類(classification)是通過對具有類別的對象的數(shù)據(jù)集進(jìn)行學(xué)習(xí),概括其主要特征,構(gòu)建分類模型,根據(jù)該模型預(yù)測對象的類別的一種數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)。例如,電信公司的客戶可以分為兩類,一類是忠誠的,一類是流失的。根據(jù)這兩類客戶的個人特征方面的數(shù)據(jù)以及在公司的消費(fèi)方面的數(shù)據(jù),利用分類技術(shù)可以構(gòu)建分類模型數(shù)據(jù)挖掘:分類分類(classification)是通過對具第1章商務(wù)智能導(dǎo)言課件數(shù)據(jù)挖掘:聚類聚類(clustering)是依據(jù)物以類聚的原理,將沒有類別的對象根據(jù)對象的特征自動聚集成不同簇的過程,使得屬于同一個簇的對象之間非常相似,屬于不同簇的對象之間不相似。其典型應(yīng)用是客戶分群數(shù)據(jù)挖掘:聚類聚類(clustering)是依據(jù)物以類聚的原數(shù)據(jù)挖掘:關(guān)聯(lián)分析關(guān)聯(lián)分析最早用于分析超市中顧客一次購買的物品之間的關(guān)聯(lián)性例如,發(fā)現(xiàn)關(guān)聯(lián)規(guī)則(associationrule)“尿不濕啤酒(0.5%,60%)”,其含義為,0.5%的交易中會同時購買尿不濕和啤酒,且買尿不濕的交易中有60%會同時買啤酒數(shù)據(jù)挖掘:關(guān)聯(lián)分析關(guān)聯(lián)分析最早用于分析超市中顧客一次購買的物數(shù)據(jù)挖掘:數(shù)值預(yù)測數(shù)值預(yù)測用于預(yù)測連續(xù)變量的取值。常用的預(yù)測方法是回歸分析例如,可以根據(jù)客戶個人特征,如年齡、工作類型、受教育程度、婚姻狀況等,來預(yù)測其每月的消費(fèi)額度。數(shù)據(jù)挖掘:數(shù)值預(yù)測數(shù)值預(yù)測用于預(yù)測連續(xù)變量的取值。數(shù)據(jù)挖掘:序列分析序列分析是對序列數(shù)據(jù)庫進(jìn)行分析,從中挖掘出有意義模式的技術(shù)。序列模式(sequentialpattern)的發(fā)現(xiàn)屬于序列分析,它是從序列數(shù)據(jù)庫中發(fā)現(xiàn)的一種有序模式例如,《赤壁,鴻門宴,見龍卸甲》,意味著“看了赤壁之后會接著看鴻門宴,過段時間會看見龍卸甲”。數(shù)據(jù)挖掘:序列分析序列分析是對序列數(shù)據(jù)庫進(jìn)行分析,從中挖掘出第1章商務(wù)智能導(dǎo)言課件數(shù)據(jù)挖掘:社會網(wǎng)絡(luò)分析社會網(wǎng)絡(luò)(socialnetwork)是由個人或組織及其之間的關(guān)系構(gòu)成的網(wǎng)絡(luò)社會網(wǎng)絡(luò)分析(socialnetworkanalysis)是對社會網(wǎng)絡(luò)的結(jié)構(gòu)和屬性進(jìn)行分析,以發(fā)現(xiàn)其中的局部或全局特點(diǎn),發(fā)現(xiàn)其中有影響力的個人或組織,發(fā)現(xiàn)網(wǎng)絡(luò)的動態(tài)變化規(guī)律等。數(shù)據(jù)挖掘:社會網(wǎng)絡(luò)分析社會網(wǎng)絡(luò)(socialnetwork業(yè)務(wù)績效管理業(yè)務(wù)績效管理(businessperformancemanagement),簡稱BPM,又稱為企業(yè)績效管理(corporateperformancemanagement),是對企業(yè)的關(guān)鍵性能指標(biāo),如銷售、成本、利潤以及可盈利性等,進(jìn)行度量、監(jiān)控和比較的方法和工具。這些信息通常通過可視化的工具如平衡積分卡和儀表盤等進(jìn)行展示。相關(guān)內(nèi)容見第10章。業(yè)務(wù)績效管理業(yè)務(wù)績效管理(businessperforma1.4商務(wù)智能的發(fā)展管理信息系統(tǒng)決策支持系統(tǒng)主管信息系統(tǒng)數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和在線分析處理1.4商務(wù)智能的發(fā)展管理信息系統(tǒng)管理信息系統(tǒng)(managementinformationsystem)簡稱MIS,產(chǎn)生于二十世紀(jì)七十年代為企業(yè)提供企業(yè)管理的全方位信息,為管理人員提供管理決策信息的信息系統(tǒng)其目的主要是提供信息以實現(xiàn)對企業(yè)或組織的快速有效管理管理信息系統(tǒng)(managementinformation決策支持系統(tǒng)(decisionsupportsystem),簡稱DSS,開始于二十世紀(jì)七十年代,發(fā)展于八十年代決策支持系統(tǒng)是基于計算機(jī)的用于支持業(yè)務(wù)或組織決策的信息系統(tǒng)。通常,決策支持系統(tǒng)基于數(shù)據(jù)庫和模型庫,用于解決半結(jié)構(gòu)化和非結(jié)構(gòu)化的決策問題,輔助管理人員做出快速、正確的決策決策支持系統(tǒng)(decisionsupportsystem主管信息系統(tǒng)(Executiveinformationsystem)簡稱EIS,又稱為經(jīng)理信息系統(tǒng),出現(xiàn)于二十世紀(jì)八十年代是針對企業(yè)內(nèi)的高級管理人員的決策支持系統(tǒng)。這種系統(tǒng)提供了靈活的報表生成、預(yù)測、趨勢分析等功能。系統(tǒng)以直觀的形式展現(xiàn)企業(yè)的運(yùn)行狀況以及關(guān)鍵成功因素(criticalsuccessfactors)主管信息系統(tǒng)(Executiveinformations商務(wù)智能商務(wù)智能系統(tǒng)是隨著數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和在線分析處理等技術(shù)的發(fā)展于二十世紀(jì)九十年代而產(chǎn)生的通過數(shù)據(jù)倉庫可以集成企業(yè)內(nèi)外的各種數(shù)據(jù),為數(shù)據(jù)的分析處理提供基礎(chǔ)。在線分析處理則提供從多個維度探查業(yè)務(wù)性能指標(biāo)的交互分析功能。數(shù)據(jù)挖掘結(jié)合人工智能、統(tǒng)計等技術(shù)實現(xiàn)對大量數(shù)據(jù)中潛在模式、規(guī)律、異常的發(fā)現(xiàn)和評價。這些新興的技術(shù)為企業(yè)管理人員提供了更強(qiáng)大的決策支持工具。商務(wù)智能商務(wù)智能系統(tǒng)是隨著數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和在線分析處理等第1章商務(wù)智能導(dǎo)言課件商務(wù)智能方法與應(yīng)用北京信息科技大學(xué)胡敏minmin516@商務(wù)智能方法與應(yīng)用北京信息科技大學(xué)第一章導(dǎo)言Lecture1:Introduction第一章導(dǎo)言思維導(dǎo)圖上課內(nèi)容:whattorememberinclass?
whattounderstandinclass?
whattoexerciseafterclass?
whattowidenyoursights?
whattogodeepintoresearch?思維導(dǎo)圖主要內(nèi)容1.1商務(wù)智能的基本概念1.2商務(wù)智能的過程1.3商務(wù)智能的系統(tǒng)構(gòu)成1.4商務(wù)智能的發(fā)展歷史主要內(nèi)容1.1商務(wù)智能的基本概念1.1商務(wù)智能的基本概念商務(wù)智能數(shù)據(jù)信息和知識1.1商務(wù)智能的基本概念商務(wù)智能商務(wù)智能商務(wù)智能(Businessintelligence)1996年GartnerGroup
HowardDresner數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的、以輔助企業(yè)決策為目的一類技術(shù)及其應(yīng)用商務(wù)智能商務(wù)智能(Businessintelligence商務(wù)智能商務(wù)智能(Businessintelligence)工業(yè)界商務(wù)智能可以被看作是一類技術(shù)或工具,利用它們可以對大量的數(shù)據(jù)進(jìn)行收集、管理、分析和挖掘,以改善業(yè)務(wù)決策水平,增強(qiáng)企業(yè)的競爭力學(xué)術(shù)界商務(wù)智能是一套理論、方法和應(yīng)用,通過它們可以快速地發(fā)現(xiàn)海量數(shù)據(jù)中隱含的各種知識,有效地解決企業(yè)面臨的管理和決策問題,支持企業(yè)的戰(zhàn)略實施。商務(wù)智能商務(wù)智能(Businessintelligence商務(wù)智能的概念
商務(wù)智能指收集、轉(zhuǎn)換、分析和發(fā)布數(shù)據(jù)的過程,目的是為了更好的決策。商務(wù)智能是指將數(shù)據(jù)轉(zhuǎn)化為知識的過程。它包括捕獲和分析信息,交流信息,以及利用這些信息開發(fā)市場。商務(wù)智能是企業(yè)利用現(xiàn)代信息技術(shù)收集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累計商務(wù)知識和見解,改善商務(wù)決策水平,采取有效的商務(wù)行動,完善各種商務(wù)流程,提升商務(wù)績效,增強(qiáng)綜合競爭力的智慧和能力。BusinessIntelligenceisaprocessofturningdataintoknowledgeandknowledgeintoactionforbusinessgain
—DataWarehouseInstitute商務(wù)智能的概念商務(wù)智能指收集、轉(zhuǎn)換、分析和發(fā)布數(shù)據(jù)的過程,商務(wù)智能是融合了先進(jìn)信息技術(shù)與創(chuàng)新管理理念的結(jié)合體,集成企業(yè)內(nèi)外數(shù)據(jù),進(jìn)行加工并從中提取能夠創(chuàng)造商業(yè)價值的知識,面向企業(yè)戰(zhàn)略并服務(wù)于管理層、業(yè)務(wù)層,指導(dǎo)企業(yè)經(jīng)營決策,提升企業(yè)競爭力。商務(wù)智能的概念商務(wù)智能是融合了先進(jìn)信息技術(shù)與創(chuàng)新管理理念的結(jié)合體,集成企業(yè)商務(wù)智能的概念數(shù)據(jù)ETL數(shù)據(jù)倉庫數(shù)據(jù)挖掘可視化OLAP數(shù)據(jù)知識決策模式趨勢事實關(guān)系模型關(guān)聯(lián)規(guī)則序列目標(biāo)市場資金分配貿(mào)易選擇在哪兒做廣告銷售的地理位置金融經(jīng)濟(jì)POS人口統(tǒng)計生命周期商務(wù)智能的概念數(shù)據(jù)ETL數(shù)據(jù)倉庫數(shù)據(jù)挖掘可視化OLAP數(shù)據(jù)知6311第1章商務(wù)智能導(dǎo)言課件商務(wù)智能在行業(yè)的應(yīng)用銀行客戶利潤分析分支行利潤分析交叉銷售信用風(fēng)險管理新產(chǎn)品推銷收費(fèi)策略保險欺詐管理收費(fèi)策略目標(biāo)市場活動客戶挽留客戶利潤分析零售地區(qū)/商店各種貨物(品牌,分類等)銷售業(yè)績定價和減價市場籃子關(guān)系市場需求預(yù)測倉儲規(guī)劃通訊客戶忠實客戶流失模式客戶利潤分析競爭分析欺詐管理商務(wù)智能在行業(yè)的應(yīng)用銀行保險零售通訊6614各行業(yè)電子商務(wù)網(wǎng)站算法層商業(yè)邏輯層行業(yè)應(yīng)用層商業(yè)應(yīng)用商業(yè)模型挖掘算法CRM產(chǎn)品推薦客戶細(xì)分客戶流失客戶利潤客戶響應(yīng)關(guān)聯(lián)規(guī)則、序列模式、分類、聚集、偏差分析…WEB挖掘網(wǎng)站結(jié)構(gòu)優(yōu)化網(wǎng)頁推薦商品推薦……基因挖掘基因表達(dá)路徑分析基因表達(dá)相似性分析基因表達(dá)共發(fā)生分析……銀行電信零售保險制藥生物信息科學(xué)研究……相關(guān)行業(yè)商務(wù)應(yīng)用需求的推動神經(jīng)網(wǎng)絡(luò)、決策樹、回歸分析、粗集、遺傳算法各行業(yè)電子商務(wù)網(wǎng)站算法商行商業(yè)應(yīng)用商業(yè)模型挖掘算法CRM關(guān)聯(lián)商務(wù)智能應(yīng)用領(lǐng)域銀行美國銀行家協(xié)會(ABA)預(yù)測數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在美國商業(yè)銀行的應(yīng)用增長率是14.9%。分析客戶使用分銷渠道的情況和分銷渠道的容量;建立利潤評測模型;客戶關(guān)系優(yōu)化;風(fēng)險控制等電子商務(wù)網(wǎng)上商品推薦;個性化網(wǎng)頁;自適應(yīng)網(wǎng)站…生物制藥、基因研究DNA序列查詢和匹配;識別基因序列的共發(fā)生性…電信欺詐甄別;客戶流失…保險、零售……政府部門、教育機(jī)構(gòu)、醫(yī)療機(jī)構(gòu)和公用事業(yè)等。利用商務(wù)智能的企業(yè)現(xiàn)在已越來越多,遍及各行各業(yè)。商務(wù)智能應(yīng)用領(lǐng)域銀行數(shù)據(jù)倉庫理解業(yè)務(wù):網(wǎng)絡(luò)資源分析產(chǎn)品結(jié)構(gòu)及組合分析服務(wù)質(zhì)量分析業(yè)務(wù)發(fā)展分析理解客戶:客戶貢獻(xiàn)度分析客戶群體劃分客戶行為分析制訂市場營銷策略風(fēng)險分析:客戶流失的測算信用分析欺詐分析內(nèi)部績效考核:產(chǎn)品、部門利潤分析資源分配資源成本分析誰是最好的客戶?如何擴(kuò)大利潤?如何避免風(fēng)險?收入/成本如何分配?商務(wù)智能對企業(yè)的作用和價值理解業(yè)務(wù):理解客戶:風(fēng)險分析:內(nèi)部績效考核:誰是最好的客戶?不同層次的商務(wù)智能應(yīng)用以前發(fā)生了什么為什么發(fā)生了現(xiàn)在發(fā)生著什么將來會發(fā)生什么業(yè)務(wù)活動管理不同層次的商務(wù)智能應(yīng)用以前發(fā)生了什么為什么發(fā)生了現(xiàn)在發(fā)生著什不同層次的商務(wù)智能應(yīng)用不同層次的商務(wù)智能應(yīng)用商務(wù)智能用戶商務(wù)智能用戶數(shù)據(jù)(data)數(shù)據(jù)是對事物描述的符號。在計算機(jī)科學(xué)中,數(shù)據(jù)是數(shù)字、文字、圖像、聲音等可以輸入到計算機(jī)被識別的符號企業(yè)運(yùn)營離不開數(shù)據(jù)。企業(yè)運(yùn)營的各個環(huán)節(jié)每天都在積累數(shù)據(jù),如供應(yīng)商、客戶的數(shù)據(jù),銷售、生產(chǎn)以及庫存數(shù)據(jù)等。用戶生成數(shù)據(jù)(usergenerateddata,UGD)社會化媒體、智能化手機(jī)等使得全世界不計其數(shù)的個體也在不斷產(chǎn)生數(shù)據(jù)。數(shù)據(jù)(data)數(shù)據(jù)是對事物描述的符號。在計算機(jī)科學(xué)中,數(shù)結(jié)構(gòu)化數(shù)據(jù)(structureddata)通常二維表格的形式存儲在關(guān)系數(shù)據(jù)庫中交易細(xì)節(jié)表交易號商品號單價折扣數(shù)量005872051337922.99010058720514677520100587205000700104.500587206147525105.900587206113838107.5結(jié)構(gòu)化數(shù)據(jù)(structureddata)通常二維表格的形非結(jié)構(gòu)化數(shù)據(jù)(unstructureddata)文本數(shù)據(jù)iphone4s,目前最大的問題,感覺還是電量,充滿一次,用兩天,不過,我還沒怎么玩游戲,都是開瀏覽器之類的應(yīng)用,和聽歌,但是想想,畢竟手機(jī)的電池和ipad的還是沒法比。非結(jié)構(gòu)化數(shù)據(jù)(unstructureddata)文本數(shù)據(jù)i信息(information)通過一定的技術(shù)和方法,對數(shù)據(jù)進(jìn)行集成、分析,挖掘其潛在的規(guī)律和內(nèi)涵,得到的結(jié)果是信息。信息是具有商務(wù)意義的數(shù)據(jù)例如,通過對零售信息的集成和分析發(fā)現(xiàn),某超市的客戶群根據(jù)其消費(fèi)行為可以分為若干個群體,每個群體具有一些明顯的特征。例如,其中一個群體是單身女性,喜歡經(jīng)常購買化妝品,消費(fèi)金額高。信息(information)通過一定的技術(shù)和方法,對數(shù)據(jù)進(jìn)知識(knowledge)當(dāng)信息用于商務(wù)決策,并基于決策開展相應(yīng)的商務(wù)活動時,信息就上升為知識信息轉(zhuǎn)化為知識的過程不僅需要信息,而且需要結(jié)合決策者的經(jīng)驗和能力,用以解決實際的問題。例如,某連鎖超市的經(jīng)理發(fā)現(xiàn),近期化妝品的銷售業(yè)績下降了,為了解決該問題,決定采取促銷措施,根據(jù)對數(shù)據(jù)的分析得到的客戶分群的信息,銷售經(jīng)理鎖定了促銷的目標(biāo)客戶群,最終開展了為這部分客戶郵寄優(yōu)惠券的促銷活動。知識(knowledge)當(dāng)信息用于商務(wù)決策,并基于決策開展1.2商務(wù)智能過程1.2.1知識發(fā)現(xiàn)知識發(fā)現(xiàn)的特征知識模式是使用一種形式化語言來進(jìn)行的表達(dá),表達(dá)描述了事實集合的子集中的一種顯著的事實。通過某種知識發(fā)現(xiàn)方法得到一個顧客細(xì)分的結(jié)果子集為{41歲顧客,42歲顧客,48歲顧客,43歲顧客,64歲顧客…},可以歸納為“40歲之上的顧客”或者“中年以上的顧客”等。知識發(fā)現(xiàn)強(qiáng)調(diào)模式的有效性、新穎性、潛在有用性以及最終能被理解。781.2商務(wù)智能過程1.2.1知識發(fā)現(xiàn)261.2商務(wù)智能過程1.2.2知識發(fā)現(xiàn)過程1、理解所要進(jìn)行研究的領(lǐng)域、與之相關(guān)的以前的知識、以及用戶的目標(biāo);2、創(chuàng)建/選擇目標(biāo)數(shù)據(jù)集合;3、數(shù)據(jù)清理和預(yù)處理;4、數(shù)據(jù)縮減和投影;5、選定數(shù)據(jù)挖掘任務(wù);6、選擇數(shù)據(jù)挖掘算法;7、數(shù)據(jù)挖掘過程;8、對挖掘出來的模式進(jìn)行解釋;9、完善和鞏固所發(fā)現(xiàn)的知識。791.2商務(wù)智能過程1.2.2知識發(fā)現(xiàn)過程278028信息管理學(xué)院1.2.2知識發(fā)現(xiàn)過程——7個步驟如下:1)數(shù)據(jù)清理:消除噪聲或不一致2)數(shù)據(jù)集成:多種數(shù)據(jù)源組合在一起3)數(shù)據(jù)選擇:從數(shù)據(jù)庫中檢索與分析任務(wù)相關(guān)的數(shù)據(jù)。4)數(shù)據(jù)變換:數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式,如匯總或聚集操作5)數(shù)據(jù)挖掘:使用智能方法提取數(shù)據(jù)模式6)模式評估:根據(jù)某種興趣度量,識別表示知識的真正有趣的模式7)知識表示:使用可視化和知識表示技術(shù),向用戶提供挖掘的知識1.2商務(wù)智能過程信息管理學(xué)院1.2.2知識發(fā)現(xiàn)過程——7個步驟如下:1.2信息管理學(xué)院知識發(fā)現(xiàn)過程7個步驟如下:數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)庫數(shù)據(jù)倉庫知識任務(wù)相關(guān)的數(shù)據(jù)選擇與轉(zhuǎn)換數(shù)據(jù)挖掘模式評估與知識表示1.2商務(wù)智能過程信息管理學(xué)院知識發(fā)現(xiàn)過程7個步驟如下:數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)庫商務(wù)智能流程1
Identifybusinessissue2Formulatebusinessquestion3Whatinfo.doIneed4WheredoIfindtheinfo.5Retrieveinfo.6
Analyse
Info.7
Report
answers8
Take
actions商務(wù)智能流程1
Identifybusinessissu1.3商務(wù)智能的系統(tǒng)構(gòu)成六個主要組成部分?jǐn)?shù)據(jù)源數(shù)據(jù)倉庫在線分析處理數(shù)據(jù)探查數(shù)據(jù)挖掘業(yè)務(wù)性能管理1.3商務(wù)智能的系統(tǒng)構(gòu)成六個主要組成部分?jǐn)?shù)據(jù)源企業(yè)內(nèi)部的操作型系統(tǒng),即支持各業(yè)務(wù)部分日常運(yùn)營的信息系統(tǒng)企業(yè)的外部,如人口統(tǒng)計信息、競爭對手信息等數(shù)據(jù)源企業(yè)內(nèi)部的操作型系統(tǒng),即支持各業(yè)務(wù)部分日常運(yùn)營的信息系數(shù)據(jù)倉庫(datawarehouse)各種數(shù)據(jù)源的數(shù)據(jù)經(jīng)過抽取、轉(zhuǎn)換之后需要放到一個供分析使用的環(huán)境,以便對數(shù)據(jù)進(jìn)行管理,這就是數(shù)據(jù)倉庫數(shù)據(jù)集市(datamart):通常針對單個部門的數(shù)據(jù)倉庫,區(qū)別于企業(yè)范圍內(nèi)的數(shù)據(jù)倉庫。數(shù)據(jù)倉庫可以將分析數(shù)據(jù)與實現(xiàn)業(yè)務(wù)處理的操作型數(shù)據(jù)隔離,一方面不影響業(yè)務(wù)處理系統(tǒng)的性能,另一方面為數(shù)據(jù)的分析提供了一個綜合的、集成的、統(tǒng)一的數(shù)據(jù)管理平臺。詳細(xì)信息在第8章介紹數(shù)據(jù)倉庫(datawarehouse)各種數(shù)據(jù)源的數(shù)據(jù)經(jīng)過在線分析處理(onlineanalyticalprocessing)在線分析處理:業(yè)務(wù)性能度量可以通過多個維度、多個層次進(jìn)行多種聚集匯總,通過交互的方式發(fā)現(xiàn)業(yè)務(wù)運(yùn)行的關(guān)鍵性能指標(biāo)的異常之處。多維數(shù)據(jù)可以進(jìn)行多種操作如切片、切塊、下鉆、上卷等詳細(xì)信息在第9章介紹在線分析處理(onlineanalyticalproce數(shù)據(jù)探查(exploration)包括靈活的查詢、即時報表以及統(tǒng)計方法等該類方法屬于被動分析方法探查數(shù)據(jù)的方法可以借助統(tǒng)計上的中心性、發(fā)散性以及相關(guān)性的統(tǒng)計量分析,多變量分析時也可以借助可視化技術(shù)。詳細(xì)信息在第7、10章介紹。數(shù)據(jù)探查(exploration)包括靈活的查詢、即時報表以數(shù)據(jù)挖掘(datamining)數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動發(fā)現(xiàn)隱含的信息和知識的過程,屬于主動分析方法,不需要分析者的先驗假設(shè),可以發(fā)現(xiàn)未知的知識常用的分析方法包括分類、聚類、關(guān)聯(lián)分析、數(shù)值預(yù)測、序列分析、社會網(wǎng)絡(luò)分析等數(shù)據(jù)挖掘(datamining)數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動數(shù)據(jù)挖掘:分類分類(classification)是通過對具有類別的對象的數(shù)據(jù)集進(jìn)行學(xué)習(xí),概括其主要特征,構(gòu)建分類模型,根據(jù)該模型預(yù)測對象的類別的一種數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)。例如,電信公司的客戶可以分為兩類,一類是忠誠的,一類是流失的。根據(jù)這兩類客戶的個人特征方面的數(shù)據(jù)以及在公司的消費(fèi)方面的數(shù)據(jù),利用分類技術(shù)可以構(gòu)建分類模型數(shù)據(jù)挖掘:分類分類(classification)是通過對具第1章商務(wù)智能導(dǎo)言課件數(shù)據(jù)挖掘:聚類聚類(clustering)是依據(jù)物以類聚的原理,將沒有類別的對象根據(jù)對象的特征自動聚集成不同簇的過程,使得屬于同一個簇的對象之間非常相似,屬于不同簇的對象之間不相似。其典型應(yīng)用是客戶分群數(shù)據(jù)挖掘:聚類聚類(clustering)是依據(jù)物以類聚的原數(shù)據(jù)挖掘:關(guān)聯(lián)分析關(guān)聯(lián)分析最早用于分析超市中顧客一次購買的物品之間的關(guān)聯(lián)性例如,發(fā)現(xiàn)關(guān)聯(lián)規(guī)則(associationrule)“尿不濕啤酒(0.5%,60%)”,其含義為,0.5%的交易中會同時購買尿不濕和啤酒,且買尿不濕的交易中有60%會同時買啤酒數(shù)據(jù)挖掘:關(guān)聯(lián)分析關(guān)聯(lián)分析最早用于分析超市中顧客一次購買的物數(shù)據(jù)挖掘:數(shù)值預(yù)測數(shù)值預(yù)測用于預(yù)測連續(xù)變量的取值。常用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度知識產(chǎn)權(quán)訴訟代理居間合同范本3篇
- 二零二五年度高科技產(chǎn)業(yè)單位企業(yè)專業(yè)勞務(wù)派遣勞動合同2篇
- 二零二五年度裝修工程調(diào)解合同
- 小升初語文專題六 課內(nèi)文言文習(xí)題 (有答案)
- 1.2復(fù)雜多變的關(guān)系(解析版)
- 二零二五年報關(guān)單據(jù)銷售與關(guān)務(wù)代理及關(guān)務(wù)咨詢合同模板3篇
- 沙灣區(qū)2024年中考語文模擬考試試卷
- 二零二五年智能家居系統(tǒng)配套瓷磚供貨合同3篇
- 二零二五年度信息化技術(shù)服務(wù)合同694262篇
- 二零二五年度綠色辦公耗材集中采購與供應(yīng)鏈管理協(xié)議3篇
- 人員保有培訓(xùn)課件
- 水上拋石安全專項施工方案
- 臺大歐麗娟《紅樓夢》公開課全部筆記
- 數(shù)據(jù)治理在物流行業(yè)的應(yīng)用
- 班組長薪酬體系設(shè)計方案
- 持續(xù)改進(jìn)管理程序
- 網(wǎng)絡(luò)安全設(shè)備巡檢報告
- ZJ50DBS鉆機(jī)-01使用說明書
- 校園廣播系統(tǒng)施工安裝方案
- 石群邱關(guān)源電路課件(第8至16單元)白底
- 暫緩執(zhí)行拘留申請書
評論
0/150
提交評論