數(shù)據(jù)倉庫應(yīng)用實例_第1頁
數(shù)據(jù)倉庫應(yīng)用實例_第2頁
數(shù)據(jù)倉庫應(yīng)用實例_第3頁
數(shù)據(jù)倉庫應(yīng)用實例_第4頁
數(shù)據(jù)倉庫應(yīng)用實例_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 數(shù)據(jù)倉庫應(yīng)用實例 1數(shù)據(jù)倉庫的數(shù)據(jù)加載與鉆取 2數(shù)據(jù)挖掘模型的設(shè)計 3SQL Server中的數(shù)據(jù)挖掘工具 4數(shù)據(jù)倉庫客戶端界面的設(shè)計 1 數(shù)據(jù)倉庫的數(shù)據(jù)加載與鉆取 1.1 數(shù)據(jù)倉庫的數(shù)據(jù)加載 1. SQL Server的數(shù)據(jù)復(fù)制工具與應(yīng)用 5個有關(guān)復(fù)制的向?qū)Чぞ撸簞?chuàng)建發(fā)布向?qū)?、?chuàng)建強制新訂閱向?qū)?、?chuàng)建請求訂閱發(fā)布、禁用發(fā)布或分布向?qū)?、配置發(fā)布和分布向?qū)?、SQL Server數(shù)據(jù)復(fù)制向?qū)?2.創(chuàng)建發(fā)布向?qū)Ю冒l(fā)布向?qū)Э梢酝瓿蛇@樣一些操作:選擇發(fā)布數(shù)據(jù)庫。使用發(fā)布模板。選擇發(fā)布類型。選擇可更新的訂閱??蓚魉偷挠嗛啠煺諒?fù)制或事務(wù)復(fù)制可使用的選項)。指定訂閱服務(wù)器類型。指定要發(fā)布的數(shù)據(jù)和數(shù)據(jù)庫對

2、象項目。選擇發(fā)布名稱和描述。3.創(chuàng)建強制新訂閱向?qū)?在強制訂閱中,集中的分發(fā)服務(wù)器將建立調(diào)度,按照此調(diào)度與遠程的、偶爾連接的訂閱服務(wù)器進行連接。使用強制訂閱,分發(fā)代理程序(用于快照發(fā)布和事務(wù)發(fā)布)或合并代理程序(用于合并發(fā)布)可以運行于分發(fā)服務(wù)器。 建立訂閱時要考慮的因素是需要訂閱的類型(強制、請求或匿名)以及運行復(fù)制代理程序的位置。 為了創(chuàng)建訂閱,發(fā)布服務(wù)器上必須有發(fā)布,訂閱服務(wù)器上也必須有訂閱數(shù)據(jù)庫??梢栽趧?chuàng)建訂閱之前創(chuàng)建訂閱數(shù)據(jù)庫,或在創(chuàng)建強制訂閱向?qū)е兄付ㄐ碌挠嗛啍?shù)據(jù)庫??梢詾槿魏卧诎l(fā)布服務(wù)器和分發(fā)服務(wù)器的屬性中啟用的訂閱服務(wù)器創(chuàng)建強制訂閱。3.創(chuàng)建強制新訂閱向?qū)?.創(chuàng)建請求訂閱向?qū)?

3、.禁用發(fā)布或分布向?qū)г赟QL Server的企業(yè)管理器中的“工具”菜單中打開向?qū)Р藛雾?,調(diào)出“選擇向?qū)А睂υ捒颍x擇其中的“復(fù)制”節(jié)點,選擇“禁用發(fā)布或分布向?qū)А辈藛雾?。進入“歡迎使用禁用發(fā)布或分布向?qū)А睂υ捒?。利用該向?qū)Э梢酝瓿伞俺ニx服務(wù)器上的所有發(fā)布”或“除去對應(yīng)已除去發(fā)布的所有訂閱”這些設(shè)置不會影響到該服務(wù)器從其它發(fā)布服務(wù)器接受到的訂閱。 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)倉庫的數(shù)據(jù)導(dǎo)入 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載DTS數(shù)據(jù)導(dǎo)入/導(dǎo)出向?qū)?1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)導(dǎo)入源的選擇 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)導(dǎo)入源的確定 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)

4、加載數(shù)據(jù)導(dǎo)入目的庫選擇 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)導(dǎo)入方式選擇 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載導(dǎo)入數(shù)據(jù)表和視圖的選擇 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)導(dǎo)入源和目的的映射確定 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)導(dǎo)入的轉(zhuǎn)換語言 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載數(shù)據(jù)導(dǎo)入任務(wù)包的保存與調(diào)度 1.2 超市數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)加載任務(wù)包的作業(yè)調(diào)度 任務(wù)包的保存 任務(wù)包完成提示 任務(wù)包的瀏覽 1.3 多維數(shù)據(jù)集的更新DTS調(diào)度包的建立 處理任務(wù)框架 選擇處理對象 調(diào)度任務(wù)處理選項確定 任務(wù)的建立 任務(wù)工作流確定 任務(wù)工作流屬性設(shè)置 DTS包的保存 任務(wù)包的調(diào)度設(shè)置 任務(wù)包的運行時間

5、設(shè)置 1.4 數(shù)據(jù)倉庫的鉆取訪問1.數(shù)據(jù)鉆取的進入2.數(shù)據(jù)鉆取選項的確定3.鉆取數(shù)據(jù)列的選擇4.數(shù)據(jù)鉆取角色的管理在進行數(shù)據(jù)鉆取前,還需要利用與編輯命令同一菜單中的“管理角色”命令確定可以進行數(shù)據(jù)鉆取的管理人員。 5.鉆取數(shù)據(jù)的選擇6.鉆取結(jié)果顯示 1.5 數(shù)據(jù)倉庫的多維表達式MDX應(yīng)用MDX啟動順序:開始程序Microsoft SQL ServerAnalysis ServicesMDX示例應(yīng)用程序。啟動MDX以后將出現(xiàn)Connect對話框,在Server輸入框中輸入Analysis Services服務(wù)器名稱,Provider輸入框中輸入MSOLAP,單擊“OK”按鈕后,出現(xiàn)示例應(yīng)用程序窗

6、口 MDX新查詢建立 MDX查詢結(jié)果顯示 MDX的立方體旋轉(zhuǎn)顯示 2 數(shù)據(jù)挖掘模型的設(shè)計 2.1 數(shù)據(jù)挖掘?qū)ο蟮姆治鲇蓴?shù)據(jù)挖掘項目組成員共同分析數(shù)據(jù)挖掘?qū)ο蟪袪I銷策略評價主要通過門市、商品、營銷策略、日期和客戶五個維度。要分析的則是商品的銷售量、銷售額、商品的成本和商品銷售的利潤等度量信息。商品銷售量增長率=(實施促銷策略后商品銷售量/實施促銷策略前商品銷售量-1)100%商品銷售額增長率=(實施促銷策略后商品銷售額/實施促銷策略前商品銷售額)100%商品利潤增長率=(實施促銷策略后商品利潤/實施促銷策略前商品利潤)100%商品促銷策略門市影響率=不同門市相同促銷策略商品利潤增長率之比商品促

7、銷策略時間影響率=不同時間相同促銷策略商品利潤增長率之比等各種新的變量。 2.2 數(shù)據(jù)挖掘模型與相關(guān)數(shù)據(jù)的準備1挖掘模型的確定 映射:業(yè)務(wù)數(shù)據(jù)是否能夠轉(zhuǎn)換成多維的、可比較的、地理的、時間的或不同的層次問題。 主要方法:分類、估計、關(guān)聯(lián)分組、聚類、細分或預(yù)測等 有時為了解決一些較大的業(yè)務(wù)問題,可能還需要對業(yè)務(wù)問題進行分解,將業(yè)務(wù)問題分解成多個較小的問題。如果這些問題能夠使用分類、估計、關(guān)聯(lián)分組、聚類、細分或預(yù)測等挖掘方法來解決。那么這一較大的問題也就可以用數(shù)據(jù)挖掘方法解決。 2挖掘數(shù)據(jù)的準備一、建立數(shù)據(jù)挖掘庫的步驟:選擇業(yè)務(wù)數(shù)據(jù)、轉(zhuǎn)換業(yè)務(wù)數(shù)據(jù)、驗證業(yè)務(wù)數(shù)據(jù)。 二、為數(shù)據(jù)挖掘工作準備訓(xùn)練數(shù)據(jù)集與數(shù)

8、據(jù)驗證集的步驟:確定數(shù)據(jù)質(zhì)量、準備適當?shù)臄?shù)據(jù)、為目標變量確定初值、確定數(shù)據(jù)挖掘變量的格式。 2.3 數(shù)據(jù)挖掘模型的應(yīng)用注意多目標變量之間的相互關(guān)系 確定多目標變量最終的分析順序 剔除那些對目標變量具有強相關(guān)性的變量 挖掘模型的維護和完善將所獲得挖掘結(jié)果存儲進多維數(shù)據(jù)集 3 SQL Server中的數(shù)據(jù)挖掘工具MS SQL Server2000中的Analysis Services可以對關(guān)系數(shù)據(jù)庫和多維數(shù)據(jù)源中的數(shù)據(jù)進行挖掘,因此任何利用OLE DB可以訪問的關(guān)系數(shù)據(jù)源數(shù)據(jù)以及通過Analysis Services創(chuàng)建的多維數(shù)據(jù)集的數(shù)據(jù)都可以訓(xùn)練挖掘模型。而且SQL Server系統(tǒng)的可擴展性使

9、第三方工具能夠與SQL Server的數(shù)據(jù)挖掘工具組裝使用,提高了系統(tǒng)的性能與靈活性。 Analysis Services中所提供的數(shù)據(jù)挖掘模型主要是兩種:Microsoft決策樹模型和Microsoft數(shù)據(jù)聚集模型。 3.1 決策類數(shù)據(jù)挖掘工具的應(yīng)用1.挖掘數(shù)據(jù)源選擇2.挖掘事例表選擇3.挖掘技術(shù)選擇挖掘事件例關(guān)鍵字選擇 4.挖掘參數(shù)選擇挖掘模型完成對話框 5.挖掘模型保存選擇挖掘模型的處理 挖掘模型編輯器 6.挖掘結(jié)果瀏覽 3.2 聚類分析的數(shù)據(jù)挖掘工具應(yīng)用多維數(shù)據(jù)集編輯 多維數(shù)據(jù)集成員屬性添加 新成員屬性選擇 源多維數(shù)據(jù)集選擇 挖掘事例選擇 預(yù)測實體選擇 培訓(xùn)數(shù)據(jù)選擇 挖掘結(jié)果存儲方式選

10、擇 挖掘模型保存設(shè)置 挖掘模型編輯器 挖掘模型瀏覽 4 數(shù)據(jù)倉庫客戶端界面的設(shè)計 4.1 客戶端界面展現(xiàn)內(nèi)容設(shè)計數(shù)據(jù)倉庫的使用主要集中在主題的多維數(shù)據(jù)集展現(xiàn)、數(shù)據(jù)挖掘結(jié)果的查看瀏覽、管理決策的預(yù)測和數(shù)據(jù)倉庫內(nèi)容的動態(tài)查詢。 主題多維數(shù)據(jù)集的不同維度、不同層次的上卷、下鉆,可以方便地查看數(shù)據(jù)倉庫的內(nèi)容。 數(shù)據(jù)挖掘結(jié)果的展現(xiàn) 管理決策的預(yù)測 數(shù)據(jù)倉庫內(nèi)容的動態(tài)查詢 銷售分析主題展現(xiàn)界面設(shè)計表 分析對象界面名稱基本維鉆取層次12345銷售收入商品子類Brand_Area.xls地區(qū)商品子類商店類型客戶Brand_Time.xls時間商品子類商店類型客戶類型商品地區(qū)Area_Stor.xls商店省市縣

11、/區(qū)客戶Cust_Time.xls時間客戶客戶收入Cust_Prod.xls商品客戶家庭人口家庭同住人口銷售分析主題展現(xiàn)界面設(shè)計表 分析對象界面名稱基本維鉆取層次12345商品擴展特性商品類型Prod_Stor.xls商店客戶類型客戶月消費客戶收入商品子類Prod_Cust.xls客戶家庭人口家庭同住人口商品商標Brad_Area.xls省市縣/區(qū)活動地域商店時間Time_Cust.xls客戶年季度月日客戶Cust_Area.xls省市縣/區(qū)活動地域商品Prod_Area.xls地區(qū)商品種類商品類型商品子類型商標銷售分析主題展現(xiàn)界面設(shè)計表 分析對象界面名稱基本維鉆取層次12345客戶客戶活動地

12、域Area_Stor.xls商店省市縣/區(qū)活動地域客戶類型Cust_Prod.xls商品客戶收入客戶家庭人口客戶住房客戶汽車會員Memb_Prod.xls商品會員卡性別Sex_Time.xls時間客戶類型年季度月日 4.2 客戶端界面展現(xiàn)工具選擇一般在客戶端開發(fā)中可以通過C+編程使用為OLAP服務(wù)的OLE DB,在VB和ASP中使用ADO MD編寫客戶端程序。Microsoft Excel使用了許多為OLAP服務(wù)的OLE DB核心API,使得Excel具有了強大的OLAP數(shù)據(jù)提取和分析功能。可以采用Excel作為數(shù)據(jù)倉庫的OLAP數(shù)據(jù)提取和分析的主要工具。在客戶端界面展現(xiàn)中,有時為了對展現(xiàn)給用

13、戶的數(shù)據(jù)倉庫數(shù)據(jù)進行更好的控制,使一部分用戶可以進行數(shù)據(jù)的鉆取,而禁止另外一部分用戶進行同樣的操作,對客戶按照其職能范圍進行必要的安全控制,或能夠使用戶進行動態(tài)的數(shù)據(jù)操作,或希望將數(shù)據(jù)倉庫的應(yīng)用與其它的信息處理整合在一起,此時,Excel VBA就是一個很好的編程工具。 4.3 EXCEL展現(xiàn)界面的實現(xiàn)要求在客戶端上有Microsoft Office 2000以上的EXCEL版本。并要求在要訪問的數(shù)據(jù)倉庫服務(wù)器上有Microsoft Internet Information服務(wù)(IIS)運行。在客戶端計算機操作系統(tǒng)所在盤上的inetpubwwwroot目錄中有Msolap.asp文件存在,如果沒有,可以從安裝OLAP Services的Program FilesMicr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論