數據倉庫應用實例_第1頁
數據倉庫應用實例_第2頁
數據倉庫應用實例_第3頁
數據倉庫應用實例_第4頁
數據倉庫應用實例_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 數據倉庫應用實例 1數據倉庫的數據加載與鉆取 2數據挖掘模型的設計 3SQL Server中的數據挖掘工具 4數據倉庫客戶端界面的設計 1 數據倉庫的數據加載與鉆取 1.1 數據倉庫的數據加載 1. SQL Server的數據復制工具與應用 5個有關復制的向導工具:創(chuàng)建發(fā)布向導、創(chuàng)建強制新訂閱向導、創(chuàng)建請求訂閱發(fā)布、禁用發(fā)布或分布向導、配置發(fā)布和分布向導、SQL Server數據復制向導 2.創(chuàng)建發(fā)布向導利用發(fā)布向導可以完成這樣一些操作:選擇發(fā)布數據庫。使用發(fā)布模板。選擇發(fā)布類型。選擇可更新的訂閱??蓚魉偷挠嗛啠煺諒椭苹蚴聞諒椭瓶墒褂玫倪x項)。指定訂閱服務器類型。指定要發(fā)布的數據和數據庫對

2、象項目。選擇發(fā)布名稱和描述。3.創(chuàng)建強制新訂閱向導 在強制訂閱中,集中的分發(fā)服務器將建立調度,按照此調度與遠程的、偶爾連接的訂閱服務器進行連接。使用強制訂閱,分發(fā)代理程序(用于快照發(fā)布和事務發(fā)布)或合并代理程序(用于合并發(fā)布)可以運行于分發(fā)服務器。 建立訂閱時要考慮的因素是需要訂閱的類型(強制、請求或匿名)以及運行復制代理程序的位置。 為了創(chuàng)建訂閱,發(fā)布服務器上必須有發(fā)布,訂閱服務器上也必須有訂閱數據庫??梢栽趧?chuàng)建訂閱之前創(chuàng)建訂閱數據庫,或在創(chuàng)建強制訂閱向導中指定新的訂閱數據庫??梢詾槿魏卧诎l(fā)布服務器和分發(fā)服務器的屬性中啟用的訂閱服務器創(chuàng)建強制訂閱。3.創(chuàng)建強制新訂閱向導4.創(chuàng)建請求訂閱向導5

3、.禁用發(fā)布或分布向導在SQL Server的企業(yè)管理器中的“工具”菜單中打開向導菜單項,調出“選擇向導”對話框,選擇其中的“復制”節(jié)點,選擇“禁用發(fā)布或分布向導”菜單項。進入“歡迎使用禁用發(fā)布或分布向導”對話框。利用該向導可以完成“除去所選服務器上的所有發(fā)布”或“除去對應已除去發(fā)布的所有訂閱”這些設置不會影響到該服務器從其它發(fā)布服務器接受到的訂閱。 1.2 超市數據倉庫系統(tǒng)的數據加載數據倉庫的數據導入 1.2 超市數據倉庫系統(tǒng)的數據加載DTS數據導入/導出向導 1.2 超市數據倉庫系統(tǒng)的數據加載數據導入源的選擇 1.2 超市數據倉庫系統(tǒng)的數據加載數據導入源的確定 1.2 超市數據倉庫系統(tǒng)的數據

4、加載數據導入目的庫選擇 1.2 超市數據倉庫系統(tǒng)的數據加載數據導入方式選擇 1.2 超市數據倉庫系統(tǒng)的數據加載導入數據表和視圖的選擇 1.2 超市數據倉庫系統(tǒng)的數據加載數據導入源和目的的映射確定 1.2 超市數據倉庫系統(tǒng)的數據加載數據導入的轉換語言 1.2 超市數據倉庫系統(tǒng)的數據加載數據導入任務包的保存與調度 1.2 超市數據倉庫系統(tǒng)的數據加載任務包的作業(yè)調度 任務包的保存 任務包完成提示 任務包的瀏覽 1.3 多維數據集的更新DTS調度包的建立 處理任務框架 選擇處理對象 調度任務處理選項確定 任務的建立 任務工作流確定 任務工作流屬性設置 DTS包的保存 任務包的調度設置 任務包的運行時間

5、設置 1.4 數據倉庫的鉆取訪問1.數據鉆取的進入2.數據鉆取選項的確定3.鉆取數據列的選擇4.數據鉆取角色的管理在進行數據鉆取前,還需要利用與編輯命令同一菜單中的“管理角色”命令確定可以進行數據鉆取的管理人員。 5.鉆取數據的選擇6.鉆取結果顯示 1.5 數據倉庫的多維表達式MDX應用MDX啟動順序:開始程序Microsoft SQL ServerAnalysis ServicesMDX示例應用程序。啟動MDX以后將出現Connect對話框,在Server輸入框中輸入Analysis Services服務器名稱,Provider輸入框中輸入MSOLAP,單擊“OK”按鈕后,出現示例應用程序窗

6、口 MDX新查詢建立 MDX查詢結果顯示 MDX的立方體旋轉顯示 2 數據挖掘模型的設計 2.1 數據挖掘對象的分析由數據挖掘項目組成員共同分析數據挖掘對象超市營銷策略評價主要通過門市、商品、營銷策略、日期和客戶五個維度。要分析的則是商品的銷售量、銷售額、商品的成本和商品銷售的利潤等度量信息。商品銷售量增長率=(實施促銷策略后商品銷售量/實施促銷策略前商品銷售量-1)100%商品銷售額增長率=(實施促銷策略后商品銷售額/實施促銷策略前商品銷售額)100%商品利潤增長率=(實施促銷策略后商品利潤/實施促銷策略前商品利潤)100%商品促銷策略門市影響率=不同門市相同促銷策略商品利潤增長率之比商品促

7、銷策略時間影響率=不同時間相同促銷策略商品利潤增長率之比等各種新的變量。 2.2 數據挖掘模型與相關數據的準備1挖掘模型的確定 映射:業(yè)務數據是否能夠轉換成多維的、可比較的、地理的、時間的或不同的層次問題。 主要方法:分類、估計、關聯分組、聚類、細分或預測等 有時為了解決一些較大的業(yè)務問題,可能還需要對業(yè)務問題進行分解,將業(yè)務問題分解成多個較小的問題。如果這些問題能夠使用分類、估計、關聯分組、聚類、細分或預測等挖掘方法來解決。那么這一較大的問題也就可以用數據挖掘方法解決。 2挖掘數據的準備一、建立數據挖掘庫的步驟:選擇業(yè)務數據、轉換業(yè)務數據、驗證業(yè)務數據。 二、為數據挖掘工作準備訓練數據集與數

8、據驗證集的步驟:確定數據質量、準備適當的數據、為目標變量確定初值、確定數據挖掘變量的格式。 2.3 數據挖掘模型的應用注意多目標變量之間的相互關系 確定多目標變量最終的分析順序 剔除那些對目標變量具有強相關性的變量 挖掘模型的維護和完善將所獲得挖掘結果存儲進多維數據集 3 SQL Server中的數據挖掘工具MS SQL Server2000中的Analysis Services可以對關系數據庫和多維數據源中的數據進行挖掘,因此任何利用OLE DB可以訪問的關系數據源數據以及通過Analysis Services創(chuàng)建的多維數據集的數據都可以訓練挖掘模型。而且SQL Server系統(tǒng)的可擴展性使

9、第三方工具能夠與SQL Server的數據挖掘工具組裝使用,提高了系統(tǒng)的性能與靈活性。 Analysis Services中所提供的數據挖掘模型主要是兩種:Microsoft決策樹模型和Microsoft數據聚集模型。 3.1 決策類數據挖掘工具的應用1.挖掘數據源選擇2.挖掘事例表選擇3.挖掘技術選擇挖掘事件例關鍵字選擇 4.挖掘參數選擇挖掘模型完成對話框 5.挖掘模型保存選擇挖掘模型的處理 挖掘模型編輯器 6.挖掘結果瀏覽 3.2 聚類分析的數據挖掘工具應用多維數據集編輯 多維數據集成員屬性添加 新成員屬性選擇 源多維數據集選擇 挖掘事例選擇 預測實體選擇 培訓數據選擇 挖掘結果存儲方式選

10、擇 挖掘模型保存設置 挖掘模型編輯器 挖掘模型瀏覽 4 數據倉庫客戶端界面的設計 4.1 客戶端界面展現內容設計數據倉庫的使用主要集中在主題的多維數據集展現、數據挖掘結果的查看瀏覽、管理決策的預測和數據倉庫內容的動態(tài)查詢。 主題多維數據集的不同維度、不同層次的上卷、下鉆,可以方便地查看數據倉庫的內容。 數據挖掘結果的展現 管理決策的預測 數據倉庫內容的動態(tài)查詢 銷售分析主題展現界面設計表 分析對象界面名稱基本維鉆取層次12345銷售收入商品子類Brand_Area.xls地區(qū)商品子類商店類型客戶Brand_Time.xls時間商品子類商店類型客戶類型商品地區(qū)Area_Stor.xls商店省市縣

11、/區(qū)客戶Cust_Time.xls時間客戶客戶收入Cust_Prod.xls商品客戶家庭人口家庭同住人口銷售分析主題展現界面設計表 分析對象界面名稱基本維鉆取層次12345商品擴展特性商品類型Prod_Stor.xls商店客戶類型客戶月消費客戶收入商品子類Prod_Cust.xls客戶家庭人口家庭同住人口商品商標Brad_Area.xls省市縣/區(qū)活動地域商店時間Time_Cust.xls客戶年季度月日客戶Cust_Area.xls省市縣/區(qū)活動地域商品Prod_Area.xls地區(qū)商品種類商品類型商品子類型商標銷售分析主題展現界面設計表 分析對象界面名稱基本維鉆取層次12345客戶客戶活動地

12、域Area_Stor.xls商店省市縣/區(qū)活動地域客戶類型Cust_Prod.xls商品客戶收入客戶家庭人口客戶住房客戶汽車會員Memb_Prod.xls商品會員卡性別Sex_Time.xls時間客戶類型年季度月日 4.2 客戶端界面展現工具選擇一般在客戶端開發(fā)中可以通過C+編程使用為OLAP服務的OLE DB,在VB和ASP中使用ADO MD編寫客戶端程序。Microsoft Excel使用了許多為OLAP服務的OLE DB核心API,使得Excel具有了強大的OLAP數據提取和分析功能。可以采用Excel作為數據倉庫的OLAP數據提取和分析的主要工具。在客戶端界面展現中,有時為了對展現給用

13、戶的數據倉庫數據進行更好的控制,使一部分用戶可以進行數據的鉆取,而禁止另外一部分用戶進行同樣的操作,對客戶按照其職能范圍進行必要的安全控制,或能夠使用戶進行動態(tài)的數據操作,或希望將數據倉庫的應用與其它的信息處理整合在一起,此時,Excel VBA就是一個很好的編程工具。 4.3 EXCEL展現界面的實現要求在客戶端上有Microsoft Office 2000以上的EXCEL版本。并要求在要訪問的數據倉庫服務器上有Microsoft Internet Information服務(IIS)運行。在客戶端計算機操作系統(tǒng)所在盤上的inetpubwwwroot目錄中有Msolap.asp文件存在,如果沒有,可以從安裝OLAP Services的Program FilesMicr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論