




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 FoodMart數(shù)據(jù)庫涉及到公司經營的各個方面,包括產品、庫存、人事、客戶和銷售等。一個真正的商業(yè)智能應用應該對這些業(yè)務需求進行全面地考慮。本章截取這些需求中的銷售部分構建商業(yè)智能 打開配套文件中附帶的foodmart.mdf文件,可以看到如圖2-1所示的表 第1頁/共71頁第2頁/共71頁 人事管理人事管理三個表中:員工信息:員工信息employee、職務信息position、員工所屬部門department,對應二個維度二個維度employee和department維度。 庫存管理業(yè)務中的倉庫類型存儲在warehouse_class表中,具體的倉庫存儲在warehouse中。 第3頁/共
2、71頁 Warehouse and Sales多維數(shù)據(jù)集 HR多維數(shù)據(jù)集多維數(shù)據(jù)集 Budget多維數(shù)據(jù)集多維數(shù)據(jù)集 Sales and Employee多維數(shù)據(jù)集多維數(shù)據(jù)集第4頁/共71頁 福馬特市場部的商務需求是要對1998年進行的所有銷售業(yè)務數(shù)據(jù)進行多角度分析,以便市場分析人員能在查詢數(shù)據(jù)庫時獲取快速的響應,高層管理人員也能從總體上把握影響本年度銷售的因素。 這需要利用存儲在公司業(yè)務數(shù)據(jù)庫中的數(shù)據(jù),建立數(shù)據(jù)倉庫,進而創(chuàng)建可用于分析的多維數(shù)據(jù)結構。第5頁/共71頁 如前所述,這里只著眼于銷售方面的數(shù)據(jù),因而把與銷售相關的表提煉銷售相關的表提煉出來進行分析。在foodmart數(shù)據(jù)庫中,銷售業(yè)
3、務的數(shù)據(jù)和時間、促時間、促銷手段、產品和店鋪銷手段、產品和店鋪等都有關系,它們的關系體現(xiàn)在表與表之間的邏輯關系上。 要從業(yè)務數(shù)據(jù)出發(fā)設計數(shù)據(jù)倉庫的結構,必須明確業(yè)務數(shù)據(jù)本身的結構,而業(yè)務數(shù)據(jù)的關系一般是基于關系數(shù)據(jù)庫設計的范式。數(shù)據(jù)倉庫中表的關系不受關系數(shù)據(jù)庫設計范式的約束,但也要遵循一定的結構規(guī)范,如星形結構和雪花形結構即是這種類型的規(guī)范。第6頁/共71頁 這里希望用雪花形結構來構建福馬特商店的銷售數(shù)據(jù)倉庫,邏輯結構設計圖如圖2-2所示 第7頁/共71頁銷售數(shù)據(jù)倉庫雪花形結構設計圖 第8頁/共71頁 在數(shù)據(jù)倉庫的邏輯結構中,數(shù)據(jù)表可以劃分為兩類:一類是事實數(shù)據(jù)表(簡稱為“事實表”),用來存儲
4、數(shù)據(jù)倉庫中的實際數(shù)據(jù),如這里存儲1998年銷售數(shù)據(jù)的sales_fact_1998表即為事實表; 另一類是維度數(shù)據(jù)表(簡稱為“維度表”),用來存儲數(shù)據(jù)倉庫中的維度數(shù)據(jù),如這里的關于時間、促銷手段和產品時間、促銷手段和產品等分析要素的表均為維度表。 第9頁/共71頁 注意:注意:在本例中設計的維度表和事實表與原始數(shù)據(jù)中的表名及結構都一致,這主要是由原始數(shù)據(jù)的特點和本章作為入門章節(jié)的定位決定的。在實際設計的時候,通常需要根據(jù)需求情況重新建立通常需要根據(jù)需求情況重新建立與原始數(shù)據(jù)不同的表結構與原始數(shù)據(jù)不同的表結構。 這主要是由于傳統(tǒng)業(yè)務的數(shù)據(jù)庫是用來進行事務處理的(即OLTP),而數(shù)據(jù)倉庫則是用來進
5、行分析處理的(即OLAP),用途的不同決定了其結構的不同。這一點在以后復雜的數(shù)據(jù)倉庫設計中會通過示例體現(xiàn)出來。 第10頁/共71頁 數(shù)據(jù)倉庫也是一種數(shù)據(jù)庫,其管理同樣是通過數(shù)據(jù)庫管理系統(tǒng)(DBMS)來進行的。因此數(shù)據(jù)倉庫可以像普通數(shù)據(jù)庫一樣進行創(chuàng)建、修改和刪除。當數(shù)據(jù)倉庫的邏輯結構設計完后,就可以創(chuàng)建物理數(shù)據(jù)倉庫了第11頁/共71頁 在SQL Server Management Studio建立名為“foodmartsaleDW”的數(shù)據(jù)庫,然后把這里設計的表創(chuàng)建好,數(shù)據(jù)類型依據(jù)原始數(shù)據(jù)庫中的各個表和字段的數(shù)據(jù)類型設置。 但由于這里數(shù)據(jù)倉庫的表結構與原始數(shù)據(jù)庫中的表結構基本一致,因此,創(chuàng)建foo
6、dmartsaleDW數(shù)據(jù)倉庫的物理結構過程也可以在ETL階段完成 第12頁/共71頁 這里的任務就是要把數(shù)據(jù)從其他類型數(shù)據(jù)庫或其他類型數(shù)據(jù)載體如access中裝載到foodmartsaleDW數(shù)據(jù)倉庫中。需要使用到SQL Server Integration Services服務,即SSIS 第13頁/共71頁 (1)打開Business Intelligence Development Studio,選擇【文件】【新建】【項目】命令,彈出“新建項目”對話框,展開“商業(yè)智能項目”,在“模板”窗格中,單擊“Integration Services項目”,把項目命名為“foodmartsale
7、ETL”,如圖2-3所示。第14頁/共71頁第15頁/共71頁 這時會在BI Studio環(huán)境中打開用于設計SSIS的各種工具和窗口,數(shù)據(jù)提取、轉換和加載數(shù)據(jù)提取、轉換和加載的操作都在這個界面下進行。 (2)選擇【項目】【SSIS導入和導出向導】命令,這時會彈出SSIS導入和導出向導的歡迎界面,單擊【下一步】按鈕。 (3)在“選擇數(shù)據(jù)源”窗口中的“數(shù)據(jù)源”下拉列表框中選擇Access數(shù)據(jù)源選項,如圖2-4所示。然后在路徑選擇中選擇此項目文件夾中的foodmart 2000.mdb文件。第16頁/共71頁第17頁/共71頁第18頁/共71頁第19頁/共71頁第20頁/共71頁 這時會讓用戶選擇源
8、表和源視圖,如圖2-7所示。按照前面對數(shù)據(jù)倉庫的設計,這里選擇原始表中的7個表:time_by_day、promotion、product、product_class、customer、store和sales_fact_1998表作為需要輸入的表。 第21頁/共71頁 這里對原始表中需要導入到數(shù)據(jù)倉庫的數(shù)據(jù)有很強的可定制性,對這些已經選擇的表中的字段還對這些已經選擇的表中的字段還可以進行篩選和改變,對不需要的字段進行去除可以進行篩選和改變,對不需要的字段進行去除操作,這就是所謂的數(shù)據(jù)清洗操作,這就是所謂的數(shù)據(jù)清洗。 當然也可以選擇其他的表一起導入數(shù)據(jù)倉庫中。可以看到,不一定所有的業(yè)務數(shù)據(jù)庫中的
9、數(shù)據(jù)都必須體現(xiàn)在數(shù)據(jù)倉庫中,數(shù)據(jù)倉庫中的數(shù)據(jù)也有可能是經過業(yè)務數(shù)據(jù)庫中的數(shù)據(jù)運算而得到的,這都取決于具體商務活動的需求。 第22頁/共71頁 在圖2-7的界面中,還可以對數(shù)據(jù)導入的目標進行定制,可以對映射方式進行編輯,甚至可以自己寫“CREATE TABLE”語句作為復制的目標表。這些改變都可以體現(xiàn)在數(shù)據(jù)倉庫的物理結構中。 第23頁/共71頁 這里不對映射及其目標進行變更,保持默認的狀態(tài),使生成的數(shù)據(jù)倉庫的物理模型完全符合前面對數(shù)據(jù)倉庫的邏輯模型的設計。 (7)以上操作完成后,單擊【下一步】按鈕,系統(tǒng)將會把前面的操作列表并要求用戶確認,并提示將會把包以“Package1.dtsx”作為文件名保
10、存在項目文件夾下面,而且不會立即執(zhí)行不會立即執(zhí)行。確認無誤后單擊【完成】按鈕。 (8)在“解決方案資源管理器”中展開“SSIS包”文件夾,在Package1.dtsx上單擊鼠標右鍵,在彈出的快捷菜單中選擇【設為啟動對象設為啟動對象】命令,如圖2-8所示。 第24頁/共71頁第25頁/共71頁 (9)單擊工具條上的運行按鈕運行按鈕運行這個工程,可以發(fā)現(xiàn)在SSIS設計界面的“控制流”和“數(shù)據(jù)流”等選項卡內都有對象在活動,這是系統(tǒng)正在把數(shù)據(jù)從foodmart 2000.mdb數(shù)據(jù)庫中按照前面所確定的規(guī)則裝載入foodmartsaleDW數(shù)據(jù)倉庫中。 注意:新建的數(shù)據(jù)倉庫中的表需要設置必要需要設置必要
11、的主鍵及外鍵的主鍵及外鍵,否則無法建立多維數(shù)據(jù)集第26頁/共71頁第27頁/共71頁 設計好了結構良好的數(shù)據(jù)倉庫,并且將需要分析的業(yè)務數(shù)據(jù)裝載到了數(shù)據(jù)倉庫中之后,就為滿足商務決策的全方位需求打下了根基,以后的操作都是基于這些擁有數(shù)據(jù)的數(shù)據(jù)倉庫進行的。 但是,對數(shù)據(jù)的多維分析卻并不是主要針對數(shù)據(jù)倉庫,而是針對從數(shù)據(jù)倉庫中提取的子集,如數(shù)據(jù)集市和多維數(shù)據(jù)集(也稱為數(shù)據(jù)立方)。因此通常還需要在具體分析數(shù)據(jù)之前創(chuàng)建數(shù)據(jù)立方。 第28頁/共71頁 數(shù)據(jù)立方的創(chuàng)建和管理需要用到SQL Server 2005中Business Intelligence Development Studio的Analysis
12、 Services組件,即SSAS。第29頁/共71頁 這里將創(chuàng)建用于福馬特商店銷售分析的數(shù)據(jù)立方,首先要創(chuàng)建一個SSAS的項目。 打開Business Intelligence Development Studio,選擇【文件】【新建】【項目】命令,或按【Ctrl+Shift+N】組合鍵以顯示“新建項目”對話框。在“新建項目”對話框中,從“項目類型”選項組中選擇“商業(yè)智能項目”。從“Visual Studio已安裝的模板”選項組中選擇“Analysis Services 項目項目”。在“名稱”文本框中輸入“foodmartsaleAS”作為項目名稱,如圖2-10所示。單擊【確定】按鈕進入SS
13、AS的工作界面。 第30頁/共71頁第31頁/共71頁 打開“解決方案資源管理器”,可以看到數(shù)據(jù)源、數(shù)據(jù)源視圖、多維數(shù)據(jù)集、維度和挖掘結構等8個文件夾對象,建立和管理數(shù)據(jù)立方也是主要針對這8個對象進行的。下面介紹創(chuàng)建數(shù)據(jù)立方的步驟 第32頁/共71頁 這是創(chuàng)建數(shù)據(jù)立方的第1步。在“解決方案資源管理器”中的“數(shù)據(jù)源”文件夾上單擊鼠標右鍵,在彈出的快捷菜單中選擇【新建數(shù)據(jù)源】命令,如圖2-11所示。 第33頁/共71頁第34頁/共71頁 在彈出的“選擇如何定義連接”窗口中選擇“基于現(xiàn)有連接或新連接創(chuàng)建數(shù)據(jù)源”單選按鈕,在“數(shù)據(jù)連接”列表框中選擇foodmartsaleDW數(shù)據(jù)源,如果沒有此連接,可
14、以單擊【新建】按鈕,定義指向foodmartsaleDW 數(shù)據(jù)倉庫的連接。設置完成后的頁面如圖2-12所示。由于向導下面的操作是沒有必要的,所以這里可以直接單擊【完成】按鈕結束數(shù)據(jù)源向導。 第35頁/共71頁第36頁/共71頁 數(shù)據(jù)源提供與數(shù)據(jù)庫的簡單連接,但更多高級功能,如緩存元數(shù)據(jù)、添加關系、緩存元數(shù)據(jù)、添加關系、創(chuàng)建計算和設置邏輯鍵等還需要使用數(shù)據(jù)創(chuàng)建計算和設置邏輯鍵等還需要使用數(shù)據(jù)源視圖源視圖來完成。為了對多維數(shù)據(jù)集進行這些高級操作,這一步定義數(shù)據(jù)源視圖。 第37頁/共71頁 可以在“數(shù)據(jù)源視圖”文件夾對象上單擊鼠標右鍵,在彈出的快捷菜單中選擇【新建數(shù)據(jù)源視圖】命令,然后在彈出的“數(shù)據(jù)
15、源視圖向導”窗口中選擇foodmartsaleDW選項作為關系數(shù)據(jù)源,單擊【下一步】按鈕。這時會彈出如圖2-13所示的“名稱匹配”窗口,其原因是在前面SSIS的數(shù)據(jù)裝載操作中沒有為數(shù)據(jù)倉庫中的表設置主鍵及其關系,SSAS試圖在匹配的列上創(chuàng)建邏輯關系,可以選擇“與主鍵同名與主鍵同名”單選按鈕(SSAS2008沒有這個功能) ,單擊【下一步】按鈕繼續(xù) 。第38頁/共71頁第39頁/共71頁 這時進入“選擇表和視圖”窗口,如圖2-14所示??梢詮倪x定的數(shù)據(jù)源提供的對象列表中選擇表和視圖。這里主要的商務需求是對銷售數(shù)據(jù)進行分析,所以可以把相關的數(shù)據(jù)表都選入數(shù)據(jù)源視圖,對數(shù)據(jù)源中與分析需求關聯(lián)不大的要素
16、也可以不選入此分析視圖,例如此處的region表可以不用選入數(shù)據(jù)源視圖。 第40頁/共71頁 以上操作完成后,單擊【下一步】按鈕,為此數(shù)據(jù)源視圖命名為Vfoodmartsale,再單擊【完成】按鈕結束此向導 第41頁/共71頁第42頁/共71頁 同樣也是由于數(shù)據(jù)源中的表沒有設置主鍵的原因,現(xiàn)在打開的數(shù)據(jù)源視圖上的表都是獨立的,相互之間沒有關系,還需要我們設置各個表的主鍵設置各個表的主鍵及其關系才能成為可用的視圖。 一般來說,事實表是沒有主鍵事實表是沒有主鍵的,而維度表都有維度表都有主鍵主鍵,且每一個維度表的主鍵都是事實表的外鍵每一個維度表的主鍵都是事實表的外鍵,因而,需要為每一個維度表設置主鍵
17、,如圖2-15所示,在維度表中選擇應該為主鍵的字段,然后單擊鼠標右鍵,在彈出的快捷菜單中選擇【設置邏輯主鍵】命令,即可設置維度表的主鍵。 第43頁/共71頁第44頁/共71頁 對每一個維度表設置好主鍵后,應該設置維度表和事實表之間的關系,方法是把事實表中的外鍵作為源,拖動到維度表中的相關字段,這時會彈出“創(chuàng)建關系”窗口,如圖2-16所示。需要注意的是一定要把外把外鍵表作為源,主鍵表作為目標鍵表作為源,主鍵表作為目標(即由維度表(即由維度表-主鍵主鍵表拖向事實表表拖向事實表-外鍵表)外鍵表),如果方向錯了,可以單擊圖2-16的【反向】按鈕以保證其關系符合業(yè)務數(shù)據(jù)中的邏輯關系。 第45頁/共71頁
18、第46頁/共71頁 按照以上的步驟,設置好維度表和事實表之間的關系后,數(shù)據(jù)源視圖將會如圖2-17所示 第47頁/共71頁第48頁/共71頁 這一步在上面創(chuàng)建的數(shù)據(jù)源視圖的基礎上生成多維數(shù)據(jù)集,方法如下。 (1)在“解決方案資源管理器”中用鼠標右鍵單擊“多維數(shù)據(jù)集”文件夾對象,在彈出的快捷菜單中選擇【新建多維數(shù)據(jù)集】命令。 (2)在彈出的“多維數(shù)據(jù)集向導”歡迎界面中單擊【下一步】按鈕進入“選擇創(chuàng)建方法”窗口,如圖2-18所示。并在下拉列表框中選擇選擇“使用現(xiàn)使用現(xiàn)有表有表”選項選項,以便向導能為維度表中的大多數(shù)列創(chuàng)建屬性,并嘗試建立包含多級的層次結構第49頁/共71頁第50頁/共71頁 (3)單
19、擊【下一步】按鈕,選擇前面創(chuàng)建的數(shù)據(jù)源視圖來為多維數(shù)據(jù)集提供數(shù)據(jù)。再單擊【下一步】按鈕,向導將掃描關系架構,以識別事實表和維度表。識別完成后,單擊【下一步】按鈕將會彈出如圖2-19所示的“選擇度量值組表”窗口。選擇“1998年銷售事實數(shù)據(jù)”含有含有度量值的事實表,并且按照圖中所示來設置度量值:銷售額、成本和數(shù)量。設置好后單擊【下一步】按鈕繼續(xù)。 第51頁/共71頁第52頁/共71頁 (3)單擊【下一步】按鈕,選擇前面創(chuàng)建的數(shù)據(jù)源視圖來為選擇維度表 。再單擊【下一步】按鈕,向導將掃描關系架構,單擊【下一步】按鈕將會彈出如圖2-19所示的“選擇維度表 ”窗口。這里不選擇“time_by_day”作
20、為時間維度作為時間維度表,其余的全選中,并且按照圖中所示來分別設置各表為維度表。設置好后單擊【下一步】按鈕繼續(xù)。 時間維度需要特殊設置。 第53頁/共71頁第54頁/共71頁 (4)由于上一步選擇了“time_by_day”作為時間維度表,這一步需要設置時間維設置時間維度的層次結構度的層次結構。在所有維度的層次結構中,只有時間維度最為特殊只有時間維度最為特殊。其他維度系統(tǒng)可以根據(jù)數(shù)據(jù)之間的關系檢測其層次結構,而時間維度則需要時間維度則需要指定指定其時間上的層次其時間上的層次。如圖2-20所示,依據(jù)時間表中的具體情況,為年月日等時間屬性指定時間表列。 設置好后單擊【下一步】按鈕繼續(xù)。第55頁/共
21、71頁第56頁/共71頁第57頁/共71頁第58頁/共71頁 (6)這時系統(tǒng)將會依據(jù)前面對維度表和事實表的設置來檢測層次結構。如果前面的設置都是正確的,則會成功檢測其層次結構,檢測完畢,單擊【下一步】按鈕繼續(xù)。 (7)由于前面系統(tǒng)自動檢測了維度之間的層次關系,因此,產生了一些新的維度,這一步向導將提供一個窗口來向導將提供一個窗口來查看新建維度的結構并根據(jù)需要進行更改查看新建維度的結構并根據(jù)需要進行更改。此例中的新建維度結構關系如圖2-22所示??梢姡沙绦蜃詣臃治龀鰜淼膶哟谓Y構和用戶自己設置的時間層次結構都是和業(yè)務數(shù)據(jù)中的邏輯結構相符合的。如果不符合,則可以在這一如果不符合,則可以在這一步進行修改步進行修改。設置完成后單擊【下一步】按鈕,為多維數(shù)據(jù)集指定一個名稱,再單擊【完成】按鈕,結束多維數(shù)據(jù)集的創(chuàng)建向導。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度技術合作項目終止及解除合同書
- 2025年度農村水井承包合同與農業(yè)灌溉用水權流轉及監(jiān)管協(xié)議
- 2025年度特殊年齡段勞動者用工協(xié)議及權益保障
- 2025年度個體商戶勞動合同(家政服務行業(yè)合作)
- 5G通信借款居間合同模板
- 2025年度分紅股收益確認與分配協(xié)議
- 2025年度影視作品著作權許可及廣告植入合作合同
- 2025年度分手協(xié)議書模板:分手后共同債務承擔協(xié)議
- 2025年度房屋拆除與建筑垃圾清運一體化服務合同
- 2025年度企業(yè)導師帶徒技能傳承服務協(xié)議
- 售后維修服務單模板
- (中職)電子技術基礎與技能(電子信息類)教案
- 汪小蘭有機化學課件(第四版)3
- 減少電力監(jiān)控系統(tǒng)告警信息上傳方法的研究(QC成果)
- 如何發(fā)揮好辦公室協(xié)調、督導、服務職能
- 交易商協(xié)會非金融企業(yè)債務融資工具發(fā)行注冊工作介紹
- 《人與環(huán)境》課程教學大綱
- 班組長管理能力提升培訓(PPT96張)課件
- 深圳市城市用地分類表
- 內蒙古自治區(qū)小額貸款公司試點管理實施細則
- 勞務分包入住生活區(qū)承諾書
評論
0/150
提交評論