SAS 數(shù)據(jù)倉庫方法論_第1頁
SAS 數(shù)據(jù)倉庫方法論_第2頁
SAS 數(shù)據(jù)倉庫方法論_第3頁
SAS 數(shù)據(jù)倉庫方法論_第4頁
SAS 數(shù)據(jù)倉庫方法論_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SAS 數(shù)據(jù)倉庫方法論目 錄 HYPERLINK /document/#方法論瀏覽 l 方法論瀏覽 A. 快速建庫方法論瀏覽 HYPERLINK /document/#什么是數(shù)據(jù)倉庫 l 什么是數(shù)據(jù)倉庫 1什么是數(shù)據(jù)據(jù)倉庫 HYPERLINK /document/#建立數(shù)據(jù)倉庫的業(yè)務理由 l 建立數(shù)據(jù)倉庫的業(yè)務理由 2建立數(shù)據(jù)倉倉庫的業(yè)務理理由 HYPERLINK m/docuument/ l 建立數(shù)據(jù)據(jù)倉庫的技術術理由 3建立數(shù)數(shù)據(jù)倉庫的技技術理由 HYPERLINK /document/#數(shù)據(jù)倉庫的技術特征 l 數(shù)據(jù)倉庫的技術特征 4數(shù)據(jù)倉庫的的技術特征 HYPERLINK /docume

2、nt/#確認業(yè)務需要和數(shù)據(jù)倉庫的目標 l 確認業(yè)務需要和數(shù)據(jù)倉庫的目標 5確認業(yè)務需需要和數(shù)據(jù)倉倉庫的目標 HYPERLINK /documeent/ l 關關鍵成功因素素 6關鍵成成功因素 HYPERLINK /document/#方法論的細節(jié) l 方法論的細節(jié) B. SAS快快速建立數(shù)據(jù)據(jù)倉庫方法論論的細節(jié) HYPERLINK /document/#業(yè)務驅動 l 業(yè)務驅動 1業(yè)務驅動 HYPERLINK /document/#收集需求的研討會 l 收集需求的研討會 2收集需求的的研討會 HYPERLINK /document/#快速應用開發(fā) (RAD) l 快速應用開發(fā) (RAD) 3快速

3、應用開開發(fā) (RAAD) HYPERLINK /document/#方法論的框架 l 方法論的框架 C方法論的框框架 A. 快速建庫庫方法論瀏覽覽 一個企企業(yè)在開發(fā)和和實施數(shù)據(jù)倉倉庫時,使用用一個高效和和經(jīng)驗證的方方法論是關鍵鍵的,這一點點已是十分清清楚的了??伎紤]到這一點點,多年來SSAS研究、發(fā)發(fā)展和改進了了經(jīng)驗證的實實施數(shù)據(jù)倉庫庫的方法論,我我們稱之為快快速建庫方法法論。本文件件的這一節(jié)將將描述這個方方法論。1什么是數(shù)據(jù)據(jù)倉庫? 一個數(shù)數(shù)據(jù)倉庫通常常是一個分散散的數(shù)據(jù)存儲儲,在其中信信息是存為這這樣的一種形形式,它適合合于業(yè)務智能能化和決策支支持系統(tǒng)。數(shù)數(shù)據(jù)可能是以以不同形式存存儲的,它

4、并并不影響OLLTP系統(tǒng)的的運作。 數(shù)據(jù)倉倉庫的建立是是用一種循環(huán)環(huán)的逐步完善善的過程而不不是一步完善善的。數(shù)據(jù)倉倉庫通常是與與解決企業(yè)不不斷改變的組組織問題的全全過程有關。 數(shù)據(jù)倉庫通常是圍繞主題建立的。主題就是企業(yè)感興趣的論題,比如部門、活動和操作結果。數(shù)據(jù)倉庫的結構是由數(shù)據(jù)倉庫應滿足的應用決定的??焖偬峤恍畔⑹浅晒嵤?shù)據(jù)倉庫的關鍵。由于這一點,就引入了象數(shù)據(jù)集市和信息集市這些概念。數(shù)據(jù)集市是數(shù)據(jù)倉庫的一個子集,它通常更為概括,以滿足對關心數(shù)據(jù)的查詢有比數(shù)據(jù)倉庫本身更快的速度。信息集市存儲可用視窗器(viewer)顯示的預處理的信息。 在信息息集市中常包包含以下幾類類信息:報告輸出(打印

5、印的文本、圖圖形等) 多媒體介質 (錄象和錄音音)內容的記記錄 電子表單 2建立數(shù)據(jù)倉倉庫的業(yè)務理理由 數(shù)據(jù)倉倉庫為管理者者和業(yè)務用戶戶提供真正決決策支持的基基礎。企業(yè)為為這些業(yè)務用用戶存儲了多多年的信息,但但是數(shù)據(jù)倉庫庫提供專為他他們設計的有有構架的信息息。數(shù)據(jù)倉庫庫實施的最初初階段往往要要解決現(xiàn)成的的業(yè)務問題(即較為被動動的),而以以后的實施常常是更為主動動的。數(shù)據(jù)倉倉庫的一個強強項是它支持持對數(shù)據(jù)的隨隨時需要的查查詢和進行未未計劃的數(shù)據(jù)據(jù)探索的需要要。就是說,數(shù)數(shù)據(jù)倉庫給業(yè)業(yè)務用戶以不不同方法分析析數(shù)據(jù)的能力力和自由度,而而不受預先設設定的一組報報告的限制。3建立數(shù)據(jù)倉倉庫的技術理理由

6、建建立數(shù)據(jù)倉庫庫最共同的技技術理由是企企業(yè)現(xiàn)用的信信息技術結構構不能滿意地地滿足業(yè)務需需要。過去,信信息技術集中中于運作系統(tǒng)統(tǒng),它保證業(yè)業(yè)務過程運行行所必須的任任務的自動化化。但是,運運作系統(tǒng)一般般不能很好地地滿足決策支支持的需要。一一個運作系統(tǒng)統(tǒng)典型的有多多個事務處理理(trannsactiion)的應應用構成,每每個應用使部部門的一個過過程和功能自自動化。在運運作系統(tǒng)中,每每個事務和每每一分鐘的業(yè)業(yè)務細節(jié)都記記錄在與事務務應用關聯(lián)的的數(shù)據(jù)庫中。 事務系統(tǒng)的設計要考慮將部門運作需要的細節(jié)信息有效地進入系統(tǒng)。有效性的要求導致應用開發(fā)者實現(xiàn)高度規(guī)范的數(shù)據(jù)和在存檔發(fā)生之前就必須決定作為應用的一部分

7、有多少數(shù)據(jù)可存儲。雖然運作系統(tǒng)對日常業(yè)務活的支持是非常有效的,但他們對于運用常規(guī)的軟件技術支持報表制作、決策和行政信息系統(tǒng)并不是很好的。他們的側重點是在數(shù)據(jù)的存儲,很少提供訪問數(shù)據(jù)和將數(shù)據(jù)變?yōu)橛杏脹Q策信息的工具。 運作系統(tǒng)和數(shù)據(jù)倉庫是完全不同的。內容是不同的,結構是不同的,硬件和軟件的需求是不同的,管理是不同的和用戶是不同的。數(shù)據(jù)倉庫的存儲是設計得能提供決策支持信息的。它由業(yè)務應用數(shù)據(jù)來構建,但數(shù)據(jù)要先經(jīng)過提取,再進行過濾、校驗并組織到反映單位需要的主題中去。 數(shù)據(jù)倉庫的數(shù)據(jù)是經(jīng)過一段時間的收集,并用于比較、趨勢分析和預測的。 若用運運作系統(tǒng)存儲儲的數(shù)據(jù)做決決策支持,將將會遇到以下下的一些問題

8、題:決策要求對歷史史數(shù)據(jù)進行比比較、趨勢分分析和預測。這這些信息通常常在運作系統(tǒng)統(tǒng)中是無法得得到的。 數(shù)據(jù)必須從運作作數(shù)據(jù)存區(qū)中中提取。隨著著時間推移,這這些提取也增增長和擴大。數(shù)數(shù)據(jù)的可靠性性、有效性和和通用性都是是無法確定的的,因為創(chuàng)建建各種分析需需要的復本時時已生成了原原始數(shù)據(jù)源的的多個復本和和多個不同水水平的數(shù)據(jù)子子集。 在運作系統(tǒng)中的的數(shù)據(jù)是按一一個特殊的活活動而格式化化的,它并不不考慮單位決決策的需要。從從多個運作數(shù)數(shù)據(jù)庫中得到到的數(shù)據(jù)需要要提取和處理理,這使得很很難顧及單位位的要求。為為了作出可靠靠的業(yè)務決策策或者回答簡簡單的業(yè)務問問題,分析工工作者必須花花費大量的時時間從不同的

9、的數(shù)據(jù)源中局局部化或整合合有關的信息息。 運作系統(tǒng)是經(jīng)常常更新的。當當數(shù)據(jù)經(jīng)常改改變時,就難難于對企業(yè)的的問題作出一一致的回答。而而回答的經(jīng)常常改變會混淆淆決策過程。 運作系統(tǒng)對大量量細小的事務務進行優(yōu)化。常常常一個查詢詢導致另一個個查詢。業(yè)務務用戶活動的的重復本質以以及處理大量量數(shù)據(jù)的需要要與運作數(shù)據(jù)據(jù)庫的設計、目目的是沖突的的。 很多企企業(yè)試圖用訪訪問數(shù)據(jù)和提提取數(shù)據(jù)的軟軟件工具從運運作系統(tǒng)獲得得決策支持的的數(shù)據(jù),有成成功的也有不不成功的。無無論如何,即即便使用這些些工具,運作作系統(tǒng)和決策策支持設計固固有的矛盾總總是存在的。數(shù)數(shù)據(jù)倉庫按其其定義消除了了上述的問題題。事實上,這這些問題幫助助

10、我們確定數(shù)數(shù)據(jù)倉庫的技技術特征。4數(shù)據(jù)倉庫的的技術特征 數(shù)據(jù)倉倉庫的技術特特征如下:數(shù)據(jù)倉庫的數(shù)據(jù)據(jù)不是多變的的。這意味著著不同人員對對同一信息的的需求將獲得得相同的回答答。這也意味味著在您分析析的過程中數(shù)數(shù)據(jù)不會改變變。 數(shù)據(jù)倉庫的的數(shù)據(jù)裝載是是適時和可用用于預測的。 數(shù)據(jù)倉庫反映企企業(yè)機構組織織的需要。數(shù)數(shù)據(jù)倉庫的構構件是直接反反映您們單位位的主題。這這些主題規(guī)定定得可滿足企企業(yè)的需要而而不管運作系系統(tǒng)的要求。 數(shù)據(jù)倉庫是整合合的。所有業(yè)業(yè)務系統(tǒng)的有有價值信息都都要整合到數(shù)數(shù)據(jù)倉庫的主主題中去。多多個業(yè)務數(shù)據(jù)據(jù)源數(shù)據(jù)的差差別應該在裝裝載到數(shù)據(jù)倉倉庫之前進行行協(xié)調。 數(shù)據(jù)倉庫提供企企業(yè)的歷史

11、回回顧。多年的的數(shù)據(jù)常以匯匯總的方式加加以存儲。與與此對照的,典典型的業(yè)務應應用只存儲一一個較短時段段的數(shù)據(jù)。 數(shù)據(jù)倉庫對查詢詢功能是優(yōu)化化的。優(yōu)化通通常需要對數(shù)數(shù)據(jù)預匯總,預預索引和預取取子集。將數(shù)數(shù)據(jù)分隔和組組合為許多可可能的組合(分片和切塊塊)的能力和和有效地反復復查詢大量數(shù)數(shù)據(jù)的能力是是數(shù)據(jù)倉庫的的基本要求。 最后,數(shù)據(jù)倉庫庫必須與分析析工具項匹配配。裝載和維維護數(shù)據(jù)倉庫庫只是過程的的一部分。一一個數(shù)據(jù)倉庫庫只有具備了了輔助的決策策支持工具時時才是完善的的,這一決策策支持工具應應反映和利用用數(shù)據(jù)倉庫的的結構。 5確認業(yè)務需需要和數(shù)據(jù)倉倉庫的目標 如同已已經(jīng)看到的,使使用數(shù)據(jù)倉庫庫技術有

12、清楚楚的技術理由由。但是,清清晰地設定數(shù)數(shù)據(jù)倉庫要實實現(xiàn)的業(yè)務需需要和用以評評價數(shù)據(jù)倉庫庫成功的標準準這兩者同樣樣是十分重要要的。在大部部分情形,數(shù)數(shù)據(jù)倉庫是為為業(yè)務部門建建立的。所以以數(shù)據(jù)倉庫的的成功依賴于于對業(yè)務部門門需求的了解解。由于這一一點,由業(yè)務務部門確定數(shù)數(shù)據(jù)倉庫的內內容是必須的的。 SAS快速速建庫方法論論也提供問卷卷和過程,它它幫助企業(yè)確確定數(shù)據(jù)倉庫庫內容和構架架。它也幫助助企業(yè)確定評評價準則和清清楚地界定數(shù)數(shù)據(jù)倉庫項目目。清楚地明明白企業(yè)的需需要和目標也也將幫助說明明數(shù)據(jù)倉庫項項目與企業(yè)的的關系以及數(shù)數(shù)據(jù)倉庫的作作用和企業(yè)成成功的關系。6關鍵成功因因素 除了對對企業(yè)的業(yè)務務需

13、求和數(shù)據(jù)據(jù)倉庫目的有有一個清晰的的了解外,還還需要采取下下列步驟確保保數(shù)據(jù)倉庫項項目滿足這些些需要和目標標:選擇公司可能的的最高人員負負責數(shù)據(jù)倉庫庫項目。他對對項目成功負負有全職。組組成包括業(yè)務務決策者和IIT專家的跨跨部門項目組組。數(shù)據(jù)倉庫庫成功的一個個關鍵是業(yè)務務專家和ITT專家的密切切合作,它將將保證數(shù)據(jù)倉倉庫項目的各各個方面都被被顧及到。 獲取項目成功所所需要的資源源投資的承諾諾。 項目擁有權的一一致意見。 項目評價標準的的一致意見。 確保業(yè)務部門與與IT部門一一致地為項目目成功進行努努力。 選擇可以提供數(shù)數(shù)據(jù)倉庫完整整解決方案的的可靠和有能能力的伙伴。 若實施一個企業(yè)業(yè)的數(shù)據(jù)倉庫庫,

14、應該在完完成第一循環(huán)環(huán)或項目的模模塊后,讓單單位的其他成成員知道其成成功。若這一一循環(huán)正確地地實現(xiàn)了,其其成功應該讓讓有關的每個個人員清楚地地看到,因為為它是可見的的且直接關系系到企業(yè)的目目標?;氐搅辛信e企業(yè)任務務和處理的清清單并從新確確定其優(yōu)先程程度。再選擇擇擴展數(shù)據(jù)倉倉庫的下一個個項目。 B. SAS快快速建立數(shù)據(jù)據(jù)倉庫方法論論的細節(jié) 數(shù)據(jù)倉倉庫建立的過過程一直還是是比較新的,還還缺少實踐經(jīng)經(jīng)驗,并不為為IT業(yè)界廣廣泛了解。此此外,數(shù)據(jù)倉倉庫常是這樣樣的一個項目目,它與單位位的許多部門門交叉,要求求額外的計劃劃,交流和管管理。在這些些情況下,最最好汲取其它它方面的經(jīng)驗驗并遵循一個個合理、經(jīng)

15、驗驗證的方法論論。 至此,SAAS研究所開開發(fā)的SASS快速建庫方方法論幫助企企業(yè)開發(fā)一個個高質量數(shù)據(jù)據(jù)倉庫,它可可以在預算的的范圍內按時時地滿足甚至至超過用戶的的需要和期望望。它提供一一個檢驗數(shù)據(jù)據(jù)倉庫開發(fā)和和實施是否成成功的測試框框架。它是基基于SAS研研究所的咨詢詢專家、合作作伙伴和用戶戶的最佳實踐踐和經(jīng)驗教訓訓,這些專家家成功地實施施了數(shù)據(jù)倉庫庫。這一方法法論提供了經(jīng)經(jīng)驗證的建庫庫框架,包括括過程、問卷卷、工作表單單和模板。若若企業(yè)自己開開發(fā)這些,將將是耗時和難難于管理的。運運用SAS的的快速建庫方方法論,在實實施數(shù)據(jù)倉庫庫的往復循環(huán)環(huán)的各階段會會快速地遞交交結果,使得得在一個很短短的

16、時間段內內達到一個可可量化的結果果。方法輪是是運用快速應應用開發(fā)和SSAS系統(tǒng)原原型技術的一一個分段式的的處理。這是是一個整合的的,業(yè)務驅動動的處理:各各用戶部門在在實施的各階階段都有重要要的輸入,為為報告和分析析目的而逐步步但快速增長長地使用數(shù)據(jù)據(jù)倉庫,對此此IT部門應應當有準備。 SAS系統(tǒng)提供的工具(例智能化的客戶機/服務器,多廠商構架等)可以幫助企業(yè)實現(xiàn)一個靈活和低風險的處理。相對于數(shù)據(jù)倉庫對企業(yè)的潛在回報,過程的每一步的投入(過程資源、開發(fā)人員和工作人員等)是非常低的。 使得SSAS快速建建庫方法論成成功的三個主主要因素是:業(yè)務或用戶的關關注; 細致的收集用戶戶需求和項目目界定的研討

17、討會; 使用快速應用開開發(fā)(RADD)處理。 這些特特點在下一節(jié)節(jié)討論。1業(yè)務驅動 SASS 快速建庫庫的方法論是是一個高度地地以業(yè)務為驅驅動的過程:了解數(shù)據(jù)倉庫的的需要和將從從數(shù)據(jù)倉庫中中獲益的業(yè)務務管理者必須須參加。 業(yè)務用戶都是項項目組的成員員。使用有用用的技術收集集、建立文檔檔和改善關于于項目參加者者需求的信息息。 度量項目業(yè)務得得益的信息應應在項目的早早期階段就加加以收集。 重點是放在評估估由數(shù)據(jù)倉庫庫得到的業(yè)務務效益和投資資回報。 2收集需求的的研討會 研討會會確立象目標標、范圍和優(yōu)優(yōu)先這樣一些些項目的高水水平要素。這這些是重要的的,因為數(shù)據(jù)據(jù)倉庫項目要要影響許多不不同的業(yè)務領領域

18、,這些領領域會有不同同的優(yōu)先程度度。研討會也也可以縮短完完成項目所需需要的時間,因因為它使人們們聚集在一起起,可減少個個別交談收集集信息的反復復次數(shù)。3快速應用開開發(fā) (RAAD) 一個 RAD循環(huán)環(huán)是對SASS 快速建庫方方法論本質的的一個寫照,因因為需要盡快快第看到他們們努力的結果果??焖賾糜瞄_發(fā)基于反反復發(fā)展的循循環(huán)。即將一一個大項目分分為小項目,或或構件,在在此每個構件件服務于單個個操作單元或或功能區(qū)域的的信息需要。每每個構件是一一個功能的可可管理的單元元,是易于理理解和可以快快速向企業(yè)顯顯示價值的。 運用 RAD 可以使項目開發(fā)組為企業(yè)用戶設定項目的優(yōu)先,為每個構件設定主題以及為每

19、個子項目清楚地劃定范圍。當每個局部任務完成后,會提出和明確進一步的需求。 循環(huán)式的處理有如下的好處:有利于應用維護護。 改進適應需求改改變的能力。 減小無法管理項項目的風險。 及早提供用戶的的反饋。 及早提交用戶的的可度量的好好處。 提交高質量的解解決方案。 及早提供結果。 C方法論的框框架 SASS快速建庫的的方法論典型型地分為概括括如下的6步步。這些步驟驟提供工作的的邏輯分段和和檢驗項目是是否建立在一一個堅實的基基礎上。評估估、需求調查查和總結階段段著眼于確認認、理解和回回顧項目目標標和單位的目目標。設計、構構建和部署階階段基于使用用RAD 手段設計、開開發(fā)和配置數(shù)數(shù)據(jù)倉庫環(huán)境境。以下的流流程圖提供了了方法論各個個階段的一個個總貌和流程程。SAS 快速建建庫方法論的的各個階段在在以下各節(jié)描描述。1評估階段 在評估估階段,對影影響要求解決決方案的用戶戶的現(xiàn)有情況況和條件進行行了解。了解解的目的是分分析用戶的問問題和解決它它的辦法。最最初的評估要要確認和澄清清目標,確認認為澄清目標標所做的研究究的任何需要要,這一評估估將導致建議議開始、延遲遲或取消這個個項目。確定定初始階段項項目組的成員員和項目范圍圍、作用和主主要的提交結結果。2需求調查階階段 在需求求調查階段,項項目組收集業(yè)業(yè)務和IT方方面的高水平平要求。對部部門目標和信信息需求的信信息進行收集集。本階段的的結果為提交交

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論