bi之ods使用手冊天善智能一家之言_第1頁
bi之ods使用手冊天善智能一家之言_第2頁
bi之ods使用手冊天善智能一家之言_第3頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、天善智能致全體 BI 同仁的各位 BI 同仁們:大家好!如果有一天,您有機會看到這封信,說明很有緣。天善智能是一個小團隊,是由幾位 BI 技術實戰(zhàn)者組織建立的草根組織,或者某一天會變得很強大,如果您支持和同意的話。天善智能專注于商業(yè)智能和數(shù)據庫性能優(yōu)化,2011 年 9 月由(Robay)組織成立,前期以接外包項目和顧問培訓服務為主,以及一些小范圍的獨家知識。在 2012 年 9 月,天善開始通過網絡來天善多年來在商業(yè)智能和數(shù)據庫方面的實戰(zhàn)經驗。目前天善智能總共已經制作了 23 份技術文檔,錄制了 25 部(陸續(xù)增加中.),開展了六期 BI 技術公開課,并且把這資料放在天善智能的博客,優(yōu)酷,各

2、種網絡媒介上免費讓大家,和學習。最難得的是,這些資料是網絡上最獨有,最全,最有含金量的,并整理的井井有序,免費開放了給大家。這樣做的目的,完全是因為天善體諒一些大學生、初學者想學習 BI 技術,但是又苦于學習無門的心情,因為天善的所有成員也經歷過一段這樣痛苦的時間,因此想通過這些小小的行為幫助到那些 BI 的初學者。俗話說:“授之以魚不如授之以漁”,天善智能雖然提供了這么多的資料供大家免費學習,但是天善認為僅僅做到這一點是不夠的,更好的方式應該是讓大家掌握一種無形的本領。這種本領可以描述成“如何思考、如何學習、如何解決問題、如果沉淀、如何成長”等。也許您會覺得有點虛無縹緲,但是請相信天善智能,

3、和天善一起前行成長,終有一天會實現(xiàn)各位心中的理想。最后,天善智能成立時間短,也還年輕,更急需成長,因此天善智能誠懇的希望您能提出具有建設性的建議,助天善團隊壯大,天善團隊,使天善邁向成階段。寫于 2012 年 12 月 22 日重生后的第一天如何找到天善?博客:(訂閱本博客隨時掌握天善動態(tài),文檔工具。目前已經 600 人訂閱,還不訂閱更待何時?)QA: HYPERLINK http:/q/ http:/q(任何技術問題,只要您認真提,天善一定認真答。)5 群:236899666 群:237979203前 4 群基本滿員,多達 2000 人,加入也是必須的。(加入時請注明:天善智能)天善優(yōu)酷:/

4、tianshansoft天善智能博客:第 1 頁 共 10 頁且ODS 探析1ODS 概述ODS 概念和特點ODS 概念ODS(Operational Data Store,操作型數(shù)據)是數(shù)據倉庫體系結構中的可選部分,ODS 具備數(shù)據倉庫的部分特征和的、集成的、可變的、反映當前數(shù)據值和詳細數(shù)據的數(shù)據集合,用OLTP 系統(tǒng)的部分特征。Billon 定義 ODS 為面向來滿足企業(yè)綜合的、集成的以及操作型的處理需求。與 Billon 給出的數(shù)據倉庫的定義類似,ODS 的定義同樣也給出了 ODS 的幾個特點,分別是:1.1.2面向的 (與數(shù)據倉庫類似)集成的 (與數(shù)據倉庫類似)易變的

5、(數(shù)據可以聯(lián)機改變,包括增、刪以及更新等操作)數(shù)據是當前或接近當前的(數(shù)據在存取時刻是ODS 的由來及基本特征的、數(shù)據是最近一段時間之前得到的)在數(shù)據庫環(huán)境中的是面向應用和聯(lián)機事務處理、當前的、細節(jié)的、分散的數(shù)據,數(shù)據庫系統(tǒng)并不能提供集成的的數(shù)據環(huán)境,使各個業(yè)務子系統(tǒng)之間實現(xiàn)較高程度的共享,使得數(shù)據庫系統(tǒng)不能提供決策支持的功能;而在數(shù)據倉庫系統(tǒng)可以提供集成、基礎。的數(shù)據環(huán)境,能夠實現(xiàn)數(shù)據的共享,但是數(shù)據倉庫并不實時的數(shù)據而是需要大量歷史數(shù)據作為分析的ODS 是由于數(shù)據庫數(shù)據環(huán)境與數(shù)據倉庫數(shù)據環(huán)境不能滿足實時決策的需求而產生的。根據其概念,ODS的是面向主題的集成的并且同時是明細的反應當前或接近

6、當前的數(shù)據值的數(shù)據,這些特點可以彌補數(shù)據庫環(huán)境和數(shù)據倉庫環(huán)境的缺陷,為實時決策的需求提供數(shù)據支持。ODS 在數(shù)據倉庫系統(tǒng)中是一個可選組件,是介于 DB 和 DW 之間的一種技術。ODS 只是存放當前或接近當前的數(shù)據,如果需要的話,可以對 ODS 中的數(shù)據進行增刪或更新操作。雖然 DW 中的數(shù)據也同樣是面向常是不能進行修改的,所有 ODS 和 DW 的區(qū)別主要體現(xiàn)在數(shù)據的可變性和當前性上。和集成的,但是這些數(shù)據通DB 數(shù)據環(huán)境:面向應用和聯(lián)機事務處理,當前的、細節(jié)的、分散的數(shù)據,不能提供集成的程度低,不能提供決策支持。的數(shù)據環(huán)境,共享DW 數(shù)據環(huán)境:面向、面向分析,可以提供集成、的數(shù)據環(huán)境,但是

7、一定量的數(shù)據是建立 DW 的前提,需要使用歷史數(shù)據,數(shù)據要體現(xiàn)集和歷史性實際中往往會有實時決策的需求,上述兩者都不能滿足要求,因此產生了 ODSODS 數(shù)據環(huán)境:一方面提供全局一致的、細節(jié)的、當前的數(shù)據,可進行聯(lián)機事務操作型處理。另一方面是一種面向的集成的數(shù)據環(huán)境。數(shù)據量小,可輔助完成日常決策的數(shù)據分析處理,同時可以保護投資,保留現(xiàn)有的應用系統(tǒng)。DB-ODS-DW 體系結構簡單結構:1.1.3天善智能博客:第 2 頁 共 10 頁特點:1)ODS 的2)DW 的復雜結構:在 DB 中;在 ODS 中。1.2ODS 與 DB、DW 的區(qū)別ODS 是介于 DB 和 DW 之間的一種數(shù)據技術,與面向

8、應用的分散的 DB 相比,ODS 中的數(shù)據組織方式與 DW 一樣也是面向的、集成的。雖然 ODS 也是一種操作型數(shù)據,但是 ODS 與面向應用的分散 DB 系統(tǒng)在設計目標、內容、數(shù)據來源、數(shù)據組織方式等方面存在較大的差異;ODS 和 DW 在結構和內容方面非常相似。它們都是面向的、集成的,每種環(huán)境都要求數(shù)據經過集成和轉換之后再被載入到 ODS 或 DW。但 ODS 有許多與數(shù)據倉庫非常不同的特性,例如 ODS 中的數(shù)據可以被前端應用更新,而數(shù)據倉庫中的數(shù)據則不可以;ODS 保存當前或者接近當前的細節(jié)數(shù)據,而數(shù)據倉庫保存各粒度級別的匯總的歷史數(shù)據。具體區(qū)別如下下表所示:天善智能博客:第 3 頁

9、共 10 頁指標DBODSDW系統(tǒng)目標事務處理中層輔助決策輔助決策處理類型面向應用、聯(lián)機事務處理日常管理和控制決策,事物處理與決策分析并存面向分析,決策支1.3ODS 的分類ODS 按照與應用系統(tǒng)的數(shù)據延遲時間分為四類,分別為:類 ODS,與應用系統(tǒng)的數(shù)據延遲為 12 秒,實時或近似實時。對于用戶來說,ODS 是個透明的,操作型系統(tǒng)業(yè)務發(fā)生之后,數(shù)據立刻在 ODS 中看到。這類 ODS 事實上是很難實現(xiàn)的。秒級的數(shù)據遷移間隔,使得沒有時間進行數(shù)據的整合。對于此類 ODS,從技術和成本上來說,都是不合算的。類 ODS,與應用系統(tǒng)的數(shù)據延遲為 24 小時。在操作型系統(tǒng)業(yè)務發(fā)生后,數(shù)據要經過幾個小時

10、才能出現(xiàn)在 ODS 部件中。類 ODS,與應用系統(tǒng)的數(shù)據延遲為 1224 小時。常見的數(shù)據倉庫的遷移頻率。類 ODS,與應用系統(tǒng)的數(shù)據延遲為月級甚至年級,該類 ODS 的數(shù)據源經常是數(shù)據倉庫,即數(shù)據倉庫中部分決策分析數(shù)據回流至 ODS 中。不同 ODS 類別的特點:數(shù)據延遲時間越短,ODS 建設難度越高;類 ODS 的建設難度最高,建設成本也是最高。由于類 ODS 得實時性,對于技術的要求與其他類型 ODS 也有所不同,一般來講需要用到 EAI 技術,但隨著當前企業(yè)對數(shù)據倉庫的實時性要求越來越高,類 ODS 變得越來越重要;在企業(yè)應用架構中,ODS 是一個可選件,但一旦需要用到 ODS 的功能

11、,那么 ODS 本身就變得極為重要。應用比較多的是類 ODS,因為一旦將決策分析結果加載到 ODS 中,重要決策信息的高性能聯(lián)機支持將成為可能。ODS 的作用1.4ODS 是一個可選的組件,但是在包含 ODS 組件的系統(tǒng)中,ODS 主要是作為 DB 與 DW 的中間層而存在的。它在系統(tǒng)中的主要作用有:1) 在業(yè)務系統(tǒng)和數(shù)據倉庫之間形成一個層。一般的數(shù)據倉庫應用系統(tǒng)都具有非常復雜的數(shù)據來源,這些數(shù)據存放在不同的地理位置、不同的數(shù)據庫、不同的應用之中,從這些業(yè)務系統(tǒng)對數(shù)據進行抽取并不容易。因此,ODS 用于存放從業(yè)務系統(tǒng)直接抽取出來的數(shù)據,這些數(shù)據從數(shù)據結構、數(shù)據之間的邏輯關系上都與業(yè)務系統(tǒng)基本保

12、持一致,因此在抽取過程中極大降低了數(shù)據轉化的復雜性,而主要關注數(shù)據抽取的接口、數(shù)據量大小、抽取方式等方面2) 轉移一部分業(yè)務系統(tǒng)細節(jié)查詢的功能。在數(shù)據倉庫建立之前,大量的報表、分析是由業(yè)務系統(tǒng)直接支持的,在一些比較復雜的報表生成過程中,對業(yè)務系統(tǒng)的運行產生相當大的壓力。ODS 的數(shù)據從粒度、組織方式等各個方面都保持了與業(yè)務系統(tǒng)的一致,那么原來由業(yè)務系統(tǒng)產生的報表、細節(jié)數(shù)據的查詢自然能夠從 ODS 中進行,從而降低業(yè)務系統(tǒng)的查詢壓力。3) 完成數(shù)據倉庫中不能完成的一些功能在帶有 ODS 的數(shù)據倉庫體系結構中,DW 層所的數(shù)據都是進行匯總過的數(shù)據和運營指標,并不每筆交易產生的細節(jié)數(shù)據,但是在某些特

13、殊的應用中,可能需要對交易細節(jié)數(shù)據進行查詢,這時就需要把細節(jié)數(shù)據查詢的功能轉移到 ODS來完成,而且 ODS 的數(shù)據模型按照面向的方式進行,可以方便地支持分析等查詢功能。即數(shù)據倉庫從宏觀角度滿足企業(yè)的決策支持要求,而 ODS 層則從微觀角度反映細節(jié)交易數(shù)據或者低粒度的數(shù)據查詢要求。在一個沒有 ODS 層的數(shù)據倉庫應用系統(tǒng)體系結構中,數(shù)據倉庫中的數(shù)據粒度是根據需要而確定的,但一般來說,最為細節(jié)的業(yè)務數(shù)據也是需要保留的,實際上也就相當于 ODS,但與 ODS 所不同的是,這時的細節(jié)數(shù)據不是“當前、不斷變化的”數(shù)據,而是“歷史的,不再變化的”數(shù)據。這樣的數(shù)據倉庫的理設計和邏輯設計提出了更高的要求。壓

14、力和性能壓力都是比較大的,因此對數(shù)據倉庫的物天善智能博客:第 4 頁 共 10 頁功能持分析功能的 OLTP企業(yè)級的 OLTP 和及時 OLAPOLAP(長期趨勢分析)特征確定的應用需求基于全局應用和中層決策的基于決策分析和數(shù)據特征內容當前數(shù)據當前或接近當前數(shù)據歷史數(shù)據來源組織外部以系統(tǒng)為主系統(tǒng)組織按業(yè)務按按穩(wěn)定性更新頻繁較穩(wěn)定,允許更新穩(wěn)定,不進行更新綜合性細節(jié)數(shù)據細節(jié)數(shù)據細節(jié)數(shù)據和綜合數(shù)據特征分散的數(shù)據庫全局一致的數(shù)據環(huán)境全局一致的數(shù)據環(huán)境1.5ODS 的功能ODS 支持全局(企業(yè)級)的聯(lián)機事務處理,并且支持日常管理和控制的操作,稱為“即時 OLAP”處理。全局的 OLTP 應用在數(shù)據倉庫

15、環(huán)境中是無法實施的,在數(shù)據庫環(huán)境中,則必須依靠個業(yè)務子系統(tǒng)之間的協(xié)調才能夠進行;即時的 OLAP 應用在數(shù)據庫環(huán)境中無法實施。而在數(shù)據倉庫環(huán)境中,由于必須提供即時的分析,因此必須提高數(shù)據刷新頻率,導致數(shù)據倉庫環(huán)境中的數(shù)據時間粒度過小,數(shù)據量增加過快,并不符合數(shù)據倉庫歷史數(shù)據的刷新周期。1.5.1全局的 OLTP 應用對于全局的 OLTP 應用,一個事務涉及多個子系統(tǒng)中的數(shù)據。通常的數(shù)據庫環(huán)境中,各個子系統(tǒng)的數(shù)據缺乏一致性,數(shù)據庫組織過于分散,無法實施全局的應用,而 ODS 則克服數(shù)據庫系統(tǒng)的缺陷。一個全局的 OLTP 應用示例:一位教員調離學校。如果是在數(shù)據庫系統(tǒng)中,子系統(tǒng)相對獨立,可能導致子

16、系統(tǒng)中的信息不一致;即使是在信息一致的情況下,也會造成調離手續(xù)繁瑣。而在 ODS 中則不會出現(xiàn)這種問題。數(shù)據庫環(huán)境ODS 環(huán)境1.5.2即時的 OLAP 應用即時的 OLAP 應用,進行非型的中層決策來實現(xiàn)對企業(yè)的日常管理和控制。這種應用只關心當前或接近當前的數(shù)據;因為涉及的數(shù)據量較少,要求有較快的相應速度。在數(shù)據倉庫環(huán)境中數(shù)據。的數(shù)據為歷史數(shù)據,并不能提供當前或接近當前的即時 OLAP 示例:商場 ODS 系統(tǒng)。該商場的基本情況是已經有部門的應用系統(tǒng):庫存、采購、銷售、財務等,并且有數(shù)據倉庫系統(tǒng)。商場 ODS 系統(tǒng)的要求與目標是支持日常管理和控制,具有即時 OLAP 能力。對于回答“某某商品

17、是否要進貨?”這一類,首先在 ODS 系統(tǒng)的商品中進行商品近期銷售情況,得出商天善智能博客:第 5 頁 共 10 頁品的周轉情況、率、庫存量,比較以后作出是否進貨的決定;如果需要進貨,則可分析供應商中的相關信息,再依據情況,確定采購數(shù)量和采購途徑。2ODS 在 RDC 系統(tǒng)中應用可行性與優(yōu)劣ODS 是一個可選件,是否需要構建 ODS 組件,需要根據客戶需求確定,分析用戶需求中關于全局的 OLTP 應用與即時的OLAP 應用是否重要的、必須的,并且這些需求是目前的業(yè)務系統(tǒng)以及 DW 系統(tǒng)中無法實現(xiàn)的。一旦確定需要為客戶構建ODS 組件,則必須從實際需求出發(fā)考慮選擇何種類型的 ODS,并且確定 O

18、DS 需要實現(xiàn)的功能。由于目前 RDC 系統(tǒng)中的分析數(shù)據全部來自于 BS業(yè)務系統(tǒng)中,是針對物流資源管理、人力資源管務資源管理、信息資源管理集成如果 ODS 層僅僅能夠實現(xiàn)從的企業(yè)管理,使得 BS業(yè)務系統(tǒng)中的數(shù)據已經進行了企業(yè)中信息的整合和集成。系統(tǒng)中集成與整合數(shù)據的功能,那么它的存在也許是沒有意義的。RDC 系統(tǒng)的建設的短期目標是實現(xiàn)中層管理者的決策分析之用,但是用于 RDC 中的數(shù)據全部是歷史的數(shù)據,并不能真正的滿足中層決策實現(xiàn)企業(yè)日常管理和控制的功能。如果在 RDC 系統(tǒng)中引入 ODS 層,可以提供給中層管理者接近實時的細粒度的數(shù)據,則 ODS 層的存在則是意義的。以下從幾個方面對比在 R

19、DC 中存在 ODS 或不存在ODS 的優(yōu)劣:(1)首先從使用角色對比:ODS 面向營業(yè)、等一線生產和一線管理,為了實現(xiàn)接近實時、跨系統(tǒng)的運營細節(jié)數(shù)據的查詢,提供細粒度的運營數(shù)據展現(xiàn)。DW 系統(tǒng)是面向企業(yè)的分析或者決策支持的,實現(xiàn)的是基于歷史數(shù)據的統(tǒng)計分析與 OLAP 分析。從使用角色角度分析,ODS 可以作為 BS數(shù)據查詢功能。的有益補充,實現(xiàn)系統(tǒng)未能實現(xiàn)的數(shù)據展現(xiàn)和數(shù)據來源的對比:DW 中的完全來自于業(yè)務系統(tǒng)數(shù)據庫,ODS 的數(shù)據既可以來源于業(yè)務系統(tǒng),也可以從 DW 中獲取部分分析數(shù)據。數(shù)據粒度:目前 RDC 系統(tǒng)中時間粒度精確到日,對于更細粒度級的數(shù)據分析目前尚無法提供,可以使用 ODS

20、 作為補充。數(shù)據獲取的性能與及時性:ODS 支持OLTP 數(shù)據更新,數(shù)據更新時間短,數(shù)據可實現(xiàn)接近實時的更新,性能和及時性要高于 RDC。系統(tǒng)功能:數(shù)據查詢。ODS 提供生產環(huán)境下的數(shù)據查詢,查詢的交易量較小不耗費太多資源,有確定的完成速度。而 DW 提供分析環(huán)境下的查詢,查詢單元量交大,消耗的資源很多,完成的速度也不確定。固定報表。ODS 提供生產環(huán)境下實時性較高的生產經營報表,而 DW 提供分析環(huán)境下的主圖分析與挖掘報表。動態(tài)報表。ODS 提供面向少量維度的細粒度的數(shù)據統(tǒng)計,而 DW 提供面向次挖掘。度的多層粗粒度數(shù)據的統(tǒng)計、分析及ODS 提供績效管理和統(tǒng)計、數(shù)據質量審計和管理等功能。RD

21、C 提供趨勢分析、客戶消費行為分析和評估等功能。分析對比圖表如下:從對比分析中可以得出,由于 ODS 和 DW 完全是不同的實體,能夠實現(xiàn)不同的需求應用,而目前 RDC 實現(xiàn)的是DW 的功能,因此,在 RDC 中加入ODS 是可行的并且有很大優(yōu)勢的。但是 ODS 的選型以及ODS 在RDC 中實現(xiàn)的作用仍需要分析詳細的客戶需求才能決定。天善智能博客:第 6 頁 共 10 頁對比角度存在 ODS僅存在 DW 系統(tǒng)(RDC 系統(tǒng))使用者面向營業(yè)、等一線生產和管理面向企業(yè)分析或決策支持數(shù)據來源業(yè)務數(shù)據可與數(shù)據倉庫業(yè)務數(shù)據庫數(shù)據粒度更細粒度級精確到日數(shù)據獲取性能與及時性實時或接近實時更新數(shù)據系統(tǒng)功能數(shù)

22、據查詢生產環(huán)境下的數(shù)據查詢分析環(huán)境下的數(shù)據查詢固定報表實時性較高的生產經營報表圖表分析與挖掘報表動態(tài)報表面向少量維度的細粒度數(shù)據統(tǒng)計面向度的多層粗粒度統(tǒng)計、分析及次挖掘實現(xiàn)功能提供績效管理和統(tǒng)計、數(shù)據質量審計和管理等趨勢分析、客戶消費行為分析和評估3基于 ODS 構建商業(yè)系統(tǒng)的即時 OLAP 應用ODS 技術和即時 OLAP問題提出面向的數(shù)據倉庫(DW)概念的提出,不但為有效地支持企業(yè)經營管理決策提供了一個全局一致的數(shù)據環(huán)境,也為歷史數(shù)據,綜合數(shù)據的處理提出了一種行之有效的解決方法。數(shù)據倉庫概念的提出也清楚的把數(shù)據處理劃分為了操作型處理和分析型處理兩種不同類型,從而建立起了 D

23、B-DW 的兩層體系結構。但是有很多情況,DB-DW 的兩層體系結構并不能涵蓋企業(yè)所有的數(shù)據處理要求,因為企業(yè)的數(shù)據處理雖然可以較為粗略的劃分成操作型和分析型兩部分,但這兩種類型也不是涇渭分明的,它們之間也有交叉的情況,譬不適合在 DW 中進行。些是操作型的,但不適合在操作型 DB 中進行,而又有一些是分析型處理,但比如開發(fā)的一個銷售公司的決策系統(tǒng),按要求公司經理要解決什么商品該進貨了,各種商品近來的贏利情況,客戶的信任情況等等。要回答這些問題,他必須首先要弄清楚藥品的存貨是否充裕,還要了解該藥品近期的銷售情況,另外還要和別的藥品的庫存和銷售情況進行比較等。如果把這個決策分析過程放在原有的面向

24、應用的分散 DB 系統(tǒng)中去完成的話,不一定得到每個部門的準確一致的信息,而要進行間的協(xié)調配合,工作量勢必會很大,但如果把其放在 DW 中去進行分析的話,不但費時,而且會有很多的不必要的數(shù)據檢索存在。對于上述問題可以借助于 DB-DW 的中間層 ODS(操作數(shù)據)來解決。它像 DW 一樣是一種面向,集成的數(shù)據環(huán)境,又像操作型 DB 一樣包含著全局一致的,細節(jié)的當前的數(shù)據。建立基于 ODS 的即時 OLAP 應用是應中層決策分析之需要的一種解決方案,它能很好的適應企業(yè)日常頻繁的中低層次的決策分析應用。3.1.2操作數(shù)據(ODS)是用于支持企業(yè)日常的全局應用的數(shù)據集合,ODS 的數(shù)據具有面向、集成的

25、、可變的和數(shù)據是當前的或是接近當前的 4 個基本特征。ODS 是介于 DB 和 DW 之間的一種數(shù)據技術,和原來面向應用的分散的 DB 相比,ODS 中的數(shù)據組織方式和數(shù)據倉庫(DW)一樣也是面向的和集成的,所以對進入 ODS 的數(shù)據也象進入數(shù)據倉庫的數(shù)據一樣進行轉化和集成處理。另外 ODS 只是存放當前或接近當前的數(shù)據,如果需要的話還可以對 ODS 中的數(shù)據進行增、刪和更新等操作,雖然 DW 中的數(shù)據也是面向和集成的,但這些數(shù)據一般不進行修改,所以 ODS 和DW 的區(qū)別主要體現(xiàn)數(shù)據的可變性和當前性上。3.1.3即時 OLAPODS 主要是適應企業(yè)級的全局應用的需要而產生的,對它的應用主要是

26、在即時OLAP的數(shù)據處理上。在 DW 上實現(xiàn) OLAP 主要是為了進行長期趨勢分析,DW 中是數(shù)據量很大,所以 OLAP 應用的運行時間都比較長。在企業(yè)日常經營中,常常要進行一些非的中層決策以實現(xiàn)企業(yè)的日常管理和控制,譬如,銷售公司經理要每周查看藥品的銷售情況,各地區(qū)的藥品銷售情況,業(yè)務員的業(yè)績情況等等,并且這種決策過程并不需要參考太多的歷史數(shù)據,主要是參考當前的或比較當前的數(shù)據,還需要比較快的執(zhí)行速度,可以把這種分析決策稱為即時 OLAP。顯然利用 DW 不但運行的效率是無法受而且也很難準確的反映近期的真實情況,ODS 的建立克服了 DW 系統(tǒng)過于臃腫,處理時間過長和不適應即時 OLAP 的

27、情況,提供給中層決策者以快捷準確的分析信息。3.1.4從 DB 向 ODS 轉化的實現(xiàn)機制在 DB-ODS 的體系結構中,ODS 的實現(xiàn)機制表現(xiàn)在其系統(tǒng)定義的數(shù)據傳送關系上,如圖 1 所示。操作型環(huán)境中各分散的 DB經過過濾后形成了 ODS 系統(tǒng)的系統(tǒng),向 ODS 系統(tǒng)中提供數(shù)據。系統(tǒng)定義了原有分散 DB 中那些數(shù)據送往ODS,并指明與 ODS 數(shù)據相應的數(shù)據表。通過 ODS 的定義可以把分散于應用的 DB 中的數(shù)據到 ODS 中去,這樣原來的分散DB 中的就形成了ODS 中的面向很少。的。ODS著一個分析型的環(huán)境,數(shù)據處理簡單得多,實際需要的支持技術也天善智能博客:第 7 頁 共 10 頁上

28、圖沒有給出從 ODS 向 DB 轉化的實現(xiàn)機制,這種情況主要用在有關企業(yè)全局操作應用的情況,可以通過在 ODS 系統(tǒng)中存放一些參數(shù)表,它所反應的關系是 ODS 全局更新時必須要反應到所有 DB 中的相關。此時,ODS 是一個操作型環(huán)境,管理、數(shù)據恢復等等技術。實現(xiàn) ODS 所要求的技術跟原來的面向應用的分散的數(shù)據庫系樣,包括事務管理、ODS 設計指南問題提出在 ODS 的概念定義中,已經描述了 ODS 的功能和特點,實際上 ODS 設計的目標就是以這些特點作為依據的。ODS 設計與DW 設計在著眼點上有所不同,ODS 重點考慮業(yè)務系統(tǒng)數(shù)據是什么樣子的,關系如何,在業(yè)務流程處理的

29、哪個環(huán)節(jié),以及數(shù)據抽取接口等問題。3.2.2第一步驟:確定數(shù)據范圍確定數(shù)據范圍實際上是對 ODS 進行劃分的過程,這種劃分是基于對業(yè)務系統(tǒng)的調研的基礎上而進行的,并不十分關心整個數(shù)據倉庫系統(tǒng)上端應用需求,但是需要把上端應用需求與 ODS 數(shù)據范圍進行驗證,以確保應用所需的數(shù)據都已經從業(yè)務系統(tǒng)中抽取出來,并且得到了很好的組織。一般來講,的劃分是以業(yè)務系統(tǒng)的信息模型為依據的,設計者需要綜合各種業(yè)務系統(tǒng)的信息模型,并進行宏觀的歸并,得到企業(yè)范圍內的數(shù)據視圖,并加以抽象,劃定幾個邏輯的數(shù)據范圍。在這個階段,以 ER 模型表示數(shù)據關系。第二步:根據數(shù)據范圍進行數(shù)據分析和定義 在第一步中定義出來了企業(yè)范圍

30、內的數(shù)據視圖,以及所收集到的各種業(yè)務系統(tǒng)的資料,在這一步中,需要對大的數(shù)據進行分解,并進行定義,直到每個能夠直接對應一個數(shù)據模型為止。在這個階段,將把第一步生成的每個 ER 圖中的實體進行分解,分解的結果仍以 ER 表示為佳。3.2.3第二步驟:定義元素、粒度、定義維、度量、定義維的概念特性:期限維名稱,名稱應該能夠清晰表示出這個維的業(yè)務含義。維成員,也就是這個維所代表的具體的數(shù)據,維層次,維成員之間的隸屬與包含的層次關系,每個層次需要定義名稱定義度量的概念特性:度量名稱,名稱應該能夠清晰表述這個度量的業(yè)務含義定義的概念特性:名稱和含義,說明該主要包含哪些數(shù)據,用于什么分析;所包含的維和度量;

31、的事實表,以及事實表的數(shù)據。天善智能博客:第 8 頁 共 10 頁定義粒度:中事實表的數(shù)據粒度說明,這種粒度可以通過對維的層次限制加以說明,也可以通過對事實表數(shù)據的業(yè)務細節(jié)程度進行說明。定義期限:中事實表中的數(shù)據周期。3.2.4迭代,歸并維、度量的定義在 ODS 中,因數(shù)據來自于多個系統(tǒng),數(shù)據劃分時雖然對數(shù)據概念進行了一定程度上的歸并,但具體的業(yè)務代碼所形成的各個維、以及維成員等還需要進一步進行歸并,把概念(像不同的業(yè)務系統(tǒng)中一樣)。的維定義成一個維,不允許同一個維存在不同的實體表示3.2.5物理實現(xiàn)定義每個的數(shù)據抽取周期、抽取時間、抽取方式、數(shù)據接口,抽取流程和規(guī)則。物理設計不僅僅是 ODS 部分的數(shù)據庫物理實現(xiàn),設計數(shù)據庫參數(shù)、操作系統(tǒng)參數(shù)、數(shù)據設計之外,有關數(shù)據抽取接口等問題必須清晰定義。ODS 數(shù)據模型的設計數(shù)據調研對與業(yè)務系統(tǒng)關聯(lián)的數(shù)據進行調研,弄清楚現(xiàn)有業(yè)務系統(tǒng)對應的數(shù)據邏輯模型和物理模型3.3.2確定數(shù)據范圍確定數(shù)據范圍實際上是對 ODS 進行劃分的過程,這種劃分是基于對業(yè)務系統(tǒng)的調研的基礎上而進行的,并不十分關心整個數(shù)據倉庫系統(tǒng)上端應用需求,但是需要把上端應用需求與 ODS 數(shù)據范圍進行驗證,以確保應用所需的數(shù)據都已經從

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論