


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、天善智能致全體 BI 同仁的各位 BI 同仁們:大家好!如果有一天,您有機會看到這封信,說明很有緣。天善智能是一個小團隊,是由幾位 BI 技術實戰(zhàn)者組織建立的草根組織,或者某一天會變得很強大,如果您支持和同意的話。天善智能專注于商業(yè)智能和數據庫性能優(yōu)化,2011 年 9 月由(Robay)組織成立,前期以接外包項目和顧問培訓服務為主,以及一些小范圍的獨家知識。在 2012 年 9 月,天善開始通過網絡來天善多年來在商業(yè)智能和數據庫方面的實戰(zhàn)經驗。目前天善智能總共已經制作了 23 份技術文檔,錄制了 25 部(陸續(xù)增加中.),開展了六期 BI 技術公開課,并且把這資料放在天善智能的博客,優(yōu)酷,各
2、種網絡媒介上免費讓大家,和學習。最難得的是,這些資料是網絡上最獨有,最全,最有含金量的,并整理的井井有序,免費開放了給大家。這樣做的目的,完全是因為天善體諒一些大學生、初學者想學習 BI 技術,但是又苦于學習無門的心情,因為天善的所有成員也經歷過一段這樣痛苦的時間,因此想通過這些小小的行為幫助到那些 BI 的初學者。俗話說:“授之以魚不如授之以漁”,天善智能雖然提供了這么多的資料供大家免費學習,但是天善認為僅僅做到這一點是不夠的,更好的方式應該是讓大家掌握一種無形的本領。這種本領可以描述成“如何思考、如何學習、如何解決問題、如果沉淀、如何成長”等。也許您會覺得有點虛無縹緲,但是請相信天善智能,
3、和天善一起前行成長,終有一天會實現各位心中的理想。最后,天善智能成立時間短,也還年輕,更急需成長,因此天善智能誠懇的希望您能提出具有建設性的建議,助天善團隊壯大,天善團隊,使天善邁向成階段。寫于 2012 年 12 月 22 日重生后的第一天如何找到天善?博客:(訂閱本博客隨時掌握天善動態(tài),文檔工具。目前已經 600 人訂閱,還不訂閱更待何時?)QA: HYPERLINK http:/q/ http:/q(任何技術問題,只要您認真提,天善一定認真答。)5 群:236899666 群:237979203前 4 群基本滿員,多達 2000 人,加入也是必須的。(加入時請注明:天善智能)天善優(yōu)酷:/
4、tianshansoft天善智能博客:第 1 頁 共 10 頁且ODS 探析1ODS 概述ODS 概念和特點ODS 概念ODS(Operational Data Store,操作型數據)是數據倉庫體系結構中的可選部分,ODS 具備數據倉庫的部分特征和的、集成的、可變的、反映當前數據值和詳細數據的數據集合,用OLTP 系統的部分特征。Billon 定義 ODS 為面向來滿足企業(yè)綜合的、集成的以及操作型的處理需求。與 Billon 給出的數據倉庫的定義類似,ODS 的定義同樣也給出了 ODS 的幾個特點,分別是:1.1.2面向的 (與數據倉庫類似)集成的 (與數據倉庫類似)易變的
5、(數據可以聯機改變,包括增、刪以及更新等操作)數據是當前或接近當前的(數據在存取時刻是ODS 的由來及基本特征的、數據是最近一段時間之前得到的)在數據庫環(huán)境中的是面向應用和聯機事務處理、當前的、細節(jié)的、分散的數據,數據庫系統并不能提供集成的的數據環(huán)境,使各個業(yè)務子系統之間實現較高程度的共享,使得數據庫系統不能提供決策支持的功能;而在數據倉庫系統可以提供集成、基礎。的數據環(huán)境,能夠實現數據的共享,但是數據倉庫并不實時的數據而是需要大量歷史數據作為分析的ODS 是由于數據庫數據環(huán)境與數據倉庫數據環(huán)境不能滿足實時決策的需求而產生的。根據其概念,ODS的是面向主題的集成的并且同時是明細的反應當前或接近
6、當前的數據值的數據,這些特點可以彌補數據庫環(huán)境和數據倉庫環(huán)境的缺陷,為實時決策的需求提供數據支持。ODS 在數據倉庫系統中是一個可選組件,是介于 DB 和 DW 之間的一種技術。ODS 只是存放當前或接近當前的數據,如果需要的話,可以對 ODS 中的數據進行增刪或更新操作。雖然 DW 中的數據也同樣是面向常是不能進行修改的,所有 ODS 和 DW 的區(qū)別主要體現在數據的可變性和當前性上。和集成的,但是這些數據通DB 數據環(huán)境:面向應用和聯機事務處理,當前的、細節(jié)的、分散的數據,不能提供集成的程度低,不能提供決策支持。的數據環(huán)境,共享DW 數據環(huán)境:面向、面向分析,可以提供集成、的數據環(huán)境,但是
7、一定量的數據是建立 DW 的前提,需要使用歷史數據,數據要體現集和歷史性實際中往往會有實時決策的需求,上述兩者都不能滿足要求,因此產生了 ODSODS 數據環(huán)境:一方面提供全局一致的、細節(jié)的、當前的數據,可進行聯機事務操作型處理。另一方面是一種面向的集成的數據環(huán)境。數據量小,可輔助完成日常決策的數據分析處理,同時可以保護投資,保留現有的應用系統。DB-ODS-DW 體系結構簡單結構:1.1.3天善智能博客:第 2 頁 共 10 頁特點:1)ODS 的2)DW 的復雜結構:在 DB 中;在 ODS 中。1.2ODS 與 DB、DW 的區(qū)別ODS 是介于 DB 和 DW 之間的一種數據技術,與面向
8、應用的分散的 DB 相比,ODS 中的數據組織方式與 DW 一樣也是面向的、集成的。雖然 ODS 也是一種操作型數據,但是 ODS 與面向應用的分散 DB 系統在設計目標、內容、數據來源、數據組織方式等方面存在較大的差異;ODS 和 DW 在結構和內容方面非常相似。它們都是面向的、集成的,每種環(huán)境都要求數據經過集成和轉換之后再被載入到 ODS 或 DW。但 ODS 有許多與數據倉庫非常不同的特性,例如 ODS 中的數據可以被前端應用更新,而數據倉庫中的數據則不可以;ODS 保存當前或者接近當前的細節(jié)數據,而數據倉庫保存各粒度級別的匯總的歷史數據。具體區(qū)別如下下表所示:天善智能博客:第 3 頁
9、共 10 頁指標DBODSDW系統目標事務處理中層輔助決策輔助決策處理類型面向應用、聯機事務處理日常管理和控制決策,事物處理與決策分析并存面向分析,決策支1.3ODS 的分類ODS 按照與應用系統的數據延遲時間分為四類,分別為:類 ODS,與應用系統的數據延遲為 12 秒,實時或近似實時。對于用戶來說,ODS 是個透明的,操作型系統業(yè)務發(fā)生之后,數據立刻在 ODS 中看到。這類 ODS 事實上是很難實現的。秒級的數據遷移間隔,使得沒有時間進行數據的整合。對于此類 ODS,從技術和成本上來說,都是不合算的。類 ODS,與應用系統的數據延遲為 24 小時。在操作型系統業(yè)務發(fā)生后,數據要經過幾個小時
10、才能出現在 ODS 部件中。類 ODS,與應用系統的數據延遲為 1224 小時。常見的數據倉庫的遷移頻率。類 ODS,與應用系統的數據延遲為月級甚至年級,該類 ODS 的數據源經常是數據倉庫,即數據倉庫中部分決策分析數據回流至 ODS 中。不同 ODS 類別的特點:數據延遲時間越短,ODS 建設難度越高;類 ODS 的建設難度最高,建設成本也是最高。由于類 ODS 得實時性,對于技術的要求與其他類型 ODS 也有所不同,一般來講需要用到 EAI 技術,但隨著當前企業(yè)對數據倉庫的實時性要求越來越高,類 ODS 變得越來越重要;在企業(yè)應用架構中,ODS 是一個可選件,但一旦需要用到 ODS 的功能
11、,那么 ODS 本身就變得極為重要。應用比較多的是類 ODS,因為一旦將決策分析結果加載到 ODS 中,重要決策信息的高性能聯機支持將成為可能。ODS 的作用1.4ODS 是一個可選的組件,但是在包含 ODS 組件的系統中,ODS 主要是作為 DB 與 DW 的中間層而存在的。它在系統中的主要作用有:1) 在業(yè)務系統和數據倉庫之間形成一個層。一般的數據倉庫應用系統都具有非常復雜的數據來源,這些數據存放在不同的地理位置、不同的數據庫、不同的應用之中,從這些業(yè)務系統對數據進行抽取并不容易。因此,ODS 用于存放從業(yè)務系統直接抽取出來的數據,這些數據從數據結構、數據之間的邏輯關系上都與業(yè)務系統基本保
12、持一致,因此在抽取過程中極大降低了數據轉化的復雜性,而主要關注數據抽取的接口、數據量大小、抽取方式等方面2) 轉移一部分業(yè)務系統細節(jié)查詢的功能。在數據倉庫建立之前,大量的報表、分析是由業(yè)務系統直接支持的,在一些比較復雜的報表生成過程中,對業(yè)務系統的運行產生相當大的壓力。ODS 的數據從粒度、組織方式等各個方面都保持了與業(yè)務系統的一致,那么原來由業(yè)務系統產生的報表、細節(jié)數據的查詢自然能夠從 ODS 中進行,從而降低業(yè)務系統的查詢壓力。3) 完成數據倉庫中不能完成的一些功能在帶有 ODS 的數據倉庫體系結構中,DW 層所的數據都是進行匯總過的數據和運營指標,并不每筆交易產生的細節(jié)數據,但是在某些特
13、殊的應用中,可能需要對交易細節(jié)數據進行查詢,這時就需要把細節(jié)數據查詢的功能轉移到 ODS來完成,而且 ODS 的數據模型按照面向的方式進行,可以方便地支持分析等查詢功能。即數據倉庫從宏觀角度滿足企業(yè)的決策支持要求,而 ODS 層則從微觀角度反映細節(jié)交易數據或者低粒度的數據查詢要求。在一個沒有 ODS 層的數據倉庫應用系統體系結構中,數據倉庫中的數據粒度是根據需要而確定的,但一般來說,最為細節(jié)的業(yè)務數據也是需要保留的,實際上也就相當于 ODS,但與 ODS 所不同的是,這時的細節(jié)數據不是“當前、不斷變化的”數據,而是“歷史的,不再變化的”數據。這樣的數據倉庫的理設計和邏輯設計提出了更高的要求。壓
14、力和性能壓力都是比較大的,因此對數據倉庫的物天善智能博客:第 4 頁 共 10 頁功能持分析功能的 OLTP企業(yè)級的 OLTP 和及時 OLAPOLAP(長期趨勢分析)特征確定的應用需求基于全局應用和中層決策的基于決策分析和數據特征內容當前數據當前或接近當前數據歷史數據來源組織外部以系統為主系統組織按業(yè)務按按穩(wěn)定性更新頻繁較穩(wěn)定,允許更新穩(wěn)定,不進行更新綜合性細節(jié)數據細節(jié)數據細節(jié)數據和綜合數據特征分散的數據庫全局一致的數據環(huán)境全局一致的數據環(huán)境1.5ODS 的功能ODS 支持全局(企業(yè)級)的聯機事務處理,并且支持日常管理和控制的操作,稱為“即時 OLAP”處理。全局的 OLTP 應用在數據倉庫
15、環(huán)境中是無法實施的,在數據庫環(huán)境中,則必須依靠個業(yè)務子系統之間的協調才能夠進行;即時的 OLAP 應用在數據庫環(huán)境中無法實施。而在數據倉庫環(huán)境中,由于必須提供即時的分析,因此必須提高數據刷新頻率,導致數據倉庫環(huán)境中的數據時間粒度過小,數據量增加過快,并不符合數據倉庫歷史數據的刷新周期。1.5.1全局的 OLTP 應用對于全局的 OLTP 應用,一個事務涉及多個子系統中的數據。通常的數據庫環(huán)境中,各個子系統的數據缺乏一致性,數據庫組織過于分散,無法實施全局的應用,而 ODS 則克服數據庫系統的缺陷。一個全局的 OLTP 應用示例:一位教員調離學校。如果是在數據庫系統中,子系統相對獨立,可能導致子
16、系統中的信息不一致;即使是在信息一致的情況下,也會造成調離手續(xù)繁瑣。而在 ODS 中則不會出現這種問題。數據庫環(huán)境ODS 環(huán)境1.5.2即時的 OLAP 應用即時的 OLAP 應用,進行非型的中層決策來實現對企業(yè)的日常管理和控制。這種應用只關心當前或接近當前的數據;因為涉及的數據量較少,要求有較快的相應速度。在數據倉庫環(huán)境中數據。的數據為歷史數據,并不能提供當前或接近當前的即時 OLAP 示例:商場 ODS 系統。該商場的基本情況是已經有部門的應用系統:庫存、采購、銷售、財務等,并且有數據倉庫系統。商場 ODS 系統的要求與目標是支持日常管理和控制,具有即時 OLAP 能力。對于回答“某某商品
17、是否要進貨?”這一類,首先在 ODS 系統的商品中進行商品近期銷售情況,得出商天善智能博客:第 5 頁 共 10 頁品的周轉情況、率、庫存量,比較以后作出是否進貨的決定;如果需要進貨,則可分析供應商中的相關信息,再依據情況,確定采購數量和采購途徑。2ODS 在 RDC 系統中應用可行性與優(yōu)劣ODS 是一個可選件,是否需要構建 ODS 組件,需要根據客戶需求確定,分析用戶需求中關于全局的 OLTP 應用與即時的OLAP 應用是否重要的、必須的,并且這些需求是目前的業(yè)務系統以及 DW 系統中無法實現的。一旦確定需要為客戶構建ODS 組件,則必須從實際需求出發(fā)考慮選擇何種類型的 ODS,并且確定 O
18、DS 需要實現的功能。由于目前 RDC 系統中的分析數據全部來自于 BS業(yè)務系統中,是針對物流資源管理、人力資源管務資源管理、信息資源管理集成如果 ODS 層僅僅能夠實現從的企業(yè)管理,使得 BS業(yè)務系統中的數據已經進行了企業(yè)中信息的整合和集成。系統中集成與整合數據的功能,那么它的存在也許是沒有意義的。RDC 系統的建設的短期目標是實現中層管理者的決策分析之用,但是用于 RDC 中的數據全部是歷史的數據,并不能真正的滿足中層決策實現企業(yè)日常管理和控制的功能。如果在 RDC 系統中引入 ODS 層,可以提供給中層管理者接近實時的細粒度的數據,則 ODS 層的存在則是意義的。以下從幾個方面對比在 R
19、DC 中存在 ODS 或不存在ODS 的優(yōu)劣:(1)首先從使用角色對比:ODS 面向營業(yè)、等一線生產和一線管理,為了實現接近實時、跨系統的運營細節(jié)數據的查詢,提供細粒度的運營數據展現。DW 系統是面向企業(yè)的分析或者決策支持的,實現的是基于歷史數據的統計分析與 OLAP 分析。從使用角色角度分析,ODS 可以作為 BS數據查詢功能。的有益補充,實現系統未能實現的數據展現和數據來源的對比:DW 中的完全來自于業(yè)務系統數據庫,ODS 的數據既可以來源于業(yè)務系統,也可以從 DW 中獲取部分分析數據。數據粒度:目前 RDC 系統中時間粒度精確到日,對于更細粒度級的數據分析目前尚無法提供,可以使用 ODS
20、 作為補充。數據獲取的性能與及時性:ODS 支持OLTP 數據更新,數據更新時間短,數據可實現接近實時的更新,性能和及時性要高于 RDC。系統功能:數據查詢。ODS 提供生產環(huán)境下的數據查詢,查詢的交易量較小不耗費太多資源,有確定的完成速度。而 DW 提供分析環(huán)境下的查詢,查詢單元量交大,消耗的資源很多,完成的速度也不確定。固定報表。ODS 提供生產環(huán)境下實時性較高的生產經營報表,而 DW 提供分析環(huán)境下的主圖分析與挖掘報表。動態(tài)報表。ODS 提供面向少量維度的細粒度的數據統計,而 DW 提供面向次挖掘。度的多層粗粒度數據的統計、分析及ODS 提供績效管理和統計、數據質量審計和管理等功能。RD
21、C 提供趨勢分析、客戶消費行為分析和評估等功能。分析對比圖表如下:從對比分析中可以得出,由于 ODS 和 DW 完全是不同的實體,能夠實現不同的需求應用,而目前 RDC 實現的是DW 的功能,因此,在 RDC 中加入ODS 是可行的并且有很大優(yōu)勢的。但是 ODS 的選型以及ODS 在RDC 中實現的作用仍需要分析詳細的客戶需求才能決定。天善智能博客:第 6 頁 共 10 頁對比角度存在 ODS僅存在 DW 系統(RDC 系統)使用者面向營業(yè)、等一線生產和管理面向企業(yè)分析或決策支持數據來源業(yè)務數據可與數據倉庫業(yè)務數據庫數據粒度更細粒度級精確到日數據獲取性能與及時性實時或接近實時更新數據系統功能數
22、據查詢生產環(huán)境下的數據查詢分析環(huán)境下的數據查詢固定報表實時性較高的生產經營報表圖表分析與挖掘報表動態(tài)報表面向少量維度的細粒度數據統計面向度的多層粗粒度統計、分析及次挖掘實現功能提供績效管理和統計、數據質量審計和管理等趨勢分析、客戶消費行為分析和評估3基于 ODS 構建商業(yè)系統的即時 OLAP 應用ODS 技術和即時 OLAP問題提出面向的數據倉庫(DW)概念的提出,不但為有效地支持企業(yè)經營管理決策提供了一個全局一致的數據環(huán)境,也為歷史數據,綜合數據的處理提出了一種行之有效的解決方法。數據倉庫概念的提出也清楚的把數據處理劃分為了操作型處理和分析型處理兩種不同類型,從而建立起了 D
23、B-DW 的兩層體系結構。但是有很多情況,DB-DW 的兩層體系結構并不能涵蓋企業(yè)所有的數據處理要求,因為企業(yè)的數據處理雖然可以較為粗略的劃分成操作型和分析型兩部分,但這兩種類型也不是涇渭分明的,它們之間也有交叉的情況,譬不適合在 DW 中進行。些是操作型的,但不適合在操作型 DB 中進行,而又有一些是分析型處理,但比如開發(fā)的一個銷售公司的決策系統,按要求公司經理要解決什么商品該進貨了,各種商品近來的贏利情況,客戶的信任情況等等。要回答這些問題,他必須首先要弄清楚藥品的存貨是否充裕,還要了解該藥品近期的銷售情況,另外還要和別的藥品的庫存和銷售情況進行比較等。如果把這個決策分析過程放在原有的面向
24、應用的分散 DB 系統中去完成的話,不一定得到每個部門的準確一致的信息,而要進行間的協調配合,工作量勢必會很大,但如果把其放在 DW 中去進行分析的話,不但費時,而且會有很多的不必要的數據檢索存在。對于上述問題可以借助于 DB-DW 的中間層 ODS(操作數據)來解決。它像 DW 一樣是一種面向,集成的數據環(huán)境,又像操作型 DB 一樣包含著全局一致的,細節(jié)的當前的數據。建立基于 ODS 的即時 OLAP 應用是應中層決策分析之需要的一種解決方案,它能很好的適應企業(yè)日常頻繁的中低層次的決策分析應用。3.1.2操作數據(ODS)是用于支持企業(yè)日常的全局應用的數據集合,ODS 的數據具有面向、集成的
25、、可變的和數據是當前的或是接近當前的 4 個基本特征。ODS 是介于 DB 和 DW 之間的一種數據技術,和原來面向應用的分散的 DB 相比,ODS 中的數據組織方式和數據倉庫(DW)一樣也是面向的和集成的,所以對進入 ODS 的數據也象進入數據倉庫的數據一樣進行轉化和集成處理。另外 ODS 只是存放當前或接近當前的數據,如果需要的話還可以對 ODS 中的數據進行增、刪和更新等操作,雖然 DW 中的數據也是面向和集成的,但這些數據一般不進行修改,所以 ODS 和DW 的區(qū)別主要體現數據的可變性和當前性上。3.1.3即時 OLAPODS 主要是適應企業(yè)級的全局應用的需要而產生的,對它的應用主要是
26、在即時OLAP的數據處理上。在 DW 上實現 OLAP 主要是為了進行長期趨勢分析,DW 中是數據量很大,所以 OLAP 應用的運行時間都比較長。在企業(yè)日常經營中,常常要進行一些非的中層決策以實現企業(yè)的日常管理和控制,譬如,銷售公司經理要每周查看藥品的銷售情況,各地區(qū)的藥品銷售情況,業(yè)務員的業(yè)績情況等等,并且這種決策過程并不需要參考太多的歷史數據,主要是參考當前的或比較當前的數據,還需要比較快的執(zhí)行速度,可以把這種分析決策稱為即時 OLAP。顯然利用 DW 不但運行的效率是無法受而且也很難準確的反映近期的真實情況,ODS 的建立克服了 DW 系統過于臃腫,處理時間過長和不適應即時 OLAP 的
27、情況,提供給中層決策者以快捷準確的分析信息。3.1.4從 DB 向 ODS 轉化的實現機制在 DB-ODS 的體系結構中,ODS 的實現機制表現在其系統定義的數據傳送關系上,如圖 1 所示。操作型環(huán)境中各分散的 DB經過過濾后形成了 ODS 系統的系統,向 ODS 系統中提供數據。系統定義了原有分散 DB 中那些數據送往ODS,并指明與 ODS 數據相應的數據表。通過 ODS 的定義可以把分散于應用的 DB 中的數據到 ODS 中去,這樣原來的分散DB 中的就形成了ODS 中的面向很少。的。ODS著一個分析型的環(huán)境,數據處理簡單得多,實際需要的支持技術也天善智能博客:第 7 頁 共 10 頁上
28、圖沒有給出從 ODS 向 DB 轉化的實現機制,這種情況主要用在有關企業(yè)全局操作應用的情況,可以通過在 ODS 系統中存放一些參數表,它所反應的關系是 ODS 全局更新時必須要反應到所有 DB 中的相關。此時,ODS 是一個操作型環(huán)境,管理、數據恢復等等技術。實現 ODS 所要求的技術跟原來的面向應用的分散的數據庫系樣,包括事務管理、ODS 設計指南問題提出在 ODS 的概念定義中,已經描述了 ODS 的功能和特點,實際上 ODS 設計的目標就是以這些特點作為依據的。ODS 設計與DW 設計在著眼點上有所不同,ODS 重點考慮業(yè)務系統數據是什么樣子的,關系如何,在業(yè)務流程處理的
29、哪個環(huán)節(jié),以及數據抽取接口等問題。3.2.2第一步驟:確定數據范圍確定數據范圍實際上是對 ODS 進行劃分的過程,這種劃分是基于對業(yè)務系統的調研的基礎上而進行的,并不十分關心整個數據倉庫系統上端應用需求,但是需要把上端應用需求與 ODS 數據范圍進行驗證,以確保應用所需的數據都已經從業(yè)務系統中抽取出來,并且得到了很好的組織。一般來講,的劃分是以業(yè)務系統的信息模型為依據的,設計者需要綜合各種業(yè)務系統的信息模型,并進行宏觀的歸并,得到企業(yè)范圍內的數據視圖,并加以抽象,劃定幾個邏輯的數據范圍。在這個階段,以 ER 模型表示數據關系。第二步:根據數據范圍進行數據分析和定義 在第一步中定義出來了企業(yè)范圍
30、內的數據視圖,以及所收集到的各種業(yè)務系統的資料,在這一步中,需要對大的數據進行分解,并進行定義,直到每個能夠直接對應一個數據模型為止。在這個階段,將把第一步生成的每個 ER 圖中的實體進行分解,分解的結果仍以 ER 表示為佳。3.2.3第二步驟:定義元素、粒度、定義維、度量、定義維的概念特性:期限維名稱,名稱應該能夠清晰表示出這個維的業(yè)務含義。維成員,也就是這個維所代表的具體的數據,維層次,維成員之間的隸屬與包含的層次關系,每個層次需要定義名稱定義度量的概念特性:度量名稱,名稱應該能夠清晰表述這個度量的業(yè)務含義定義的概念特性:名稱和含義,說明該主要包含哪些數據,用于什么分析;所包含的維和度量;
31、的事實表,以及事實表的數據。天善智能博客:第 8 頁 共 10 頁定義粒度:中事實表的數據粒度說明,這種粒度可以通過對維的層次限制加以說明,也可以通過對事實表數據的業(yè)務細節(jié)程度進行說明。定義期限:中事實表中的數據周期。3.2.4迭代,歸并維、度量的定義在 ODS 中,因數據來自于多個系統,數據劃分時雖然對數據概念進行了一定程度上的歸并,但具體的業(yè)務代碼所形成的各個維、以及維成員等還需要進一步進行歸并,把概念(像不同的業(yè)務系統中一樣)。的維定義成一個維,不允許同一個維存在不同的實體表示3.2.5物理實現定義每個的數據抽取周期、抽取時間、抽取方式、數據接口,抽取流程和規(guī)則。物理設計不僅僅是 ODS 部分的數據庫物理實現,設計數據庫參數、操作系統參數、數據設計之外,有關數據抽取接口等問題必須清晰定義。ODS 數據模型的設計數據調研對與業(yè)務系統關聯的數據進行調研,弄清楚現有業(yè)務系統對應的數據邏輯模型和物理模型3.3.2確定數據范圍確定數據范圍實際上是對 ODS 進行劃分的過程,這種劃分是基于對業(yè)務系統的調研的基礎上而進行的,并不十分關心整個數據倉庫系統上端應用需求,但是需要把上端應用需求與 ODS 數據范圍進行驗證,以確保應用所需的數據都已經從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國血瓊脂培養(yǎng)基數據監(jiān)測研究報告
- 臨時用地計劃表
- 二零二五年度企業(yè)資質轉讓與市場營銷支持合同
- 2025年度智能制造園區(qū)招商代理協議
- 風險投資企業(yè)數字化轉型與智慧升級戰(zhàn)略研究報告
- 文化、教育類雜志專門零售企業(yè)數字化轉型與智慧升級戰(zhàn)略研究報告
- 2025年度汽修廠與保險公司車險理賠合作合同
- 蔬菜專門零售企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 硝酸鋇企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 二零二五法人借款合同及財務審計要求
- 感冒(2023年遼寧本溪中考語文試卷非連續(xù)性文本閱讀題及答案)
- 2024新版英語英語3500個單詞分類大全
- 2024年新高考英語最后一卷(新高考專用)(含答案解析)
- 《新模式英語3(第三版)》 課件 Unit 3 Campus Life
- 領域特定代碼優(yōu)化與生成技術
- 上海市社區(qū)工作者管理辦法
- 信息技術咨詢服務合同協議2024年
- 小學語文閱讀素養(yǎng)大賽檢測卷
- 《網絡營銷實務》 課程標準
- 《鐵路職業(yè)道德》課件-7.1《鐵路法》、《勞動法》和《勞動合同法》
- 2024年徐州生物工程職業(yè)技術學院單招職業(yè)適應性測試題庫各版本
評論
0/150
提交評論