




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Olap模型設(shè)計(jì)指南作者狀態(tài)時(shí)間說(shuō)明林志賢創(chuàng)建2006-3-21初稿摘要:本指南詳細(xì)介紹OLAP立方體結(jié)構(gòu),幾種維度模型,Kingdee OLAP Schema文檔結(jié)構(gòu)。通過(guò)學(xué)習(xí)和參考本指南,我們希望讀者理解OLAP立方體結(jié)構(gòu),掌握Kingdee OLAP Cube模型結(jié)構(gòu)和Schema文檔結(jié)構(gòu),能否基于具體的業(yè)務(wù)設(shè)計(jì)出多維模型,滿足匯總分析報(bào)表的開(kāi)發(fā)。由于Kingdee OLAP模型與Microsoft Analysis Services基本上一致,如果本文檔無(wú)法滿足你或者你希望更深入了解OLAP知識(shí),請(qǐng)參考Microsoft Analysis Services聯(lián)機(jī)文檔。Schema文檔結(jié)構(gòu)
2、請(qǐng)參考OlapSchema.xsd文件。1.OLAP立方體結(jié)構(gòu)1.1立方體(Cube)多維數(shù)據(jù)模型,是Olap分析的數(shù)據(jù)模型,由多個(gè)維度構(gòu)造出的多維立方架構(gòu)和度量值組成,多維度的交點(diǎn),即立方體的單元格,對(duì)應(yīng)一個(gè)度量值。多維運(yùn)算的結(jié)果,是n維的超立方體。在數(shù)學(xué)上可對(duì)應(yīng)一個(gè)多維數(shù)組(維度1、維度2、維度3維度n,度量)。如下圖,該Cube有三個(gè)維度:產(chǎn)品、時(shí)間、工廠位置,單元格中的數(shù)字是度量,比如金額,這個(gè)Cube只有一個(gè)度量值,實(shí)際上Cube可能有多個(gè)度量值。圖1 立方體結(jié)構(gòu)1.2維度(Dimension)是人們觀察數(shù)據(jù)的特定角度,是考慮問(wèn)題時(shí)的一類屬性,屬性集合構(gòu)成一個(gè)維。例如:時(shí)間維、地理維
3、等。維度具有層級(jí)結(jié)構(gòu),由多個(gè)級(jí)別組成,每個(gè)級(jí)別掛有多個(gè)成員,因此,一個(gè)維度結(jié)構(gòu)是一個(gè)樹狀結(jié)構(gòu)或稱金字塔結(jié)構(gòu)(當(dāng)然,如果只有一個(gè)級(jí)別,那就是扁平結(jié)構(gòu)),每個(gè)節(jié)點(diǎn)帶一個(gè)成員。維度水平布局由維度層次結(jié)構(gòu)中具有相同級(jí)別的列值生成,而垂直布局由維度層次結(jié)構(gòu)中具有不同級(jí)別的列值生成。圖2 維度結(jié)構(gòu)(工廠位置)1.3級(jí)別(Level)人們觀察數(shù)據(jù)的某個(gè)特定角度還可以存在細(xì)節(jié)程度不同的各個(gè)描述方面。例如:時(shí)間維可分為年、季度、月等3個(gè)級(jí)別。級(jí)別構(gòu)成維度的層級(jí)結(jié)構(gòu),如上圖工廠位置維度,由兩個(gè)級(jí)別組成:東西部、州。當(dāng)然,不是說(shuō)維度都必須具有幾個(gè)級(jí)別,很多情況下只有一個(gè)級(jí)別。可以定義這樣一種特殊的級(jí)別,即“所有”級(jí)
4、別,處于最高級(jí)別。它只有一個(gè)成員“所有成員”,是所有成員的聚合值。1.4成員(Member)表示維度的項(xiàng)目值,構(gòu)成了維度的坐標(biāo)。維的取值。是數(shù)據(jù)項(xiàng)在維中位置的描述。例如:“2004年3月28日”是在時(shí)間維上成員的描述。成員掛接在級(jí)別上,一個(gè)成員必須且只屬于一個(gè)級(jí)別,比如工廠位置維度,從下至上有兩個(gè)級(jí)別“州”、“東西部”,以及特殊的“所有”級(jí)別,其中“州”級(jí)別上有以下成員:“緬因州”、“俄亥俄州”、“愛(ài)達(dá)荷州”,“得克薩斯州”,“東西部”級(jí)別上有“東部”、“西部”兩個(gè)成員,“所有”級(jí)別上有一個(gè)成員“所有工廠位置”。1.5 成員屬性(Member Property)表示成員的屬性,每個(gè)成員可以有多
5、個(gè)屬性。最常見(jiàn)的屬性有name、caption等,name屬性可以用來(lái)查詢,caption可以用來(lái)顯示,根據(jù)業(yè)務(wù)需要,可以定義各種屬性供分析使用。1.6 度量值(Measure)在多維數(shù)據(jù)集中,度量值是一組值,這些值基于多維數(shù)據(jù)集的事實(shí)數(shù)據(jù)表中的一列,而且通常為數(shù)字。此外,度量值是所分析的多維數(shù)據(jù)集的中心值。即,度量值是最終用戶瀏覽多維數(shù)據(jù)集時(shí)重點(diǎn)查看的數(shù)字?jǐn)?shù)據(jù)。不同維度在某一取值下的交叉點(diǎn)。例如:維度為2004年1月,上海,筆記本電腦,度量值為$100000。度量值表示分析指標(biāo),如銷售額,銷售數(shù)量,一個(gè)立方體包括一個(gè)或一個(gè)以上的度量值,所有度量值組成一個(gè)特殊的維度,即度量維,度量維是扁平結(jié)構(gòu)
6、,其成員就是度量值,度量值本身是一個(gè)Member。如果Cube定義了兩個(gè)度量值::銷售額,銷售數(shù)量,那么度量維包括一個(gè)特殊級(jí)別,該級(jí)別掛了兩個(gè)成員(“銷售額”,“銷售數(shù)量”),度量維一般取名為“Measures”。每個(gè)度量值必須定義一個(gè)聚集函數(shù)(Aggregator),聚集函數(shù)表示在構(gòu)造立方體數(shù)據(jù)時(shí),度量值如何從低級(jí)別匯總到高級(jí)別。常見(jiàn)的聚集函數(shù)包括: Sum(求和),Max(最大值),Min(最小值),Avg(平均值),Count(計(jì)數(shù))。度量值還可以定義格式字符串(FormatString),表示該度量的精度,一般用于界面顯示。2. 數(shù)據(jù)來(lái)源多維數(shù)據(jù)集的數(shù)據(jù)來(lái)源由兩個(gè)部分組成,一是構(gòu)成維度
7、的數(shù)據(jù),二是事實(shí)發(fā)生的數(shù)據(jù)。一般稱為維表和事實(shí)表。其中維表,包括維度的必要信息,如主鍵、name、caption等,事實(shí)表包括發(fā)生的事實(shí)數(shù)據(jù),即度量字段,以及維度表關(guān)聯(lián)字段。請(qǐng)參考圖3。圖3 數(shù)據(jù)來(lái)源3. 維度類型所有多維數(shù)據(jù)集,最重要的就是維度結(jié)構(gòu)。上面提過(guò),維度從垂直布局看,是由多個(gè)級(jí)別組成,從水平布局看,是由成員組成。成員掛在級(jí)別上。這是維度基本的結(jié)構(gòu)。但是,存在兩種特殊的維度。時(shí)間維度:時(shí)間維度從本質(zhì)上跟普通的維度沒(méi)有什么差別,只是,時(shí)間序列分析是olap分析中最常用的功能,有很多專門針對(duì)時(shí)間維度的分析函數(shù),而且,時(shí)間維度的級(jí)別是固定的(如年、季、月、日、周等等)。因此,將時(shí)間維度作為
8、一個(gè)特殊的維。父子維度:有一類維度的層級(jí)關(guān)系,無(wú)法通過(guò)預(yù)先定義,而是由數(shù)據(jù)決定的,這種維度就是父子維度,它的級(jí)別是動(dòng)態(tài)生成的,沒(méi)有特殊的含義。這種維度一般是這樣形成的,基于兩個(gè)維度表列,這兩列一起定義了維度成員中的沿襲關(guān)系(即父子關(guān)系),如圖4的Employee_Number和Manager_Emploee_Number構(gòu)成父子關(guān)系,形成了圖5的維度結(jié)構(gòu),三個(gè)級(jí)別:圖4 父子關(guān)系表圖5 父子關(guān)系維度父子維度是比較常用的維度,比如組織架構(gòu)、科目等,都是父子維度。4. Kingdee OLAP模型結(jié)構(gòu)Kingdee OLAP模型,由三部分組成:數(shù)據(jù)源、維度、Cube立方體組成。數(shù)據(jù)源定義了維表和事
9、實(shí)表。模型本身可以定義sql方式的數(shù)據(jù)源,也可以定義成參數(shù),只有數(shù)據(jù)源名稱,具體數(shù)據(jù)在執(zhí)行期由程序傳入。本文檔中,我們只介紹后面這種應(yīng)用情況。維度定義了維度結(jié)構(gòu),它引用了一個(gè)數(shù)據(jù)源作為維表。維度中定義了它的層級(jí)結(jié)構(gòu)。維度支持時(shí)間維度類型和父子維度類型。立方體引用或包含了幾個(gè)維度,并定義了若干度量值。Kingdee OLAP模型可以包括多個(gè)維度和多個(gè)Cube,維度一般定義成共享方式,立方體引用它。但是,在當(dāng)前應(yīng)用下,我們建議,一個(gè)OLAP模型只能定義一個(gè)Cube,且只定義該Cube需要用的維度。不定義沒(méi)有被使用的維度。具體模型結(jié)構(gòu)請(qǐng)參考Schema定義文件。5. Schema文檔結(jié)構(gòu)圖圖6 Ki
10、ngdee OLAP Schema文檔結(jié)構(gòu)5.1 一般結(jié)構(gòu)詳細(xì)文檔描述請(qǐng)參考xsd文件。由圖看出,一個(gè)OLAP Schema由三個(gè)元素組成:Parameter/Dimension/Cube。Parameter用來(lái)定義外部傳入的參數(shù),本文檔只介紹一種參數(shù),即數(shù)據(jù)源,格式如下:<Parameter name="Currency" type="Table"/>定義了一個(gè)類型為Table的數(shù)據(jù)源,名字為Currency,運(yùn)行時(shí)調(diào)用程序必須傳入該參數(shù)。Dimension格式如下:<Dimension name="Currency&quo
11、t; caption="幣別" table="Currency" primaryKey="fID"><Hierarchy><Level name="Currency" column="fnumber"><Property name="name" column="fname_l2"/></Level></Hierarchy></Dimension>table引用了Parameter
12、中定義的Currency表。PrimaryKey表示維度的主鍵。Hierarchy定義層級(jí)結(jié)構(gòu),實(shí)際上一個(gè)維度可以定義多種層級(jí)關(guān)系,但本文檔建議只能定義一個(gè)Hierarchy,Hierarchy具有hasAll屬性,值為true/false,表示是否在該層級(jí)結(jié)構(gòu)樹上生成所有成員和所有級(jí)別,默認(rèn)為false,本文檔建議不要修改該默認(rèn)屬性,主要是考慮到性能原因。Cube格式如下:<Cube name="fm" caption="金額" table="Fact"><DimensionUsage name="Cur
13、rency" foreignKey="FCurrencyID"/><Measure name="FIAmount" caption="流入合計(jì)(本位幣)" column="FIAmount" aggregator="sum" formatString="#,#0.0000"/><Measure name="FOAmount" caption="流出合計(jì)(本位幣)" column="FOAmou
14、nt" aggregator="sum" formatString="#,#0.0000"/><Measure name="FSumAmount" caption="凈流量(本位幣)" column="FSumAmount" aggregator="sum" formatString="#,#0.0000"/></Cube>Cube name屬性是必須的,并且在olap查詢語(yǔ)言中使用,因此,請(qǐng)取有意義的名字。Tabl
15、e引用了Parameter中的數(shù)據(jù)源定義,表示事實(shí)表。DimensionUsage表示對(duì)Dimension定義的引用,通過(guò)name來(lái)引用,foreignKey表示該事實(shí)表中與維表相關(guān)聯(lián)的外鍵。一個(gè)Cube有幾個(gè)維度,就應(yīng)該定義幾個(gè)Dimension和DimensionUsage。Measure定義了度量值,column表示度量字段,必須為數(shù)字。Aggregator表示聚合函數(shù),有5種聚合函數(shù)(sum、count、max、min、avg)。formatString表示度量的格式化字符串,一般用來(lái)顯示。采用java.text.DecimalFormater格式,請(qǐng)參考JDK文檔。下面介紹兩種特殊維
16、度,時(shí)間維度和父子維度。5.2 時(shí)間維度<Dimension name="Time" type="Time" table="Time" primaryKey="month_ID"><Hierarchy><Level name="Year" column="month" type="Years"/><Level name="Month" column="month" type=
17、"Months"/></Hierarchy></Dimension>時(shí)間維度與一般維度的區(qū)別在于兩點(diǎn),一是Dimension屬性type=”Time”,二是級(jí)別中需要定義該級(jí)別類型type=”Years”,時(shí)間維度級(jí)別類型包括:<xs:enumeration value="Years"/><xs:enumeration value="Quarters"/><xs:enumeration value="Months"/><xs:enumerati
18、on value="Weeks"/><xs:enumeration value="WeekDays"/><xs:enumeration value="Days"/><xs:enumeration value="Hours"/><xs:enumeration value="Minutes"/> <xs:enumeration value="Seconds"/>5.3 父子維度<Dimension name="Employee" table="Employee" primaryKey="Employee_ID"><Hierarchy hasAll="true"><Level name="Employee" column="Employee_Name" childColumn="Employee_ID" parentColumn="Manager_ID"><Property name="
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工職業(yè)發(fā)展與工作計(jì)劃的結(jié)合
- 提升創(chuàng)造力的團(tuán)隊(duì)管理策略計(jì)劃
- Unit 5 The colourful world Lesson 2(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教PEP版(2024)英語(yǔ)三年級(jí)上冊(cè)
- 某村村民高血壓發(fā)病率的調(diào)查
- 第1章相交線和平行線單元教學(xué)設(shè)計(jì) 2024-2025學(xué)年浙教版數(shù)學(xué)七年級(jí)下冊(cè)標(biāo)簽標(biāo)題
- 2025年南昌年貨運(yùn)從業(yè)資格證考試從業(yè)從業(yè)資格資格題庫(kù)及答案
- 2025年清遠(yuǎn)貨物從業(yè)資格證考試
- 2025年宿州貨運(yùn)從業(yè)資格證模擬考試下載
- 2025年那曲貨運(yùn)從業(yè)資格證考試試題及答案
- 2025年陜西從業(yè)資格貨運(yùn)資格考試題庫(kù)及答案解析
- 戴德梁行物業(yè)培訓(xùn)ppt課件
- 《法院執(zhí)行實(shí)務(wù)》單元三(上)(課堂PPT)課件
- 煤礦防治水中長(zhǎng)期規(guī)劃2017—2019
- 幼兒園一日生活中的保教結(jié)合(課堂PPT)
- 有害物質(zhì)培訓(xùn)教材(ROHS2.0及REACH)
- 基于深度學(xué)習(xí)的圖像壓縮感知算法綜述
- 德語(yǔ)A1單詞表
- ARL4460 OXSAS曲線制作及學(xué)習(xí)筆記
- 主板維修思路分析
- 高三地理二輪專題河流特征
- Unit__A_View_of_Mountains
評(píng)論
0/150
提交評(píng)論