下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)倉避坑-整明白懂粒度編輯導(dǎo)語:在數(shù)倉中,你理解什么是粒度嗎?這是一個很抽象的名詞,但同時(shí)它又是數(shù)倉中重要的一個概念。作者通過五個方面總結(jié)如何把粒度整明白的方法,我們一起來看下吧。上篇文章數(shù)倉避坑-搞懂維度模型介紹了維度建模經(jīng)典的四部曲:選定業(yè)務(wù)過程、聲明粒度、確定維度、確定事實(shí)。第二步中,粒度的概念著實(shí)有點(diǎn)抽象,很難理解。但是,如果粒度整不明白,近乎等于數(shù)倉沒入門,你將會面臨一系列問題~今天就給大家分享一下,我踩坑粒度的過程。一、先說說粒度的概念選定了分析的過程,緊接著就要聲明粒度??吹綍镞@么說,我當(dāng)時(shí)的反應(yīng)是:為什么?粒度是什么?普通場景里,粒度可以理解為一個東西的大小。比如,鉆石要區(qū)分顆粒度,大小不同的鉆石,價(jià)格不一。而在數(shù)據(jù)分析的語境里,粒度則意味著分析的范圍,分析的細(xì)致程度。舉兩個例子。系統(tǒng)的注冊總?cè)藬?shù),可以按照國家、省份來統(tǒng)計(jì),這是地域?qū)用嫔系牟煌y(tǒng)計(jì)粒度。系統(tǒng)的活躍用戶數(shù),可以按天、按周統(tǒng)計(jì)登錄人數(shù),這是時(shí)間層面上不同的統(tǒng)計(jì)粒度。從數(shù)據(jù)表的角度來看,粒度則解釋著什么情況下增加一條記錄。按國家統(tǒng)計(jì)用戶數(shù),中國只會有一條記錄,按省統(tǒng)計(jì),中國則會有34條記錄。按周統(tǒng)計(jì)活躍用戶,一年只會有52行記錄,按天統(tǒng)計(jì),一年則有365或366條記錄。二、通過實(shí)戰(zhàn)理解粒度好,看書搞懂了概念,實(shí)戰(zhàn)就來了。公司出了新APP,老板很關(guān)心新APP的用戶活躍程度,于是,用戶端產(chǎn)品經(jīng)理希望做個面板,看每天有多少人登錄。同時(shí),他提了另一個需求,他希望能支持統(tǒng)計(jì)兩個日期區(qū)間內(nèi)的登錄人數(shù)(兩個日期是變化的)。通過例子理解:某個活動發(fā)布后,要查看不同時(shí)間區(qū)間內(nèi)的累積活躍用戶數(shù),比如1-2號,3-5號,以便及時(shí)調(diào)整促活的策略。初生牛犢不怕虎,說搞咱就搞,就按照維度建模經(jīng)典套路搞。首先,選定業(yè)務(wù)過程。這個一目了然,自然就是用戶登錄過程。其次,聲明粒度。這里用戶方希望按照不同的日期統(tǒng)計(jì)累積人數(shù),那粒度是天。然后,是確定維度。這個例子里,因?yàn)橐凑杖掌诜治觯钪饕木S度是日期(為了簡單,例子里就就先不考慮其他維度了),日期維度表設(shè)計(jì)如下:三下五除二,維度模型搞定!就等寫好ETL腳本,按周期調(diào)度啦。三、維度模型搞不定,是粒度理解不到位構(gòu)建模型,最終都是為了查出對應(yīng)的指標(biāo)和結(jié)果,所以維度模型通常都會跟標(biāo)準(zhǔn)的指標(biāo)系統(tǒng)配套來使用。對指標(biāo)體系不太了解的朋友可以看這篇:一文幫你更好地理解指標(biāo),或者看華為阿里的產(chǎn)品。當(dāng)我們按照標(biāo)準(zhǔn)套路,進(jìn)入指標(biāo)設(shè)計(jì)階段,問題就會慢慢浮出水
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年邯鄲貨運(yùn)從業(yè)資格證試題及答案
- 《講師邀請函》課件
- 旅館業(yè)治安管理培訓(xùn)會
- 《放射防護(hù)體系》課件
- 圍手術(shù)期患者糖尿病管理
- 《信息組織與檢索》課件
- 2025簡易煤炭買賣合同范本
- 2025產(chǎn)品加工合同格式
- 儀器儀表元器件選用管理辦法
- 火力發(fā)電開發(fā)商施工合同
- GB/T 37779-2019數(shù)據(jù)中心能源管理體系實(shí)施指南
- GB/T 32960.1-2016電動汽車遠(yuǎn)程服務(wù)與管理系統(tǒng)技術(shù)規(guī)范第1部分:總則
- GB/T 28733-2012固體生物質(zhì)燃料全水分測定方法
- 五年級上冊英語試題-綜合閱讀(人教版PEP)含答案
- GB/T 18451.2-2003風(fēng)力發(fā)電機(jī)組功率特性試驗(yàn)
- GB/T 12706.3-2020額定電壓1 kV(Um=1.2 kV)到35 kV(Um=40.5 kV)擠包絕緣電力電纜及附件第3部分:額定電壓35 kV(Um=40.5 kV)電纜
- 工資發(fā)放承諾書3篇(完整版)
- GB 19079.1-2013體育場所開放條件與技術(shù)要求第1部分:游泳場所
- GB 1886.339-2021食品安全國家標(biāo)準(zhǔn)食品添加劑焦磷酸鈉
- 錨桿(土釘)施工記錄表
- 聽力殘疾的評定
評論
0/150
提交評論