![大數(shù)據(jù)可視化技術(shù)-關(guān)系數(shù)據(jù)可視化_第1頁](http://file4.renrendoc.com/view7/M02/35/0B/wKhkGWcA7lKAa_BcAAG_z9mV8wk175.jpg)
![大數(shù)據(jù)可視化技術(shù)-關(guān)系數(shù)據(jù)可視化_第2頁](http://file4.renrendoc.com/view7/M02/35/0B/wKhkGWcA7lKAa_BcAAG_z9mV8wk1752.jpg)
![大數(shù)據(jù)可視化技術(shù)-關(guān)系數(shù)據(jù)可視化_第3頁](http://file4.renrendoc.com/view7/M02/35/0B/wKhkGWcA7lKAa_BcAAG_z9mV8wk1753.jpg)
![大數(shù)據(jù)可視化技術(shù)-關(guān)系數(shù)據(jù)可視化_第4頁](http://file4.renrendoc.com/view7/M02/35/0B/wKhkGWcA7lKAa_BcAAG_z9mV8wk1754.jpg)
![大數(shù)據(jù)可視化技術(shù)-關(guān)系數(shù)據(jù)可視化_第5頁](http://file4.renrendoc.com/view7/M02/35/0B/wKhkGWcA7lKAa_BcAAG_z9mV8wk1755.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)系數(shù)據(jù)可視化主要內(nèi)容1.關(guān)系數(shù)據(jù)在大數(shù)據(jù)中的應(yīng)用2.數(shù)據(jù)的關(guān)聯(lián)性3.數(shù)據(jù)的分布性1.關(guān)系數(shù)據(jù)在大數(shù)據(jù)中的應(yīng)用大數(shù)據(jù)的一個(gè)重要價(jià)值是可以幫助我們找到變量之間的聯(lián)系,發(fā)掘事物背后的因果。在進(jìn)行大數(shù)據(jù)挖掘前的重要一步就是探索變量的相關(guān)關(guān)系,進(jìn)而才能探索背后可能隱藏著的因果關(guān)系。分析數(shù)據(jù)時(shí),我們不僅可以從整體進(jìn)行觀察,還可以關(guān)注數(shù)據(jù)的分布,如數(shù)據(jù)間是否存在重疊或者是否毫不相干?還可以從更寬泛的角度觀察各個(gè)分布數(shù)據(jù)的相關(guān)關(guān)系。其實(shí)最重要的點(diǎn),就是數(shù)據(jù)在進(jìn)行可視化處理后,呈現(xiàn)在讀者眼前的圖表所表達(dá)的意義是什么。關(guān)系數(shù)據(jù)具有關(guān)聯(lián)性和分布性。下面通過實(shí)例具體講解關(guān)系數(shù)據(jù),以及如何觀察數(shù)據(jù)間的相關(guān)關(guān)系。2.數(shù)據(jù)的關(guān)聯(lián)性事物之間的關(guān)聯(lián)性是比較容易被發(fā)現(xiàn)的,但是關(guān)聯(lián)并不代表存在因果關(guān)系。比如,大豆的價(jià)格上漲,豬肉的價(jià)格可能也會(huì)上漲,但是大豆的價(jià)格上漲可能不是豬肉上漲的原因。盡管如此,關(guān)聯(lián)性還是能給我?guī)砭薮蟮膬r(jià)值的,比如大豆的價(jià)格已經(jīng)上漲了,那我們就可以抓緊時(shí)間囤一些豬肉,這樣往往能省下一筆錢,至于背后是否存在因果關(guān)系,就沒那么重要了。大數(shù)據(jù)可視化就是在告訴我們分析結(jié)果是“什么”,而不是“為什么”.2.數(shù)據(jù)的關(guān)聯(lián)性數(shù)據(jù)的關(guān)聯(lián)性,其核心就是指量化的兩個(gè)數(shù)據(jù)間的數(shù)理關(guān)系。關(guān)聯(lián)性強(qiáng),是指當(dāng)一個(gè)數(shù)值變化時(shí),另一個(gè)數(shù)值也會(huì)隨之相應(yīng)地發(fā)生變化。相反地,關(guān)聯(lián)性弱,就是指當(dāng)一個(gè)數(shù)值變化時(shí)另一個(gè)數(shù)值幾乎沒有發(fā)生變化。通過數(shù)據(jù)關(guān)聯(lián)性,就可以根據(jù)一個(gè)已知的數(shù)值變化來預(yù)測(cè)另個(gè)數(shù)值的變化。下面通過散點(diǎn)圖、散點(diǎn)圖矩陣、氣泡圖等來研究這類關(guān)系。2.1散點(diǎn)圖變量間一般有三種關(guān)系:正相關(guān)、負(fù)相關(guān)和不相關(guān),如圖所示。正相關(guān)時(shí),橫軸數(shù)據(jù)和縱軸數(shù)據(jù)變化趨勢(shì)相同;負(fù)相關(guān)時(shí),橫軸數(shù)據(jù)和縱軸數(shù)據(jù)變化趨勢(shì)相反;不相關(guān)時(shí)散點(diǎn)的排列則是雜亂無章的。在統(tǒng)計(jì)學(xué)中有更科學(xué)的方法(比如相關(guān)系數(shù))衡量?jī)蓚€(gè)變量的相關(guān)性,但是散點(diǎn)圖往往是判斷相關(guān)性的最簡(jiǎn)單、直觀的方法,在計(jì)算相關(guān)系數(shù)前通常依靠散點(diǎn)圖作出初步判斷。2.2散點(diǎn)圖矩陣前面講解的散點(diǎn)圖,是用兩組數(shù)據(jù)構(gòu)成多個(gè)坐標(biāo)點(diǎn),再通過觀察坐標(biāo)點(diǎn)的分布,判斷兩個(gè)變量之間是否存在某種關(guān)聯(lián),或總結(jié)坐標(biāo)點(diǎn)的分布模式。但很多時(shí)候變量不止兩個(gè),因此,應(yīng)同時(shí)考察多個(gè)(超過兩個(gè))變量間的相互關(guān)系,但是若一一繪制它們之間的簡(jiǎn)單散點(diǎn)圖就十分繁瑣。此時(shí)就可以利用散點(diǎn)圖矩陣來同時(shí)繪制多個(gè)變量問的散點(diǎn)圖,這樣就可以快速發(fā)現(xiàn)哪些變量之間的相關(guān)性更高。這種方法在數(shù)據(jù)探索階段十分有用,其基本框架如圖所示。2.3氣泡圖氣泡圖和散點(diǎn)圖相比,多了一個(gè)維度的數(shù)據(jù)。氣泡圖就是將散點(diǎn)圖中沒有大小的“點(diǎn)“變成有大小的“圓”,圓的大小就可以用來表示多出的那一維數(shù)據(jù)的大小。氣泡圖讓我們可以同時(shí)比較三個(gè)變量,其基本框架如圖所示。一個(gè)具體的例子如圖5-4所示。二手車的價(jià)格由車齡和里程來決定,可以看出,兩個(gè)指標(biāo)越小,氣泡越大,代表價(jià)格越高,反之則反。3.1莖葉圖莖葉圖又稱“枝葉圖”,是由20世紀(jì)早期的英國統(tǒng)計(jì)學(xué)家阿瑟?鮑利(ArthurBowley)設(shè)計(jì)。1997年統(tǒng)計(jì)學(xué)家約翰托奇(JohnTukey)在其著作《探索性數(shù)據(jù)分析》(exploratorydataanalysis)中將這種繪圖方法介紹給大家,從此這種作圖方法變得流行起來。莖葉圖的思路是將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾數(shù),每個(gè)數(shù)具體是多少。莖葉圖是一個(gè)與直方圖相類似的特殊工具,但又與直方圖不同,莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息。將莖葉圖莖和葉逆時(shí)針方向旋轉(zhuǎn)90度,實(shí)際上就是一個(gè)直方圖,可以從中統(tǒng)計(jì)出次數(shù),計(jì)算出各數(shù)據(jù)段的頻率或百分比。從而看出分布是否與正態(tài)分布或單峰偏態(tài)分布逼近。3.2直方圖直方圖與莖葉圖類似,若逆時(shí)針翻轉(zhuǎn)莖葉圖,則行就變成列;若是把每一列的數(shù)字改成柱形,則得到了一個(gè)直方圖。直方圖又稱質(zhì)量分布圖,是數(shù)值數(shù)據(jù)分布的精確圖形表示。直方圖中的柱形高度表示的是數(shù)值頻率,柱形的寬度是取值區(qū)間。水平軸和垂直軸與一般的柱形圖不同,它是連續(xù)的;一般的柱形圖的水平軸是分離的3.3密度圖直方圖反映的是一組數(shù)據(jù)的分布情況,直方圖的水平軸是連續(xù)性的,整個(gè)圖表呈現(xiàn)的是柱形,用戶無法獲知每個(gè)柱形的內(nèi)部變化。而在莖葉圖中,用戶可以看到具體數(shù)字,但是要求比較數(shù)值間的差距大小并不是很明確。為了呈現(xiàn)更多的細(xì)節(jié),人們提出了密度圖,可用它對(duì)分布的細(xì)節(jié)變化進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 上漿黃麻紗行業(yè)行業(yè)發(fā)展趨勢(shì)及投資戰(zhàn)略研究分析報(bào)告
- 沖壓模具開發(fā)合同范本
- 人工挖方合同范本
- 關(guān)于安裝監(jiān)控合同范本
- 代銷合同范例5篇
- 養(yǎng)殖基地養(yǎng)雞合同范本
- 無合同勞動(dòng)仲裁申請(qǐng)書范本
- 企業(yè)房產(chǎn)贈(zèng)與合同范本
- 借錢協(xié)議合同范本
- 公司電費(fèi)簡(jiǎn)易合同范本
- 2025年電力鐵塔市場(chǎng)分析現(xiàn)狀
- 臨床提高膿毒性休克患者1h集束化措施落實(shí)率PDCA品管圈
- DB53∕T 1269-2024 改性磷石膏用于礦山廢棄地生態(tài)修復(fù)回填技術(shù)規(guī)范
- JBT 14727-2023 滾動(dòng)軸承 零件黑色氧化處理 技術(shù)規(guī)范 (正式版)
- GB/T 3478.1-1995圓柱直齒漸開線花鍵模數(shù)基本齒廓公差
- GB/T 1346-2001水泥標(biāo)準(zhǔn)稠度用水量、凝結(jié)時(shí)間、安定性檢驗(yàn)方法
- FZ/T 25001-2012工業(yè)用毛氈
- 中國工運(yùn)史知識(shí)競(jìng)答附答案
- 瑞幸咖啡SWOT分析
- DL∕T 1867-2018 電力需求響應(yīng)信息交換規(guī)范
- 小學(xué)生品德發(fā)展水平指標(biāo)評(píng)價(jià)體系(小學(xué))
評(píng)論
0/150
提交評(píng)論