版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)的分析與可視化表達(dá)2目錄CONTENT0102數(shù)據(jù)的分析數(shù)據(jù)的可視化表達(dá)3目錄CONTENT0102數(shù)據(jù)的分析數(shù)據(jù)的可視化表達(dá)特征探索關(guān)聯(lián)分析聚類分析數(shù)據(jù)分類數(shù)據(jù)的分析401運(yùn)用數(shù)字化工具和技術(shù),探索數(shù)據(jù)內(nèi)在的結(jié)構(gòu)和規(guī)律數(shù)據(jù)進(jìn)行預(yù)測做出決策采集存儲保護(hù)分析可視化表達(dá)5數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析
數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析
6數(shù)據(jù)的分析01特征探索預(yù)處理分布特征描述性統(tǒng)計(jì)量檢查數(shù)據(jù)是否缺失,是否有異常7數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析
數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析
8數(shù)據(jù)的分析01關(guān)聯(lián)分析
分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性全國零售業(yè)巨頭沃爾瑪再對消費(fèi)者購物行為分析時(shí),發(fā)現(xiàn):男性顧客在購買尿布時(shí),常常會順便搭幾瓶啤酒來犒勞自己。9數(shù)據(jù)的分析01訂單編號商品1商品2商品3商品4商品5商品61啤酒蘋果奶酪2奶酪薯片3薯片面包蘋果牛奶4薯片面包牛奶香蕉5面包6奶酪蘋果牛奶薯片7牛奶奶酪香蕉面包啤酒8薯片奶酪香蕉啤酒牛奶9面包薯片奶酪蘋果香蕉10薯片面包香蕉牛奶啤酒蘋果10數(shù)據(jù)的分析01支持度:某商品(或組合)在所有訂單中出現(xiàn)的頻率。訂單編號商品1商品2商品3商品4商品5商品61啤酒蘋果奶酪2奶酪薯片3薯片面包蘋果牛奶4薯片面包牛奶香蕉5面包6奶酪蘋果牛奶薯片7牛奶奶酪香蕉面包啤酒8薯片奶酪香蕉啤酒牛奶9面包薯片奶酪蘋果香蕉10薯片面包香蕉牛奶啤酒蘋果支持度(面包
牛奶)=(面包+牛奶)/記錄總數(shù)=4/10置信度:在所有包含A的訂單中出現(xiàn)B商品的概率。置信度(面包
牛奶)=(面包+牛奶)/面包=4/6提升度:銷售A商品對B商品帶來的提升率。提升度(面包
牛奶)=(面包+牛奶)/有牛奶無面包=4/10頻繁項(xiàng)集:支持度大于或等于某個閾值的項(xiàng)集。項(xiàng)集:包含一個或多個商品的組合。寫作:AB11數(shù)據(jù)的分析01支持度:某商品(或組合)在所有訂單中出現(xiàn)的頻率。支持度(面包
牛奶)=(面包+牛奶)/記錄總數(shù)=4/10置信度:在所有包含A的訂單中出現(xiàn)B商品的概率。置信度(面包
牛奶)=(面包+牛奶)/面包=4/6提升度:銷售A商品對B商品帶來的提升率。提升度(面包
牛奶)=(面包+牛奶)/有牛奶無面包=4/10頻繁項(xiàng)集:支持度大于或等于某個閾值的項(xiàng)集。項(xiàng)集:包含一個或多個商品的組合。寫作:AB找出頻繁項(xiàng)集(即一個商品組合):按照“支持度≥最小支持度”的標(biāo)準(zhǔn)篩選出頻繁項(xiàng)集。找出強(qiáng)關(guān)聯(lián)原則:在所有的銷售記錄中,找出所有的強(qiáng)關(guān)聯(lián)原則。12數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析
數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析
13數(shù)據(jù)的分析01聚類分析
從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法13245614數(shù)據(jù)的分析01聚類分析
從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法13245615數(shù)據(jù)的分析01聚類分析
從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法13245616數(shù)據(jù)的分析01K-平均算法步驟
隨機(jī)選取K個點(diǎn)作為質(zhì)心;計(jì)算每個點(diǎn)到K個質(zhì)心的距離,分成K個簇;計(jì)算K個簇樣本的平均值作為新的質(zhì)心;循環(huán)
;位置不變或者達(dá)到迭代次數(shù),聚類完成。13245617數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析
數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析
18數(shù)據(jù)的分析01數(shù)據(jù)分類基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。待分類數(shù)據(jù)分類器某一類別樣本數(shù)據(jù)訓(xùn)練19數(shù)據(jù)的分析01貝葉斯分類垃圾郵件7封5封郵件包含“發(fā)票”4封郵件包含“便宜”正常郵件3封1封郵件包含“發(fā)票”1封郵件包含“便宜”P(正常|發(fā)票)=P(發(fā)票|正常)P(正常)P(發(fā)票)=
1/3×3/106/10=1/6P(垃圾|發(fā)票)=P(發(fā)票|垃圾)P(垃圾)P(發(fā)票)=
5/7×7/106/10=5/6“發(fā)票”20數(shù)據(jù)的分析01貝葉斯分類垃圾郵件7封5封郵件包含“發(fā)票”4封郵件包含“便宜”正常郵件3封1封郵件包含“發(fā)票”1封郵件包含“便宜”P(正常|發(fā)票)=P(發(fā)票|正常)P(正常)P(發(fā)票)=
1/3×3/106/10=1/6P(垃圾|發(fā)票)=P(發(fā)票|垃圾)P(垃圾)P(發(fā)票)=
5/7×7/106/10=5/6垃圾郵件數(shù)據(jù)的可視化表達(dá)2102視覺沖擊力數(shù)據(jù)的可視化表達(dá)2202以圖形、圖像、地圖、動畫等生動、易于理解的方式展示數(shù)據(jù)和詮釋數(shù)據(jù)之間的關(guān)系、趨勢和規(guī)律等,以便更好地理解數(shù)據(jù)。數(shù)據(jù)的可視化表達(dá)2302分組柱形圖堆疊柱形圖折線圖柱線混合圖有關(guān)趨勢的分析數(shù)據(jù)的可視化表達(dá)2402
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 共青科技職業(yè)學(xué)院《材料表面技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 小朋友的安全課件
- 《營養(yǎng)苗的培育》課件
- 贛西科技職業(yè)學(xué)院《微波電路》2023-2024學(xué)年第一學(xué)期期末試卷
- 《漫談?wù)n堂教學(xué)的有效性》課件
- 2022年上海市中級消防設(shè)施操作員《技能操作》近年真題(含答案)
- 小學(xué)生流感防治教育課件
- 三年級科學(xué)上冊第四單元1常見材料教案蘇教版
- 三年級英語上冊Unit1Hello第5課時(shí)教案人教PEP
- 小學(xué)生模擬法庭教學(xué)課件
- DB22JT 147-2015 巖土工程勘察技術(shù)規(guī)程
- 杵針療法課件
- 軟件企業(yè)戰(zhàn)略規(guī)劃
- 護(hù)理安全隱患及風(fēng)險(xiǎn)防范
- 臨床成人失禁相關(guān)性皮炎的預(yù)防與護(hù)理團(tuán)體標(biāo)準(zhǔn)解讀
- 期末復(fù)習(xí)試題(試題)-2024-2025學(xué)年三年級上冊數(shù)學(xué)蘇教版
- JGJT46-2024《建筑與市政工程施工現(xiàn)場臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)》知識培訓(xùn)
- 供應(yīng)鏈貿(mào)易安全制度
- 2024美容院規(guī)章制度(31篇)
- 《咳嗽的診斷與治療指南(2021)》解讀課件
- 現(xiàn)代農(nóng)業(yè)機(jī)械操作考核試卷
評論
0/150
提交評論