5.3數(shù)據(jù)的分析與可視化表達(dá)課件粵教版高中信息技術(shù)必修1_第1頁
5.3數(shù)據(jù)的分析與可視化表達(dá)課件粵教版高中信息技術(shù)必修1_第2頁
5.3數(shù)據(jù)的分析與可視化表達(dá)課件粵教版高中信息技術(shù)必修1_第3頁
5.3數(shù)據(jù)的分析與可視化表達(dá)課件粵教版高中信息技術(shù)必修1_第4頁
5.3數(shù)據(jù)的分析與可視化表達(dá)課件粵教版高中信息技術(shù)必修1_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)的分析與可視化表達(dá)2目錄CONTENT0102數(shù)據(jù)的分析數(shù)據(jù)的可視化表達(dá)3目錄CONTENT0102數(shù)據(jù)的分析數(shù)據(jù)的可視化表達(dá)特征探索關(guān)聯(lián)分析聚類分析數(shù)據(jù)分類數(shù)據(jù)的分析401運(yùn)用數(shù)字化工具和技術(shù),探索數(shù)據(jù)內(nèi)在的結(jié)構(gòu)和規(guī)律數(shù)據(jù)進(jìn)行預(yù)測做出決策采集存儲保護(hù)分析可視化表達(dá)5數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析

數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析

6數(shù)據(jù)的分析01特征探索預(yù)處理分布特征描述性統(tǒng)計(jì)量檢查數(shù)據(jù)是否缺失,是否有異常7數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析

數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析

8數(shù)據(jù)的分析01關(guān)聯(lián)分析

分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性全國零售業(yè)巨頭沃爾瑪再對消費(fèi)者購物行為分析時(shí),發(fā)現(xiàn):男性顧客在購買尿布時(shí),常常會順便搭幾瓶啤酒來犒勞自己。9數(shù)據(jù)的分析01訂單編號商品1商品2商品3商品4商品5商品61啤酒蘋果奶酪2奶酪薯片3薯片面包蘋果牛奶4薯片面包牛奶香蕉5面包6奶酪蘋果牛奶薯片7牛奶奶酪香蕉面包啤酒8薯片奶酪香蕉啤酒牛奶9面包薯片奶酪蘋果香蕉10薯片面包香蕉牛奶啤酒蘋果10數(shù)據(jù)的分析01支持度:某商品(或組合)在所有訂單中出現(xiàn)的頻率。訂單編號商品1商品2商品3商品4商品5商品61啤酒蘋果奶酪2奶酪薯片3薯片面包蘋果牛奶4薯片面包牛奶香蕉5面包6奶酪蘋果牛奶薯片7牛奶奶酪香蕉面包啤酒8薯片奶酪香蕉啤酒牛奶9面包薯片奶酪蘋果香蕉10薯片面包香蕉牛奶啤酒蘋果支持度(面包

牛奶)=(面包+牛奶)/記錄總數(shù)=4/10置信度:在所有包含A的訂單中出現(xiàn)B商品的概率。置信度(面包

牛奶)=(面包+牛奶)/面包=4/6提升度:銷售A商品對B商品帶來的提升率。提升度(面包

牛奶)=(面包+牛奶)/有牛奶無面包=4/10頻繁項(xiàng)集:支持度大于或等于某個閾值的項(xiàng)集。項(xiàng)集:包含一個或多個商品的組合。寫作:AB11數(shù)據(jù)的分析01支持度:某商品(或組合)在所有訂單中出現(xiàn)的頻率。支持度(面包

牛奶)=(面包+牛奶)/記錄總數(shù)=4/10置信度:在所有包含A的訂單中出現(xiàn)B商品的概率。置信度(面包

牛奶)=(面包+牛奶)/面包=4/6提升度:銷售A商品對B商品帶來的提升率。提升度(面包

牛奶)=(面包+牛奶)/有牛奶無面包=4/10頻繁項(xiàng)集:支持度大于或等于某個閾值的項(xiàng)集。項(xiàng)集:包含一個或多個商品的組合。寫作:AB找出頻繁項(xiàng)集(即一個商品組合):按照“支持度≥最小支持度”的標(biāo)準(zhǔn)篩選出頻繁項(xiàng)集。找出強(qiáng)關(guān)聯(lián)原則:在所有的銷售記錄中,找出所有的強(qiáng)關(guān)聯(lián)原則。12數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析

數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析

13數(shù)據(jù)的分析01聚類分析

從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法13245614數(shù)據(jù)的分析01聚類分析

從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法13245615數(shù)據(jù)的分析01聚類分析

從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法13245616數(shù)據(jù)的分析01K-平均算法步驟

隨機(jī)選取K個點(diǎn)作為質(zhì)心;計(jì)算每個點(diǎn)到K個質(zhì)心的距離,分成K個簇;計(jì)算K個簇樣本的平均值作為新的質(zhì)心;循環(huán)

;位置不變或者達(dá)到迭代次數(shù),聚類完成。13245617數(shù)據(jù)的分析01特征探索關(guān)聯(lián)分析

數(shù)據(jù)分類01030204預(yù)處理分布特征描述性統(tǒng)計(jì)量分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性從樣本數(shù)據(jù)出發(fā),自動進(jìn)行分類K-平均算法基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。聚類分析

18數(shù)據(jù)的分析01數(shù)據(jù)分類基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(分類器),再根據(jù)分類器具進(jìn)行預(yù)測。待分類數(shù)據(jù)分類器某一類別樣本數(shù)據(jù)訓(xùn)練19數(shù)據(jù)的分析01貝葉斯分類垃圾郵件7封5封郵件包含“發(fā)票”4封郵件包含“便宜”正常郵件3封1封郵件包含“發(fā)票”1封郵件包含“便宜”P(正常|發(fā)票)=P(發(fā)票|正常)P(正常)P(發(fā)票)=

1/3×3/106/10=1/6P(垃圾|發(fā)票)=P(發(fā)票|垃圾)P(垃圾)P(發(fā)票)=

5/7×7/106/10=5/6“發(fā)票”20數(shù)據(jù)的分析01貝葉斯分類垃圾郵件7封5封郵件包含“發(fā)票”4封郵件包含“便宜”正常郵件3封1封郵件包含“發(fā)票”1封郵件包含“便宜”P(正常|發(fā)票)=P(發(fā)票|正常)P(正常)P(發(fā)票)=

1/3×3/106/10=1/6P(垃圾|發(fā)票)=P(發(fā)票|垃圾)P(垃圾)P(發(fā)票)=

5/7×7/106/10=5/6垃圾郵件數(shù)據(jù)的可視化表達(dá)2102視覺沖擊力數(shù)據(jù)的可視化表達(dá)2202以圖形、圖像、地圖、動畫等生動、易于理解的方式展示數(shù)據(jù)和詮釋數(shù)據(jù)之間的關(guān)系、趨勢和規(guī)律等,以便更好地理解數(shù)據(jù)。數(shù)據(jù)的可視化表達(dá)2302分組柱形圖堆疊柱形圖折線圖柱線混合圖有關(guān)趨勢的分析數(shù)據(jù)的可視化表達(dá)2402

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論