機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課件模板_第1頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課件模板_第2頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課件模板_第3頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課件模板_第4頁(yè)
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課件模板_第5頁(yè)
已閱讀5頁(yè),還剩88頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

機(jī)器學(xué)習(xí)實(shí)戰(zhàn)演講人202x-11-1101版權(quán)聲明版權(quán)聲明02獻(xiàn)詞獻(xiàn)詞

03一分類一分類041機(jī)器學(xué)習(xí)基礎(chǔ)1機(jī)器學(xué)習(xí)基礎(chǔ)11.1何謂機(jī)器學(xué)習(xí)21.2關(guān)鍵術(shù)語(yǔ)31.3機(jī)器學(xué)習(xí)的主要任務(wù)41.4如何選擇合適的算法51.5開(kāi)發(fā)機(jī)器學(xué)習(xí)應(yīng)用程序的步驟61.6python語(yǔ)言的優(yōu)勢(shì)1機(jī)器學(xué)習(xí)基礎(chǔ)1.7numpy函數(shù)庫(kù)基礎(chǔ)1.8本章小結(jié)1.8本章小結(jié)1機(jī)器學(xué)習(xí)基礎(chǔ)1.1何謂機(jī)器學(xué)習(xí)11.1.1傳感器和海量數(shù)據(jù)21.1.2機(jī)器學(xué)習(xí)非常重要1機(jī)器學(xué)習(xí)基礎(chǔ)1.6python語(yǔ)言的優(yōu)勢(shì)11.6.1可執(zhí)行偽代碼21.6.2python比較流行31.6.3python語(yǔ)言的特色41.6.4python語(yǔ)言的缺點(diǎn)052k-近鄰算法2k-近鄰算法2.1k-近鄰算法概述2.2示例:使用k近鄰算法改進(jìn)約會(huì)網(wǎng)站的配對(duì)效果2.3示例:手寫(xiě)識(shí)別系統(tǒng)2.4本章小結(jié)2k-近鄰算法2.1k-近鄰算法概述12.1.1準(zhǔn)備:使用python導(dǎo)入數(shù)據(jù)22.1.2實(shí)施knn分類算法32.1.3如何測(cè)試分類器2k-近鄰算法2.2示例:使用k近鄰算法改進(jìn)約會(huì)網(wǎng)站的配對(duì)效果2.2.1準(zhǔn)備數(shù)據(jù):從文本文件中解析數(shù)據(jù)012.2.2分析數(shù)據(jù):使用matplotlib創(chuàng)建散點(diǎn)圖022.2.3準(zhǔn)備數(shù)據(jù):歸一化數(shù)值032.2.4測(cè)試算法:作為完整程序驗(yàn)證分類器042.2.5使用算法:構(gòu)建完整可用系統(tǒng)052k-近鄰算法2.3示例:手寫(xiě)識(shí)別系統(tǒng)ab2.3.2測(cè)試算法:使用k近鄰算法識(shí)別手寫(xiě)數(shù)字2.3.1準(zhǔn)備數(shù)據(jù):將圖像轉(zhuǎn)換為測(cè)試向量063決策樹(shù)3決策樹(shù)3.1決策樹(shù)的構(gòu)造3.2在python中使用matplotlib注解繪制樹(shù)形圖3.3測(cè)試和存儲(chǔ)分類器3.4示例:使用決策樹(shù)預(yù)測(cè)隱形眼鏡類型3.5本章小結(jié)3.2在Python中使用Matplotlib注解繪制樹(shù)形圖3.3測(cè)試和存儲(chǔ)分類器3.4示例:使用決策樹(shù)預(yù)測(cè)隱形眼鏡類型3.5本章小結(jié)3決策樹(shù)3.1決策樹(shù)的構(gòu)造3.1.2劃分?jǐn)?shù)據(jù)集1323.1.1信息增益3.1.3遞歸構(gòu)建決策樹(shù)3決策樹(shù)3.2在python中使用matplotlib注解繪制樹(shù)形圖a3.2.1matplotlib注解3.2.2構(gòu)造注解樹(shù)b3決策樹(shù)3.3測(cè)試和存儲(chǔ)分類器ab3.3.2使用算法:決策樹(shù)的存儲(chǔ)3.3.1測(cè)試算法:使用決策樹(shù)執(zhí)行分類074基于概率論的分類方法:樸素貝葉斯14.1基于貝葉斯決策理論的分類方法34.3使用條件概率來(lái)分類24.2條件概率44.4使用樸素貝葉斯進(jìn)行文檔分類4基于概率論的分類方法:樸素貝葉斯54.5使用Python進(jìn)行文本分類64.6示例:使用樸素貝葉斯過(guò)濾垃圾郵件4基于概率論的分類方法:樸素貝葉斯4.7示例:使用樸素貝葉斯分類器從個(gè)人廣告中獲取區(qū)域傾向4.8本章小結(jié)4基于概率論的分類方法:樸素貝葉斯4.5使用python進(jìn)行文本分類4.5.1準(zhǔn)備數(shù)據(jù):從文本中構(gòu)建詞向量014.5.2訓(xùn)練算法:從詞向量計(jì)算概率024.5.3測(cè)試算法:根據(jù)現(xiàn)實(shí)情況修改分類器034.5.4準(zhǔn)備數(shù)據(jù):文檔詞袋模型044基于概率論的分類方法:樸素貝葉斯4.6示例:使用樸素貝葉斯過(guò)濾垃圾郵件01024.6.1準(zhǔn)備數(shù)據(jù):切分文本4.6.2測(cè)試算法:使用樸素貝葉斯進(jìn)行交叉驗(yàn)證4基于概率論的分類方法:樸素貝葉斯4.7示例:使用樸素貝葉斯分類器從個(gè)人廣告中獲取區(qū)域傾向14.7.1收集數(shù)據(jù):導(dǎo)入rss源24.7.2分析數(shù)據(jù):顯示地域相關(guān)的用詞085logistic回歸5logistic回歸5.1基于logistic回歸和sigmoid函數(shù)的分類

5.2基于最優(yōu)化方法的最佳回歸系數(shù)確定5.2.1梯度上升法5.2.2訓(xùn)練算法:使用梯度上升找到最佳參數(shù)5.2.3分析數(shù)據(jù):畫(huà)出決策邊界5.2.4訓(xùn)練算法:隨機(jī)梯度上升5.3示例:從疝氣病癥預(yù)測(cè)病馬的死亡率5.3.1準(zhǔn)備數(shù)據(jù):處理數(shù)據(jù)中的缺失值5.3.2測(cè)試算法:用logistic回歸進(jìn)行分類5.4本章小結(jié)

5.2基于最優(yōu)化方法的最佳回歸系數(shù)確定5.2.1梯度上升法5.2.2訓(xùn)練算法:使用梯度上升找到最佳參數(shù)5.2.3分析數(shù)據(jù):畫(huà)出決策邊界5.2.4訓(xùn)練算法:隨機(jī)梯度上升5.3示例:從疝氣病癥預(yù)測(cè)病馬的死亡率5.3.1準(zhǔn)備數(shù)據(jù):處理數(shù)據(jù)中的缺失值5.3.2測(cè)試算法:用Logistic回歸進(jìn)行分類5.4本章小結(jié)

096支持向量機(jī)6支持向量機(jī)ABCDEF6.1基于最大間隔分隔數(shù)據(jù)6.3smo高效優(yōu)化算法6.5在復(fù)雜數(shù)據(jù)上應(yīng)用核函數(shù)6.2尋找最大間隔6.4利用完整plattsmo算法加速優(yōu)化6.6示例:手寫(xiě)識(shí)別問(wèn)題回顧6支持向量機(jī)6.7本章小結(jié)6支持向量機(jī)6.2尋找最大間隔16.2.1分類器求解的優(yōu)化問(wèn)題26.2.2svm應(yīng)用的一般框架6支持向量機(jī)6.3smo高效優(yōu)化算法ab6.3.2應(yīng)用簡(jiǎn)化版smo算法處理小規(guī)模數(shù)據(jù)集6.3.1platt的smo算法6支持向量機(jī)6.5在復(fù)雜數(shù)據(jù)上應(yīng)用核函數(shù)6.5.1利用核函數(shù)將數(shù)據(jù)映射到高維空間6.5.2徑向基核函數(shù)6.5.3在測(cè)試中使用核函數(shù)107利用adaboost元算法提高分類性能17.1基于數(shù)據(jù)集多重抽樣的分類器37.3基于單層決策樹(shù)構(gòu)建弱分類器27.2訓(xùn)練算法:基于錯(cuò)誤提升分類器的性能47.4完整AdaBoost算法的實(shí)現(xiàn)7利用adaboost元算法提高分類性能57.5測(cè)試算法:基于AdaBoost的分類67.6示例:在一個(gè)難數(shù)據(jù)集上應(yīng)用AdaBoost7利用adaboost元算法提高分類性能7.1基于數(shù)據(jù)集多重抽樣的分類器017.1.1bagging:基于數(shù)據(jù)隨機(jī)重抽樣的分類器構(gòu)建方法027.1.2boosting7利用adaboost元算法提高分類性能7.7非均衡分類問(wèn)題單擊此處添加標(biāo)題9,300million7.7.1其他分類性能度量指標(biāo):正確率、召回率及roc曲線7.7.2基于代價(jià)函數(shù)的分類器決策控制7.7.3處理非均衡問(wèn)題的數(shù)據(jù)抽樣方法單擊此處輸入你的正文,文字是您思想的提煉,為了最終演示發(fā)布的良好效果,請(qǐng)盡量言簡(jiǎn)意賅的闡述觀點(diǎn);根據(jù)需要可酌情增減文字,以便觀者可以準(zhǔn)確理解您所傳達(dá)的信息。11二利用回歸預(yù)測(cè)數(shù)值型數(shù)據(jù)二利用回歸預(yù)測(cè)數(shù)值型數(shù)據(jù)128預(yù)測(cè)數(shù)值型數(shù)據(jù):回歸8預(yù)測(cè)數(shù)值型數(shù)據(jù):回歸ABCDEF8.1用線性回歸找到最佳擬合直線8.3示例:預(yù)測(cè)鮑魚(yú)的年齡8.5權(quán)衡偏差與方差8.2局部加權(quán)線性回歸8.4縮減系數(shù)來(lái)「理解」數(shù)據(jù)8.6示例:預(yù)測(cè)樂(lè)高玩具套裝的價(jià)格8預(yù)測(cè)數(shù)值型數(shù)據(jù):回歸8.7本章小結(jié)8預(yù)測(cè)數(shù)值型數(shù)據(jù):回歸8.4縮減系數(shù)來(lái)「理解」數(shù)據(jù)8.4.1嶺回歸8.4.2lasso8.4.3前向逐步回歸8預(yù)測(cè)數(shù)值型數(shù)據(jù):回歸8.6示例:預(yù)測(cè)樂(lè)高玩具套裝的價(jià)格18.6.1收集數(shù)據(jù):使用google購(gòu)物的api28.6.2訓(xùn)練算法:建立模型139樹(shù)回歸9樹(shù)回歸19.1復(fù)雜數(shù)據(jù)的局部性建模29.2連續(xù)和離散型特征的樹(shù)的構(gòu)建39.3將cart算法用于回歸49.4樹(shù)剪枝59.5模型樹(shù)69.6示例:樹(shù)回歸與標(biāo)準(zhǔn)回歸的比較9.7使用python的tkinter庫(kù)創(chuàng)建gui9.8本章小結(jié)9.8本章小結(jié)9樹(shù)回歸9樹(shù)回歸9.3將cart算法用于回歸9.3.1構(gòu)建樹(shù)19.3.2運(yùn)行代碼29樹(shù)回歸9.4樹(shù)剪枝9.4.1預(yù)剪枝19.4.2后剪枝29樹(shù)回歸9.7使用python的tkinter庫(kù)創(chuàng)建gui19.7.1用tkinter創(chuàng)建gui29.7.2集成matplotlib和tkinter14三無(wú)監(jiān)督學(xué)習(xí)三無(wú)監(jiān)督學(xué)習(xí)1510利用k-均值聚類算法對(duì)未標(biāo)注數(shù)據(jù)分組10利用k-均值聚類算法對(duì)未標(biāo)注數(shù)據(jù)分組10.1k均值聚類算法

10.2使用后處理來(lái)提高聚類性能

10.3二分k均值算法

10.4示例:對(duì)地圖上的點(diǎn)進(jìn)行聚類10.4.1yahoo!placefinderapi10.4.2對(duì)地理坐標(biāo)進(jìn)行聚類10.4.2對(duì)地理坐標(biāo)進(jìn)行聚類10.5本章小結(jié)

1611使用apriori算法進(jìn)行關(guān)聯(lián)分析11使用apriori算法進(jìn)行關(guān)聯(lián)分析M.94275.CN111.1關(guān)聯(lián)分析211.2apriori原理311.3使用apriori算法來(lái)發(fā)現(xiàn)頻繁集411.4從頻繁項(xiàng)集中挖掘關(guān)聯(lián)規(guī)則511.5示例:發(fā)現(xiàn)國(guó)會(huì)投票中的模式611.6示例:發(fā)現(xiàn)毒蘑菇的相似特征11使用apriori算法進(jìn)行關(guān)聯(lián)分析11.7本章小結(jié)11使用apriori算法進(jìn)行關(guān)聯(lián)分析11.3使用apriori算法來(lái)發(fā)現(xiàn)頻繁集111.3.1生成候選項(xiàng)集211.3.2組織完整的apriori算法11使用apriori算法進(jìn)行關(guān)聯(lián)分析11.5示例:發(fā)現(xiàn)國(guó)會(huì)投票中的模式11.5.1收集數(shù)據(jù):構(gòu)建美國(guó)國(guó)會(huì)投票記錄的事務(wù)數(shù)據(jù)集11.5.2測(cè)試算法:基于美國(guó)國(guó)會(huì)投票記錄挖掘關(guān)聯(lián)規(guī)則1712使用fp-growth算法來(lái)高效發(fā)現(xiàn)頻繁項(xiàng)集12使用fp-growth算法來(lái)高效發(fā)現(xiàn)頻繁項(xiàng)集

12.1fp樹(shù):用于編碼數(shù)據(jù)集的有效方式lorem12.2.1創(chuàng)建fp樹(shù)的數(shù)據(jù)結(jié)構(gòu)12.2.2構(gòu)建fp樹(shù)12.2.2構(gòu)建FP樹(shù)12.2構(gòu)建fp樹(shù)12.3.1抽取條件模式基12.3.2創(chuàng)建條件fp樹(shù)12.3.2創(chuàng)建條件FP樹(shù)12.3從一棵fp樹(shù)中挖掘頻繁項(xiàng)集

12.6本章小結(jié)

12.5示例:從新聞網(wǎng)站點(diǎn)擊流中挖掘

12.4示例:在twitter源中發(fā)現(xiàn)一些共現(xiàn)詞loremloremloremloremlorem18四其他工具四其他工具1913利用pca來(lái)簡(jiǎn)化數(shù)據(jù)

13.3示例:利用pca對(duì)半導(dǎo)體制造數(shù)據(jù)降維

13.4本章小結(jié)

13.1降維技術(shù)13.2.1移動(dòng)坐標(biāo)軸13.2.2在numpy中實(shí)現(xiàn)pca13.2.2在NumPy中實(shí)現(xiàn)PCA13.2pca單擊此處添加文本具體內(nèi)容,簡(jiǎn)明扼要的闡述您的觀點(diǎn)。添加標(biāo)題單擊此處添加文本具體內(nèi)容,簡(jiǎn)明扼要的闡述您的觀點(diǎn)。添加標(biāo)題66%36%13利用pca來(lái)簡(jiǎn)化數(shù)據(jù)2014利用svd簡(jiǎn)化數(shù)據(jù)14.1svd的應(yīng)用14.2矩陣分解14.3利用python實(shí)現(xiàn)svd14.4基于協(xié)同過(guò)濾的推薦引擎14.5示例:餐館菜肴推薦引擎14.6示例:基于svd的圖像壓縮14利用svd簡(jiǎn)化數(shù)據(jù)單擊此處添加文本具體內(nèi)容,簡(jiǎn)明扼要的闡述您的觀點(diǎn)。根據(jù)需要可酌情增減文字,以便觀者準(zhǔn)確的理解您傳達(dá)的思想。單擊此處添加標(biāo)題14利用svd簡(jiǎn)化數(shù)據(jù)14.7本章小結(jié)14.1svd的應(yīng)用14.1.2推薦系統(tǒng)14利用svd簡(jiǎn)化數(shù)據(jù)14利用svd簡(jiǎn)化數(shù)據(jù)14.4基于協(xié)同過(guò)濾的推薦引擎14.4.1相似度計(jì)算0114.4.2基于物品的相似度還是基于用戶的相似度?0214.4.3推薦引擎的評(píng)價(jià)0314利用svd簡(jiǎn)化數(shù)據(jù)14.5示例:餐館菜肴推薦引擎114.5.1推薦未嘗過(guò)的菜肴214.5.2利用svd提高推薦的效果314.5.3構(gòu)建推薦引擎面臨的挑戰(zhàn)2115大數(shù)據(jù)與mapreduce115.1MapReduce:分布式計(jì)算的框架315.3在Amazon網(wǎng)絡(luò)服務(wù)上運(yùn)行Hadoop程序215.2Hadoop流415.4MapReduce上的機(jī)器學(xué)習(xí)15大數(shù)據(jù)與mapreduce515.5在Python中使用mrjob來(lái)自動(dòng)化MapReduce615.6示例:分布式SVM的Pegasos算法15大數(shù)據(jù)與mapreduce15.7你真的需要mapreduce嗎?15.8本章小結(jié)15.8本章小結(jié)15大數(shù)據(jù)與mapreduce15.2hadoop流ab15.2.2分布式計(jì)算均值和方差的reducer15.2.1分布式計(jì)算均值和方差的mapper15大數(shù)據(jù)與mapreduce15.3在amazon網(wǎng)絡(luò)服務(wù)上運(yùn)行hadoop程序115.3.1aws上的可用服務(wù)215.3.2開(kāi)啟amazon網(wǎng)絡(luò)服務(wù)之旅315.3.3在emr上運(yùn)行hadoop作業(yè)15大數(shù)據(jù)與mapreduce15.5在python中使用mrjob來(lái)自動(dòng)化mapredu

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論