版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
PAGE《數(shù)據(jù)挖掘與機器學(xué)習(xí)》課程教學(xué)大綱一、課程信息課程名稱數(shù)據(jù)挖掘與機器學(xué)習(xí)英文名稱DataMiningandMachineLearning課程編碼316042412課程類別專業(yè)核心課程是否為混合式課程否課程性質(zhì)必修學(xué)分3.5學(xué)時總學(xué)時:72理論學(xué)時36實踐/實驗學(xué)時36線上拓展學(xué)時適用專業(yè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)建議修讀學(xué)期第5學(xué)期先修課程數(shù)據(jù)庫系統(tǒng)與應(yīng)用,Python數(shù)據(jù)分析與可視化、優(yōu)化理論與方法考核方式考試(√)考查()成績構(gòu)成及比例:過程性評價(平時作業(yè)、期中考試、課內(nèi)實驗)50%結(jié)果性評價(期末考試)50%大綱執(zhí)筆人大綱審核人注:線上拓展學(xué)時為教師安排學(xué)生利用課余時間完成線上學(xué)習(xí)的學(xué)時。二、課程簡介數(shù)據(jù)挖掘與機器學(xué)習(xí)是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的一門核心基礎(chǔ)課,也是進(jìn)行數(shù)據(jù)分析和處理必不可少的基礎(chǔ)。通過本課程的學(xué)習(xí),使學(xué)生掌握數(shù)據(jù)預(yù)處理技術(shù)(包括數(shù)據(jù)度量、數(shù)據(jù)清理、數(shù)據(jù)集成和轉(zhuǎn)換等方法)和數(shù)據(jù)挖掘與機器學(xué)習(xí)技術(shù)(包括分類、預(yù)測、關(guān)聯(lián)和聚類的概念與技術(shù)),并且熟悉數(shù)據(jù)挖掘與機器學(xué)習(xí)基本原理和發(fā)展方向,提升解決復(fù)雜數(shù)據(jù)工程問題能力,激發(fā)學(xué)生科技報國的家國情懷和使命擔(dān)當(dāng),鍛煉創(chuàng)造性思維和創(chuàng)新性實踐能力,具備初步的科研能力和創(chuàng)造能力。數(shù)據(jù)挖掘與機器學(xué)習(xí)作為理論和實踐結(jié)合的課程,其先修課是概率論與數(shù)理統(tǒng)計、Python數(shù)據(jù)分析與可視化、優(yōu)化理論與應(yīng)用,這三門課程為本課程提供理論基礎(chǔ)與實踐工具。本課程也是行業(yè)大數(shù)據(jù)分析、大數(shù)據(jù)處理綜合實踐、數(shù)據(jù)挖掘課程設(shè)計等專業(yè)課的重要基礎(chǔ)。三、課程內(nèi)容及要求(一)引言(2學(xué)時)1.教學(xué)內(nèi)容理論教學(xué)(2學(xué)時):(1)掌握數(shù)據(jù)挖掘與機器學(xué)習(xí)的概念、內(nèi)容。(2)數(shù)據(jù)挖掘的任務(wù)、數(shù)據(jù)源、存在的問題與常用工具。(3)數(shù)據(jù)挖掘與機器學(xué)習(xí)課程的核心地位和學(xué)習(xí)目標(biāo)(思政教育內(nèi)容:我國大數(shù)據(jù)政務(wù)平臺、大數(shù)據(jù)醫(yī)療平臺等優(yōu)秀的公司案例,展示中國目前蓬勃開展的數(shù)據(jù)挖掘技術(shù),培養(yǎng)學(xué)生的愛國情懷,同時幫助學(xué)生樹立專業(yè)自信心)。2.基本要求(1)數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本內(nèi)容及其聯(lián)系和區(qū)別,數(shù)據(jù)挖掘與機器學(xué)習(xí)的基本內(nèi)容及其聯(lián)系和區(qū)別。(2)要求學(xué)生掌握數(shù)據(jù)挖掘和機器學(xué)習(xí)中存在的主要問題,數(shù)據(jù)建模的常用工具以及Python數(shù)據(jù)挖掘與機器學(xué)習(xí)的常用庫。3.重點及難點重點:數(shù)據(jù)挖掘與機器學(xué)習(xí)的基本流程。難點:數(shù)據(jù)挖掘與機器學(xué)習(xí)的主要問題。4.教學(xué)模式:課堂講述與討論5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成數(shù)據(jù)挖掘與機器學(xué)習(xí)基本概念的知識性作業(yè);(2)要求學(xué)生閱讀文獻(xiàn)或查閱資料,完成數(shù)據(jù)挖掘與機器學(xué)習(xí)發(fā)展的綜述性書面作業(yè);(二)Python數(shù)據(jù)分析與挖掘基礎(chǔ)(4學(xué)時)1.教學(xué)內(nèi)容理論教學(xué)(2學(xué)時):(1)掌握Python編程基礎(chǔ)。(2)數(shù)據(jù)Numpy、Pandas、matplotlib數(shù)據(jù)分析與可視化。2.基本要求(1)Python編程基礎(chǔ)。(2)Numpy、Pandas、matplotlib數(shù)據(jù)分析與可視化用法。3.重點及難點重點:Numpy、Pandas、matplotlib的基本用法。難點:數(shù)據(jù)挖掘數(shù)據(jù)建模編程基礎(chǔ)。4.教學(xué)模式:課堂講述與實踐5.作業(yè)及課外學(xué)習(xí)要求數(shù)據(jù)分析與可視化編程實踐練習(xí);(三)認(rèn)識數(shù)據(jù)(4學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(2學(xué)時)(1)數(shù)據(jù)對象的屬性及其類型。(2)數(shù)據(jù)的基本統(tǒng)計描述。(3)數(shù)據(jù)可視化。(4)數(shù)據(jù)對象的相似性度量。(思政融入點:特征選擇時,通過算法選擇出對識別有重大貢獻(xiàn)的特征,堅決淘汰不良文化(貢獻(xiàn)小)的影響。)實驗教學(xué)(2學(xué)時)(1)數(shù)據(jù)對象及其相似性度量的Python實現(xiàn)。(2)數(shù)據(jù)對象的統(tǒng)計描述及Python和Scipy實現(xiàn)。2.基本要求:(1)掌握數(shù)據(jù)對象及其屬性和類型;(2)掌握數(shù)據(jù)對象的相似性度量;(3)掌握并能實驗數(shù)據(jù)中心趨勢和散度的度量方法,數(shù)據(jù)直方圖、散點圖等數(shù)據(jù)可視化方法,數(shù)據(jù)相似性和相異性的度量方法。3.重點及難點:重點:數(shù)據(jù)對象的屬性類型、相似性度量。難點:具有混合數(shù)據(jù)類型屬性的數(shù)據(jù)對象相似性度量。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成數(shù)據(jù)對象相關(guān)基本概念的知識性作業(yè);(2)要求學(xué)生完成數(shù)據(jù)對象相似性度量的習(xí)題;(3)要求學(xué)生編程環(huán)境中完成數(shù)據(jù)對象的相似性度量和數(shù)據(jù)的統(tǒng)計描述;(四)數(shù)據(jù)預(yù)處理(6學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(4學(xué)時)(1)數(shù)據(jù)預(yù)處理的必要性。(2)數(shù)據(jù)清洗。(3)數(shù)據(jù)異常值檢測。(4)數(shù)據(jù)集成。(5)數(shù)據(jù)標(biāo)準(zhǔn)化。(6)數(shù)據(jù)規(guī)約(思政融入點:“橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同”,從不同維度探索高維數(shù)據(jù),看清事物全貌。)。實驗教學(xué)(2學(xué)時)(1)利用Pandas進(jìn)行數(shù)據(jù)清洗。(2)利用sklearn進(jìn)行數(shù)據(jù)預(yù)處理。2.基本要求:(1)掌握數(shù)據(jù)預(yù)處理的基本過程;(2)掌握數(shù)據(jù)預(yù)處理的算法和方法;(3)掌握并能實驗處理數(shù)據(jù)相關(guān)性的方法、數(shù)據(jù)規(guī)范化方法以及主成分分析方法。3.重點及難點:重點:數(shù)據(jù)預(yù)處理的內(nèi)容及其典型算法和方法。難點:數(shù)據(jù)規(guī)約中的屬性選擇、維度規(guī)約、數(shù)據(jù)壓縮以及傅里葉變換、小波變換和PCA主成分分析。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成數(shù)據(jù)預(yù)處理相關(guān)基本概念的知識性作業(yè);(2)要求學(xué)生完成數(shù)據(jù)異常值檢測編程實現(xiàn);(3)要求學(xué)生編程實現(xiàn)PCA數(shù)據(jù)屬性約減;(4)要求學(xué)生查閱資料,完成數(shù)據(jù)預(yù)處理綜述的書面作業(yè)。(五)回歸分析(6學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(4學(xué)時)(1)回歸分析概述。(2)一元線性回歸分析。(3)多元線性回歸。(4)邏輯回歸。(5)多項式回歸。(6)其他回歸分析方法。實驗教學(xué)(2學(xué)時)(1)回歸分析的一般過程。(2)回歸分析的Python實現(xiàn)。2.基本要求:(1)掌握數(shù)據(jù)分析回歸分析的過程;(2)掌握一元線性回歸模型的參數(shù)估計;(3)理解多元線性回歸模型;(4)了解多元線性回歸的假設(shè)檢驗及其評價;(5)掌握邏輯回歸;(6)掌握嶺回歸、lasso回歸及彈性回歸和逐步回歸;(7)掌握利用Python進(jìn)行數(shù)據(jù)的回歸分析;3.重點及難點:重點:線性回歸、多項式回歸。難點:回歸分析中的過擬合及正則化處理。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成回歸分析相關(guān)基本概念的知識性作業(yè);(2)要求學(xué)生完成數(shù)據(jù)回歸分析實驗。(六)關(guān)聯(lián)分析分析(6學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(4學(xué)時)(1)關(guān)聯(lián)規(guī)則分析概述(2)頻繁項集挖掘方法(融入點:在Apriori算法中,計算頻繁項集需要屢次重復(fù)掃描數(shù)據(jù)庫,引導(dǎo)學(xué)生“成功不是一蹴而就的,需多維度培養(yǎng)和做煉自己的耐心”,強調(diào)工匠精神的重要性。)(3)關(guān)聯(lián)規(guī)則評估方法實驗教學(xué)(2學(xué)時)(1)Apriori算法及其應(yīng)用。(2)FP-growth算法及其應(yīng)用。2.基本要求:(1)理解了解關(guān)聯(lián)規(guī)則的基本思想、概念和意義;(2)熟練掌握頻繁項集、閉項集和關(guān)聯(lián)規(guī)則的概念;(3)理解頻繁模式挖掘的路線圖;(4)掌握Apriori算法:使用候選項集找頻繁項集;(5)掌握由頻繁項集產(chǎn)生關(guān)聯(lián)規(guī)則的方法;(6)理解提高Apriori算法有效性的方法;(7)掌握挖掘頻繁項集的模式增長方法;(8)理解解強關(guān)聯(lián)規(guī)則不一定是有趣的;(9)使用提升度進(jìn)行相關(guān)分析;3.重點及難點:重點:Apriori算法及其應(yīng)用。難點:FP-growth算法。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成回歸分析相關(guān)基本概念的知識性作業(yè);(2)Apriori算法解決頻繁項挖掘;(2)要求學(xué)生完成數(shù)據(jù)關(guān)聯(lián)分析實驗;(七)分類(有監(jiān)督學(xué)習(xí))(14學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(8學(xué)時)(1)分類的基本思想;(2)典型的分類算法:決策樹規(guī)約、KNN、SVM、樸素貝葉斯;(3)模型評估與選擇;(思政融入點:將分類中常見的過度擬合現(xiàn)象,引入結(jié)合孔子在《論語先進(jìn)》中“過猶不及”的案例進(jìn)行闡述分析,任何事都要有限度,適可而止,潛移默化生活處世哲學(xué)“物極必反,盛極而衰”的道理。)(4)組合學(xué)習(xí);(5)利用Python實現(xiàn)模型的評估與選擇;實驗教學(xué)(6學(xué)時)(1)典型分類算法及其應(yīng)用。(2)模型評估與選擇。2.基本要求:(1)理解分類及預(yù)測的基本思想、概念和意義;(2)掌握常用的分類及預(yù)測算法(或模型);(3)掌握利用Python實現(xiàn)各種分類算法的方法;(4)掌握分類算法的評估與模型選擇方法;(5)掌握集成學(xué)習(xí)的思想,隨機森林實現(xiàn);3.重點及難點:重點:分類算法(決策樹、SVM、樸素貝葉斯、KNN)及其應(yīng)用。難點:模型評估與選擇。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成數(shù)據(jù)分類相關(guān)基本概念的知識性作業(yè);(2)典型分類算法實現(xiàn);(八)聚類(無監(jiān)督學(xué)習(xí))(12學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(8學(xué)時)(1)聚類分析的概念;(2)K-Means聚類;(3)層次聚類方法;(4)基于密度的方法;(5)其他聚類算法(FCM聚類,EM聚類);(6)聚類評估;(思政融入點:1.“物以類聚、人以群分”,生活中很多事物因某些內(nèi)在特征呈現(xiàn)出自動聚集特征,引入聚類分析的算法思想;2.飛行數(shù)據(jù)聚類分析,分析飛行數(shù)據(jù)之間關(guān)聯(lián)和飛行行為效能評估,樹立利用科技解決實際問題的意識。)(7)利用Python實現(xiàn)聚類算法;實驗教學(xué)(4學(xué)時)(1)典型聚類算法及其應(yīng)用。(2)聚類模型的評估。2.基本要求:(1)掌握K-Means聚類、層次聚類、基于密度的聚類和其他常用方法;(2)掌握聚類模型的評估方法;(3)掌握利用sklearn實現(xiàn)聚類的方法;3.重點及難點:重點:典型聚類算法及其性能評估。難點:EM算法。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成數(shù)據(jù)聚類相關(guān)基本概念的知識性作業(yè);(2)典型聚類算法實現(xiàn);(3)查閱資料或閱讀文獻(xiàn),完成聚類分析發(fā)展的綜述性書面作業(yè);(九)神經(jīng)網(wǎng)絡(luò)(4學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(2學(xué)時)(1)神經(jīng)網(wǎng)絡(luò)基礎(chǔ);(2)BP神經(jīng)網(wǎng)絡(luò);(3)深度學(xué)習(xí)及CNN介紹;實驗教學(xué)(2學(xué)時)(1)BP算法實現(xiàn)。(2)BP算法應(yīng)用及Sklearn實現(xiàn)。2.基本要求:(1)掌握感知機與BP神經(jīng)網(wǎng)絡(luò)的原理;(2)了解深度學(xué)習(xí)基礎(chǔ);(4)掌握利用Python實現(xiàn)BP網(wǎng)絡(luò);3.重點及難點:重點:BP神經(jīng)網(wǎng)絡(luò)。難點:BP算法實現(xiàn)。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成神經(jīng)網(wǎng)絡(luò)相關(guān)基本概念的知識性作業(yè);(2)BP算法實現(xiàn);(十)離群點檢測(4學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(2學(xué)時)(1)離群點概述;(2)離群點分類;(3)離群點檢測常用方法;(思政融入點融入點:1.使用離群點檢驗可以檢測出保險欺詐、電信詐騙、信用卡盜刷、電子商務(wù)欺詐等小概率事件,引入知名影星偷稅漏稅的案例,教育學(xué)生要具備正確的三觀,不違法亂紀(jì)、不存片幸心理,腳踏實地做人做事;2.離群點通常會被當(dāng)作噪聲而忽略,這就需要學(xué)生在數(shù)據(jù)挖掘過程中學(xué)會辯證看待問題,具體情況具體分析。)(4)sklearn中的異常值檢測方法;實驗教學(xué)(2學(xué)時)(1)典型聚類算法及其應(yīng)用。(2)聚類模型的評估。2.基本要求:(1)理解離群點的概念和類型;(2)理解離群點檢測的挑戰(zhàn);(3)理解基于統(tǒng)計學(xué)的離群點檢測方法;(4)理解基于臨近性的離群點檢測方法;(5)理解基于聚類的離群點檢測方法;(6)掌握利用Python進(jìn)行異常值檢測的方法。3.重點及難點:重點:典型離群點檢測算法及其應(yīng)用。難點:離群點的預(yù)測。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)要求學(xué)生完成數(shù)據(jù)離群點檢測相關(guān)基本概念的知識性作業(yè);(2)典型離群點檢測算法實現(xiàn);(3)查閱資料或閱讀文獻(xiàn),完成離群點檢測的綜述性書面作業(yè);(十一)時序數(shù)據(jù)與文本數(shù)據(jù)挖掘(8學(xué)時)1.教學(xué)內(nèi)容:理論教學(xué)(4學(xué)時)(1)文本數(shù)據(jù)挖掘方法;(2)時序數(shù)據(jù)挖掘方法;實驗教學(xué)(4學(xué)時)(1)時序數(shù)據(jù)分析應(yīng)用。(2)文本數(shù)據(jù)分析應(yīng)用。2.基本要求:(1)掌握文本數(shù)據(jù)挖掘內(nèi)容與時序數(shù)據(jù)挖掘方法;(2)掌握利用Python進(jìn)行綜合數(shù)據(jù)分析;3.重點及難點:重點:文本數(shù)據(jù)與時序數(shù)據(jù)分析挖掘。難點:時序數(shù)據(jù)挖掘。4.教學(xué)模式:課堂講述與討論,上機實驗5.作業(yè)及課外學(xué)習(xí)要求(1)時序數(shù)據(jù)與文本數(shù)據(jù)挖掘應(yīng)用;(3)查閱資料或閱讀文獻(xiàn),完成文本數(shù)據(jù)挖掘技術(shù)發(fā)展的綜述性書面作業(yè);四、教學(xué)安排及學(xué)時分配教學(xué)環(huán)節(jié)及學(xué)時主要內(nèi)容學(xué)時分配授課習(xí)題課實驗網(wǎng)絡(luò)其它小計第1章引言202第2章Python數(shù)據(jù)分析與可視化224第2章認(rèn)識數(shù)據(jù)224第3章數(shù)據(jù)預(yù)處理426第5章回歸分析426第6章關(guān)聯(lián)分析426第7章分類82414第8章聚類62412第9章神經(jīng)網(wǎng)絡(luò)224第10章離群點檢測224第11章時序數(shù)據(jù)與文本數(shù)據(jù)挖掘448總計4242672五、實驗部分教學(xué)內(nèi)容和要求序號實驗項目名稱實驗內(nèi)容及要求學(xué)時實驗類型演示驗證設(shè)計綜合1數(shù)據(jù)分析與可視化給定數(shù)據(jù)集進(jìn)行數(shù)據(jù)分析與可視化2√2認(rèn)識數(shù)據(jù)打開一數(shù)據(jù)集,進(jìn)行探索性分析,并進(jìn)行數(shù)據(jù)對象的相似性度量2√3數(shù)據(jù)預(yù)處理給定數(shù)據(jù)集進(jìn)行預(yù)處理2√4回歸分析回歸算法實現(xiàn)及應(yīng)用2√5關(guān)聯(lián)分析給定數(shù)據(jù)集進(jìn)行關(guān)聯(lián)分析2√√6分類分類算法實現(xiàn)及其應(yīng)用4√√7聚類聚類算法實現(xiàn)及其應(yīng)用4√√8神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)應(yīng)用2√9離群點分析給定數(shù)據(jù)集進(jìn)行離群點檢測2√10時序與文本數(shù)據(jù)時序數(shù)據(jù)分析文本數(shù)據(jù)分析4√√合計2605615比例0.0%19.2%23.1%57.7%六、課程考核與評價課程考核總評成績(滿分100)=平時成績(滿分100,占比10%)+課內(nèi)實驗成績(滿分100,占比20%)+期中考試(滿分100分,占20%)+期末考試成績(滿分100分,占比50%)1.平時考核:主要考核各單元知識點的復(fù)習(xí)、理解和掌握程度,每次課堂討論、課堂測驗、平時作業(yè)和網(wǎng)絡(luò)學(xué)習(xí)的完成情況。2.實驗考核:主要考查學(xué)生實踐動手能力和開發(fā)工具的掌握情況及每次實驗的完成情況。3.期中考試:主要考核對課程的前6章掌握情況,并起到查漏補缺和督促的作用。4.期末考試:主要考核對課程的知識點掌握程度以及運用理論知識解決實際問題的能力。七、建議教材及參考資料建議教材:[1]《Python數(shù)據(jù)挖掘與機器學(xué)習(xí)(微課視頻版)》第2版,魏偉一等編,清華大學(xué)出版社,2024.08.網(wǎng)絡(luò)資料:[1]李侃等.機器學(xué)習(xí).中國大學(xué)MOOC平臺,/course/BIT-1449601164參考資料:[1](美)韓家煒著.孟曉峰等譯.《數(shù)據(jù)挖掘:概念與技術(shù)》.機械工業(yè)出版社,2012年.[2]喻梅等編著.《數(shù)據(jù)分析與數(shù)據(jù)挖掘》.清華大學(xué)出版社,2018年.[3]毛國君編著.《數(shù)據(jù)挖掘原理與算法》.清華大學(xué)出版社,2016年.教學(xué)進(jìn)度計劃表(教學(xué)日歷)202*/202*學(xué)年第二學(xué)期采用教材:《Python數(shù)據(jù)挖掘與機器學(xué)習(xí)》,魏偉一主編,清華大學(xué)出版社參考教材:《數(shù)據(jù)挖掘概念與技術(shù)》,韓家煒,機械工業(yè)出版社名稱總時數(shù)講課實踐/實驗上機習(xí)題課程設(shè)計周學(xué)時計劃時數(shù)7254184周次課次授課內(nèi)容摘要時數(shù)目的要求11第一章數(shù)據(jù)挖掘與機器學(xué)習(xí)概述一、數(shù)據(jù)挖掘簡介二、數(shù)據(jù)分析與數(shù)據(jù)挖掘三、數(shù)據(jù)挖掘的任務(wù)四、數(shù)據(jù)挖掘的數(shù)據(jù)源2理解和掌握數(shù)據(jù)挖掘與機器學(xué)習(xí)的基本概念、數(shù)據(jù)挖掘過程、數(shù)據(jù)挖掘的主要任務(wù)以及數(shù)據(jù)挖掘使用的主要技術(shù)。2五、數(shù)據(jù)挖掘使用的主要技術(shù)六、數(shù)據(jù)挖掘的主要任務(wù)七、數(shù)據(jù)挖掘的商用工具八、利用Python進(jìn)行數(shù)據(jù)挖掘2了解數(shù)據(jù)挖掘與機器學(xué)習(xí)的應(yīng)用和面臨的問題。對數(shù)據(jù)挖掘和機器學(xué)習(xí)能夠解決的問題和解決問題思路有清晰的認(rèn)識。熟練應(yīng)用Jupyternotebook的開發(fā)環(huán)境。23第二章Python數(shù)據(jù)分析基礎(chǔ)一、Python程序概述二、Python內(nèi)建的數(shù)據(jù)結(jié)構(gòu)2理解和掌握Python基礎(chǔ)語法、內(nèi)建的數(shù)據(jù)結(jié)構(gòu)。4三、Numpy數(shù)值計算基礎(chǔ)2掌握Numpy數(shù)值計算方法,主要包括數(shù)組和矩陣運算。35四、Pandas統(tǒng)計分析基礎(chǔ)2掌握Pandas中的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)查詢與編輯、分組匯總及繪圖。6五、Matplotlib數(shù)據(jù)可視化基礎(chǔ)六、Scikit-learn基礎(chǔ)2掌握Matplotlib數(shù)據(jù)可視化繪圖基礎(chǔ),參數(shù)設(shè)置及常用繪圖。47實驗一、數(shù)據(jù)分析與可視化實訓(xùn)2利用Python進(jìn)行數(shù)據(jù)分析與可視化8第三章認(rèn)識數(shù)據(jù)數(shù)據(jù)對象與屬性類型數(shù)據(jù)的基本統(tǒng)計描述數(shù)據(jù)可視化度量數(shù)據(jù)的相似性2理解和掌握數(shù)據(jù)對象和屬性類型,數(shù)據(jù)的基本統(tǒng)計描述,掌握度量數(shù)據(jù)相似性和相異性的方法;了解數(shù)據(jù)可視化的方法。59第四章數(shù)據(jù)預(yù)處理一、數(shù)據(jù)預(yù)處理概述,Python數(shù)據(jù)預(yù)處理方法二、數(shù)據(jù)清理及Python數(shù)據(jù)清洗方法2了解數(shù)據(jù)預(yù)處理的目的和意義;掌握如何對數(shù)據(jù)進(jìn)行清理。10三、數(shù)據(jù)集成及利用Python進(jìn)行數(shù)據(jù)合并四、數(shù)據(jù)變換與離散化五、數(shù)據(jù)歸約2掌握如何對不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并;掌握如何對數(shù)據(jù)進(jìn)行變換,使之適合建模的需要;掌握如何對數(shù)據(jù)進(jìn)行消減,使得在消減后的數(shù)據(jù)集上挖掘更有效;掌握利用Python進(jìn)行數(shù)據(jù)預(yù)處理的方法。611實驗二、利用Python實現(xiàn)數(shù)據(jù)預(yù)處理(數(shù)據(jù)合并、數(shù)據(jù)清洗、數(shù)據(jù)變換)2掌握利用Python實現(xiàn)數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)變換的方法12第五章回歸分析一、回歸分析概述二、一元線性回歸分析2掌握回歸分析原理;掌握一元線性回歸分析的原理與方法。713三、多元線性回歸四、邏輯回歸五、其他回歸分析2掌握多元線性回歸分析;掌握邏輯回歸;了解其他回歸分析14實驗三、利用Python實現(xiàn)典型的回歸分析2掌握利用Python實現(xiàn)典型的回歸分析方法815第六章關(guān)聯(lián)規(guī)則挖掘一、關(guān)聯(lián)規(guī)則分析概述二、頻繁項集挖掘方法2了解頻繁項集、閉項集和關(guān)聯(lián)規(guī)則的概念,理解模式評估方法,掌握Apriori算法16三、頻繁模式樹算法四、關(guān)聯(lián)規(guī)則評估方法2掌握FP挖掘算法;利用Python實現(xiàn)關(guān)聯(lián)規(guī)則分析;了解其它方法的內(nèi)容、了解關(guān)聯(lián)規(guī)則挖掘的研究動態(tài)。917實驗四、Python實現(xiàn)數(shù)據(jù)的關(guān)聯(lián)規(guī)則分析2掌握利用Python實現(xiàn)數(shù)據(jù)的關(guān)聯(lián)規(guī)則分析18第七章分類一、分類概述二、決策樹規(guī)約及其Python實現(xiàn)2了解分類及預(yù)測的基本思想、概念和意義;掌握決策樹規(guī)約算法。1019三、K近鄰算法四、支持向量機算法及其實現(xiàn)2掌握KNN算法原理與實現(xiàn);了解SVM算法及其實現(xiàn)。20五、貝葉斯分類六、模型評估與選擇2熟悉掌握貝葉斯分類算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年電動機殼體項目投資價值分析報告
- 2024至2030年女拉鏈棉服項目投資價值分析報告
- 2024至2030年中國動物肥料數(shù)據(jù)監(jiān)測研究報告
- 2024年銀稅一體化系統(tǒng)軟件項目可行性研究報告
- 年度印染涂料競爭策略分析報告
- 河北省定興中學(xué)2025屆高一物理第一學(xué)期期中經(jīng)典試題含解析
- 遼寧省沈陽二中、撫順二中2025屆高二物理第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 2025屆湖北省黃岡市麻城實驗高中物理高一第一學(xué)期期末復(fù)習(xí)檢測試題含解析
- 2025屆廣西玉林高中高一物理第一學(xué)期期末調(diào)研試題含解析
- 2025屆洛陽市重點中學(xué)物理高三上期末監(jiān)測模擬試題含解析
- 土木工程專業(yè)職業(yè)生涯規(guī)劃(PPT)
- 犬神經(jīng)障礙性疾病的針灸診療
- 福建廈門廉租房申請條件一覽2022(條件+程序+材料)
- (完整PPT)干眼的診治課件
- 一對一談心談話記錄3篇精選
- 男女有別親密有間
- 抽水蓄能機組抽水工況的啟動(1)SFC 83
- 心臟瓣膜置換術(shù)后抗凝護(hù)理學(xué)習(xí)教案
- 腦梗塞臨床路徑
- 蘇教版數(shù)學(xué) 五年級上冊 教材分析
- 機讀答題卡模板 英語
評論
0/150
提交評論