![《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第1頁](http://file4.renrendoc.com/view7/M01/2D/20/wKhkGWcDXrOABxgQAAJ9RwAoZDg048.jpg)
![《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第2頁](http://file4.renrendoc.com/view7/M01/2D/20/wKhkGWcDXrOABxgQAAJ9RwAoZDg0482.jpg)
![《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第3頁](http://file4.renrendoc.com/view7/M01/2D/20/wKhkGWcDXrOABxgQAAJ9RwAoZDg0483.jpg)
![《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第4頁](http://file4.renrendoc.com/view7/M01/2D/20/wKhkGWcDXrOABxgQAAJ9RwAoZDg0484.jpg)
![《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱_第5頁](http://file4.renrendoc.com/view7/M01/2D/20/wKhkGWcDXrOABxgQAAJ9RwAoZDg0485.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
《數(shù)據(jù)挖掘技術(shù)》教學(xué)大綱適用范圍:202X版本科人才培養(yǎng)方案課程代碼:08140201課程性質(zhì):專業(yè)必修課學(xué)分:4學(xué)分學(xué)時:64學(xué)時(理論48學(xué)時,實驗16學(xué)時)先修課程:高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計后續(xù)課程:人工智能適用專業(yè):數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)開課單位:計算機科學(xué)與技術(shù)學(xué)院一、課程說明《數(shù)據(jù)挖掘技術(shù)》課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的一門專業(yè)必修課。本課程的主要任務(wù)是讓學(xué)生掌握數(shù)據(jù)挖掘基本概念與算法,針對實際工作與應(yīng)用中產(chǎn)生的大數(shù)據(jù),用數(shù)據(jù)挖掘技術(shù)來發(fā)現(xiàn)數(shù)據(jù)中隱藏的知識或規(guī)律,從而為生產(chǎn)、生活、商務(wù)活動、社會活動等提供決策支持。要求學(xué)生通過本課程的學(xué)習(xí),認(rèn)識數(shù)據(jù)倉庫和數(shù)據(jù)挖掘在當(dāng)今大數(shù)據(jù)時代中的重要作用,了解數(shù)據(jù)倉庫的基本原理和實現(xiàn)方法,掌握數(shù)據(jù)預(yù)處理技術(shù)和數(shù)據(jù)挖掘常用算法(包括關(guān)聯(lián)分析、分類與預(yù)測、聚類分析、回歸分析、數(shù)據(jù)摘要等),為解決實際問題打下堅實的知識基礎(chǔ)。二、課程目標(biāo)通過本課程的學(xué)習(xí),使學(xué)生達(dá)到如下目標(biāo):課程目標(biāo)1:能夠應(yīng)用數(shù)學(xué)、自然科學(xué)和工程科學(xué)的基本原理,進行抽象分析與識別、建模表達(dá),并通過文獻(xiàn)研究分析數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題,以獲得有效結(jié)論。課程目標(biāo)2:培養(yǎng)團隊合作的能力,追求思維碰撞;學(xué)會主動思考、思辨;培養(yǎng)自主學(xué)習(xí)的能力。小組合作完成設(shè)計開發(fā)解決方案,系統(tǒng)模塊化完成大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理、建模、分析、可視化等階段。課程目標(biāo)3:通過引入課程思政,讓學(xué)生明白工匠精神和精益求精的重要性。具備大數(shù)據(jù)思維,從數(shù)據(jù)挖掘與統(tǒng)計分析的角度分析未來的發(fā)展趨勢,主動適應(yīng)社會發(fā)展,成為國之重器,做對社會對國家有用之人。三、課程目標(biāo)與畢業(yè)要求《數(shù)據(jù)挖掘技術(shù)》課程教學(xué)目標(biāo)對數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)畢業(yè)要求的支撐見表1。表1課程教學(xué)目標(biāo)與畢業(yè)要求關(guān)系畢業(yè)要求指標(biāo)點課程目標(biāo)支撐強度2.問題分析2.2能夠認(rèn)識到復(fù)雜工程問題有多種相互關(guān)聯(lián)和制約的因素,并通過分析文獻(xiàn)尋求最佳解決方法。課程目標(biāo)1:能夠應(yīng)用數(shù)學(xué)、自然科學(xué)和工程科學(xué)的基本原理,進行抽象分析與識別、建模表達(dá),并通過文獻(xiàn)研究分析數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題,以獲得有效結(jié)論。H3.設(shè)計/開發(fā)解決方案3.1能夠針對大數(shù)據(jù)應(yīng)用系統(tǒng)設(shè)計與開發(fā)滿足特定需求的模塊或算法。課程目標(biāo)2:培養(yǎng)團隊合作的能力,追求思維碰撞;學(xué)會主動思考、思辨;培養(yǎng)自主學(xué)習(xí)的能力。小組合作完成設(shè)計開發(fā)解決方案,系統(tǒng)模塊化完成大數(shù)據(jù)分析的數(shù)據(jù)預(yù)處理、建模、分析、可視化等階段。H5.使用現(xiàn)代工具5.2能夠選擇與使用恰當(dāng)?shù)募夹g(shù)、資源、現(xiàn)代工程工具和信息技術(shù)工具,對數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題進行預(yù)測與模擬。課程目標(biāo)1:能夠應(yīng)用數(shù)學(xué)、自然科學(xué)和工程科學(xué)的基本原理,進行抽象分析與識別、建模表達(dá),并通過文獻(xiàn)研究分析數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域復(fù)雜工程問題,以獲得有效結(jié)論。課程目標(biāo)3:通過引入課程思政,讓學(xué)生明白工匠精神和精益求精的重要性。具備大數(shù)據(jù)思維,從數(shù)據(jù)挖掘與統(tǒng)計分析的角度分析未來的發(fā)展趨勢,主動適應(yīng)社會發(fā)展,成為國之重器,做對社會對國家有用之人。H注:表中“H(高)、M(中)”表示課程與相關(guān)畢業(yè)要求的關(guān)聯(lián)度。四、教學(xué)內(nèi)容、基本要求與學(xué)時分配1.理論部分理論部分的教學(xué)內(nèi)容、基本要求與學(xué)時分配見表2。表2教學(xué)內(nèi)容、基本要求與學(xué)時分配教學(xué)內(nèi)容教學(xué)要求,教學(xué)重點難點理論學(xué)時實驗學(xué)時對應(yīng)的課程目標(biāo)1.?dāng)?shù)據(jù)挖掘簡介1.1數(shù)據(jù)分析與數(shù)據(jù)挖掘1.2數(shù)據(jù)挖掘的主要任務(wù)1.3關(guān)聯(lián)分析1.4數(shù)據(jù)源1.5數(shù)據(jù)挖掘技術(shù)1.6數(shù)據(jù)挖掘的工具教學(xué)要求:使學(xué)生理解和掌握數(shù)據(jù)挖掘與機器學(xué)習(xí)的基本概念、數(shù)據(jù)挖掘過程、數(shù)據(jù)挖掘的主要任務(wù)以及數(shù)據(jù)挖掘使用的主要技術(shù)。了解數(shù)據(jù)挖掘與機器學(xué)習(xí)的應(yīng)用和面臨的問題。對數(shù)據(jù)挖掘和機器學(xué)習(xí)能夠解決的問題和解決問題思路有清晰的認(rèn)識。熟練應(yīng)用Jupyternotebook的開發(fā)環(huán)境。重點:熟悉數(shù)據(jù)挖掘技術(shù)及其開源開發(fā)工具。難點:Pyhton數(shù)據(jù)挖掘工具庫的配置。21、2、32.Python數(shù)據(jù)分析與挖掘基礎(chǔ)2.1Python程序概述2.2Pyhton內(nèi)建的數(shù)據(jù)結(jié)構(gòu)2.3Numpy數(shù)值計算基礎(chǔ)2.4Pandas數(shù)據(jù)分析基礎(chǔ)2.5Matplotlib數(shù)據(jù)可視化基礎(chǔ)2.6Scikit-learn基礎(chǔ)教學(xué)要求:使學(xué)生理解和掌握Python基礎(chǔ)語法、內(nèi)建的數(shù)據(jù)結(jié)構(gòu)、Numpy數(shù)值運算基礎(chǔ)、Pandas統(tǒng)計分析基礎(chǔ)。掌握Matplotlib圖表繪制基礎(chǔ)等數(shù)據(jù)分析和可視化方法。重點:Python基礎(chǔ)語法、內(nèi)建的數(shù)據(jù)結(jié)構(gòu)、Numpy數(shù)值運算基礎(chǔ)、Pandas統(tǒng)計分析基礎(chǔ)。難點:Matplotlib圖表繪制基礎(chǔ)等數(shù)據(jù)分析和可視化方法。61、2、33.認(rèn)識數(shù)據(jù)3.1數(shù)據(jù)對象與屬性類型3.2數(shù)據(jù)的基本統(tǒng)計描述3.3數(shù)據(jù)可視化3.4度量數(shù)據(jù)的相似性和相異性教學(xué)要求:使學(xué)生了解數(shù)據(jù)的屬性類型,理解數(shù)據(jù)的基本統(tǒng)計描述,掌握度量數(shù)據(jù)相似性和相異性的方法。重點:理解和掌握數(shù)據(jù)對象和屬性類型,數(shù)據(jù)的基本統(tǒng)計描述,掌握度量數(shù)據(jù)相似性和相異性的方法。難點:了解數(shù)據(jù)可視化的方法。41、2、34.數(shù)據(jù)預(yù)處理4.1數(shù)據(jù)預(yù)處理概念4.2數(shù)據(jù)清洗4.3數(shù)據(jù)集成4.4數(shù)據(jù)變化與離散化4.5數(shù)據(jù)歸約教學(xué)要求:使學(xué)生理解數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換于數(shù)據(jù)離散化的方法,掌握數(shù)據(jù)預(yù)處理的基本方法。重點:數(shù)據(jù)預(yù)處理的目的和意義,如何對數(shù)據(jù)進行清理,如何對不同數(shù)據(jù)源的數(shù)據(jù)進行合并,如何對數(shù)據(jù)進行變換,使之適合建模的需要。難點:如何對數(shù)據(jù)進行消減,使得在消減后的數(shù)據(jù)集上挖掘更有效。利用Python進行數(shù)據(jù)預(yù)處理的方法。441、2、35.回歸分析5.1回歸的概念;5.2一元線性回歸;5.3多元線性回歸;5.4邏輯回歸。教學(xué)要求:使學(xué)生了解掌握回歸的定義,各類回歸的原理及Python實現(xiàn)。重點:回歸分析的原理。難點:元線性回歸,邏輯回歸。41、2、36.關(guān)聯(lián)規(guī)則挖掘6.1關(guān)聯(lián)規(guī)則分析概述6.2頻繁項集挖掘方法6.3關(guān)聯(lián)規(guī)則評估方法教學(xué)要求:使學(xué)生了解頻繁項集、閉項集和關(guān)聯(lián)規(guī)則的概念,理解模式評估方法,掌握Apriori算法和挖掘頻繁項集的模式增長方法。重點:關(guān)聯(lián)規(guī)則的基本思想、概念和意義關(guān)聯(lián)規(guī)則挖掘的應(yīng)用背景;掌握常用的關(guān)聯(lián)規(guī)則算法。難點:利用Python實現(xiàn)關(guān)聯(lián)規(guī)則分析。441、2、37.分類7.1基本概念7.2決策樹歸約7.3K近鄰算法7.4支持向量機7.5貝葉斯分類7.6模型評估與選擇7.7組合分類教學(xué)要求:使學(xué)生了解分類的概念,理解評估分類器性能的度量方法,掌握決策樹分類算法、SVM、貝葉斯分類算法、模型評估與選擇、組合分類及利用Python實現(xiàn)分類的方法。重點:常用的分類及預(yù)測算法。難點:利用Python實現(xiàn)各種分類算法的方法。1041、2、38.聚類8.1聚類的概念8.2K-Means算法8.3層次聚類8.4基于密度的方法8.5聚類評估教學(xué)要求:了解聚類的概念,掌握k-Means和k-Medoids算法、層次方法和基于密度的方法等典型算法及其Python的實現(xiàn)方法。重點:掌握K-Means聚類、層次聚類、基于密度的聚類和其他常用方法。難點:掌握利用sklearn實現(xiàn)聚類的方法。841、2、39.神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)9.1基本原理9.2BP神經(jīng)網(wǎng)絡(luò)9.3深度學(xué)習(xí)教學(xué)要求:掌握神經(jīng)網(wǎng)絡(luò)基本原理;了解深度神經(jīng)網(wǎng)絡(luò)。重點:神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的原理。難點:深度學(xué)習(xí)。21、2、310.離群點檢測9.1基本概述9.2離群點檢測9.3異常值檢測方法教學(xué)要求:了解離群點的概念、類型以及離群點檢測的常用方法,掌握sklearn中的異常值檢測方法。重點:離群點的概念與檢測方法。難點:sklearn中的異常值檢測方法。41、2、3合計48162.實驗部分實驗部分的教學(xué)內(nèi)容、基本要求與學(xué)時分配見表3。表3實驗項目、實驗內(nèi)容與學(xué)時實驗項目實驗內(nèi)容和要求實驗學(xué)時對應(yīng)的課程目標(biāo)1.數(shù)據(jù)分析與可視化實驗內(nèi)容:利用Python進行數(shù)據(jù)分析與可視化。實驗要求:熟悉數(shù)據(jù)挖掘開發(fā)環(huán)境Anaconda和Jupyter,利用Python進行數(shù)據(jù)預(yù)處理,清洗,合并,變換,基本分析和可視化。41、2、32.關(guān)聯(lián)規(guī)則與回歸分析實驗內(nèi)容:對數(shù)據(jù)文進行關(guān)聯(lián)規(guī)則分析與回歸分析。實驗要求:利用Python環(huán)境對數(shù)據(jù)進行關(guān)聯(lián)規(guī)則分析,多元線性回歸和邏輯回歸分析。41、2、33.數(shù)據(jù)的分類分析實驗內(nèi)容:對數(shù)據(jù)進行分類分析和算法應(yīng)用。實驗要求:用不同的算法實現(xiàn)給定數(shù)據(jù)集的分類分析,利用Python處理分類分析的常用方法。41、2、34.數(shù)據(jù)的聚類分析實驗內(nèi)容:對數(shù)據(jù)進行聚類分析和算法應(yīng)用。實驗要求:用不同的算法實現(xiàn)給定數(shù)據(jù)集的聚類分析,利用Python處理聚類分析的常用方法。41、2、3合計16五、教學(xué)方法及手段本課程以課堂講授為主,采用啟發(fā)式、討論式教學(xué)和案例教學(xué)等,促進學(xué)生積極思考,開發(fā)學(xué)生的潛能,培養(yǎng)學(xué)生思考問題、分析問題和解決問題的能力;以“少而精”為原則,精選教學(xué)內(nèi)容,精講多練;安排習(xí)題課,鞏固課堂所學(xué)知識;結(jié)合學(xué)習(xí)通超星平臺,中國大學(xué)慕課網(wǎng),嗶哩嗶哩視頻網(wǎng)站等視頻資源提供靈活的自主的學(xué)習(xí)方式。六、課程資源1.推薦教材(1)魏偉一.Python數(shù)據(jù)挖掘與機器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2021.(2)韓家煒.數(shù)據(jù)挖掘:概念與技術(shù)(第三版)[M].北京:機械工業(yè)出版社,2012.(3)王國胤等.大數(shù)據(jù)挖掘及應(yīng)用(第2版)[M].北京:清華大學(xué)出版社,2021.2.參考書(1)周志華.機器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.(2)StevenBird,EwanKlein,EdwardLoper.NaturalLanguageProcessingwithPython[M].
Sevastopol:O'REILLY,
2009.(3)陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程(第3版)[M].北京:機械工業(yè)出版社,2021.3.期刊(1)牛佳惠.數(shù)據(jù)挖掘在人力資源信息化管理中的運用探析[J].數(shù)字通信世界,2022,(03):94-96.(2)陳新.論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的理論與方法[J].電腦知識與技術(shù),2021,17(33):20-21,31.(3)冀江瑀,陳秀波.上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法[J].計算機仿真,2022,39(06):386-390.(4)Sohail,M.N.,etal."Whyonlydatamining?Apilotstudyoninadequacyanddominationofdataminingtechnology."
Int.J.RecentSci.Res
9.10(2018):29066-29073.(5)Chhabra,VIIII.,andGunmalaSuri."DataScienceandKnowledgeDiscoverythroughDataMiningParadigms."
JournalofMechanicsofContinuaandMathematicalSciences
14.2(2019):167-173.4.網(wǎng)絡(luò)資源(1)ChristopherClifton.datamining[J/OL].Britannica,2019./technology/data-mining(2)王大寶的CD.數(shù)據(jù)挖掘(一)你真的了解什么是數(shù)據(jù)挖掘和數(shù)據(jù)本身嗎?[R/OL].CSDN文庫,2017./sinat_22594309/article/details/74923643.(3)術(shù)墻穿:喜茶廣州地區(qū)門店評價數(shù)據(jù)可視化與文本挖掘[R/OL].飛漿官網(wǎng),(2022-074-01)..七、課程考核對課程目標(biāo)的支撐課程成績由過程性考核成績和期末考核成績兩部分構(gòu)成,具體考核/評價細(xì)則及對課程目標(biāo)的支撐關(guān)系見表4。表4課程考核對課程目標(biāo)的支撐考核環(huán)節(jié)占比考核/評價細(xì)則課程目標(biāo)123過程性考核課堂表現(xiàn)15(1)根據(jù)課堂出勤情況和課堂回答問題情況進行考核,滿分100分。(2)以平時考核成績乘以其在總評成績中所占的比例計入課程總評成績。√√√555實驗20(1)根據(jù)每個實驗的實驗操作完成情況和實驗報告質(zhì)量單獨評分,滿分100分;(2)每次實驗單獨評分,取各次實驗成績的平均值作為此環(huán)節(jié)的最終成績。(3)以實驗成績乘以其在總評成績中所占的比例計入課程總評成績?!獭獭?105作業(yè)15(1)主要考核學(xué)生對各章節(jié)知識點的復(fù)習(xí)、理解和掌握程度,滿分100分;(2)每次作業(yè)單獨評分,取各次成績的平均值作為此環(huán)節(jié)的最終成績。(3)以作業(yè)成績乘以其在總評成績中所占的比例計入課程總評成績。√√√555期末考核50(1)卷面成績100分,以卷面成績乘以其在總評成績中所占的比例計入課程總評成績。(2)主要考核方式為機試??己藘?nèi)容為數(shù)據(jù)挖掘核心算法應(yīng)用。(3)考試題型為:數(shù)據(jù)分析程序設(shè)計等?!獭?525合計:100分402040八、考核與成績評定1.考核方式及成績評定考核方式:本課程主要以課堂表現(xiàn)、實驗、作業(yè)、期末機試等方式對學(xué)生進行考核評價??己嘶疽螅嚎己丝偝煽冇善谀C試成績和過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023八年級數(shù)學(xué)上冊 第13章 全等三角形13.2三角形全等的判定 4角邊角說課稿 (新版)華東師大版
- 2024年四年級品社下冊《怎樣到達(dá)目的地》說課稿2 蘇教版
- 2025鋼質(zhì)門小型鋼結(jié)構(gòu)制作及安裝合同
- 2025個人電路出租合同書
- 2025公司經(jīng)理勞動合同
- 道路邊坡加固維修施工方案
- 交通圍欄銷售合同范本
- 農(nóng)業(yè)營銷合作合同范本
- 保溫鋼結(jié)構(gòu)合同范本
- Sara's Medicine(說課稿)-2023-2024學(xué)年麗聲北極星分級繪本四年級上(江蘇版)
- 全過程造價咨詢服務(wù)的質(zhì)量、進度、保密等保證措施
- 縣城屠宰場建設(shè)可行性研究報告
- 25學(xué)年六年級數(shù)學(xué)寒假作業(yè)《每日一練》
- 2025高考數(shù)學(xué)一輪復(fù)習(xí)-第8章-第3節(jié) 圓的方程【課件】
- 人文關(guān)懷在護理工作中的體現(xiàn)
- 2025年1月八省聯(lián)考高考綜合改革適應(yīng)性測試-高三生物(陜西、山西、寧夏、青海卷) 含解析
- 環(huán)保行業(yè)深度研究報告
- 開工第一課安全培訓(xùn)內(nèi)容
- 社會主義核心價值觀課件
- 《公路養(yǎng)護安全培訓(xùn)》課件
- 公益捐助活動影響力評估方法
評論
0/150
提交評論