Python數(shù)據(jù)分析與數(shù)據(jù)挖掘 教學大綱_第1頁
Python數(shù)據(jù)分析與數(shù)據(jù)挖掘 教學大綱_第2頁
Python數(shù)據(jù)分析與數(shù)據(jù)挖掘 教學大綱_第3頁
Python數(shù)據(jù)分析與數(shù)據(jù)挖掘 教學大綱_第4頁
Python數(shù)據(jù)分析與數(shù)據(jù)挖掘 教學大綱_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

《Python數(shù)據(jù)分析與數(shù)據(jù)挖掘》教學大綱課程基本信息課程中文名稱:Python數(shù)據(jù)分析與數(shù)據(jù)挖掘課程英文名稱:PythonDataAnalysisandDataMining課程類別:專業(yè)必修適用專業(yè):大數(shù)據(jù)管理與應用、數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)、人工智能及計算機相關專業(yè)先修課程:計算機導論、數(shù)據(jù)結(jié)構(gòu)、面向?qū)ο蟪绦蛟O計建議開課學期:第4學期建議學時:64學時(其中理論32學時,實驗32學時)建議學分:2.0學分課程性質(zhì)、目標及任務《Python數(shù)據(jù)分析與數(shù)據(jù)挖掘》是大數(shù)據(jù)管理與應用等專業(yè)的一門必修課程,也是計算機科學與技術(shù)、軟件工程、人工智能等相關專業(yè)的選修課程。本課程的先修課為《計算機導論》、《數(shù)據(jù)結(jié)構(gòu)》、《面向?qū)ο蟪绦蛟O計》等,后續(xù)課程為《大數(shù)據(jù)可視化》、《深度學習》等。本課程以學生掌握數(shù)據(jù)分析與挖掘的相關概念和理論為知識培養(yǎng)目標,以學生熟練使用Python開展數(shù)據(jù)分析與挖掘的實踐應用為能力培養(yǎng)目標,以學生初步形成“數(shù)據(jù)思維”為素質(zhì)培養(yǎng)目標。課程按照Python基礎知識、數(shù)據(jù)分析相關包、數(shù)據(jù)挖掘理論與算法的應用、綜合案例的學習路徑,全面系統(tǒng)的介紹了運用Python進行數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本概念與方法。課程第一部分主要講解Python基礎語法知識,包括Python數(shù)據(jù)結(jié)構(gòu)、函數(shù)和面向?qū)ο蟮戎R,為學習者掌握后續(xù)內(nèi)容打下良好的編程基礎;第二部分主要講解Python中數(shù)據(jù)分析相關包,包括使用NumPy和Pandas進行數(shù)據(jù)的統(tǒng)計分析、分組與聚合、交叉分析,以及使用Matplotlib進行數(shù)據(jù)可視化等;第三部分講解數(shù)據(jù)挖掘的理論與算法應用,包括數(shù)據(jù)挖掘的相關概念、常用算法原理和實踐應用;第四部分為綜合案例,通過精選案例詳細介紹了數(shù)據(jù)分析與挖掘的步驟和方法,進一步提高學生的綜合實踐能力。本課程采用理論與實踐應用相結(jié)合的教學方式,循序漸進的培養(yǎng)學生數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)挖掘的能力,每個知識點均設計了典型性的綜合案例,引導學生在掌握理論知識的基礎上快速開展編程實踐,為將來從事數(shù)據(jù)科學相關領域的工作打下堅實的基礎。教學方法1.建議采用線上線下混合式教學。可基于學習通等平臺,完善教學大綱、教學課件、教學難點的講解視頻、教學案例、實踐練習、算法原理視頻、習題、習題解答等課程資源,打造數(shù)字資源豐富的課程學習平臺。2.采用理論結(jié)合實踐的教學方式。理論教學以教師課堂講授為主,可結(jié)合程序演示、課堂練習、提問、案例討論等多種形式,加強互動,促進學生對知識點的理解。實驗教學采用教師布置實驗任務,學生自主上機練習,教師現(xiàn)場指導并答疑的形式,提高學生的實踐應用能力。實驗教學中,教師還可啟發(fā)學生自己思考并設計實驗內(nèi)容,以培養(yǎng)學生自主學習和解決問題的能力。3.案例式教學。每個重要知識點以及每章小結(jié)前,均設計了豐富的典型性案例,課程基礎知識的教學完成后,還有多個基于較復雜數(shù)據(jù)的綜合案例。通過案例式教學,可實現(xiàn)知識的綜合運用,幫助學生更好理解理論知識并跟隨操作,快速開展編程實踐。課程學時分配序號教學內(nèi)容理論學時實驗學時1第1章Python概述112第2章Python基礎語法443第3章函數(shù)224第4章類與對象225第5章NumPy基礎與應用226第6章Pandas基礎與應用447第7章Matplotlib基礎及應用228第8章分類449第9章聚類4410第10章回歸4411第11章實戰(zhàn)案例--電商消費者數(shù)據(jù)分析1112第12章實戰(zhàn)案例--乳腺癌數(shù)據(jù)分析與預測1113第13章實戰(zhàn)案例--鉆石數(shù)據(jù)分析與預測11總計=SUM(ABOVE)3232教學內(nèi)容及學時安排理論教學序號章節(jié)名稱主要內(nèi)容教學目標學時1第1章Python概述了解Python的優(yōu)點和特性;掌握Python開發(fā)環(huán)境的安裝與配置;掌握Python第三方包的獲取和安裝方法;掌握編輯和運行Python程序的方法;熟悉Python的運行原理;掌握Python的編寫規(guī)范。掌握Python開發(fā)環(huán)境的安裝與配置;Python的運行原理和編程規(guī)范。12第2章Python基礎語法了解Python中的標識符與變量;掌握Python中數(shù)據(jù)的輸入與輸出;掌握Python中常用的數(shù)據(jù)結(jié)構(gòu);掌握Python中的運算符與表達式;掌握Python的流程控制。掌握Python中常用的數(shù)據(jù)輸入和輸出方法;掌握Python中序列類型和映射類型的特點及應用;掌握Python中的流程控制語句。43第3章函數(shù)理解Python中的函數(shù)、模塊和包;掌握Python中函數(shù)定義的方法;理解Python中參數(shù)的傳遞;掌握Python中函數(shù)參數(shù)的設置;掌握Python中的匿名函數(shù)和遞歸函數(shù)。掌握Python中函數(shù)的定義方法;理解Python中函數(shù)參數(shù)的傳遞方法;掌握Python中函數(shù)參數(shù)的設置。24第4章類與對象掌握Python中類的定義與使用;掌握Python中類的屬性與方法;理解繼承;理解運算符重載。掌握Python中類的定義與使用方法;掌握Python中類的屬性與方法。25第5章NumPy基礎與應用掌握NumPy數(shù)組的創(chuàng)建方法;掌握NumPy數(shù)組的基本屬性;掌握NumPy數(shù)組的相關操作;掌握NumPy數(shù)組的讀寫。掌握NumPy數(shù)組的創(chuàng)建和使用方法;掌握NumPy數(shù)組的統(tǒng)計、形狀、運算等操作。26第6章Pandas基礎與應用理解Series和DataFrame數(shù)據(jù)結(jié)構(gòu);掌握DataFrame中數(shù)據(jù)的選??;掌握Pandas中的數(shù)據(jù)合并;掌握Pandas中的數(shù)據(jù)算術(shù)運算和比較運算;掌握Pandas中數(shù)據(jù)的統(tǒng)計分析;掌握Pandas中的透視表與交叉表。理解Pandas中主要的數(shù)據(jù)結(jié)構(gòu);掌握Pandas中數(shù)據(jù)的基本操作方法;掌握使用Pandas對數(shù)據(jù)進行運算與分析。47第7章Matplotlib基礎及應用理解Matplotlib中圖形(Figure)的構(gòu)成;掌握子圖的多種設置方法;掌握Pyplot中常用圖形的繪制方法;Matplotlib與Numpy和Pandas的綜合應用。理解Matplotlib中圖形(Figure)的構(gòu)成;掌握子圖的多種設置方法;掌握Pyplot中常用圖形的繪制方法。28第8章分類理解分類的基本概念;了解常用的分類算法;掌握分類算法常用的評價指標;理解決策樹的算法原理;掌握sklearn中決策樹的應用;理解樸素貝葉斯分類器的原理;掌握sklearn中樸素貝葉斯分類器的應用;理解支持向量機的原理;掌握sklearn中支持向量機的應用;理解梯度提升決策樹的原理;掌握sklearn中梯度提升決策樹的應用。掌握常用分類算法的原理;掌握Python中常用分類算法的應用。49第9章聚類理解聚類的基本概念;了解常用的聚類算法;理解聚類的評估;理解基于劃分聚類的原理;掌握sklearn中K-Means的應用;理解基于層次分析聚類的原理;掌握sklearn中Birch的應用;理解基于密度聚類的原理;掌握sklearn中DBSCAN的應用。掌握常用聚類算法的原理;掌握Python中常用聚類算法的應用。410第10章回歸理解回歸的基本概念;了解常用的回歸算法;理解回歸分析的步驟;掌握回歸模型的評價指標;理解線性回歸的原理;掌握一元線性回歸的應用;掌握多元線性回歸的應用;理解邏輯回歸的原理; 掌握邏輯回歸的應用; 掌握多項式回歸的應用;掌握嶺回歸的應用; 掌握Lasso回歸的應用。掌握常用回歸算法的原理;掌握Python中常用回歸算法的應用。411第11章實戰(zhàn)案例-電商消費者數(shù)據(jù)分析了解電商消費者數(shù)據(jù)分析背景和數(shù)據(jù)集;理解電商消費者數(shù)據(jù)分析的步驟與流程;掌握電商消費者數(shù)據(jù)加載和預處理;掌握電商消費者數(shù)據(jù)的探索性分析;掌握電商消費者數(shù)據(jù)的可視化分析。掌握探索整體數(shù)據(jù)分布和不同屬性之間關系的方法;掌握空值、異常值檢測等數(shù)據(jù)預處理方法;掌握用分組、聚合及可視化等對訂單、顧客及產(chǎn)品情況進行分析的方法;掌握按時間對銷售數(shù)據(jù)進行分析的方法;理解探索性分析與可視化分析的結(jié)果。112第12章實戰(zhàn)案例--乳腺癌數(shù)據(jù)分析與預測了解乳腺癌數(shù)據(jù)分析與預測案例背景和數(shù)據(jù)集;理解乳腺癌數(shù)據(jù)分析與預測的步驟與流程;掌握乳腺癌數(shù)據(jù)的探索性分析;掌握乳腺癌數(shù)據(jù)的相關性分析;掌握乳腺癌數(shù)據(jù)的可視化分析;掌握邏輯回歸、決策樹、SVM等多種分類預測模型的運用;熟悉分類預測模型評價的指標;探討提升預測準確率的策略。掌握數(shù)據(jù)分布情況的可視化分析;掌握數(shù)據(jù)相關性分析的方法;掌握多種常用分類預測模型的應用;熟悉分類預測模型評價的指標;掌握數(shù)據(jù)規(guī)范化、特征選擇、超參數(shù)優(yōu)化等提升模型預測準確率的方法。113第13章實戰(zhàn)案例—鉆石數(shù)據(jù)分析與預測了解鉆石數(shù)據(jù)分析與預測案例背景和數(shù)據(jù)集;理解鉆石數(shù)據(jù)分析與預測的步驟與流程;掌握鉆石數(shù)據(jù)加載和預處理方法;分別掌握對數(shù)據(jù)類別特征和數(shù)值特征的分析方法;掌握數(shù)據(jù)的相關性分析;掌握使用管道機制(pipeline)進行數(shù)據(jù)預處理和預測。掌握缺失值進行處理、異常值識別與處理、類別特征編碼等數(shù)據(jù)預處理方法;分別掌握對數(shù)據(jù)類別特征和數(shù)值特征的分析方法;掌握使用管道機制(pipeline)對數(shù)據(jù)的預處理和預測等步驟進行封裝和管理。1學時合計32實驗教學序號實驗項目名稱實驗要求學時1第1章Python概述Python開發(fā)環(huán)境的搭建;熟悉Anaconda開發(fā)環(huán)境;進行包管理的方法。12第2章Python基礎語法練習Python中數(shù)據(jù)輸入和輸出的多種方法;使用列表、字典、集合等Python中的數(shù)據(jù)結(jié)構(gòu)。練習Python中的循環(huán)等流程控制。43第3章函數(shù)練習Python中函數(shù)定義的方法;練習Python中參數(shù)的傳遞;練習Python中函數(shù)參數(shù)的設置方法;練習Python中的匿名函數(shù)。24第4章類與對象練習Python中類定義與使用;練習Python中類屬性與方法的使用。25第5章NumPy基礎與應用練習Numpy數(shù)組的創(chuàng)建;練習Numpy數(shù)組的索引和切片、轉(zhuǎn)置與降維等;使用Numpy數(shù)組進行統(tǒng)計分析、四則運算等;練習Numpy數(shù)組的讀寫。26第6章Pandas基礎與應用使用Pandas進行數(shù)據(jù)的導入和導出、選取和編輯;練習Pandas中數(shù)據(jù)的合并;練習Pandas中的數(shù)據(jù)算術(shù)運算和比較運算;練習Pandas中數(shù)據(jù)的分組與聚合;練習Pandas中的數(shù)據(jù)透視表與交叉表。47第7章Matplotlib基礎及應用練習Pyplot中常用圖形的繪制;練習子圖的多種設置方法;練習Matplotlib與Numpy和Pandas的綜合應用。28第8章分類練習使用決策樹進行分類分析;練習使用樸素貝葉斯進行分類分析。練習使用支持向量機進行分類分析;練習使用梯度提升決策樹進行分類分析;練習常用分類算法的綜合應用。49第9章聚類練習使用K-Means進行聚類分析;練習使用Birch進行聚類分析;練習使用DBSCAN進行聚類分析;練習常用聚類算法的綜合應用。410第10章回歸練習使用一元線性回歸模型;練習使用多元線性回歸模型;練習使用邏輯回歸模型;練習使用多項式回歸模型; 練習使用嶺回歸模型;練習使用Lasso回歸模型。411實戰(zhàn)案例-電商消費者數(shù)據(jù)分析數(shù)據(jù)加載;數(shù)據(jù)信息初步分析;數(shù)據(jù)預處理;各國訂單情況的探索性分析;客戶情況的探索性分析;產(chǎn)品情況的探索性分析;按時間的銷售數(shù)據(jù)分析。112實戰(zhàn)案例--乳腺癌數(shù)據(jù)分析與預測數(shù)據(jù)加載和預處理; 探索性數(shù)據(jù)分析; 診斷結(jié)果列分布分析;數(shù)據(jù)分布的可視化分析;相關性分析;使用LogisticRegression模型預測;使用決策樹模型預測;使用SVM模型預測;評價分類模型;提升預測準確率的策略探索。113實戰(zhàn)案例—鉆石數(shù)據(jù)分析與預測數(shù)據(jù)加載;數(shù)據(jù)信息初步分析;數(shù)據(jù)預處理;鉆石數(shù)據(jù)中類別特征分析;鉆石數(shù)據(jù)中數(shù)值特征分析;相關性分析;多種回歸模型預測及對比分析;分類模型評價。1學時合計32考核方式加強過程性考核,課程考核成績可采用如下比例:課程成績構(gòu)成=平時作業(yè)(20%)+課堂參與(10%)+期末考核(70%),期末考試建議采用開卷上機考試形式,注重學生實踐能力和解決實際問題能力的考核。試題內(nèi)容可包括:Python基本語法、數(shù)據(jù)描述性統(tǒng)計分析、數(shù)據(jù)可視化、數(shù)據(jù)預處理、數(shù)據(jù)分類分析、數(shù)據(jù)聚類分析、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論