Python與機器學(xué)習(xí)(第2版)(微課版) 課件 項目04 性別與肥胖程度分類分析_第1頁
Python與機器學(xué)習(xí)(第2版)(微課版) 課件 項目04 性別與肥胖程度分類分析_第2頁
Python與機器學(xué)習(xí)(第2版)(微課版) 課件 項目04 性別與肥胖程度分類分析_第3頁
Python與機器學(xué)習(xí)(第2版)(微課版) 課件 項目04 性別與肥胖程度分類分析_第4頁
Python與機器學(xué)習(xí)(第2版)(微課版) 課件 項目04 性別與肥胖程度分類分析_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

項目背景|項目概述|學(xué)習(xí)目標(biāo)|任務(wù)實施步驟性別

分類分析【數(shù)據(jù)挖掘應(yīng)用】01101111011010111101010000101101010100111101背景先導(dǎo)項目概述項目學(xué)習(xí)目標(biāo)任務(wù)實施步驟01Background02BriefIntroduction03LearningObjectives04ImplementationSteps主要內(nèi)容性

別一個囊括了生物、社會、心理等學(xué)科的綜合概念生理性別:性別指基于人類的男性、女性等,動物的雌、雄、雌雄同體等生物特征的解剖學(xué)上的身體差異社會性別:基于女性氣質(zhì)、男性氣質(zhì),或者非二元氣質(zhì)的性別角色劃分性別認(rèn)知0110111101101011110101111001001001011010101001001111010010110010111011010110100111101性別平等如何看待性別不平等、性別刻板印象和偏見帶來的負(fù)面影響以及如何建立基于性別平等的關(guān)系性別的社會屬性社會性別主要是指自身所在的生存環(huán)境對其性別的認(rèn)定,包括家人、朋友、周圍群體、社會機構(gòu)和法律機關(guān)的認(rèn)定等,是生物基本的社會屬性之一,主要體現(xiàn)在性別角色上,是一種文化構(gòu)成物,不僅因時間而異,而且因民族地域而異,是一種特定的社會構(gòu)成。性別不平等現(xiàn)象十分復(fù)雜,是滲透在社會文化生活的方方面面?!吨腥A人民共和國憲法》(2018修正)、《中華人民共和國民法典》(2020)、《中華人民共和國全國人民代表大會及地方各級人民代表大會選舉法》(2015修正)、《中華人民共和國婦女權(quán)益保障法》(2018修正)等都明確認(rèn)可了性別平等,禁止性別歧視。中國18-44歲男性平均身高為169.7厘米,體重為69.6公斤。男性

中國18-44歲女性平均身高為158厘米,體重為59公斤。女性中國性別數(shù)據(jù)性別上的生理差異項目總體要求

性別分類分析

本項目將基于“hw.csv”文件中的年齡、身高、體重和性別等數(shù)據(jù)做性別判定應(yīng)用,并進一步完成肥胖程度分析。項目三維目標(biāo)掌握機器學(xué)習(xí)、監(jiān)督學(xué)習(xí)、分類的基本概念;

(阿里云大數(shù)據(jù)分析與應(yīng)用中級5.1.1、5.1.2)掌握邏輯回歸、樸素貝葉斯、決策樹、支持向量機等分類分析方法及相關(guān)參數(shù)的意義;

(大數(shù)據(jù)技術(shù)工程人員國家職業(yè)標(biāo)準(zhǔn)高級6.2.2)進一步掌握數(shù)據(jù)分析與挖掘的流程,加深對模型建立與分析過程的理解;進一步掌握數(shù)據(jù)分析與挖掘常用包的使用;掌握模型評估報告的生成方法并理解各具體指標(biāo)的含義。知識目標(biāo)能力目標(biāo)素質(zhì)目標(biāo)證崗項目三維目標(biāo)會使用sklearn中的算法LogisticRegression、GaussianNB、DecisionTreeClassifier、SVC等實現(xiàn)分類分析;

(阿里云大數(shù)據(jù)分析與應(yīng)用中級5.3.2)會調(diào)整分類模型的參數(shù)實現(xiàn)分類效果的優(yōu)化;

(大數(shù)據(jù)技術(shù)工程人員國家職業(yè)標(biāo)準(zhǔn)初級6.3.3)會使用散點圖、折線圖展現(xiàn)不同因素間的關(guān)系。知識目標(biāo)能力目標(biāo)素質(zhì)目標(biāo)崗證011011110110101111010111100100001011010101001111101項目三維目標(biāo)尊重兩性差異,結(jié)合“三觀”教育促進學(xué)生自由、全面和諧發(fā)展;幫助兩性建立性別自信和完善人格,提供更寬廣的社會角色發(fā)展方向和職業(yè)規(guī)劃;引入行業(yè)名人事跡,通過榜樣力量激發(fā)科技報國之心。能力目標(biāo)素質(zhì)目標(biāo)知識目標(biāo)011011110110101111010111100100001011010101001111101性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評估與應(yīng)用明確目標(biāo)基于采集的年齡、身高、體重和性別等數(shù)據(jù)做性別判定應(yīng)用,并進一步完成肥胖程度分析。數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評估與應(yīng)用明確目標(biāo)從本地文件hw.csv中讀取身高、體重等原始數(shù)據(jù)。性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評估與應(yīng)用明確目標(biāo)1.標(biāo)簽映射:性別項F代表女,M代表男。為了分析數(shù)據(jù),需將兩者分別映射為1和0性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評估與應(yīng)用明確目標(biāo)使用邏輯回歸實現(xiàn)性別分類使用樸素貝葉斯實現(xiàn)性別分類使用決策樹實現(xiàn)性別分類使用支持向量機實現(xiàn)性別分類使用支持向量機實現(xiàn)肥胖分類性別分類分析任務(wù)流程數(shù)據(jù)獲取數(shù)據(jù)解析分類分析模型評估與應(yīng)用明確目標(biāo)圖形化展示各模型的分類結(jié)果

評估不同算法的優(yōu)劣模型應(yīng)用性別分類分析任務(wù)流程還在等什么?馬上動手實施性別分類分析項目吧~1.生理性別與社會性別2.經(jīng)典的機器學(xué)習(xí)分類算法3.性別分類流程小結(jié)邏輯回歸分類任務(wù)實施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析會使用sklearn第三方包實現(xiàn)機器學(xué)習(xí)算法應(yīng)用;會應(yīng)用邏輯回歸算法實現(xiàn)分類分析;會使用LogisticRegression()對性別進行分類分析與預(yù)測應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問題任務(wù)評價標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用邏輯回歸實現(xiàn)性別分類hw.csv教學(xué)難點任務(wù)工單項目中使用的hw.csv文件中的數(shù)據(jù),包含了性別、年齡、身高、體重等數(shù)據(jù)項。性別項的值為字符類型,其中F代表女,M代表男。為了分析數(shù)據(jù),我們需要將兩者分別映射為1和0,再進行邏輯回歸分類。任務(wù)概述

任務(wù)描述:從本地文件(hw.csv)中獲取數(shù)據(jù)并邏輯回歸分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果

任務(wù)要求任務(wù)概述(1)性別與人的哪些生理特征是密切相關(guān)的?(2)男和女的映射值會不會對訓(xùn)練結(jié)果造成影響?(3)邏輯回歸的原理是什么?主要應(yīng)用在哪些方面?(4)sklearn中是如何實現(xiàn)邏輯回歸算法的?寫出關(guān)鍵函數(shù)與實現(xiàn)步驟。(5)模型的輸入與輸出分別是什么?”

問題引導(dǎo):任務(wù)概述

任務(wù)評價:任務(wù)概述評價內(nèi)容評價要點分值分?jǐn)?shù)評定自我評價1.任務(wù)實施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分

模型訓(xùn)練2分模型初始化正確得1分,模型訓(xùn)練順利執(zhí)行得1分

模型預(yù)測2分模型能應(yīng)用得1分,模型預(yù)測結(jié)果可展現(xiàn)得1分

2.效果評估模型可視化并評估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點要點得1分

合計10分

任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對性別進行數(shù)值化處理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任務(wù)解決方案三、數(shù)據(jù)可視化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(

df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,

cmap=plt.cm.Paired)plt.title('性別判定(實際值)')plt.xlabel('身高/厘米')plt.ylabel('體重/千克')plt.show()任務(wù)解決方案四、模型訓(xùn)練fromsklearnimportlinear_model#初始化回歸模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#擬合classifier.fit(X,Y.values.ravel())#給出預(yù)測結(jié)果output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn)plt.figure()plt.scatter(

df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',

linewidths=1,cmap=plt.cm.Paired)plt.title('性別判定(線性分類器,預(yù)測值)')plt.xlabel('身高')plt.ylabel('體重')plt.show()任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn):進階x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,cmap=plt.cm.Paired)小結(jié)1.如何使用sklearn第三方包實現(xiàn)分類分析?2.

如何調(diào)用LogisticRegression()實現(xiàn)性別分類分析?3.

如何對模型分類結(jié)果進行可視化?不急后續(xù)會有詳細說明與講解哦~樸素貝葉斯分類分析任務(wù)實施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析熟練使用sklearn第三方包實現(xiàn)機器學(xué)習(xí)算法應(yīng)用;會應(yīng)用樸素貝葉斯算法實現(xiàn)分類分析;會使用MultinomialNB()對性別進行分類分析與預(yù)測應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問題任務(wù)評價標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用樸素貝葉斯實現(xiàn)性別分類hw.csv教學(xué)難點任務(wù)工單樸素貝葉斯基于條件概率的思想,用來做分類決策?,F(xiàn)可基于前續(xù)任務(wù)(邏輯回歸)得到數(shù)據(jù),使用樸素貝葉斯實現(xiàn)性別判定,并區(qū)分兩個算法的異同。任務(wù)概述

任務(wù)描述:基于身高、體重數(shù)據(jù)使用樸素貝葉斯實現(xiàn)分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果

任務(wù)要求任務(wù)概述(1)樸素貝葉斯可以用來做性別判定嗎?試結(jié)合該應(yīng)用說明其中的原理。(2)樸素貝葉斯在sklearn中是如何實現(xiàn)的?具體有哪些實現(xiàn)的類?(3)試比較不同樸素貝葉斯實現(xiàn)的異同?說明GaussianNB()的適用范圍。(4)假設(shè)我們所使用的身高和體重數(shù)據(jù)是不精確的,范圍小、刻度大?用哪種方法更合適?(5)如何比較兩種不同分類模型的優(yōu)劣?”

問題引導(dǎo):任務(wù)概述

任務(wù)評價:任務(wù)概述評價內(nèi)容評價要點分值分?jǐn)?shù)評定自我評價1.任務(wù)實施模型初始化3分包導(dǎo)入正確得1分,模型選用正確得1分,模型構(gòu)建正確得1分

模型訓(xùn)練1分模型訓(xùn)練順利執(zhí)行得1分

模型預(yù)測1分歷史數(shù)據(jù)及預(yù)測結(jié)果展現(xiàn)得1分

2.效果評估模型可視化并評估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實施情況總結(jié)結(jié)論2分總結(jié)內(nèi)容切中本任務(wù)的重點要點得1分,能有效比較方法異同得1分

合計10分

任務(wù)解決方案核心部分代碼:方案(1)fromsklearn.naive_bayesimportGaussianNB#建立樸素貝葉斯模型classifier=GaussianNB()#擬合classifier.fit(X,Y.values.ravel())#給出待預(yù)測的一個特征output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案核心部分代碼:方案(2)fromsklearn.naive_bayesimportMultinomialNB#建立模型

classifier=MultinomialNB()

#擬合

classifier.fit(X,Y.values.ravel())

#給出待預(yù)測的一個特征

output=classifier.predict(X)

output=output.reshape(len(output),1)小結(jié)1.如何使用sklearn第三方包實現(xiàn)分類分析?2.

如何調(diào)用GaussianNB()實現(xiàn)性別分類分析?3.

如何對模型分類結(jié)果進行可視化?不急后續(xù)會有詳細說明與講解哦~決策樹分類分析任務(wù)實施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析熟練使用sklearn第三方包實現(xiàn)機器學(xué)習(xí)算法應(yīng)用;會應(yīng)用決策樹算法實現(xiàn)分類分析;會使用DecisionTreeClassifier()對性別進行分類分析與預(yù)測應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問題任務(wù)評價標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用決策樹實現(xiàn)性別分類hw.csv教學(xué)難點任務(wù)工單決策樹能夠從一系列有特征有標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖的結(jié)構(gòu)來呈現(xiàn)這些規(guī)則,以解決分類和回歸問題?,F(xiàn)基于前續(xù)任務(wù)得到數(shù)據(jù),使用決策樹算法實現(xiàn)性別判定,并區(qū)分三個算法的異同。任務(wù)概述

任務(wù)描述:基于身高、體重數(shù)據(jù)使用決策樹實現(xiàn)分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv及前續(xù)結(jié)果顯示結(jié)果

任務(wù)要求任務(wù)概述(1)決策樹如何用來做性別判定?結(jié)合其中原理,試畫一種簡單的決策樹結(jié)構(gòu)。(2)決策樹在sklearn中是如何實現(xiàn)分類的?與決策樹有關(guān)的模塊有哪些?(3)試比較不同決策樹實現(xiàn)方法的異同?說明DecisionTreeClassifier的適用范圍。(4)DecisionTreeRegressor有何用處?可以解決什么問題?(5)比較決策樹分類算法與前述兩種不同分類方法的優(yōu)劣,其優(yōu)勢體現(xiàn)在哪里?”

問題引導(dǎo):任務(wù)概述

任務(wù)評價:任務(wù)概述評價內(nèi)容評價要點分值分?jǐn)?shù)評定自我評價1.任務(wù)實施模型初始化3分導(dǎo)入正確得1分,模型選用正確得1分,模型構(gòu)建正確得1分

模型訓(xùn)練2分?jǐn)?shù)據(jù)有切分訓(xùn)練得1分模型訓(xùn)練順利執(zhí)行得1分

模型可視化1分模型可視化實現(xiàn)得1分

2.效果評估模型評估報告展現(xiàn)3分會得出模型評估報告得1分,能準(zhǔn)確解釋各個指標(biāo)的含義得1分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點要點得1分,能有效比較三種方法的異同得1分

合計10分

任務(wù)解決方案核心部分代碼:模型訓(xùn)練

fromsklearn.treeimportDecisionTreeClassifier#建立決策樹模型classifier=DecisionTreeClassifier()#數(shù)據(jù)訓(xùn)練classifier.fit(X,Y.values.ravel())任務(wù)解決方案核心部分代碼:模型評估fromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportclassification_report#切分?jǐn)?shù)據(jù)集x_train,x_test,y_train,y_test=train_test_split(X,Y,train_size=0.7,test_size=0.3)classifier=DecisionTreeClassifier()classifier.fit(x_train,y_train.values.ravel())y_predict=classifier.predict(x_test)print(classification_report(y_predict,y_test))小結(jié)1.如何使用sklearn第三方包實現(xiàn)分類分析?2.

如何調(diào)用DecisionTreeClassifier()實現(xiàn)性別分類分析?3.

如何對不同模型分類結(jié)果進行評估?不急后續(xù)會有詳細說明與講解哦~支持向量機分類分析任務(wù)實施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析熟練使用sklearn第三方包實現(xiàn)機器學(xué)習(xí)算法應(yīng)用;會應(yīng)用支持向量機算法實現(xiàn)分類分析;會使用SVC()對性別進行分類分析與預(yù)測應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問題任務(wù)評價標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用支持向量機實現(xiàn)性別分類hw.csv教學(xué)難點任務(wù)工單支持向量機是一類按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進行二元分類的廣義線性分類器,其決策邊界是對學(xué)習(xí)樣本求解的最大邊距超平面?,F(xiàn)基于任務(wù)前續(xù)任務(wù)得到數(shù)據(jù)及分類結(jié)果,使用支持向量機算法實現(xiàn)性別判定,并區(qū)分四個算法的異同。任務(wù)概述

任務(wù)描述:基于身高、體重數(shù)據(jù)使用支持向量機實現(xiàn)分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv及前續(xù)結(jié)果顯示結(jié)果

任務(wù)要求任務(wù)概述(1)支持向量機如何用來做性別判定?結(jié)合應(yīng)用,說明其中的原理。(2)支持向量機在sklearn中是如何實現(xiàn)分類的?與支持向量機有關(guān)的模塊有哪些?(3)試比較不同支持向量機實現(xiàn)方法的異同?說明SVC與SVR的不同。(4)SVR有何用處?可以解決什么問題?(5)比較支持向量機分類算法與前述三種不同分類方法的優(yōu)劣,其優(yōu)勢體現(xiàn)在哪里?”

問題引導(dǎo):任務(wù)概述

任務(wù)評價:任務(wù)概述評價內(nèi)容評價要點分值分?jǐn)?shù)評定自我評價1.任務(wù)實施模型初始化4分導(dǎo)入正確得1分,模型選用正確得1分,模型構(gòu)建正確得1分,模型參數(shù)會修改得1分

模型訓(xùn)練1分模型型訓(xùn)練順利執(zhí)行得1分

模型可視化1分模型可視化實現(xiàn)得1分

2.效果評估模型評估報告展現(xiàn)2分能準(zhǔn)確解釋各個指標(biāo)的含義得1分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實施情況總結(jié)結(jié)論2分總結(jié)內(nèi)容切中本任務(wù)的重點要點得1分,能有效比較四種方法的異同得1分

合計10分

任務(wù)解決方案核心部分代碼:模型訓(xùn)練

fromsklearn.svmimportSVC#建立支持向量機線性分類器模型params={'kernel':'linear'}classifier=SVC(**params)#擬合X=df[['Height','Weight']]Y=df[['Gender']]classifier.fit(X,Y)任務(wù)解決方案核心部分代碼:模型評估#評估報告fromsklearn.metricsimportclassification_reportprint("\n"+"#"*30)print("\nClassifierperformanceontrainingdataset\n")print(classification_report(Y,classifier.predict(X)))print("#"*30+"\n")小結(jié)1.如何使用sklearn第三方包實現(xiàn)分類分析?2.

如何調(diào)用SVC()實現(xiàn)性別分類分析?3.

如何對不同分類模型進行評估?不急后續(xù)會有詳細說明與講解哦~支持向量機多分類分析任務(wù)實施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析>>肥胖程度分類分析熟練使用sklearn第三方包實現(xiàn)機器學(xué)習(xí)算法應(yīng)用;會使用支持向量機算法實現(xiàn)多分類分析;會使用SVC()對肥胖程度進行分類分析與預(yù)測應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問題任務(wù)評價標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用支持向量機肥胖分類分析教學(xué)難點肥胖不僅影響身材,還對身體健康有害,易誘發(fā)高血壓、高血脂、糖尿病、代謝綜合征及心腦血管等疾病。肥胖主要和身高、體重數(shù)據(jù)有關(guān)?,F(xiàn)基于hw3.csv中的數(shù)據(jù),使用支持向量機算法實現(xiàn)肥胖程度的判定。任務(wù)概述

任務(wù)描述:基于身高與體重等數(shù)據(jù),使用支持向量機對不同人的肥胖程度進行分類(4類)。010010011001101010100100110110100101110101000100001011011101001010101101010011010010hw3.csv任務(wù)工單數(shù)據(jù)源hw3.csv顯示結(jié)果

任務(wù)要求任務(wù)概述(1)支持向量機如何用來做多分類應(yīng)用?結(jié)合應(yīng)用,說明其中的原理。(2)支持向量機在sklearn中是如何實現(xiàn)線性不可分的應(yīng)用?(3)試比較不同核函數(shù)的用途?多項式核函數(shù)主要應(yīng)用在什么情況?(4)本應(yīng)用問題中,用哪一種核函數(shù)得到更多的準(zhǔn)確率?(5)樣本數(shù)據(jù)量對算法有何影響?本應(yīng)用中的樣本數(shù)據(jù)存在什么樣的問題?”

問題引導(dǎo):任務(wù)概述

任務(wù)評價:任務(wù)概述評價內(nèi)容評價要點分值分?jǐn)?shù)評定自我評價1.任務(wù)實施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分

模型訓(xùn)練3分?jǐn)?shù)據(jù)集有切分得1分,模型核函數(shù)有設(shè)置得1分,模型訓(xùn)練順利執(zhí)行得1分

模型預(yù)測1分模型可應(yīng)用于預(yù)測得1分

2.效果評估模型可視化并評估效果3分能正確展現(xiàn)模型得1分,展示模型評估報告得1分,模型準(zhǔn)確率90%以上得1分

3.任務(wù)總結(jié)依據(jù)任務(wù)實施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點要點得1分

合計10分

任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw3.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對肥胖程度的判定結(jié)果進行數(shù)值化處理le=preprocessing.LabelEncoder()df['Class_2']=le.fit_transform(df['Class'])df.head()任務(wù)解決方案三、數(shù)據(jù)集切分與模型訓(xùn)練X=df[['Height','Weight']]Y=df[['Class_2']]x_train,x_test,y_train,y_test=train_test_split(X,Y,train_size=0.7,test_size=0.3)#建立支持向量機分類器模型params={'kernel':'linear'}classifier=SVC(**params)classifier.fit(x_train,y_train.values.ravel())任務(wù)解決方案四、模型評估#評估報告fromsklearn.metricsimportclassification_reportprint(classification_report(y_test,classifier.predict(x_test)))任務(wù)解決方案五、參數(shù)調(diào)整與優(yōu)化#

采用多項式核函數(shù)params={'kernel':'poly','degree':3}classifier=SVC(**params)classifier.fit(x_train,y_train.values.ravel())小結(jié)1.如何使用sklearn第三方包實現(xiàn)分類分析?2.

如何調(diào)用SVC()實現(xiàn)肥胖程度分類分析?3.

如何設(shè)置核函數(shù)并對不同模型分類結(jié)果進行評估?不急后續(xù)會有詳細說明與講解哦~項目背景|項目概述|學(xué)習(xí)目標(biāo)|任務(wù)實施步驟拓展實訓(xùn)利用身高、體重、性別數(shù)據(jù)實現(xiàn)肥胖判定【數(shù)據(jù)挖掘應(yīng)用】01101111011010111101010000101101010100111101

熟練使用read_csv()從本地CSV文件讀取數(shù)據(jù);

熟練使用Sklearn的preprocessing對數(shù)據(jù)進行預(yù)處理;

熟練使用Sklearn分類算法對數(shù)據(jù)進行分類分析與預(yù)測;技能學(xué)習(xí)目標(biāo)熟練使用Matplotlib工具包展現(xiàn)分類分析結(jié)果。項目總體要求原始數(shù)據(jù)肥胖分類分析一、數(shù)據(jù)獲取#coding:utf-8importpandasaspddf=pd.read_csv('hws31.csv',delimiter=',')df.head()二、數(shù)據(jù)預(yù)處理歸一化處理數(shù)值化處理數(shù)據(jù)集切分三、模型訓(xùn)練邏輯回歸樸素貝葉斯決策樹支持向量機四、模型評估#模型評估報告

fromsklearn.metricsimportclassification_report

print(clas

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論