版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主講人:陳清華邏輯回歸分類(lèi)任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類(lèi)分析會(huì)使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用邏輯回歸算法實(shí)現(xiàn)分類(lèi)分析;會(huì)使用LogisticRegression()對(duì)性別進(jìn)行分類(lèi)分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問(wèn)題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用邏輯回歸實(shí)現(xiàn)性別分類(lèi)hw.csv教學(xué)難點(diǎn)任務(wù)工單項(xiàng)目中使用的hw.csv文件中的數(shù)據(jù),包含了性別、年齡、身高、體重等數(shù)據(jù)項(xiàng)。性別項(xiàng)的值為字符類(lèi)型,其中F代表女,M代表男。為了分析數(shù)據(jù),我們需要將兩者分別映射為1和0,再進(jìn)行邏輯回歸分類(lèi)。任務(wù)概述
任務(wù)描述:從本地文件(hw.csv)中獲取數(shù)據(jù)并邏輯回歸分類(lèi)分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果
任務(wù)要求任務(wù)概述(1)性別與人的哪些生理特征是密切相關(guān)的?(2)男和女的映射值會(huì)不會(huì)對(duì)訓(xùn)練結(jié)果造成影響?(3)邏輯回歸的原理是什么?主要應(yīng)用在哪些方面?(4)sklearn中是如何實(shí)現(xiàn)邏輯回歸算法的?寫(xiě)出關(guān)鍵函數(shù)與實(shí)現(xiàn)步驟。(5)模型的輸入與輸出分別是什么?”
問(wèn)題引導(dǎo):任務(wù)概述
任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分
模型訓(xùn)練2分模型初始化正確得1分,模型訓(xùn)練順利執(zhí)行得1分
模型預(yù)測(cè)2分模型能應(yīng)用得1分,模型預(yù)測(cè)結(jié)果可展現(xiàn)得1分
2.效果評(píng)估模型可視化并評(píng)估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分
3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分
合計(jì)10分
任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類(lèi)型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對(duì)性別進(jìn)行數(shù)值化處理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任務(wù)解決方案三、數(shù)據(jù)可視化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,
cmap=plt.cm.Paired)plt.title('性別判定(實(shí)際值)')plt.xlabel('身高/厘米')plt.ylabel('體重/千克')plt.show()任務(wù)解決方案四、模型訓(xùn)練fromsklearnimportlinear_model#初始化回歸模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#擬合classifier.fit(X,Y.values.ravel())#給出預(yù)測(cè)結(jié)果output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn)plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',
linewidths=1,cmap=plt.cm.Paired)plt.title('性別判定(線(xiàn)性分類(lèi)器,預(yù)測(cè)值)')plt.xlabel('身高')plt.ylabel('體重')plt.show()任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn):進(jìn)階x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州城市職業(yè)學(xué)院《機(jī)械設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 貴陽(yáng)職業(yè)技術(shù)學(xué)院《數(shù)據(jù)科學(xué)導(dǎo)論》2023-2024學(xué)年第一學(xué)期期末試卷
- 油橄欖示范基地建設(shè)項(xiàng)目可行性研究報(bào)告-油橄欖市場(chǎng)需求持續(xù)擴(kuò)大
- 貴陽(yáng)人文科技學(xué)院《樂(lè)理視唱一》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣州中醫(yī)藥大學(xué)《智慧城市信息系統(tǒng)建設(shè)與實(shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025山西省建筑安全員-A證考試題庫(kù)及答案
- 2025河南省建筑安全員B證(項(xiàng)目經(jīng)理)考試題庫(kù)
- 2025河南省安全員B證考試題庫(kù)附答案
- 2025福建建筑安全員B證考試題庫(kù)附答案
- 2025上海市安全員A證考試題庫(kù)
- 滯銷(xiāo)風(fēng)險(xiǎn)管理制度內(nèi)容
- 關(guān)于物業(yè)服務(wù)意識(shí)的培訓(xùn)
- JJF 2184-2025電子計(jì)價(jià)秤型式評(píng)價(jià)大綱(試行)
- 排污許可證辦理合同1(2025年)
- GB/T 44890-2024行政許可工作規(guī)范
- 上??颇恳豢荚囶}庫(kù)參考資料1500題-上海市地方題庫(kù)-0
- 【7地XJ期末】安徽省宣城市寧國(guó)市2023-2024學(xué)年七年級(jí)上學(xué)期期末考試地理試題(含解析)
- 設(shè)備操作、保養(yǎng)和維修規(guī)定(4篇)
- (完整版)四年級(jí)上冊(cè)數(shù)學(xué)豎式計(jì)算題100題直接打印版
- 玻璃瓶罐的缺陷產(chǎn)生原因及解決方法63699
- 高層住宅(23-33層)造價(jià)估算指標(biāo)
評(píng)論
0/150
提交評(píng)論