下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章分門(mén)別類(lèi):幫你分而治之課后習(xí)題答案一、考考你.關(guān)于正負(fù)樣本的說(shuō)法正確是D。A.樣本數(shù)量多的那一類(lèi)是正樣本 B.樣本數(shù)量少的那一類(lèi)是負(fù)樣本C.正負(fù)樣本沒(méi)有明確的定義 D.想要正確識(shí)別的那一類(lèi)為正樣本.分類(lèi)器實(shí)質(zhì)為一個(gè)A,把樣本的特征集X映射到一個(gè)預(yù)先定義的類(lèi)標(biāo)號(hào)y。A.模式 B.函數(shù) C.映射 D.轉(zhuǎn)換.用計(jì)算概率來(lái)解決分類(lèi)問(wèn)題是哪種分類(lèi)器C。A.決策樹(shù) B.最近鄰C.貝葉斯D.支持向量機(jī).識(shí)別手寫(xiě)數(shù)字過(guò)程中,對(duì)圖片進(jìn)行灰度化處理的主要原因是C。從方便轉(zhuǎn)為文本格式 B.盡可能保存全部圖片信息C.較少計(jì)算量,同時(shí)盡可能保存圖片信息 D.有利于提高分類(lèi)效果.SVM的最優(yōu)分界面是由A決定的。A.支持向量 B.所有樣本 C.多數(shù)樣本 D少數(shù)樣本二、亮一亮.最近鄰分類(lèi)器與支持向量機(jī)各自分類(lèi)的基本思想是什么?參考答案:最近鄰分類(lèi)器的基本思想:找到與待分類(lèi)的樣本最相似的k個(gè)鄰居,這k個(gè)鄰居中多數(shù)鄰居屬于哪一類(lèi),那么就指定該樣本屬于哪一類(lèi)。即我們把每個(gè)具有n個(gè)特征的樣本看作n維空間的一個(gè)點(diǎn),對(duì)于給定的新樣本,先計(jì)算該點(diǎn)與其它樣本點(diǎn)的距離(相似度),然后將新樣本指派為周?chē)鷎個(gè)最近鄰的多數(shù)類(lèi)。該分類(lèi)思想源于這樣的常識(shí):判別一個(gè)人是好人還是壞人,可以從跟他走得最近的k個(gè)人來(lái)判斷,如果k個(gè)人中多數(shù)是好人,那么可以指派他為好人,否則他是壞人。支持向量機(jī)分類(lèi)器的基本思想:通過(guò)非線性映射,把無(wú)法在低維樣本空間分類(lèi)的問(wèn)題映射到一個(gè)高維的特征空間,在高維空間通過(guò)一個(gè)線性超平面而非低維空間的直線將樣本完全劃分開(kāi)。.在案例1的手寫(xiě)數(shù)字識(shí)別過(guò)程中,個(gè)別樣本出現(xiàn)錯(cuò)分的現(xiàn)象,主要原因是什么?參考答案:個(gè)別樣本出現(xiàn)錯(cuò)分主要原因有:(1)因訓(xùn)練樣本數(shù)據(jù)規(guī)模不夠造成分類(lèi)模型學(xué)習(xí)不夠,導(dǎo)致不能有效應(yīng)對(duì)各種樣本的分類(lèi);(2)樣本質(zhì)量不高時(shí)也會(huì)影響模型識(shí)別的正確率。三、幫幫我1.嘗試改用SVM方法來(lái)識(shí)別手寫(xiě)數(shù)字,建議核函數(shù)使用rbf,其它模型參數(shù)自己設(shè)定,對(duì)比SVM模型的識(shí)別效果與案例1的差異,并分析原因。參考答案:數(shù)字圖片信息轉(zhuǎn)存為txt文件importosfromPILimportImageimportnumpyasnpimportpandasaspdimportsklearn.model_selectionasms定義圖片到文本的轉(zhuǎn)換函數(shù)defimgtotext(imgfile,txtfile,size=(32,32)):版mgfile待識(shí)別圖像,txtfile將圖像轉(zhuǎn)換為txt文件輸出,size圖像大小,默認(rèn)32*32image_file=Image.open(imgfile)image_file=image_file.resize(size,Image.LANCZOS)image_file=image_file.convert('L')width,height=image_file.sizef=open(txtfile,'w')ascii_char='10'foriinrange(height):pix_char='';forjinrange(width):pixel=image_file.getpixel((j,i))pix_char+=ascii_char[int(pixel/128)]pix_char+='\n'f.write(pix_char)f.close()將圖片轉(zhuǎn)換成文本信息imgtotext(r'data\3.jpg',r'data\3_0.txt')#定義函數(shù),將文本數(shù)據(jù)轉(zhuǎn)換成數(shù)字形式的數(shù)組deftxt2array(filename):X=np.zeros((1,1024))f=open(filename)foriinrange(32):lineStr=f.readline()forjinrange(32):X[0,32*i+j]=int(lineStr[j])returnX將文件夾下所的文件轉(zhuǎn)換成數(shù)組和對(duì)應(yīng)的標(biāo)簽defconvert2dataset(file_path):list_file=os.listdir(file_path)m=len(list_file)datas=np.zeros((m,1024))labels=[]foriinrange(m):num=int(list_file[i][0])labels.append(num)datas[i,:]=txt2array(file_path+'\\'+list_file[i])returndatas,labels生成訓(xùn)練樣本集和測(cè)試樣本集x_train,y_train=convert2dataset(r'data\trainingDigits')x_test,y_test=convert2dataset(r'data\testDigits')構(gòu)建并訓(xùn)練SVM模型importsklearn.svmassvmmodle=svm.SVC(C=1,kernel='rbf')modle.fit(x_train,y_train)print(modle.score(x_train,y_train))運(yùn)行結(jié)果:0.9946293691330403測(cè)試模型效果importsklearn.metricsassmy_pred=modle.predict(x_test)print(sm.classification_report(y_test,y_pred))運(yùn)行結(jié)果:precisionrecal1fl-scoresupportO0.99LDO0.998710.980.990.9θ9720.990.980.9θ9230.990,站0.973540.990.980.9911450.99LDO1.OD10860.990.990.998770.991.DO0.9996θ0.980,980.9091g0.970.980.9789accuracy0.99946macroavg0.980.980.9θ946weightedavg0.990,990.99946從以上結(jié)果可知,基于SVm的分類(lèi)器預(yù)測(cè),平均精確率為99%,優(yōu)于案例1的knn分類(lèi)器,原因是對(duì)于數(shù)字這種轉(zhuǎn)為文本后特征值較多的分類(lèi)場(chǎng)景,svm相對(duì)有優(yōu)勢(shì)。2.嘗試使用KNN方法輔助診斷乳腺癌,注意調(diào)整合適的K值,比較該方法與案例2方法在診斷效果上誰(shuí)優(yōu)誰(shuí)劣,并分析原因。參考答案:#homwork-02#準(zhǔn)備訓(xùn)練集和測(cè)試集importnumpyaSnpimportpandaSaSpdimportSklearn.model_SelectionaSmSdataS=pd.read_cSV(r'data\wiSc_bc_data.cSV',Sep=',')x=dataS.iloc[:,2:32]y=dataS.iloc[:,1:2]x_train,x_teSt,y_train,y_teSt=mS.train_teSt_Split(x,y,teSt_Size=0.2,random_State=42)y_train=y_train.ValueS.raVel()y_teSt=y_teSt.ValueS.raVel()構(gòu)建和訓(xùn)練模型importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.neighborsimportKNeighborsClassifierimportpandasaspd構(gòu)建knn模型knn=KNeighborsClassifier(n_neighbors=43,weights='distance',p=2)訓(xùn)練KNN模型knn.fit(x_train,y_train)knn.score(x_train,y_train)評(píng)估模型效果fromsklearn.metricsimportclassification_reporty_pred=knn.predict(x_test)print(classification_report(y_test,y_pred))運(yùn)行效果:prec1si?nrecallfl-≡coresupportB0,9Ξ1.OO0.9671帆1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2合肥2024年煙囪拆除工程售后服務(wù)合同
- 2024量子通信系統(tǒng)建設(shè)與服務(wù)合同
- 2024電子商務(wù)支付與安全概述
- 專(zhuān)業(yè)保安服務(wù)協(xié)議模板2024年適用版B版
- 標(biāo)準(zhǔn)合同某餐飲企業(yè)與某冷藏設(shè)備供應(yīng)商之間的采購(gòu)合同(04版)
- 三方合作型企業(yè)2024年度投資運(yùn)營(yíng)協(xié)議一
- 2024木地板采購(gòu)合同范本
- 2024網(wǎng)絡(luò)安全公司與政府機(jī)構(gòu)之間的技術(shù)服務(wù)合同
- 2024年:公寓買(mǎi)賣(mài)合同樣本
- 2024年網(wǎng)絡(luò)安全防護(hù)系統(tǒng)搭建合同
- 浙江省杭州市八縣區(qū)2024-2025學(xué)年高二數(shù)學(xué)上學(xué)期期末學(xué)業(yè)水平測(cè)試試題
- 超星爾雅學(xué)習(xí)通《孫子兵法與執(zhí)政藝術(shù)(浙江大學(xué))》2024章節(jié)測(cè)試含答案
- 分布式光伏高處作業(yè)專(zhuān)項(xiàng)施工方案
- 6x37 FC鋼絲繩破斷拉力
- 軸承(1)(公開(kāi)課)
- 催化氧化合成4-氯-2-硝基苯甲酸_圖文
- 金屬鍍覆和化學(xué)處理表示方法
- 同濟(jì)大學(xué)本科生學(xué)籍管理規(guī)定
- 單細(xì)胞水平同位素拉曼散射分析
- 三年級(jí)數(shù)學(xué)寒假每日一練
- 最新宜昌市中考數(shù)學(xué)21題圓訓(xùn)練(1)教師版有答案
評(píng)論
0/150
提交評(píng)論