多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用

上傳人：h*** IP屬地：山東上傳時(shí)間：2024-02-02 格式：PPTX 頁數(shù)：56 大?。?.96MB 積分：15 舉報(bào) 版權(quán)申訴

多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用_第2頁

多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用_第3頁

多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用_第4頁

多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用_第5頁

已閱讀5頁，還剩51頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體技術(shù)與應(yīng)用

第9章多媒體技術(shù)拓展應(yīng)用9.1.1神經(jīng)網(wǎng)絡(luò)的發(fā)展9.1.2感知機(jī)9.1.3神經(jīng)網(wǎng)絡(luò)9.1.4卷積神經(jīng)網(wǎng)絡(luò)9.1深度學(xué)習(xí)概述生物神經(jīng)元的結(jié)構(gòu)9.1.1神經(jīng)網(wǎng)絡(luò)的發(fā)展M-P模型：1943年美國心理學(xué)家McCulloch（麥卡洛克）和數(shù)學(xué)家Pitts（皮茨）最先在論文《神經(jīng)活動中所蘊(yùn)含思想的邏輯活動》中提出的第一個(gè)神經(jīng)元數(shù)學(xué)模型，將接收到的一個(gè)輸入中多個(gè)分量加權(quán)求和后通過硬限幅函數(shù)處理后再輸出。第一代：感知機(jī)，1950年左右被提出來，算法分為輸入層和輸出層，輸入和輸出之間為線性關(guān)系，感知機(jī)無法處理非線性模型；第二代：多層感知機(jī)(MLP），又叫人工神經(jīng)網(wǎng)絡(luò)（ANN），在中間加了多個(gè)隱含層，隱含層可以引入非線性結(jié)構(gòu)，能夠處理非線性問題;第三代：深度神經(jīng)網(wǎng)絡(luò)，主要包括深度神經(jīng)網(wǎng)絡(luò)（DNN）、循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）、卷積神經(jīng)網(wǎng)絡(luò)（CNN）等。9.1.1神經(jīng)網(wǎng)絡(luò)的發(fā)展9.1.2感知機(jī)9.1.3神經(jīng)網(wǎng)絡(luò)9.1.4卷積神經(jīng)網(wǎng)絡(luò)9.1深度學(xué)習(xí)概述9.1.2感知機(jī)感知機(jī)是一個(gè)簡單的二分類線性分類模型，可以接收多個(gè)輸入信號并輸出一個(gè)結(jié)果信號。1.感知機(jī)模型

2.感知機(jī)的特點(diǎn)只有1層輸入信號的感知機(jī)稱為單層感知機(jī)，適合于線性分類當(dāng)權(quán)重參數(shù)b=-0.5，ω1=ω2=1.0時(shí)，感知機(jī)可表示為由直線?0.5+x1+x2=0分割成的兩個(gè)空間單層感知機(jī)的缺陷：無法實(shí)現(xiàn)非線性可分空間如右圖所示的圓圈和三角標(biāo)志無法畫一條直線來分隔只能繪制一條曲線來進(jìn)行分隔9.1.1神經(jīng)網(wǎng)絡(luò)的發(fā)展9.1.2感知機(jī)9.1.3神經(jīng)網(wǎng)絡(luò)9.1.4卷積神經(jīng)網(wǎng)絡(luò)9.1深度學(xué)習(xí)概述1.神經(jīng)網(wǎng)絡(luò)就是把多個(gè)單層感知機(jī)進(jìn)行組合，形成一個(gè)多層感知機(jī)，可實(shí)現(xiàn)更復(fù)雜的功能。神經(jīng)網(wǎng)絡(luò)的特點(diǎn)：①

神經(jīng)網(wǎng)絡(luò)包括輸入層、中間層和輸出層，中間層又稱為隱含層；②

該網(wǎng)絡(luò)由3層神經(jīng)元構(gòu)成，但只有2層神經(jīng)元有權(quán)重，一般稱之為2層網(wǎng)絡(luò)；③

信號從輸入到輸出都是單向的，整個(gè)網(wǎng)絡(luò)中無反饋，稱為前饋神經(jīng)網(wǎng)絡(luò)；輸入層輸出層中間層2.激活函數(shù)將輸入信號的總和轉(zhuǎn)換為輸出信號，設(shè)x=b+ω1x1+ω2x2，則y=h(x)函數(shù)h(x)稱之為激活函數(shù)，即決定如何來激活輸入信號的總和。

激活函數(shù)實(shí)質(zhì)是一種非線性的數(shù)學(xué)變換，用于對上一層神經(jīng)元的輸出進(jìn)行某種數(shù)學(xué)變換，將變換后的結(jié)果作為下一層神經(jīng)元的輸入。如果使用線性激活函數(shù)時(shí)，不管神經(jīng)網(wǎng)絡(luò)有幾層，最終輸出還是一個(gè)線性變換，無法發(fā)揮多層網(wǎng)絡(luò)疊加帶來的優(yōu)勢，所以激活函數(shù)都使用非線性的激活函數(shù)。2.常用非線性激活函數(shù)（1）ReLU激活函數(shù)（RectifiedLinearUnit，線性整流函數(shù)）：該函數(shù)以閾值為界，一旦輸入超過某個(gè)閾值，就輸出，這就是感知機(jī)中的激活函數(shù)，又叫階躍函數(shù)

2.常用非線性激活函數(shù)（2）Sigmoid激活函數(shù)：當(dāng)輸入信號x較小時(shí)，輸出接近為0，隨著輸入信號x的增大，輸出向1靠近，對每個(gè)神經(jīng)元的輸出進(jìn)行了歸一化處理。一般用于將預(yù)測概率作為輸出的模型，主要用于輸出為二分類的神經(jīng)網(wǎng)絡(luò)模型。

（3）tanh激活函數(shù)（雙曲正切函數(shù)）：輸出以0為中心，范圍在-1和+1之間，與Sigmoid相比，tanh的梯度下降作用更強(qiáng)在一般的二分類問題中，tanh函數(shù)用于隱含層，而Sigmoid函數(shù)則用于輸出層2.常用非線性激活函數(shù)（4）Softmax激活函數(shù)：對于神經(jīng)網(wǎng)絡(luò)具有K個(gè)信號的輸出向量，Softmax可以將其變換到K個(gè)數(shù)值位于（0，1）之間的實(shí)數(shù)，剛好可以對應(yīng)每個(gè)輸出結(jié)果出現(xiàn)的概率，并且各項(xiàng)輸出的總和為1，輸出值中概率值最大的即為對應(yīng)的結(jié)果，一般用于多分類問題。2.常用非線性激活函數(shù)機(jī)器學(xué)習(xí)就是要從訓(xùn)練數(shù)據(jù)中獲得最優(yōu)權(quán)重參數(shù)的過程。神經(jīng)網(wǎng)絡(luò)中參數(shù)的數(shù)量超多，需要在學(xué)習(xí)過程中通過反向傳播的方式不斷地調(diào)整網(wǎng)絡(luò)中的權(quán)重參數(shù)，使模型中的權(quán)重參數(shù)盡可能達(dá)到最優(yōu)。3.損失函數(shù)損失函數(shù)就是用來評價(jià)模型的預(yù)測值和真實(shí)值不一樣的程度，用于衡量神經(jīng)網(wǎng)絡(luò)性能一個(gè)指標(biāo)，模型訓(xùn)練過程中損失函數(shù)的值越來越小，說明模型的性能越來越好常見的損失函數(shù)（1）均方誤差（MSE，MeanSquaredError）（2）交叉熵誤差（CrossEntropyError）

交叉熵就是用來判定實(shí)際的輸出與期望輸出的接近程度

優(yōu)化器就是在深度學(xué)習(xí)的反向傳播過程中，通過損失函數(shù)來指引如何調(diào)整各個(gè)權(quán)重參數(shù)往正確的方向更新到合適的大小，更新后的各個(gè)權(quán)重參數(shù)使損失函數(shù)的值不斷逼近全局最小。4.優(yōu)化器①

批量梯度下降（BGD）：使用所有樣本計(jì)算梯度并更新權(quán)重參數(shù)，計(jì)算工作量大，訓(xùn)練速度慢，能夠更準(zhǔn)確地逼近最優(yōu)解。②

隨機(jī)梯度下降法（SGD）：每輪迭代都是針對一個(gè)樣本而不是全部樣本，更新速度大大加快，但是得到的可能只是局部最優(yōu)而不是全局最優(yōu)解。③

小批量梯度下降（MBGD）：每輪迭代都是針對一個(gè)小樣本集合，既可以加快訓(xùn)練速度，又可以避免只能得到局部最優(yōu)，如手寫數(shù)字識別batch_size=32。4.優(yōu)化器④

自適應(yīng)梯度下降（AdaGrad）：對不同的權(quán)重參數(shù)調(diào)整不同的學(xué)習(xí)率α，對頻繁變化的權(quán)重參數(shù)以更小的步長進(jìn)行更新，而稀疏的權(quán)重參數(shù)以更大的步長進(jìn)行更新，一般默認(rèn)學(xué)習(xí)率α=0.01。⑤

均方根傳遞（RMSProp）：采用指數(shù)加權(quán)移動平均（累計(jì)局部梯度和）來替代AdaGrad中的累計(jì)平方梯度和，能夠在不穩(wěn)定的目標(biāo)函數(shù)情況下很好地收斂，可克服AdaGrad梯度急劇減小的問題。5.模型的評價(jià)預(yù)測值真實(shí)值正類負(fù)類正類ab負(fù)類cd（1）準(zhǔn)確率（Accuracy）:(a+d)/(a+b+c+d)，所有樣本中被正確預(yù)測的比例；（2）精確率（Precision）:a/(a+c)，所有被預(yù)測為正類的樣本中，預(yù)測正確的比例（3）召回率（Recall）：a/(a+b)，所有真實(shí)類別為正類的樣本中，被正確預(yù)測出來的比例；（4）F1得分:2a/(2a+b+c)，是準(zhǔn)確率和召回率的一種調(diào)和均值；混淆矩陣其他評價(jià)方法泛化能力：是指機(jī)器學(xué)習(xí)算法處理訓(xùn)練集之外未知樣本的適應(yīng)能力，即把未知樣本作為測試集，檢測已訓(xùn)練好的模型在測試集上的適應(yīng)能力。擬合（fit）：模型在訓(xùn)練集與測試集上的表現(xiàn)都好欠擬合：就是模型在訓(xùn)練集與測試集上的表現(xiàn)都不好過擬合：模型在訓(xùn)練數(shù)據(jù)集上表現(xiàn)很好，但在未知數(shù)據(jù)集上卻表現(xiàn)欠佳模型出現(xiàn)欠擬合或過擬合的話，建議增加訓(xùn)練樣本數(shù)，調(diào)整超參數(shù)，包括Epcho、batch-size（小批量的大?。?、學(xué)習(xí)率等，對訓(xùn)練集與測試集數(shù)據(jù)做歸一化預(yù)處理等。9.1.1神經(jīng)網(wǎng)絡(luò)的發(fā)展9.1.2感知機(jī)9.1.3神經(jīng)網(wǎng)絡(luò)9.1.4卷積神經(jīng)網(wǎng)絡(luò)9.1深度學(xué)習(xí)概述卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)（1）輸入層卷積神經(jīng)網(wǎng)絡(luò)的輸入層可以處理多維數(shù)據(jù)，如四維數(shù)組【0，0，0，0】可理解為第1張圖片的第0行第0列的第0個(gè)通道的像素值通常在數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)前，需對數(shù)據(jù)進(jìn)行歸一化處理，若輸入數(shù)據(jù)為像素，原始像素值【0，255】會被歸一化處理為【0，1】之間的實(shí)數(shù)，有利于提升卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率和性能。

隱含層又叫隱藏層，一般包含了卷積層、池化層和全連接層（2）隱含層卷積計(jì)算過程②

池化層：每個(gè)卷積層輸出的特征圖會被傳遞至池化層進(jìn)行特征選擇和信息過濾，仿照人的視覺系統(tǒng)進(jìn)行降維（又叫降采樣），可以提取出圖像更高層的抽象特征。③

全連接層：是卷積神經(jīng)網(wǎng)絡(luò)隱含層的最后部分，特征圖在全連接層中會失去空間拓?fù)浣Y(jié)構(gòu)，被展平為一個(gè)向量，對提取的特征進(jìn)行非線性組合得到最后的輸出結(jié)果使用邏輯函數(shù)或Softmax函數(shù)輸出分類標(biāo)簽，對于物體識別問題，輸出層將輸出物體的中心坐標(biāo)、大?。ǔ叽纾┖头诸愋畔⒌?。（2）隱含層（3）輸出層9.2.1基于按鈕交互的動畫實(shí)現(xiàn)9.2.2基于圖像識別的動畫實(shí)現(xiàn)9.2拓展應(yīng)用案例—剪刀石頭布簡單交互動畫的運(yùn)行結(jié)果界面設(shè)計(jì)思路（1）準(zhǔn)備好代表剪刀石頭布的圖片；（2）機(jī)器出的圖片用一個(gè)標(biāo)簽顯示，由系統(tǒng)時(shí)鐘控制其隨機(jī)出現(xiàn)；（3）我出的是哪個(gè)，通過單擊圖片按鈕實(shí)現(xiàn)；（4）當(dāng)我單擊某個(gè)按鈕時(shí)，系統(tǒng)時(shí)鐘暫停，機(jī)器標(biāo)簽顯示的圖片即為機(jī)器出結(jié)果；（5）根據(jù)游戲規(guī)則判別輸贏，并對贏的次數(shù)進(jìn)行累計(jì)；（6）游戲采用5局3勝制，當(dāng)某一方獲勝時(shí)，彈出對話框，顯示最后的結(jié)果；（7）點(diǎn)按“下一局”，開始新一輪的比賽。9.2.1基于按鈕交互的動畫實(shí)現(xiàn)9.2.2基于圖像識別的動畫實(shí)現(xiàn)9.2拓展應(yīng)用案例—剪刀石頭布剪刀石頭布——采用圖像識別（神經(jīng)網(wǎng)絡(luò)模型）1）我和機(jī)器隨機(jī)出的剪刀石頭布圖片動畫顯示在界面上面；2）左下角顯示當(dāng)前攝像頭采集的圖像畫面；3）單擊按鈕“開始識別”，視頻采集畫面靜止，將當(dāng)前識別出的圖片顯示在上面我出的圖片位置，同時(shí)動畫停止，并與當(dāng)前機(jī)器出的圖片按游戲規(guī)則判別輸贏，動畫圖片下方顯示當(dāng)前輸贏次數(shù)；4）單擊“繼續(xù)出拳”按鈕，繼續(xù)視頻采集，游戲采用5局3勝制，游戲結(jié)束彈出贏了的對話框；5）單擊“下一局”按鈕，繼續(xù)下一輪的游戲Step1，設(shè)計(jì)思路剪刀石頭布——采用圖像識別（神經(jīng)網(wǎng)絡(luò)簡單建模）首先采集剪刀石頭布的圖像，并按規(guī)律保存為圖像文件，本例采集了3000*3=9000張訓(xùn)練用的原始jpg格式的圖像（大小為640*480），采用外接USB攝像頭，背景為黑色的屏幕背景。采集了2000*3=6000張測試用jpg圖像文件。三種圖片分三次采集，分別保存在指定目錄下，本例為當(dāng)前目錄。準(zhǔn)備工作1：采集原始圖像importimageio#圖像輸入輸出處理importvisvisasvv#計(jì)算機(jī)視覺庫fc,i=0,-100#圖片起始編號為負(fù)，便于將來采用時(shí)從1開始success=Truecapt=imageio.get_reader('<video3>')#ThinkPad中打開外接USB攝像頭，0~2為內(nèi)置攝像頭#windowssurface:0為前置攝像頭，1對于后置攝像頭，2對應(yīng)外接USB攝像頭frame=capt.get_next_data()#讀取幀數(shù)據(jù)t=vv.imshow(frame,clim=(0,255))#將幀數(shù)據(jù)顯示在VV的視頻窗口t中，clim控制顏色的范圍forimincapt:#循環(huán)控制讀取cessEvents()#vv處理事件t.SetData(im)#刷新t窗口中的圖像fc=fc+1#累計(jì)幀數(shù)iffc%5==0:#設(shè)置截取的幀頻，這里每隔5幀保存一次i+=1#給需要保存的圖像文件編號vv.imwrite("jd_%d.jpg"%i,im)#將圖像保存為指定的jpg文件ifi==6000:#當(dāng)保存的文件數(shù)為6000時(shí)停止采集capt.close()#關(guān)閉攝像頭break#退出循環(huán)app=vv.use()#開始消息循環(huán)app.Run()vv.closeAll()#關(guān)閉采集窗口剪刀石頭布——采用圖像識別（神經(jīng)網(wǎng)絡(luò)簡單建模）分別讀取三種圖像文件，按照訓(xùn)練模型中的格式要求進(jìn)行處理，同時(shí)對其進(jìn)行標(biāo)注（對應(yīng)剪刀石頭布的序號）準(zhǔn)備工作2：制作數(shù)據(jù)集importnumpyasnpfromPILimportImageimportrandom#初始化一個(gè)二維的圖像數(shù)組，默認(rèn)為空，第1維是高度，第2維是寬度TrainImage=np.array([],dtype=np.uint8,ndmin=2)#存放打亂順序的圖像TrainLabel=[0]*9000TrainImg=np.array([],dtype=np.uint8,ndmin=2)#順序添加圖像數(shù)據(jù)TrainLbl=[]foriinrange(3000):#讀取3000張訓(xùn)練用剪刀圖像

TrainLbl.append(0)#剪刀的標(biāo)記為0fileName=r"F:\sjb_recog\trainphoto\jd_"+str(i)+'.jpg'#打開圖像文件并轉(zhuǎn)換為灰度圖像,數(shù)據(jù)類型為np的二維數(shù)組

img=np.array(Image.open(fileName).convert("L"))#再從數(shù)組類型轉(zhuǎn)換成圖像，然后縮放圖像大小，本例是縮小了10倍

imgResize=Image.fromarray(img.astype('uint8')).resize((64,48))#將所有訓(xùn)練圖像數(shù)據(jù)（二維數(shù)組）依次添加到用于存儲訓(xùn)練圖像的三維數(shù)組中

TrainImg=np.append(TrainImg,imgResize)TrainImage=np.append(TrainImage,imgResize)foriinrange(3000):#讀取3000張訓(xùn)練用石頭圖像

TrainLbl.append(1)#石頭標(biāo)記為1fileName=r"F:\sjb_recog\trainphoto\st_"+str(i)+'.jpg'

img=np.array(Image.open(fileName).convert("L"))imgResize=Image.fromarray(img.astype('uint8')).resize((64,48))TrainImg=np.append(TrainImg,imgResize)TrainImage=np.append(TrainImage,imgResize)

foriinrange(3000):#讀取3000張訓(xùn)練用布圖像

TrainLbl.append(2)#布標(biāo)記為2fileName=r"F:\sjb_recog\trainphoto\bu_"+str(i)+'.jpg'img=np.array(Image.open(fileName).convert("L"))imgResize=Image.fromarray(img.astype('uint8')).resize((64,48))TrainImg=np.append(TrainImg,imgResize)TrainImage=np.append(TrainImage,imgResize)#再將訓(xùn)練圖像數(shù)據(jù)改成三維數(shù)組，依次表示圖像的序號，像素的高度和寬度TrainImg=TrainImg.reshape(9000,48,64)#有序的圖像數(shù)組TrainImage=TrainImage.reshape(9000,48,64)#有序的圖像數(shù)組xh=random.sample(range(0,9000),9000)#隨機(jī)生成9000個(gè)不一樣的隨機(jī)整數(shù)0~9000，打亂圖像順序random.shuffle(xh)foriinrange(9000):k=xh[i]TrainImage[k]=TrainImg[i]TrainLabel[k]=TrainLbl[i]準(zhǔn)備工作2：制作數(shù)據(jù)集(續(xù))準(zhǔn)備工作2：制作數(shù)據(jù)集(續(xù))TestImg=np.array([],dtype=np.uint8,ndmin=2)TestLbl=[]TestImage=np.array([],dtype=np.uint8,ndmin=2)#存放打亂順序的圖像TestLabel=[0]*6000foriinrange(2000):#讀取2000張訓(xùn)練用剪刀圖像TestLbl.append(0)#剪刀的標(biāo)記為0fileName=r"F:\sjb_recog\trainphoto\jd_"+str(3000+i)+'.jpg'#打開圖像文件并轉(zhuǎn)換為灰度圖像,數(shù)據(jù)類型為np的二維數(shù)組img=np.array(Image.open(fileName).convert("L"))#再從數(shù)組類型轉(zhuǎn)換成圖像，然后縮放圖像大小，本例是縮小了10倍imgResize=Image.fromarray(img.astype('uint8')).resize((64,48))#將所有訓(xùn)練圖像數(shù)據(jù)（二維數(shù)組）依次添加到用于存儲訓(xùn)練圖像的三維數(shù)組中TestImg=np.append(TestImg,imgResize)TestImage=np.append(TestImage,imgResize)準(zhǔn)備工作2：制作數(shù)據(jù)集(續(xù))foriinrange(2000):#讀取2000張訓(xùn)練用石頭圖像TestLbl.append(1)#石頭標(biāo)記為1fileName=r"F:\sjb_recog\trainphoto\st_"+str(3000+i)+'.jpg'

img=np.array(Image.open(fileName).convert("L"))imgResize=Image.fromarray(img.astype('uint8')).resize((64,48))TestImg=np.append(TestImg,imgResize)TestImage=np.append(TestImage,imgResize)foriinrange(2000):#讀取2000張訓(xùn)練用布圖像TestLbl.append(2)#布標(biāo)記為2fileName=r"F:\sjb_recog\trainphoto\bu_"+str(3000+i)+'.jpg'img=np.array(Image.open(fileName).convert("L"))imgResize=Image.fromarray(img.astype('uint8')).resize((64,48))TestImg=np.append(TestImg,imgResize)TestImage=np.append(TestImage,imgResize)準(zhǔn)備工作2：制作數(shù)據(jù)集(續(xù))#再將訓(xùn)練圖像數(shù)據(jù)改成三維數(shù)組，依次表示圖像的序號，像素的高度和寬度TestImg=TestImg.reshape(6000,48,64)TestImage=TestImage.reshape(6000,48,64)xh1=random.sample(range(0,6000),6000)random.shuffle(xh1)foriinrange(6000):kk=xh1[i]TestImage[kk]=TestImg[i]TestLabel[kk]=TestLbl[i]#用savez函數(shù)將訓(xùn)練集和測試集的圖像數(shù)據(jù)以及標(biāo)簽數(shù)據(jù)寫入sjb.npz數(shù)據(jù)集文件中np.savez(r'C:\Users\lxm\.keras\datasets\sjb.npz',TrainImage=TrainImage,TrainLabel=TrainLabel,TestImage=TestImage,TestLabel=TestLabel)#訪問該數(shù)據(jù)集中的數(shù)據(jù)用#data=np.load(r'C:\Users\lxm\.keras\datasets\sjb.npz')#data['TrainImage']獲取訓(xùn)練圖像數(shù)據(jù)，data['TrainLabel']獲取訓(xùn)練標(biāo)簽準(zhǔn)備工作3：訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型importnumpyasnpdata=np.load(r'C:\Users\lxm\.keras\datasets\sjb.npz')train_images=data['TrainImage']test_images=data['TestImage']train_labels=data['TrainLabel'].astype(np.uint8)test_labels=data['TestLabel'].astype(np.uint8)（1）讀取數(shù)據(jù)集train_images=train_images.reshape((9000,64*48))test_images=test_images.reshape((6000,64*48))train_images=train_images.astype('float32')/255test_images=test_images.astype('float32')/255（2）準(zhǔn)備圖像數(shù)據(jù)：變換數(shù)據(jù)維度，并將圖像數(shù)據(jù)轉(zhuǎn)化為[0~1]準(zhǔn)備工作3：訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型fromtensorflow.kerasimportmodelsfromtensorflow.kerasimportlayersnetwork=models.Sequential()network.add(layers.Dense(512,activation='relu',input_shape=(64*48,)))network.add(layers.Dense(3,activation='softmax'))（3）創(chuàng)建訓(xùn)練模型并添加層pile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])（4）指定模型的優(yōu)化器、損失函數(shù)和評價(jià)方法準(zhǔn)備工作3：訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型fromtensorflow.keras.utilsimportto_categoricaltrain_labels=to_categorical(train_labels)test_labels=to_categorical(test_labels)（5）處理訓(xùn)練標(biāo)簽和測試標(biāo)簽network.fit(train_images,train_labels,epochs=6,batch_size=32)（6）開始模型的訓(xùn)練，指定輪數(shù)和每輪數(shù)據(jù)批量的大小network.save("F:\sjb_recog\sjb-2.h5")（7）保存訓(xùn)練好的模型（8）查看測試結(jié)果test_loss,test_acc=network.evaluate(test_images,test_labels)模型的改進(jìn)fromtensorflow.kerasimportlayersfromtensorflow.kerasimportmodelssjbModel=models.Sequential()sjbModel.add(layers.Conv2D(32,(3,3),activation='relu',input_shape=(48,64,1)))sjbModel.add(layers.MaxPooling2D((2,2)))sjbModel.add(layers.Conv2D(64,(3,3),activation='relu'))sjbModel.add(layers.MaxPooling2D((2,2)))sjbModel.add(layers.Conv2D(64,(3,3),activation='relu'))sjbModel.add(layers.Flatten())sjbModel.add(layers.Dense(512,activation='relu'))sjbModel.add(layers.Dense(3,activation='softmax'))importnumpyasnpdata=np.load(r'C:\Users\lxm\.keras\datasets\sjb.npz')train_images=data['TrainImage'].reshape(9000,48,64,1)train_images=train_images.astype('float32')/255test_images=data['TestImage'].reshape(6000,48,64,1)test_images=test_images.astype('float32')/255train_labels=data['TrainLabel'].astype(np.uint8)test_labels=data['TestLabel'].astype(np.uint8)模型的改進(jìn)（續(xù)）fromtensorflow.keras.utilsimportto_categoricaltrain_labels=to_categorical(train_labels)test_labels=to_categorical(test_labels)sjbMpile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])模型的改進(jìn)（續(xù)）sjbModel.fit(train_images,train_labels,epochs=5,batch_size=64)sjbModel.save("F:\sjb_recog\sjb-4.h5")test_loss,test_acc=sjbModel.evaluate(test_images,test_labels)print('test_acc:',test_acc)importtkinterastkimportrandomimportthreadingastrimporttkinter.messagebox#importmatplotlib.pyplotaspltimportcv2fromPILimportImage,ImageTkfromtensorflow.keras.modelsimportload_modelimportnumpyasnpStep2，導(dǎo)入必要的庫，全局變量初始化root=tk.Tk()root.title("游戲：剪刀石頭布")root.geometry('600x600')random.seed()#隨機(jī)數(shù)種子jqNo=1#機(jī)器默認(rèn)出剪刀meWin,jqWin=0,0#我贏的次數(shù)和機(jī)器贏的次數(shù)初始化為0imgtk=None#控制畫布上顯示的圖片im1=None#控制圖像的數(shù)據(jù)傳遞conCapture=True#控制視頻是否繼續(xù)采集Step3，界面控件設(shè)計(jì)#定義兩個(gè)標(biāo)簽，時(shí)鐘開始后隨機(jī)顯示我和機(jī)器出的圖片jqLabel=tk.Label(root,text=‘機(jī)器出的’)#機(jī)器出的圖片，標(biāo)簽顯示jqLabel.place(x=220,y=60,width=150,height=50)myLabel=tk.Label(root,text='我出的')#我出的圖片，標(biāo)簽顯示myLabel.place(x=20,y=60,width=120,height=50)#下面先加載用于顯示的圖片對象，分別控制機(jī)器和我出的圖片jqph=[None,None,None]#初始化圖像文件對象,兩個(gè)語句不能合在一起賦值，否則引用的圖片是一樣的myph=[None,None,None]foriinrange(3):jqph[i]=tk.PhotoImage(file='r'+str(i+1)+'.gif')#每個(gè)圖像文件必須單獨(dú)保存，不能迭代賦值myph[i]=tk.PhotoImage(file='l'+str(i+1)+'_2.gif')jq_disp=tk.Label(root,image=jqph[0])#機(jī)器默認(rèn)出的剪刀石頭布jq_disp.place(x=250,y=120,width=70,height=50)my_disp=tk.Label(root,image=myph[0])#我默認(rèn)出的剪刀石頭布my_disp.place(x=50,y=120,width=70,height=50)Step3，界面控件設(shè)計(jì)（續(xù)）#下面定義兩個(gè)標(biāo)簽。分別顯示我和機(jī)器贏的次數(shù)，文本可動態(tài)變化varMe=tkinter.StringVar()lbMe=tk.Label(root,textvariable=varMe)lbMe.place(x=50,y=200,width=70,height=30)varJq=tkinter.StringVar()lbjq=tk.Label(root,textvariable=varJq)lbjq.place(x=250,y=200,width=70,height=30)#定義一個(gè)下一局按鈕，單擊開始下一輪比賽nextbt=tk.Button(root,text="下一局",command=nextClick)nextbt.place(x=450,y=400,width=70,height=30)nextbt.config(state="disabled")#在圖片上方放2個(gè)提示性的文字標(biāo)簽tsLb1=tk.Label(root,text="我")tsLb1.place(x=40,y=30,width=90,height=30)tsLb2=tk.Label(root,text="機(jī)器")tsLb2.place(x=240,y=30,width=90,height=30)Step3，界面控件設(shè)計(jì)（續(xù)）#定義一塊畫布，用于顯示采集的視頻圖像canvas=tk.Canvas(root,width=400,height=300)canvas.place(x=10,y=250)#定義兩個(gè)按鈕，控制開始圖像識別和繼續(xù)出拳

recogBt=tk.Button(root,text="開始識別",command=startRecog)recogBt.place(x=450,y=300,width=70,height=30)conCaptBt=tk.Button(root,text="繼續(xù)出拳",command=conCapt)conCaptBt.place(x=450,y=350,width=70,height=30)conCaptBt.config(state="disabled")#繼續(xù)出拳按鈕默認(rèn)為灰Step4，主程序設(shè)計(jì)#0是內(nèi)置攝像頭，1是外接USB攝像頭，capt.read()將開啟攝像頭capt=cv2.VideoCapture(1,cv2.CAP_DSHOW)#定義一個(gè)全局的定時(shí)器，調(diào)用Fun_timer處理相應(yīng)的事件，機(jī)器默認(rèn)顯示第1張圖片timer1=tr.Timer(0.1,Fun_timer,['1'])timer1.start()#開啟定時(shí)器t=tr.Thread(target=dispVideo)#通過線程控制執(zhí)行自定義函數(shù)t.start()#啟動線程model=load_model(r".\sjb-2.h5")#載入訓(xùn)練好的模型root.focus_set()#獲取焦點(diǎn)root.mainloop()#開始事件循環(huán)Step5，隨機(jī)顯示圖片的動畫設(shè)計(jì)defFun_timer(n):#時(shí)鐘觸發(fā)時(shí)，將三張照片隨機(jī)顯示

globaljqNo,timer1,myph,jqph,my_disp,jq_dispi=eval(n)-1jqNo=i+1#記住當(dāng)前機(jī)器出的圖片序號

jq_disp=tk.Label(root,image=jqph[i])#image指定機(jī)器要打開的圖片文件

jq_disp.place(x=250,y=120,width=70,height=50)my_disp=tk.Label(root,image=myph[i])#image指定我要打開的圖片文件

my_disp.place(x=50,y=120,width=70,height=50)timer1=tr.Timer(0.1,Fun_timer,args=[str(random.randint(1,3))])

#每隔0.1秒調(diào)用一次Fun_timer函數(shù)，參數(shù)為隨機(jī)生成的文件序號（字符）

timer1.start()#啟動時(shí)鐘

root.update()#刷新窗體Step6，采集視頻的顯示defdispVideo():#控制視頻的顯示

globalcanvas,capt,imgtk,im1,conCapture,timer1capt=cv2.VideoCapture(1,,cv2.CAP_DSHOW)#0對應(yīng)內(nèi)置，1對應(yīng)USB外置攝像頭

conCapture=True#控制攝像頭是否繼續(xù)捕獲圖像

defcapture():#捕獲攝像頭的圖像并顯示

globalcanvas,capt,imgtk,im1whileTrue:rval,frame=capt.read()#從攝像頭讀取圖像保存在frame中，rval保存是否讀取成功

ifconCaptureandrval:#conCapture=True表示攝像頭繼續(xù)捕獲圖像im=Image.fromarray(frame)#轉(zhuǎn)換圖像的數(shù)據(jù)類型,im可顯示為圖像

im1=im.convert("L")#將其轉(zhuǎn)換為灰度圖像

imgtk=ImageTk.PhotoImage(image=im1)#將讀取到的圖像轉(zhuǎn)換為image屬性支持的類型

canvas.create_image(200,150,image=imgtk)#200,150指定圖像的中心

canvas.image=imgtk#該語句用于解決圖像顯示時(shí)候的閃爍

rval,frame=capt.read()#繼續(xù)從攝像頭讀取圖像

t1=tr.Thread(target=capture)#創(chuàng)建一個(gè)線程t,指向函數(shù)capturet1.start()Step7，開始識別圖像defstartRecog():#單擊開始識別按鈕執(zhí)行的功能

globalcanvas,capt,imgtk,im1,conCapture,model,timer1,myph,jqph,jqNo,my_disp,jq_dispglobalconCapture=False#通過該邏輯變量控制攝像頭停止捕獲視頻

timer1.cancel()#定時(shí)器停止，使機(jī)器出拳畫面靜止

conCaptBt.config(state="active")#繼續(xù)出拳按鈕變亮

recogBt.config(state="disabled")#開始識別按鈕變灰

imgRecognized=np.array([],dtype=np.uint8,ndmin=2)#初始化圖像列表，一個(gè)二維的空列表

canvas.create_image(200,150,image=imgtk)#當(dāng)前畫布顯示待識別的圖像

imGray=np.array(im1)#先將待識別的圖像im1轉(zhuǎn)換成灰度圖像

imgRec=Image.fromarray(imGray.astype('uint8')).resize((64,48))#將圖像縮小10倍imgRecognized=np.append(imgRecognized,imgRec)#將圖像添加到圖像列表imgRecognizedimgRecognized=imgRecognized.reshape(1,48,64)#將該圖像列表變成三維

imgRecognized=imgRecognized.reshape((1,64*48))#繼續(xù)變換為二維數(shù)組

imgRecognized=imgRecognized.astype('float32')/255#將所有像素點(diǎn)的值變換到【0，1】區(qū)間

result=model.predict_classes(imgRecognized)#調(diào)用訓(xùn)練好的模型開始預(yù)測，結(jié)果保存在result中ifresult==0:rk=0elifresult==1:rk=1elifresult==2:rk=2my_disp.config(text='',image=myph[rk])#我出的圖片標(biāo)簽替換顯示為圖片

root.update()#更新照片必須刷新窗體才能顯示

Judge(rk+1,jqNo)#調(diào)用判別輸贏的函數(shù)model=load_model(r".\sjb-2.h5")defstartRecog():#單擊開始識別按鈕執(zhí)行的功能globalcanvas,capt,imgtk,im1,conCapture,modelglobaltimer1,myph,jqph,jqNo,my_disp,jq_dispconCapture=False#通過該邏輯變量控制攝像頭停止捕獲視頻timer1.cancel()#定時(shí)器停止，使機(jī)器出拳畫面靜止conCaptBt.config(state="active")#繼續(xù)出拳按鈕變亮recogBt.config(state="disabled")#開始識別按鈕變灰imgRecognized=np.array([],dtype=np.uint8,ndmin=3)#初始化圖像列表，一個(gè)四維的空列表canvas.create_image(200,150,image=imgtk)#當(dāng)前畫布顯示待識別的圖像imGray=np.array(im1)#先將待識別的圖像im1轉(zhuǎn)換為np數(shù)組imgRec=Image.fromarray(imGray.astype('uint8')).resize((64,48))#將圖像縮小10倍

imgRec=np.array(imgRec).reshape(48,64,1)imgRecognized=np.append(imgRecognized,imgRec)#將圖像添加到圖像列表imgRecognizedimgRecognized=imgRecognized.reshape(1,48,64,1)#將該圖像列表變成四維imgRecognized=imgRecognized.astype(‘float32’)/255#將所有像素點(diǎn)的值變換到【0，1】區(qū)間result=model.predict_classes(imgRecognized)#調(diào)用訓(xùn)練好的模型開始預(yù)測，結(jié)果保存在result中ifresult==0:rk=0elifresult==1:rk=1elifresult==2:rk=2Step7，開始識別圖像（使用改進(jìn)的模型）my_disp.config(text='',image=myph[rk])#我出的圖片標(biāo)簽替換顯示為圖片

root.update()#更新照片必須刷新窗體才能顯示

Judge(rk+1,jqNo)#調(diào)用判別輸贏的函數(shù)model=load_model(r".\sjb-4.h5")Step8，判別輸贏defJudge(x,y):#x對應(yīng)我出的圖片序號，y對應(yīng)機(jī)器出

globalmeWin,jqWin,timer1ifx!=y:#根據(jù)圖片序號判輸贏

ifx==1andy==2:#我出剪刀，機(jī)器出石頭

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

多媒體技術(shù)及應(yīng)用（第3版） 課件第9章 多媒體技術(shù)拓展應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

多媒體技術(shù)及應(yīng)用（第3版）課件第9章多媒體技術(shù)拓展應(yīng)用