Pytorch計算機視覺與深度學(xué)習(xí) 課件 第09章 基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用_第1頁
Pytorch計算機視覺與深度學(xué)習(xí) 課件 第09章 基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用_第2頁
Pytorch計算機視覺與深度學(xué)習(xí) 課件 第09章 基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用_第3頁
Pytorch計算機視覺與深度學(xué)習(xí) 課件 第09章 基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用_第4頁
Pytorch計算機視覺與深度學(xué)習(xí) 課件 第09章 基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

PyTorch計算機視覺與深度學(xué)習(xí)實戰(zhàn)基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用第九章目錄02生成式對抗網(wǎng)絡(luò)模型Generativecountermeasurenetworkmodel01應(yīng)用背景Background04案例小結(jié)CaseSummary03集成應(yīng)用開發(fā)Visualsearchengine應(yīng)用背景Background3019.1應(yīng)用背景4生成式對抗網(wǎng)絡(luò)(GenerativeAdversarialNetworks,GAN)自從2014年由IanGoodfellow提出以來,在人工智能和計算機視覺領(lǐng)域引起了廣泛關(guān)注。GAN通過生成器與判別器相互對抗,生成逼真的圖像、音頻和文本等數(shù)據(jù)。這種方法在理論上有重要的創(chuàng)新意義,并在多個實際應(yīng)用領(lǐng)域展現(xiàn)了巨大的潛力。在圖像生成方面,GAN已經(jīng)取得了顯著的成果。例如,在藝術(shù)創(chuàng)作領(lǐng)域,GAN能夠生成獨特的藝術(shù)作品,模仿不同畫家的風(fēng)格;在游戲和影視制作中,GAN被用來生成逼真的場景和角色,大幅降低制作成本;在醫(yī)學(xué)影像處理上,GAN可以生成高分辨率的病灶圖像,輔助醫(yī)生進行診斷和研究;在時尚行業(yè),GAN被用于設(shè)計新穎的服裝和配飾樣式。此外,GAN在數(shù)據(jù)增強和圖像修復(fù)方面也展現(xiàn)了強大的能力,通過生成大量高質(zhì)量的訓(xùn)練數(shù)據(jù),提升機器學(xué)習(xí)模型的性能?;谏墒綄咕W(wǎng)絡(luò)的圖像生成應(yīng)用,不僅展示了深度學(xué)習(xí)技術(shù)的前沿發(fā)展,也為各行各業(yè)帶來了全新的創(chuàng)作和應(yīng)用模式。4生成式對抗網(wǎng)絡(luò)模型Generativecountermeasurenetworkmodel5029.2.1卡通頭像大數(shù)據(jù)6Anime-faces數(shù)據(jù)集是一個著名的動漫頭像集合,含有成千上萬張高清的動漫角色頭像,大小通常在90×90到120×120像素范圍內(nèi),部分樣本展示圖。6樣本圖像的背景清晰且顏色信息豐富,頭像占據(jù)了圖像的主要區(qū)域。9.2.2GAN網(wǎng)絡(luò)設(shè)計77(2)判別器模型將實際訓(xùn)練樣本和由生成器產(chǎn)生的仿真樣本作為輸入,判別器負責(zé)判斷這些圖像是真實(輸出1)還是虛假(輸出0)。從輸入的隨機數(shù)字向量出發(fā),生成器能夠自動產(chǎn)生與訓(xùn)練樣本具有相似屬性的圖片。(1)生成器模型設(shè)計GAN網(wǎng)絡(luò)GAN網(wǎng)絡(luò)旨在通過真實數(shù)據(jù)的訓(xùn)練,最終生成與之高度相似的仿真數(shù)據(jù),它由兩個獨立的子模型組成:生成器和判別器。9.2.2GAN網(wǎng)絡(luò)設(shè)計8定義一個生成器模型,該模型將以隨機數(shù)向量作為輸入,并通過重構(gòu)投影、反卷積層和激活層的序列,最終產(chǎn)生64×64×3尺寸的仿真圖像。網(wǎng)絡(luò)結(jié)構(gòu)的詳細圖示如下。801生成器9.2.2GAN網(wǎng)絡(luò)設(shè)計9定義判別器模型,設(shè)置輸入為64×64×3的彩色圖像矩陣,經(jīng)卷積層、正則化層和激活層,最終輸出圖像的鑒定結(jié)果,其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖所示。902判別器9.2.3GAN網(wǎng)絡(luò)訓(xùn)練10定義了GAN網(wǎng)絡(luò)的生成器和判別器模型后,可加載前面提到的卡通頭像大數(shù)據(jù),設(shè)置訓(xùn)練參數(shù)進行網(wǎng)絡(luò)模型的訓(xùn)練,步驟如下。100203設(shè)置訓(xùn)練參數(shù),初始化模型、損失函數(shù)、優(yōu)化器、數(shù)據(jù)讀取接口01循環(huán)訓(xùn)練判別器和生成器模型,更新模型參數(shù)循環(huán)驗證生成器模型,可視化中間訓(xùn)練狀態(tài)9.2.4GAN網(wǎng)絡(luò)測試11defdenorm(img_tensors):"""反歸一化"""returnimg_tensors*0.5+0.5

num=64#生成64張圖像torch.manual_seed(int(self.seed_value.get()))#設(shè)置隨機數(shù)種子noise=torch.randn(num,1024,1,1)#產(chǎn)生隨機數(shù)fake_images=self.model(noise)#生成圖像save_image(denorm(fake_images),'samples/show.jpg',nrow=8)#將圖像保存到本地網(wǎng)絡(luò)模型訓(xùn)練后可將其存儲到本地文件,按照對應(yīng)的輸入維度要求生成隨機向量,然后調(diào)用生成器模型獲得卡通頭像的生成圖,代碼如下:9.2.4GAN網(wǎng)絡(luò)測試12如上處理過程加載已訓(xùn)練的生成器模型,設(shè)置隨機輸入向量進行卡通頭像生成,運行效果如下所示。生成器模型能對輸入的隨機數(shù)向量生成對應(yīng)的卡通頭像模擬圖,受限于訓(xùn)練步數(shù)和生成圖像的分辨率大小,測試結(jié)果存在一定的模糊,可通過增加訓(xùn)練步數(shù)和提高分辨率可以有一定的效果改進,但同時也會增加新的訓(xùn)練資源投入。集成應(yīng)用開發(fā)Visualsearchengine13039.3集成應(yīng)用開發(fā)14本案例開發(fā)GUI界面,實現(xiàn)基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用,應(yīng)用集成了圖像生成的關(guān)鍵步驟,包括加載模型、設(shè)置隨機數(shù)種子、卡通圖像生成等步驟,并對生成圖像進行展示。其中,集成應(yīng)用的界面設(shè)計如圖所示。應(yīng)用界面包括控制面板和顯示面板兩個區(qū)域,單擊加載模型會將GAN模型加載至內(nèi)存,單擊開始生成則會根據(jù)隨機數(shù)種子,調(diào)用生成器模型獲取批量的卡通頭像仿真圖,最終在右側(cè)區(qū)域顯示處理結(jié)果。9.3集成應(yīng)用開發(fā)15通過運行卡通頭像生成程序,能批量獲得仿真卡通頭像,顯示出生成器模型的有效性。這些頭像捕捉了卡通形象的主要特征。然而,由于訓(xùn)練次數(shù)限制和圖像分辨率的限制,生成的頭像可能會呈現(xiàn)一些模糊。為了改善這一點,讀者可以考慮提升圖像分辨率或增加訓(xùn)練的次數(shù)等措施。案例小結(jié)CaseSummary16049.4案例小結(jié)17在近幾年,伴隨著大數(shù)據(jù)和人工智能技術(shù)的進步,多種AI應(yīng)用已融入大家日常生活的多個方面,比如面部識別支付系統(tǒng)、AI國際象棋對手和智能客戶服務(wù)代表等。生成對抗網(wǎng)絡(luò)(GAN)由于其出色的數(shù)據(jù)模擬能力,在圖像和視頻生成、文圖轉(zhuǎn)換、人臉替換等熱門應(yīng)用領(lǐng)域獲得了廣泛應(yīng)用,并正在擴展至自然語言處理和人機交互等領(lǐng)域。在本案例中,選用了特定的卡通圖像數(shù)據(jù)集,并利

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論