生成對抗網(wǎng)絡(luò)_第1頁
生成對抗網(wǎng)絡(luò)_第2頁
生成對抗網(wǎng)絡(luò)_第3頁
生成對抗網(wǎng)絡(luò)_第4頁
生成對抗網(wǎng)絡(luò)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、一、生成對抗網(wǎng)絡(luò)(GAN我們提出了一個通過對抗過程估計生成模型的新框架,在新框架中我們同 時訓(xùn)練兩個模型:一個用來捕獲數(shù)據(jù)分布的生成模型 G和一個用來估計樣本 來自訓(xùn)練數(shù)據(jù)而不是G的概率的判別模型D, G的訓(xùn)練過程是最大化D產(chǎn)生錯誤 的概率。這個框架相當(dāng)于一個極小化極大的雙方博弈。在任意函數(shù)G和D的空間中存在唯一的解,其中G恢復(fù)訓(xùn)練數(shù)據(jù)分布,并且D處處都等于1/2。在G 和D由多層感知器定義的情況下,整個系統(tǒng)可以用反向傳播進(jìn)行訓(xùn)練。在訓(xùn)練 或生成樣本期間不需要任何馬爾科夫鏈或展開的近似推理網(wǎng)絡(luò)。實驗通過對生成的樣品進(jìn)行定性和定量評估來展示這個框架的潛力。目標(biāo)函數(shù)GAN勺目標(biāo)函數(shù):minnwcV

2、(D,G) =嘰凡皿+舊九即阻1 - D(G:),從判別器D的角度,他希望自己可以盡可能的區(qū)分真是樣本和虛假樣本,因此 希望D (x)盡可能的大,D (G (x)盡可能的小,即V (D,G)盡可能的大。 從生成器的角度看,他希望自己盡可能的騙過 D,也就是希望D (G (x)盡可 能的大,即V (D,G)盡可能的小。兩個模型相對抗,最后達(dá)到全局最優(yōu)。(b)(c)(d)圖中,黑色曲線是真實樣本的概率分布函數(shù),綠色曲線是虛假樣本的概率分布 函數(shù),藍(lán)色曲線是判別器D的輸出,它的值越大表示這個樣本越有可能是真實 樣本。最下方的數(shù)噪聲z,它映射到了 Xo我們可以看到,一開始,雖然 G(z)和x是在同一個

3、特征空間里的,但它的的差 異很大,這時,雖然鑒別真實樣本和虛假樣本的模型D性能也不強,但它很容易就能把兩者區(qū)分開來,而隨著訓(xùn)練的推進(jìn),虛假樣本的分布住建與真實樣本 重合,D雖然也在不斷更新,但也已經(jīng)力不從心了。最后黑線和綠線幾乎重合,模型達(dá)到了最優(yōu)狀態(tài),這時D的輸出對弈任意樣本都是0.5.最優(yōu)化問題表達(dá)定義最優(yōu)化問題的方法由兩部分組成,首先我們需要定義判別器D以判別樣本是不是從Pdata(x)分布中取出來的,因此有:4心口) 1。虱。(工)其中E指代取期望。這一項是根據(jù)正類(即辨別出x屬于真實數(shù)據(jù)data )的對數(shù)損失函數(shù)而構(gòu)建的。最大化這一項相當(dāng)于令判別器D在x服從于data的概率密度時能準(zhǔn)

4、確地預(yù)測 D(x)=1 ,即:0(工)1 when pd睢式力另外一項是企圖欺騙判別器的生成器 Go該項根據(jù)負(fù)類的對數(shù)損失函數(shù)而 構(gòu)建,即:Jg log(l-D(G(z)我們定義目標(biāo)函數(shù)為:=舊工一*logQQ) +嘰Lg(l - D(G(z).G tJ對于D而言要盡量使公式最大化(識別能力強),而對于 G又想使之最小(生成的數(shù)據(jù)接近實際數(shù)據(jù))。整個訓(xùn)練是一個迭代過程。其實極小極大化博弈可以分開理解,即在給定 G的情況下先最大化 V(D,G)而取D,然后固定D, 并最小化V(D,G)而得到Go其中,給定G,最大化V(D,G)評估了 Pg和 Pdata之間的差異或距離。最后,我們可以將最優(yōu)化問題

5、表達(dá)為:G. 理向心/。方)理論推導(dǎo)3.1知識預(yù)備一KL散度要進(jìn)行接下來的理論推導(dǎo).掰盾先需要一點預(yù)備知識,KL散段(KL divergence ),這是統(tǒng)計中的一個覆念.是r星兩種吸率分布的相 似程度,其建小表示網(wǎng)種柢率分布越接近.對于總敵的概率分布,定義如下:以期|0一工口叫留對于連期概率分布,定義如下Dkl(P Q) = /)(幻修翳i*找們想耍將一個例機部通道T生成網(wǎng)絡(luò)(汨到一個和真的數(shù)據(jù)分布Pdaia(r)差不多的生成分布 人(明。)旦中的參數(shù)0 255? 絡(luò)的婁我決定的,我們號空找到e化伴pG(xe)和/%“)盡可獨按通Maximun Likelihood Estimation我們

6、從其實數(shù)據(jù)分布Pdata(x)里面取樣m個點,儲,/,,小 根據(jù)給翔0我(I何以計算如下的囁率及(洌.哪么生 成斌m個用竭08的似然(likelihood)就是:L一3*例 i-I我侑加翌仔的韋情就是找列&至H大化這個似然估計O - anctuax IT R;(, c arxinaxlog II %(,洌 i-i te=argmax 52 log (r1;fl)=arg max &%七(;州j arg max / /(x) log PG(x; O)dx - / %式力 log 幾在上面的推導(dǎo)中,我屏里特大化似然由敢L.若對似佼逑做取對嵌,肥么鴕桑II就能恁化為里E ,并且這TH程并不會改變最優(yōu)

7、 化的結(jié)聿.因此我們可I脂極大似然估計化為求令kgR;(j:6)期里最大化的。.向朗空Ek)年(1;6)可以展開為在工上的快分形 式 f Efrj(x) log Pa(x;0)dx.又因為該M優(yōu)化過程是行對9的.所以我們添加一項不含e的積分并不fiflW訛翅,田可添加log、(*)/1添加 該積分后.我何以合并這兩個失分并存*類似KI前物詡式.該過的下: ag max /入匕噂 A匕3(*)-NgmEKL(Pj(“川心(&)這年在前面添7L個負(fù)號 將log干面的分?jǐn)呈恳幌?就變成了KL散層: 而外(工冶)如何算出來呢?%(1) - /小川)加上時*二里面的I去示示酶妓,也就會:Jo G(”工

8、以 X1 G(z) = x這特我們?nèi)諏嵏緵]辦法求出這個pcx)出土,這就是生成糖現(xiàn)建本想法.3.2 Global Optimality of p(f =下面,豆(焉要證明:該片優(yōu)化何軸唯一隹G并且該唯一解滿足Pa Pdala.Basic Idea of GAN生 5G:G是一個生成器.給走先蛉分在片優(yōu)生存到生城分布心(工),這里短迤通也畛似然估計耳到*崛富D:D是一個科做,充南是P(M 與凡必(工)之間的差不.這呈閑來取代極大蝗詁估計政玻喝在板MR大博弈的第一步中,給定生成器G ,最大化V(D, G)而得出最優(yōu)判削器Do其中,或人化V(D. G)評怙了 Pc和 外皿之郝I爰異或跑奇.因為在原

9、論文中價值函數(shù)可寫為在x上的枳分,即將數(shù)學(xué)期里層開為枳分形式:P(x)logD(x)dz | J p(z) log(l l)(G(z)dz=Jj&M l D(# 4 加(工)k電(1 例工)d2美于上兩枳分式的證明在GAN原論文中,T7T四?KB布很圣方法都不同,即生18 G不。隔足可送條件 Scott Rome認(rèn)為這一點,因為劉4中G就是不 可逆的.而很步證明宅已都期8 了法 點,fWfWI哪州饃地使用了枳分換元公式,而織分怏元又恰好至于G的可逆第K Scott認(rèn)為證明只汨 基于以下等式的施立性:. log(l- RG(z) = E所卻log(l -。(工)該吟式來源于測度論中的Radon

10、Nikodym定理有I明國程卷用了枳分隨訟式,但進(jìn)行空泄玩就必須計貶G(T).而G的迪麗沒有艇為存在,井目在呻絳網(wǎng)絡(luò)的實疑中,它也并不在 在.可闔這個方法在磯器學(xué)習(xí)和統(tǒng)計竽文獻(xiàn)中太常見了,因urn們3座了它.在數(shù)據(jù)給定,G給定的前提下. 臉(工)與PcM 都可以看作是常數(shù),我們可以分別用a,b耒表示他們,這樣我,麻可以得到如下 的式子:f(D) 01由。+ 6log(l - D)= ax(l-D)= bxDProposition 1. For G fixedt the optimal discriminator D isHT該彳優(yōu)的D在女心中并不是可計更的.但在數(shù)學(xué)上十分里航 我們并不應(yīng)S3先

11、驗的 心小工),所以我,口在VI穌中永遠(yuǎn)不會用到它. 另一方面,它的存在今我們可以證明給值為G是存在的.并且在川康中找們只點姿逼近D.星優(yōu)生忒H當(dāng)然GAN過程的目標(biāo)是令PG - 嘖1這對彳優(yōu)的D觸味后什么呢?我ff何以格這Tit代入DG.的表達(dá)式中:及意味若判刖器已0克全。了,它完全分辨不出Pdata和PO的區(qū)&J .暝斯樣本安自和PG的錢率為;基于這一觀點.GAN作者證明了 G就是極蛾大博棄的解.該定理如下:Theorem 1. The global minimum of the virtual training criterion C(G) is achieved if and only

12、if pg = Pdaia- Ai that point. C(G) achieves the value - log 4.即當(dāng)目僅當(dāng)Pc- Pdata,訓(xùn)緣昧準(zhǔn)C(G) - max V(G9D)的可以達(dá)到最優(yōu).以上定理fl網(wǎng)大極A.求令V(G, ZT)船J的生成餐G (N中ZT代而配加9判則修).之所以當(dāng)Pc三 為皿 可以令 價值就鼓最小化,是因為這時財個分布的JS R5LS JSDtPdaMWPaix)等于跖 這一過程的詳細(xì)解超原論文中的這理是當(dāng)且僅當(dāng)聲明,所以倒穴要從兩個方向遭隊 首先我們先從反向逼近開證明C(G)的取值,然后再利用在 及向荻用的新知識從正向證明.設(shè)生=Pdata (反向

13、指預(yù)先知癡E優(yōu)條他并做推9 ),我們可I力爻向推出:V(G.D) (punMOOJug;)必?)=-。2 / z3 A -/2 / x(,)dr = -2咻2 = - 44談值JE全層最小值的怪造.因為它只有在Pg = P* 的時候才出見 倒現(xiàn)在需要從正向證明這一Hfi常常為量小但也就是同時滿 是當(dāng)J和僅當(dāng)J的條件.現(xiàn)在放棄Pc = Pj aoeis,對任意一個G.建們可以將上T求出的H優(yōu)#H8J35 D9代入到 C(G) = maxV(G,D)中:的/i(?。ㄖ幑ぃ贺?)內(nèi)理工.)山因為已知Iog4為全同會吸選值,麻”我們希望構(gòu)道某個僚以使方程式中出現(xiàn)Iog2.因此我f可以在抵個枳分中加上硒去k)g2 ,開 不上概也以示.這是一個十分常見并且不會改變等式的故學(xué)證明技【5 .因為本質(zhì)上髭們只JE在方例口上了 0.c-止2由1,) aM (京:匕,)3i+ MX(內(nèi)”黑曲j)也采用該技巧主要是希望麟構(gòu)建成含Ioq2 ffl JS的度的形式,上式化劣后可以得至蟻下方達(dá)式:C(G) - -log2 %”)+ Pd“a(H)dz+鬲端融十卬3 (log 2十叫p ) da國力1率電度的定義,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論