hsic公式轉(zhuǎn)為矩陣形式_第1頁(yè)
hsic公式轉(zhuǎn)為矩陣形式_第2頁(yè)
hsic公式轉(zhuǎn)為矩陣形式_第3頁(yè)
hsic公式轉(zhuǎn)為矩陣形式_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

hsic公式轉(zhuǎn)為矩陣形式HSIC公式的矩陣形式簡(jiǎn)介HSIC(HilbertSchmidtIndependenceCriterion)是一種用于衡量?jī)蓚€(gè)變量之間相互獨(dú)立程度的方法,常用于非線性數(shù)據(jù)的相關(guān)性分析。它是由Gretton等人在2005年提出的。HSIC的公式涉及到內(nèi)積和核函數(shù)等數(shù)學(xué)概念,為了方便處理,可以將其轉(zhuǎn)化為矩陣形式,便于計(jì)算和分析。本文將介紹HSIC公式的矩陣形式推導(dǎo)過(guò)程、應(yīng)用以及注意事項(xiàng)。HSIC公式及其推導(dǎo)假設(shè)有兩個(gè)隨機(jī)變量$X$和$Y$,它們的樣本集分別為$\{\mathbf{x}_1,\mathbf{x}_2,...,\mathbf{x}_n\}$和$\{\mathbf{y}_1,\mathbf{y}_2,...,\mathbf{y}_n\}$,其中$\mathbf{x}_i$和$\mathbf{y}_i$分別為$X$和$Y$的第$i$個(gè)樣本,假設(shè)$X$和$Y$的期望為零。HSIC的公式為:$$HSIC(X,Y)=\frac{1}{n^2}\text{tr}(K_XHK_YH)$$其中$K_X$和$K_Y$分別為$X$和$Y$的Gram矩陣,$H=I_n-\frac{1}{n}\mathbf{1}_n\mathbf{1}^T_n$是中心化矩陣,$\mathbf{1}_n$是$n$維全$1$向量,$I_n$是$n$維單位矩陣,$\text{tr}(\cdot)$表示矩陣的跡。對(duì)于任意兩個(gè)向量$\mathbf{x}$和$\mathbf{y}$,它們的內(nèi)積可以表示為$\langle\mathbf{x},\mathbf{y}\rangle=\mathbf{x}^T\mathbf{y}$,稱為$\mathbf{x}$和$\mathbf{y}$的標(biāo)準(zhǔn)內(nèi)積。接下來(lái),我們將根據(jù)上述公式推導(dǎo)HSIC的矩陣形式。首先,定義矩陣$\mathbf{X}=[\mathbf{x}_1\\mathbf{x}_2\...\\mathbf{x}_n]$和矩陣$\mathbf{Y}=[\mathbf{y}_1\\mathbf{y}_2\...\\mathbf{y}_n]$,它們的維度為$d\timesn$,其中$d$為樣本的維度。然后,定義矩陣$\mathbf{K}_X=[k(\mathbf{x}_i,\mathbf{x}_j)]_{n\timesn}$和$\mathbf{K}_Y=[k(\mathbf{y}_i,\mathbf{y}_j)]_{n\timesn}$,它們的維度為$n\timesn$,其中$k(\cdot,\cdot)$為核函數(shù),表示兩個(gè)樣本之間的相似度,一般常用的核函數(shù)有高斯核、線性核、多項(xiàng)式核等。接下來(lái),我們利用矩陣的性質(zhì)將HSIC的公式轉(zhuǎn)化為矩陣形式。首先,將$K_X$和$K_Y$分別加以列均值和行均值,得到矩陣$\hat{K}_X=H\mathbf{K}_XH$和$\hat{K}_Y=H\mathbf{K}_YH$,它們的維度仍為$n\timesn$。此處我們利用了中心化矩陣的性質(zhì):對(duì)于任意矩陣$\mathbf{A}$,$H\mathbf{A}H$即為$\mathbf{A}$的列均值和行均值之差矩陣。然后,定義矩陣$\mathbf{L}=\text{vec}(\mathbf{X})$和$\mathbf{M}=\text{vec}(\mathbf{Y})$,它們的維度為$nd\times1$,其中$\text{vec}(\cdot)$表示矩陣的列向量化操作,即將矩陣按列展開(kāi)成一個(gè)向量。接下來(lái),定義矩陣$\mathbf{A}=(\mathbf{I}_n\otimes\mathbf{L})\mathbf{A}(\mathbf{I}_n\otimes\mathbf{M})^T$,其中$\otimes$表示Kronecker積,$\mathbf{I}_n$為$n$維單位矩陣,$\mathbf{A}$為$n\timesn$對(duì)稱矩陣,它的元素均為$1$,表示每個(gè)樣本的權(quán)重都相等。最后,定義矩陣$\mathbf{K}=\text{vec}(\hat{K}_X)$和$\mathbf{L}=\text{vec}(\hat{K}_Y)$,它們的維度也為$nd\times1$,即將$\hat{K}_X$和$\hat{K}_Y$分別按列展開(kāi)成向量。則HSIC的矩陣形式為:$$HSIC(X,Y)=\frac{1}{n^2}\mathbf{A}^T\mathbf{K}\mathbf{A}$$HSIC的應(yīng)用HSIC可以用于衡量?jī)蓚€(gè)變量之間的非線性相關(guān)性,常用于圖像處理、生物信息學(xué)、金融風(fēng)險(xiǎn)分析等領(lǐng)域。在圖像處理領(lǐng)域,HSIC可以用于圖像的內(nèi)容分析、相似性搜索等任務(wù),在生物信息學(xué)領(lǐng)域,HSIC可以用于基因選擇、蛋白質(zhì)配對(duì)等任務(wù)。除此之外,HSIC還可以用于數(shù)據(jù)的降維和特征選擇,可以通過(guò)求解HSIC的最大值來(lái)選擇和目標(biāo)變量具有最大相關(guān)性的變量。HSIC的注意事項(xiàng)在使用HSIC時(shí),需要注意一些問(wèn)題:1.核函數(shù)的選擇:不同的核函數(shù)適用于不同的數(shù)據(jù)類型和數(shù)據(jù)分布,需要根據(jù)實(shí)際情況選擇合適的核函數(shù)進(jìn)行計(jì)算和分析。2.樣本數(shù)量的大小:HSIC對(duì)樣本數(shù)量的要求較高,一般至少需要有$100$個(gè)以上的樣本才能獲得可靠的結(jié)果。3.維數(shù)的大?。篐SIC對(duì)數(shù)據(jù)維數(shù)的要求也較高,如果維數(shù)過(guò)高,會(huì)導(dǎo)致運(yùn)算困難和過(guò)擬

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論