半?yún)?shù)回歸模型的廣義交互改進(jìn)

上傳人：1*** IP屬地：境外上傳時(shí)間：2023-11-25 格式：DOCX 頁(yè)數(shù)：4 大?。?9.44KB 積分：25 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

半?yún)?shù)回歸模型的廣義交互改進(jìn)

在醫(yī)學(xué)科學(xué)研究數(shù)據(jù)的統(tǒng)計(jì)分析過(guò)程中，參數(shù)回歸模型的一些假設(shè)是不完全滿足的。例如，反應(yīng)變量與解釋變量之間的具體依存關(guān)系不明確，反應(yīng)變量的分布難以確定。此時(shí),參數(shù)回歸模型難以進(jìn)行擬合處理,而非參數(shù)回歸模型則能進(jìn)行有效的分析。簡(jiǎn)單的非參數(shù)回歸模型研究的是反應(yīng)變量Y與單一解釋變量t的依存關(guān)系,它能夠解決醫(yī)學(xué)與衛(wèi)生研究工作中的許多重要問(wèn)題,但是,在實(shí)際工作中,有許多事物或現(xiàn)象受多個(gè)變量的影響,因此,需要研究多個(gè)變量間的相互關(guān)系。經(jīng)典統(tǒng)計(jì)模型在研究受多個(gè)解釋變量影響的依存關(guān)系時(shí)常常采用多重回歸,而多重回歸的更一般模型即為線性模型:yi=x′iβ+εi,為了放寬該線性模型中的某一個(gè)解釋變量的線性假定,使模型在假定方面具有較強(qiáng)的適應(yīng)性,本文對(duì)半?yún)?shù)回歸模型進(jìn)行了研究?；貧w系數(shù)向量的估計(jì)假定對(duì)每一個(gè)觀察值yi,有p+1個(gè)解釋變量,其中p維向量xi和數(shù)量變量t,如果反應(yīng)變量y線性相關(guān)于解釋變量x,則有以下模型yi=x′iβ+g(ti)+εi(1)yi=x′iβ+g(ti)+εi(1)其中β為未知的p維回歸系數(shù)向量,g(t)為未知的光滑函數(shù)(如光滑樣條),x為線性變量,t為樣條變量,ε與(x,t)相互獨(dú)立,且E(ε)=0,V(ε)=σ2(未知),顯然,xi不含常數(shù)1,常數(shù)項(xiàng)可以包含在g(t)中,則以上模型被稱為半?yún)?shù)回歸模型(semiparametricregressionmodel)。半?yún)?shù)回歸模型可通過(guò)懲罰最小二乘方法進(jìn)行求解,β和g(t)的估計(jì)使得以下加權(quán)懲罰平方和最小Sw(β,g)=n∑i=1wi{yi-x′iβ-g(ti)}2+α∫g″(t)2dt(2)Sw(β,g)=∑i=1nwi{yi?x′iβ?g(ti)}2+α∫g′′(t)2dt(2)其中光滑參數(shù)α>0,wi>0,不加權(quán)時(shí),可令wi=1。令Y=(y1,…,yn)′,W=diag(w1,…,wn),X為n×p階矩陣,其第i行為x′i,為了考慮相持情況,假定t1,t2,…,tn可由s1,s2,…,sq來(lái)表示,表示它們之間關(guān)系的矩陣叫關(guān)聯(lián)矩陣(incidencematrix),用N來(lái)表示,N為n×q階矩陣,其元素為Nij,當(dāng)ti=sj時(shí),Nij=1,否則,Nij=0。假定點(diǎn)ti不全相同,則q≥2。令αj=g(sj),j=1,2,…,q。則待估計(jì)向量g為(α1,α2,…,αq)′。同理,假定s1<s2<…<sq,而且αj=g(sj),則可以定義兩個(gè)矩陣Q和R,只不過(guò)要用s1,s2,…,sq來(lái)代替t1,t2,…,tn。令K=QR-1Qt,則∫g″(s)2ds=g′Kg。若用矩陣符號(hào)來(lái)表示Sw(β,g),則Sw(β,g)=(Y-Xβ-Ng)′W(Y-Xβ-Ng)+αg′Kg(3)當(dāng)β和g為以下分塊矩陣方程的解時(shí),上式取最小值。[X′WXX′WΝΝ′WXΝ′WΝ+αΚ](βg)=[X′Ν′]WY(4)方程(4)是一個(gè)(p+q)元方程組,直接解方程組不方便,也很不實(shí)際,實(shí)際工作中,一般將方程(4)化為以下形式X′WXβ=X′W(Y-Ng)(5)(N′WN+αK)g=N′W(Y-Xβ)(6)求解時(shí)可采用不需迭代的直接法(directmethod)進(jìn)行求解。由(6)可得:Ng=S(Y-Xβ)(7)其中S=N(N′WN+αK)-1N′W,(Ng)i=g(ti)。將(7)代入(5),化簡(jiǎn)得X′W(I-S)Xβ=X′W(I-S)Y(8)這是廣義最小二乘正規(guī)方程組,用來(lái)估計(jì)β,加權(quán)矩陣為非對(duì)角陣W(I-S),解得β后,就可通過(guò)(7)求得g和Ng,因此,可得到光滑曲線g(t)。對(duì)于回歸系數(shù)向量β的估計(jì)值,可進(jìn)行假設(shè)檢驗(yàn),β=(β1,β2,…,βp)′。檢驗(yàn)假設(shè)為H0:βi=0,i=1,2,…,p備擇假設(shè)為H1:βi≠0,α=0.05檢驗(yàn)統(tǒng)計(jì)量為t=?βi√Cii?σ2(9)其中Cii表示(X′W(I-S)X)-1的對(duì)角線上第i個(gè)元素,?σ2=n∑i=1(yi-?yi)2tr{Ι-A}?A為帽子陣。A=S+(I-S)X{X′W(I-S)X}-1X′W(I-S)(10)當(dāng)H0成立時(shí),t～tυ,υ=tr{I-A}。在半?yún)?shù)回歸模型中,對(duì)于光滑參數(shù)的自動(dòng)選擇需要計(jì)算廣義交互有效GCV(generalizedcross-validation)得分函數(shù)。GCV得分函數(shù)為GCV(α)=n∑i=1wi(yi-?yi)2(1-n-1trA)2(11)其中trA=trS+tr[{X′W(I-S)X}-1X′W(I-S)2X]。另外,半?yún)?shù)模型的誤差自由度EDF=tr{I-A}=n-trA,均方差MSE=n∑i=1(yi-?yi)2tr{Ι-A},殘差平方和SSE=n∑i=1(yi-?yi)2,令ˉy=1nn∑i=1yi,則擬合優(yōu)度R2=1-SSEn∑i=1(yi-ˉy)2。本文利用6.11版SAS軟件的IML模塊進(jìn)行編程來(lái)實(shí)現(xiàn)以上分析過(guò)程?；貧w模型的建立為說(shuō)明半?yún)?shù)模型的擬合效果,本文用SAS程序進(jìn)行模擬抽樣實(shí)驗(yàn),取p=2,n=60,t由1變化到60,x1～N(12.66,2.572),x2～N(6.7,1.872),誤差項(xiàng)ε相互獨(dú)立且服從分布N(0.52),y=3.4x1-5.2x2+0.1(t-30)2+30.2+ε,則用SAS模擬抽樣程序可得到一個(gè)樣本模擬數(shù)據(jù)(表1)。如果假定y與x1,x2存在線性依存關(guān)系,對(duì)該數(shù)據(jù)人為地進(jìn)行參數(shù)線性模型擬合,則可以得到回歸方程:?y=49.0545+0.1282t+4.4925x1-6.0078x2,雖然該回歸方程有意義(P≈0.0005),但擬合效果差,SSE=45494.6052,R2=0.2692,誤差均方為812.4037,從下面的圖1可知,殘差與t之間存在二次曲線趨勢(shì),即殘差中仍然蘊(yùn)含有用的回歸信息。如果采用半?yún)?shù)回歸模型進(jìn)行擬合,則計(jì)算得到的α值為148.75,x1和x2的回歸系數(shù)分別為3.7976和-5.2356,標(biāo)準(zhǔn)誤分別為0.2385和0.2958,檢驗(yàn)結(jié)果均有顯著意義(P<0.01),SSE=980.6252,MSE=19.2357,R2=0.9842,模型擬合的殘差情況見(jiàn)圖2,由上述計(jì)算結(jié)果和圖2可以看出,半?yún)?shù)模型的擬合效果得到大大提高,并且正確地反映了y與t的關(guān)系?；緮?shù)學(xué)模型的基本思想半?yún)?shù)回歸模型可看作是參數(shù)線性模型和非參數(shù)回歸模型的混合模型,半?yún)?shù)回歸模型較參數(shù)線性模型有較強(qiáng)的適應(yīng)性。由于實(shí)際工作中經(jīng)常會(huì)遇到某個(gè)變量有影響,但表現(xiàn)為未知函數(shù)的情況,因此,半?yún)?shù)回歸模型是線性模型的一個(gè)擴(kuò)展,它放寬了線性模型中的某一個(gè)解釋變量的線性假定,使模型適應(yīng)數(shù)據(jù)變化的能力更強(qiáng)。實(shí)際應(yīng)用半?yún)?shù)回歸模型時(shí),反應(yīng)變量線性相關(guān)于線性變量應(yīng)以專業(yè)理論知識(shí)或以往經(jīng)驗(yàn)為依據(jù),樣條變量t的處理不同于其他線性變量,它是采用非參數(shù)的形式進(jìn)行處理。方程(4)是一個(gè)(p+q)元方程組,多元方程組的解法很多,但直接解方程組不方便,也很不實(shí)際,實(shí)際工作中,也可采用backfitting方法求解方程組,backfitting是一個(gè)迭代求解的方法,它在上述二個(gè)方程(5)和(6)之間交替迭代求解,直至收斂為止。該方法的收斂速度取決于α的大小以及有關(guān)矩陣的特征值的大小,雖然該矩陣特征值的絕對(duì)值都小于1,最終也會(huì)收斂,但實(shí)際應(yīng)用中,經(jīng)常發(fā)生最大特征值很接近于1,從

人人文庫(kù)> 全部分類> 專業(yè)文獻(xiàn) > 學(xué)術(shù)論文

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

半?yún)?shù)回歸模型的廣義交互改進(jìn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

半?yún)?shù)回歸模型的廣義交互改進(jìn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔