一元非參數(shù)回歸-(非參數(shù)統(tǒng)計(jì))_第1頁
一元非參數(shù)回歸-(非參數(shù)統(tǒng)計(jì))_第2頁
一元非參數(shù)回歸-(非參數(shù)統(tǒng)計(jì))_第3頁
一元非參數(shù)回歸-(非參數(shù)統(tǒng)計(jì))_第4頁
一元非參數(shù)回歸-(非參數(shù)統(tǒng)計(jì))_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

參數(shù)回來與非參數(shù)回來的優(yōu)缺點(diǎn)比較:參數(shù)回來:優(yōu)點(diǎn):(1).模型形式簡潔明確,僅由一些參數(shù)表達(dá)(2).在經(jīng)濟(jì)中,模型的參數(shù)具有一般都具有明確的經(jīng)濟(jì)含義(3).當(dāng)模型參數(shù)假設(shè)成立,統(tǒng)計(jì)推斷的精度較高,能經(jīng)受實(shí)際檢驗(yàn)(4).模型能夠進(jìn)行外推運(yùn)算(5).模型可以用于小樣本的統(tǒng)計(jì)推斷缺點(diǎn):(1).回來函數(shù)的形式預(yù)先假定(2).模型限制較多:一般要求樣本滿足某種分布要求,隨機(jī)誤差滿足正態(tài)假設(shè),說明變量間獨(dú)立,說明變量與隨機(jī)誤差不相關(guān),等(3)須要對模型的參數(shù)進(jìn)行嚴(yán)格的檢驗(yàn)推斷,步驟較多(4).模型泛化實(shí)力弱,缺乏穩(wěn)健性,當(dāng)模型假設(shè)不成立,擬合效果不好,須要修正或者甚至更換模型非參數(shù)回來:優(yōu)點(diǎn):(1)回來函數(shù)形式自由,受約束少,對數(shù)據(jù)的分布一般不做任何要求(2)適應(yīng)實(shí)力強(qiáng),穩(wěn)健性高,回來模型完全由數(shù)據(jù)驅(qū)動(3)模型的精度高;(4)對于非線性、非齊次問題,有特殊好的效果缺點(diǎn):(1)不能進(jìn)行外推運(yùn)算,(2)估計(jì)的收斂速度慢(3)一般只有在大樣本的狀況下才能得到很好的效果,而小樣本的效果較差(4)高維詛咒,光滑參數(shù)的選取一般較困難非參數(shù)回來方法樣條光滑正交回來核回來:N-W估計(jì)、P-C估計(jì)、G-M估計(jì)(9.1)局部多項(xiàng)式回來:線性、多項(xiàng)式(9.2)光滑樣條:光滑樣條、B樣條近鄰回來:k-NN、k近鄰核、對稱近鄰(9.4)正交級數(shù)光滑(9.5)穩(wěn)健回來:LOWESS、L光滑、R光滑、M光滑----------(9.3)局部回來Fourier級數(shù)光滑wavelet光滑處理高維的非參數(shù)方法:多元局部回來、薄片樣條、可加模型、投影尋蹤、回來樹、張量積,等3核函數(shù)K:函數(shù)K(.)滿足:常見的核函數(shù):Parzen核:Gaussian核:Epanechnikov核:tricube核:為示性函數(shù)4回來模型:(1)模型為隨機(jī)設(shè)計(jì)模型,樣本觀測(Xi,Yi)~iid(2)模型為固定設(shè)計(jì)模型Xi為R中n個試驗(yàn)點(diǎn)列,i=1,2,…,nYi為固定Xi的n次獨(dú)立觀測,i=1,2,…,nm(x)為為一未知函數(shù),用一些方法來擬合定義:線性光滑(linearsmoother)5光滑參數(shù)的選取風(fēng)險(均方誤差)

(meansquarederror,MSE)志向的狀況是希望選擇合適的光滑參數(shù)h,使得通過樣本數(shù)據(jù)擬合的回來曲線能夠最好的靠近真實(shí)的回來曲線(即達(dá)到風(fēng)險最小),這里真實(shí)回來函數(shù)m(x)一般是未知的。可能會想到用平均殘差平方和來估計(jì)風(fēng)險R(h)但是這并不是一個好的估計(jì),會導(dǎo)致過擬合(欠光滑),緣由在于兩次利用了數(shù)據(jù),一次估計(jì)函數(shù),一次估計(jì)風(fēng)險。我們選擇的函數(shù)估計(jì)就是使得殘差平方和達(dá)到最小,因此它傾向于低估了風(fēng)險。是

的估計(jì),h是光滑參數(shù),稱為帶寬或窗寬6光滑參數(shù)的選取缺一交叉驗(yàn)證方法(leave-one-outcrossvalidation,CV)這里是略去第i個數(shù)據(jù)點(diǎn)后得到的函數(shù)估計(jì)交叉驗(yàn)證的直觀意義:因此:7光滑參數(shù)的選取定理:若那么缺一交叉驗(yàn)證得分

能夠?qū)懗桑哼@里是光滑矩陣L的第i個對角線元素廣義交叉驗(yàn)證(generalizedcross-validation,GCV)其中:為有效自由度8光滑參數(shù)的選取其他標(biāo)準(zhǔn)(1)干脆插入法(DirectPlug-In,DPI)相關(guān)文獻(xiàn)可以參考:

WolfgangH?rdle(1994),AppliedNonparametricRegression,BerlinJeffreyD.Hart(1997),NonparametricSmoothingandLack-of-FitTests,SpringerSeriesinStatistics李竹渝、魯萬波、龔金國(2007),經(jīng)濟(jì)、金融計(jì)量學(xué)中的非參數(shù)估計(jì)技術(shù),科學(xué)出版社,北京

吳喜之譯(2008),現(xiàn)代非參數(shù)統(tǒng)計(jì),科學(xué)出版社,北京

(2)罰函數(shù)法(penalizingfunction)(3)單邊交叉驗(yàn)證(OneSidedCrossValidation,OSCV)(4)拇指規(guī)則(RuleOfThumb)99.1.核回來(核光滑)模型N-W估計(jì)是一種簡潔的加權(quán)平均估計(jì),可以寫成線性光滑:局部回來由Nadaraya(1964)和Watson(1964)分別提出,(1)N-W估計(jì)形式:其中:,為核函數(shù),為帶寬或窗寬10局部回來(2)G-M估計(jì)由GasserandMüller(1979)提出,形式如下:其中寫成線性光滑的形式:11局部回來核估計(jì)存在邊界效應(yīng),邊界點(diǎn)的估計(jì)偏差較大,以N-W估計(jì)為例,如下圖12局部回來一般,核函數(shù)的選取并不是很重要,重要的是帶寬的選取13局部回來一般,核函數(shù)的選取并不是很重要,重要的是帶寬的選取14局部回來一般,核函數(shù)的選取并不是很重要,重要的是帶寬的選取可以看到:擬合曲線的光滑度受到光滑參數(shù)h變更的影響15局部回來核估計(jì)的漸近方差核漸近偏差核估計(jì)漸近偏差漸近方差N-W估計(jì)

G-M估計(jì)

其中,h為光滑參數(shù),f為X的密度函數(shù),且16局部回來9.2.局部多項(xiàng)式回來多項(xiàng)式的回來模型其中可由最小二乘法估計(jì),即局部多項(xiàng)式回來:對m(x)在u處進(jìn)行p階泰勒綻開,略去p階高階無窮小量,得到m(x)在u處的一個p階多項(xiàng)式近似,即此時,x應(yīng)當(dāng)靠近u,且17局部回來通過最小二乘來估計(jì)系數(shù)留意:是在x的一個鄰域內(nèi)進(jìn)行多項(xiàng)式估計(jì),因此,最小二乘應(yīng)當(dāng)與x的鄰域有關(guān)局部加權(quán)平方和:使上述問題最小化,可以得到系數(shù)的局部多項(xiàng)式的最小二乘估計(jì)可以很簡潔得到,取p=0時為局部常數(shù)估計(jì),即N-W核估計(jì)取p=1,為局部線性估計(jì)18局部回來寫成矩陣形式:使上式最小化,可以得到系數(shù)的估計(jì)其中19局部回來得到加權(quán)最小二乘估計(jì)當(dāng)p=1時(局部線性估計(jì))的漸近偏差和漸近方差其中可以看到局部線性回來的漸近方差和N-W估計(jì)相同,而漸近偏差卻比N-W回來小,說明局部線性多項(xiàng)式可以削減邊界效應(yīng),局部線性估計(jì)由于N-W估計(jì)20局部回來局部多項(xiàng)式光滑可以很好的削減邊界效應(yīng)21局部回來檢驗(yàn)函數(shù)(Doppler函數(shù))22局部回來運(yùn)用GCV選取最優(yōu)帶寬h=0.017,權(quán)函數(shù)為tricube核函數(shù)23局部回來運(yùn)用GCV選取最優(yōu)帶寬h=0.017,權(quán)函數(shù)為tricube核函數(shù)24局部回來9.4.近鄰光滑(1)k-NN回來(k-nearestneighborregression)其中={i:xi是離x最近的k個觀測值之一}K-NN估計(jì)的漸近偏差和漸近方差:對于隨機(jī)設(shè)計(jì)模型,近鄰估計(jì)寫成線性光滑器的形式權(quán)函數(shù):25局部回來(1)k-NN回來(k-nearestneighborregression)26局部回來(1)k-NN回來(k-nearestneighborregression)27局部回來(2)k-近鄰核回來K近鄰核估計(jì)的權(quán)重其中R為xi中離x最近的第k個距離,K為核函數(shù)漸近偏差和漸近方差:28局部回來(2)k-近鄰核回來29局部回來(2)k-近鄰核回來30局部回來9.3.穩(wěn)健光滑(1)局部加權(quán)描點(diǎn)光滑(LocallyWeightedScatterplotSmoothing,LOWESS)Step1:在x的鄰域內(nèi),用一個多項(xiàng)式進(jìn)行擬合,求出系數(shù){βj}其中wi(x,k)為k-N

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論