版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
非參數(shù)回歸的介紹第一頁,共六十一頁,2022年,8月28日參數(shù)回歸與非參數(shù)回歸的優(yōu)缺點比較:參數(shù)回歸:非參數(shù)回歸:優(yōu)點:(1).模型形式簡單明確,僅由一些參數(shù)表達(2).在經(jīng)濟中,模型的參數(shù)具有一般都具有明確的經(jīng)濟含義(3).當(dāng)模型參數(shù)假設(shè)成立,統(tǒng)計推斷的精度較高,能經(jīng)受實際檢驗(4).模型能夠進行外推運算(5).模型可以用于小樣本的統(tǒng)計推斷缺點:(1).回歸函數(shù)的形式預(yù)先假定(2).模型限制較多:一般要求樣本滿足某種分布要求,隨機誤差滿足
正態(tài)假設(shè),解釋變量間獨立,解釋變量與隨機誤差不相關(guān),等(3)需要對模型的參數(shù)進行嚴(yán)格的檢驗推斷,步驟較多(4).模型泛化能力弱,缺乏穩(wěn)健性,當(dāng)模型假設(shè)不成立,擬合效果
不好,需要修正或者甚至更換模型優(yōu)點;(1)回歸函數(shù)形式自由,受約束少,對數(shù)據(jù)的分布一般不做任何要求(2)適應(yīng)能力強,穩(wěn)健性高,回歸模型完全由數(shù)據(jù)驅(qū)動(3)模型的精度高;(4)對于非線性、非齊次問題,有非常好的效果缺點:(1)不能進行外推運算,(2)估計的收斂速度慢(3)一般只有在大樣本的情況下才能得到很好的效果,
而小樣本的效果較差(4)高維詛咒,光滑參數(shù)的選取一般較復(fù)雜2第二頁,共六十一頁,2022年,8月28日非參數(shù)回歸方法樣條光滑正交回歸核回歸:N-W估計、P-C估計、G-M估計局部多項式回歸:線性、多項式光滑樣條:光滑樣條、B樣條近鄰回歸:k-NN、k近鄰核、對稱近鄰正交級數(shù)光滑穩(wěn)健回歸:LOWESS、L光滑、R光滑、M光滑局部回歸Fourier級數(shù)光滑wavelet光滑處理高維的非參數(shù)方法:多元局部回歸、薄片樣條、
可加模型、投影尋蹤、
回歸樹、張量積,等3第三頁,共六十一頁,2022年,8月28日核函數(shù)K:函數(shù)K(.)滿足:常見的核函數(shù):Boxcar核:Gaussian核:Epanechnikov核:tricube核:為示性函數(shù)4第四頁,共六十一頁,2022年,8月28日回歸模型:(1)模型為隨機設(shè)計模型,樣本觀測(Xi,Yi)~iid(2)模型為固定設(shè)計模型Xi為R中n個試驗點列,i=1,2,…,nYi為固定Xi的n次獨立觀測,i=1,2,…,nm(x)為為一未知函數(shù),用一些方法來擬合定義:線性光滑器(linearsmoother)5第五頁,共六十一頁,2022年,8月28日光滑參數(shù)的選取風(fēng)險(均方誤差)
(meansquarederror,MSE)理想的情況是希望選擇合適的光滑參數(shù)h,使得通過樣本數(shù)據(jù)擬合的回歸曲線能夠最好的逼近真實的回歸曲線(即達到風(fēng)險最小),這里真實回歸函數(shù)m(x)一般是未知的。
可能會想到用平均殘差平方和來估計風(fēng)險R(h)但是這并不是一個好的估計,會導(dǎo)致過擬合(欠光滑),原因在于兩次利用了數(shù)據(jù),一次估計函數(shù),一次估計風(fēng)險。我們選擇的函數(shù)估計就是使得殘差平方和達到最小,因此它傾向于低估了風(fēng)險。是
的估計,h是光滑參數(shù),稱為帶寬或窗寬6第六頁,共六十一頁,2022年,8月28日光滑參數(shù)的選取缺一交叉驗證方法(leave-one-outcrossvalidation,CV)這里是略去第i個數(shù)據(jù)點后得到的函數(shù)估計交叉驗證的直觀意義:因此:7第七頁,共六十一頁,2022年,8月28日光滑參數(shù)的選取定理:若那么缺一交叉驗證得分
能夠?qū)懗桑哼@里是光滑矩陣L的第i個對角線元素廣義交叉驗證(generalizedcross-validation,GCV)其中:為有效自由度8第八頁,共六十一頁,2022年,8月28日光滑參數(shù)的選取其他標(biāo)準(zhǔn)(1)直接插入法(DirectPlug-In,DPI)相關(guān)文獻可以參考:
WolfgangH?rdle(1994),AppliedNonparametricRegression,BerlinJeffreyD.Hart(1997),NonparametricSmoothingandLack-of-FitTests,SpringerSeriesinStatistics李竹渝、魯萬波、龔金國(2007),經(jīng)濟、金融計量學(xué)中的非參數(shù)估計技術(shù),科學(xué)出版社,北京
吳喜之譯(2008),現(xiàn)代非參數(shù)統(tǒng)計,科學(xué)出版社,北京
(2)罰函數(shù)法(penalizingfunction)(3)單邊交叉驗證(OneSidedCrossValidation,OSCV)(4)拇指規(guī)則(RuleOfThumb)9第九頁,共六十一頁,2022年,8月28日1.核回歸(核光滑)N-W估計是一種簡單的加權(quán)平均估計,可以寫成線性光滑器:局部回歸由Nadaraya(1964)和Watson(1964)分別提出,(1)N-W估計形式:其中:,為核函數(shù),為帶寬或窗寬10第十頁,共六十一頁,2022年,8月28日局部回歸(2)P-C-估計由Priestley
andChao(1972)提出,形式:寫成線性光滑器的形式:在隨機設(shè)計模型下,P-C估計可由x的密度估計:推導(dǎo)出來,相關(guān)文獻可參考h?rdle(1994)和李竹渝等(2007)11第十一頁,共六十一頁,2022年,8月28日局部回歸(3)G-M估計由GasserandMüller(1979)提出,形式如下:其中寫成線性光滑器的形式:G-M估計是卷積形式的估計,P-C估計可看成G-M估計的近似:當(dāng)K連續(xù)12第十二頁,共六十一頁,2022年,8月28日局部回歸核估計存在邊界效應(yīng),邊界點的估計偏差較大,以N-W估計為例,如下圖13第十三頁,共六十一頁,2022年,8月28日局部回歸一般,核函數(shù)的選取并不是很重要,重要的是帶寬的選取14第十四頁,共六十一頁,2022年,8月28日局部回歸一般,核函數(shù)的選取并不是很重要,重要的是帶寬的選取15第十五頁,共六十一頁,2022年,8月28日局部回歸一般,核函數(shù)的選取并不是很重要,重要的是帶寬的選取可以看到:擬合曲線的光滑度受到光滑參數(shù)h變化的影響16第十六頁,共六十一頁,2022年,8月28日局部回歸核估計的漸近方差核漸近偏差核估計漸近偏差漸近方差N-W估計
G-M估計
其中,h為光滑參數(shù),f為X的密度函數(shù),且17第十七頁,共六十一頁,2022年,8月28日局部回歸
2.局部多項式光滑多項式的回歸模型其中可由最小二乘法估計,即局部多項式回歸:對m(x)在u處進行p階泰勒展開,略去p階高階無窮小量,得到m(x)在u處的一個p階多項式近似,即此時,x應(yīng)該靠近u,且18第十八頁,共六十一頁,2022年,8月28日局部回歸通過最小二乘來估計系數(shù)注意:是在x的一個鄰域內(nèi)進行多項式估計,因此,最小二乘應(yīng)該與x的鄰域有關(guān)局部加權(quán)平方和:使上述問題最小化,可以得到系數(shù)的局部多項式的最小二乘估計可以很容易得到,取p=0時為局部常數(shù)估計,即N-W核估計取p=1,為局部線性估計19第十九頁,共六十一頁,2022年,8月28日局部回歸寫成矩陣形式:使上式最小化,可以得到系數(shù)的估計其中20第二十頁,共六十一頁,2022年,8月28日局部回歸得到加權(quán)最小二乘估計當(dāng)p=1時(局部線性估計)的漸近偏差和漸近方差其中可以看到局部線性回歸的漸近方差和N-W估計相同,而漸近偏差卻比N-W回歸小,說明局部線性多項式可以減少邊界效應(yīng),局部線性估計由于N-W估計21第二十一頁,共六十一頁,2022年,8月28日局部回歸局部多項式光滑可以很好的減少邊界效應(yīng)22第二十二頁,共六十一頁,2022年,8月28日局部回歸檢驗函數(shù)(Doppler函數(shù))23第二十三頁,共六十一頁,2022年,8月28日局部回歸使用GCV選取最優(yōu)帶寬h=0.017,權(quán)函數(shù)為tricube核函數(shù)24第二十四頁,共六十一頁,2022年,8月28日局部回歸使用GCV選取最優(yōu)帶寬h=0.017,權(quán)函數(shù)為tricube核函數(shù)25第二十五頁,共六十一頁,2022年,8月28日局部回歸3.近鄰光滑(1)k-NN回歸(k-nearestneighborregression)其中={i:xi是離x最近的k個觀測值之一}K-NN估計的漸近偏差和漸近方差:對于隨機設(shè)計模型,近鄰估計寫成線性光滑器的形式權(quán)函數(shù):26第二十六頁,共六十一頁,2022年,8月28日局部回歸(1)k-NN回歸(k-nearestneighborregression)27第二十七頁,共六十一頁,2022年,8月28日局部回歸(1)k-NN回歸(k-nearestneighborregression)28第二十八頁,共六十一頁,2022年,8月28日局部回歸(2)k-近鄰核回歸K近鄰核估計的權(quán)重其中R為xi中離x最近的第k個距離,K為核函數(shù)漸近偏差和漸近方差:29第二十九頁,共六十一頁,2022年,8月28日局部回歸(2)k-近鄰核回歸30第三十頁,共六十一頁,2022年,8月28日局部回歸(2)k-近鄰核回歸31第三十一頁,共六十一頁,2022年,8月28日局部回歸(3)對稱化近鄰回歸(SymmetrizedNearestNeighborEstimate)Yang(1981),Stute(1984)研究了這種估計其中權(quán)重寫成線性光滑器這里的k(h)相當(dāng)于nh,可以看出實質(zhì)上相當(dāng)于nh個Yi值加權(quán)平均32第三十二頁,共六十一頁,2022年,8月28日局部回歸4.穩(wěn)健光滑(1)局部加權(quán)描點光滑(LocallyWeightedScatterplotSmoothing,LOWESS)Step1:在x的鄰域內(nèi),用一個多項式進行擬合,求出系數(shù){βj}其中Wki(x)為k-NN權(quán)Step2:根據(jù)殘差計算尺度估計,定義穩(wěn)健權(quán)重Step3:用新的權(quán)重
重復(fù)Step1、Step2,直到第N次結(jié)束33第三十三頁,共六十一頁,2022年,8月28日(1)局部加權(quán)描點光滑(LOWESS)局部回歸34第三十四頁,共六十一頁,2022年,8月28日(1)局部加權(quán)描點光滑(LOWESS)局部回歸35第三十五頁,共六十一頁,2022年,8月28日局部回歸(2)L-
光滑條件L函數(shù)其中
為條件分位數(shù)函數(shù)特別:a)當(dāng)
時b)當(dāng)
時,為中位數(shù)光滑其中={i:xi是離x最近的k個觀測值之一}36第三十六頁,共六十一頁,2022年,8月28日局部回歸(2)L-
光滑對于條件L函數(shù)其中用
來估計F(y|x)得到L-估計37第三十七頁,共六十一頁,2022年,8月28日局部回歸(3)M-
光滑(局部)最小二乘方法得到的光滑估計是通過考慮損失函數(shù)為二次函數(shù)得到的,現(xiàn)在考慮損失函數(shù)c較大時,為普通的二次損失函數(shù),c較小(≈1倍或2倍觀測誤差的標(biāo)準(zhǔn)差)可以獲得更多的穩(wěn)健性38第三十八頁,共六十一頁,2022年,8月28日局部回歸M-樣條(Cox,1983)核M-光滑(kernelM-smoother)(Hubber,1979;Silverman,1985)39第三十九頁,共六十一頁,2022年,8月28日局部回歸(3)R-光滑定義得分函數(shù)其中J是定義在(0,1)上的非減函數(shù),滿足J(1-s)=J(s)用來估計F(y|x),則
應(yīng)該粗略地接近0對于
,則ChengandCheng(1986)提出的R-估計:40第四十頁,共六十一頁,2022年,8月28日樣條回歸設(shè)m(x)在[a,b]連續(xù)可微,且二階導(dǎo)數(shù)平方可積考查形式其中為粗糙懲罰1.光滑樣條41第四十一頁,共六十一頁,2022年,8月28日樣條回歸定義一組樣條基函數(shù):注意,這里樣條基函數(shù)可以是其他樣條基
如:B樣條基(吳喜之譯(2008))樣條42第四十二頁,共六十一頁,2022年,8月28日樣條回歸將前面的優(yōu)化問題寫成矩陣形式:其中
上述問題的最優(yōu)解其中43第四十三頁,共六十一頁,2022年,8月28日樣條回歸下面的圖利用的是B樣條基函數(shù),44第四十四頁,共六十一頁,2022年,8月28日樣條回歸下面的圖利用的是B樣條基函數(shù),45第四十五頁,共六十一頁,2022年,8月28日樣條回歸下面的圖利用的是B樣條基函數(shù),46第四十六頁,共六十一頁,2022年,8月28日正交光滑1.正交多項式回歸回歸函數(shù)其中是正交基函數(shù),如Laguerre,Legendre正交多項式正交基滿足系數(shù)系數(shù)估計如47第四十七頁,共六十一頁,2022年,8月28日正交光滑回歸函數(shù)估計寫成線性光滑器:48第四十八頁,共六十一頁,2022年,8月28日Legendre正交多項式正交光滑49第四十九頁,共六十一頁,2022年,8月28日正交光滑2.Fourier級數(shù)光滑在實際中,將無窮用有限值r替換,r稱為截斷點,相當(dāng)于光滑參數(shù)是正交cosine基空間系數(shù)系數(shù)的估計其中50第五十頁,共六十一頁,2022年,8月28日正交光滑m(x)的估計將代入,得其中可以看到上面的估計與G-M估計有相同的表達形式,都為卷積形式,只是核函數(shù)不相同51第五十一頁,共六十一頁,2022年,8月28日正交光滑另外一種的Fourier估計一般要求:同樣可以寫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工作總結(jié)之電大行政管理畢業(yè)總結(jié)
- 房屋轉(zhuǎn)租的合同范本(35篇)
- 電鍍技術(shù)合作協(xié)議書(33篇)
- 小學(xué)生暑假最后一次國旗下講話范文(31篇)
- 廣西玉林市容縣部分學(xué)校2024屆九年級下學(xué)期中考一模數(shù)學(xué)試卷(含答案)
- C#程序設(shè)計案例教程 王明福 源代碼習(xí)題答案 第2章新
- 材料課件簡介緒論部分
- 西藏林芝市一中2025屆高考英語考前最后一卷預(yù)測卷含解析
- 慶陽市重點中學(xué)2025屆高考壓軸卷數(shù)學(xué)試卷含解析
- 2025屆江西省吉安一中、九江一中等八所重點中學(xué)高三第二次調(diào)研英語試卷含解析
- 胖東來商貿(mào)集團各項管理制度
- 部編版五年級上冊第一單元集體備課
- nasa緊固件設(shè)計手冊-達文中翻譯版
- DB37T 3366-2018 山東省涉路工程技術(shù)規(guī)范
- ICD-10惡性腫瘤編碼整理版
- 丙二醇化學(xué)品安全技術(shù)說明書
- 機械設(shè)計基礎(chǔ)課程設(shè)計yu-new
- 黑布林名著閱讀-Black Beauty 黑駿馬 學(xué)案及閱讀訓(xùn)練(含答案)
- 紅色卡通風(fēng)區(qū)三好學(xué)生競選演講圖文PPT教學(xué)課件
- 一年綜合實踐活動課程年度規(guī)劃
- 初中數(shù)學(xué)實數(shù)計算題專題訓(xùn)練含答案詳情
評論
0/150
提交評論