基于核密度估計的上證A股收益率分析_第1頁
基于核密度估計的上證A股收益率分析_第2頁
基于核密度估計的上證A股收益率分析_第3頁
基于核密度估計的上證A股收益率分析_第4頁
基于核密度估計的上證A股收益率分析_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上第六章 基于核密度估計的上證A股收益率分析一、模型的相關(guān)理論知識(一)問題的提出經(jīng)濟(jì)計量研究中常用的是參數(shù)估計,即假定經(jīng)濟(jì)變量之間具有一定的函數(shù)關(guān)系,且函數(shù)形式是可以確定的,可以寫成帶參數(shù)的形式進(jìn)行估計,經(jīng)典的線性回歸和非線性回歸就屬于參數(shù)估計方法。但經(jīng)濟(jì)變量之間的關(guān)系未必是線性關(guān)系或可線性化的非線性關(guān)系,而變量之間的真實關(guān)系到底是什么又很難確定。因而當(dāng)模型及參數(shù)的假定與實際背離時,就容易造成模型設(shè)定誤差。此時,基于經(jīng)典假設(shè)模型所做出的預(yù)測,很難達(dá)到預(yù)期的效果。針對該問題,非參數(shù)估計方法提供了最佳的解決辦法,它使我們能尋找到最精確的非線性系統(tǒng)來描述變量之間的內(nèi)在關(guān)系。

2、非參數(shù)估計的回歸函數(shù)的形式可以任意,沒有任何約束,解釋變量和被解釋變量的分布也很少限制,因而有較大的適應(yīng)性,其目的在于放松回歸函數(shù)形式的限制,為確定或建議回歸函數(shù)的參數(shù)表達(dá)式提供有用的工具,從而能在廣泛的基礎(chǔ)上得出更加帶有普遍性的結(jié)論。核估計就是一種非參數(shù)估計方法,主要用于對隨機(jī)變量密度函數(shù)進(jìn)行估計。(二)核密度估計方法的原理設(shè)是從具有未知密度函數(shù)的總體中抽出的獨(dú)立同分布樣本,要依據(jù)這些樣本對每一去估計的值。密度估計最基本的方法是直方圖估計,我們可以從直方圖估計導(dǎo)出密度核估計。作直方圖時,先用點把直線分成若干小的計數(shù)區(qū)間。這樣,計數(shù)區(qū)間的端點與寬度都是固定的。記為樣本點落在第i個計數(shù)區(qū)間里的個

3、數(shù),則密度函數(shù)在里的函數(shù)估計值就取為: 這樣的直方圖估計結(jié)果是階梯函數(shù),如果對每個,各作一個以為中點的小計數(shù)區(qū)間, 再對落在該計數(shù)區(qū)間的樣本點計數(shù),設(shè)為,則密度估計為:。其與直方圖不同在于它的計數(shù)區(qū)間端點劃分不是固定的,而是隨而變,可以自始至終保持點在計數(shù)區(qū)間中間。不過此時計數(shù)區(qū)間寬度一般是固定的。如果引進(jìn)均勻核函數(shù),則上述變端點計數(shù)區(qū)間的密度估計可寫為: 。后來Parzen(1962)提出,可以將這種核函數(shù)形式放寬限制,只須積分為1(最好還為恒正)即可。這就導(dǎo)出了一般的密度核估計: (6-1) 其中為核函數(shù),h為窗寬。另外也可以從經(jīng)驗分布函數(shù)導(dǎo)出密度核估計。經(jīng)驗分布函數(shù)也是一種計數(shù),不過從一

4、直計到為止。利用它表示一個以為中心,窗寬為計數(shù)區(qū)間里的樣本點數(shù),于是密度估計為:對核函數(shù)形式放寬了,一般來說,要求核函數(shù)滿足以下條件:對于一般概率密度函數(shù),這些條件是能滿足的,所以可以選一個概率密度函數(shù)作核函數(shù)。對窗寬h的要求,顯然樣本數(shù)越多,窗寬應(yīng)越小,但不能太小,即h是n的函數(shù),且。在上述要求的核函數(shù)及窗寬條件下,密度的核估計是的漸近無偏估計與一致估計。(三)幾種常用的和函數(shù)下面介紹幾種常用的核函數(shù):1,均勻核,2,高斯核,3,Epanechnikov核, 4,三角形核,5,四次方核,6,六次方核。通常在大樣本的情況下,非參數(shù)估計對核函數(shù)的選擇并不敏感,但是,窗寬 的選擇對估計的效果影響較

5、大。一般來說,窗寬取得越大,估計的密度函數(shù)就越平滑,但偏差可能會較大。如果選的太小,估計的密度曲線和樣本擬合得較好,但可能很不光滑,即方差過大。所以,窗寬的變化不可能既使核估計的偏差減小,同時又使核估計的方差較小。因此,最佳窗寬的選擇標(biāo)準(zhǔn)必須在核估計的偏差和方差之間作一個權(quán)衡,即使積分均方誤差達(dá)到最小。選擇h的方法有許多,比如交錯鑒定選擇法,直接插入選擇法,在各個局部取不同的窗寬,或者估計出一個光滑的窗寬函數(shù)等等 見于吳喜之.非參數(shù)統(tǒng)計M.中國統(tǒng)計出版社,p188-p189.。= (6-2)可以證明,在很一般的正則條件下,使積分均方誤差極小化的任何h取值一定與成比例。 見于羅素.戴維森,詹姆斯

6、.G.麥金農(nóng).計量經(jīng)濟(jì)理論和方法M上海財經(jīng)大學(xué)出版社.p580-p581.由此得到,一般的最佳窗寬選擇為(其中c為常數(shù)),通過不斷地調(diào)整c,使得所采用的窗寬的核估計達(dá)到滿意的估計結(jié)果。的兩個常見選擇為: (6-3) (6-4)其中,n為樣本單位數(shù)。s為的標(biāo)準(zhǔn)差,為數(shù)據(jù)的0.75分位數(shù)估計值和0.25分位數(shù)估計值之差。因子1.059實際上就是,是通過最優(yōu)性證明得出的,因子0.785是1.059除以1.349得出的,1.349是標(biāo)準(zhǔn)正態(tài)分布的四分位數(shù)中間跨度。二、案例分析:基于核密度估計的上證A股收益率分析(一)案例背景材料中國的股票市場經(jīng)過二十多年的發(fā)展,已經(jīng)取得了令人矚目的成就。在市場參與者各

7、方的共同努力之下,市場日漸走向成熟和完善,對中國股票市場的研究也日漸深入和豐富多彩。幾乎所有的關(guān)于市場的學(xué)術(shù)研究中都會涉及到股票的收益率,而在股票市場,對收益率隨機(jī)過程的充分認(rèn)識是做出正確投資決定的基礎(chǔ),因為它提供了有關(guān)資產(chǎn)風(fēng)險的基本信息。在現(xiàn)代金融經(jīng)濟(jì)學(xué)中,線性范式一直占據(jù)著主導(dǎo)地位,許多經(jīng)典理論都是以正態(tài)分布或?qū)?shù)正態(tài)分布為基礎(chǔ)建立的。股市收益率作為反映股票市場波動性的指標(biāo),在描述股價行為的經(jīng)典計量模型中,通常被假定服從正態(tài)分布。但是許多計量金融學(xué)家對這一經(jīng)典假設(shè)做了大量的研究并發(fā)現(xiàn),收益率的分布并不服從正態(tài)分布這一假設(shè)。事實上,大多數(shù)收益率的變化存在很明顯的尖峰現(xiàn)象,也就是說相對正態(tài)分布

8、而言,在均值附近的數(shù)據(jù)點特別多。許多學(xué)者認(rèn)為這只不過是由一些“異常值”所引起,從而在統(tǒng)計分析中將這些“異常值”去掉。例如,國內(nèi)學(xué)者陶亞民認(rèn)為,上海股市收益率分布是服從正態(tài)分布的,但這卻是在剔除了“異常點”的基礎(chǔ)上得到的結(jié)論。然而Mandelbrot認(rèn)為將這些“異常值”值從數(shù)據(jù)中去掉是不可取的。因為“異常值”的出現(xiàn)并不是一種偶然現(xiàn)象,尖峰和厚尾現(xiàn)象幾乎是所有股票收益率數(shù)據(jù)所共有的。這說明“異常值”本身反映了股票收益率并不服從正態(tài)分布這一假定。陳啟歡也通過實證研究的方法得到我國股市收益率分布曲線并不服從正態(tài)分布。因此,在收益率分布非正態(tài)的情況下,本案例利用非參數(shù)估計中的核密度估計方法來對上證A股指

9、數(shù)收益率的密度進(jìn)行估計。(二)數(shù)據(jù)來源及說明本案例采用wind資訊公司提供的2005年1月至2009年11月12日期間我國上證A股日收盤指數(shù),共計1180個觀測值為樣本,運(yùn)用密度估計模型來研究股指數(shù)收益率波動。(三)模型建立與估計結(jié)果本模型的建立,采用上證A股指數(shù)日收益率為變量。,是第t日的收盤指數(shù),是第t+1日的收盤指數(shù)。另外,本案例的模型估計是通過使用R軟件來實現(xiàn)的。 1、收益率分布的正態(tài)性檢驗本案例利用Shapiro-Wilk(夏皮羅-威爾克)W統(tǒng)計量對樣本作正態(tài)性檢驗。在R軟件中,函數(shù)shapiro.test()提供W統(tǒng)計量和相應(yīng)的p值,當(dāng)p值小于某個顯著水平(比如0.05)時,則認(rèn)為

10、樣本不是來自正態(tài)分布的總體;否則認(rèn)為樣本是來自正態(tài)分布的總體。在此,假設(shè)上證A股指數(shù)收益率服從正態(tài)分布,得出的檢驗結(jié)果如下:Shapiro-Wilk normality testdata: x W = 0.8, p-value < 2.2e-16 從上述結(jié)果可以看出,上證A股指數(shù)收益率不服從正態(tài)分布。2、核函數(shù)與窗寬的選擇由于核函數(shù)在核密度估計中不敏感,滿足核函數(shù)條件的高斯核、均勻核、Ep-anch-nikov核、Biweight核的最優(yōu)性幾乎一致(Prakasa Rao,1983)。因此,本文僅選取高斯核作為核函數(shù)進(jìn)行估計。對于窗寬的選擇,本案例先由(3)式和(4)式分別計算得出=0.

11、,=0.。再在選用高斯核函數(shù)的條件下,根據(jù)使積分均方誤差達(dá)到最小法則,得到高斯核估計的最優(yōu)窗寬為=0.。(四)非參數(shù)估計下的上證A股指數(shù)收益率密度函數(shù)的實際應(yīng)用在核估計的核函數(shù)與窗寬都確定后,就可以得到上證A股指數(shù)收益率的核估計密度函數(shù)的確定形式: (6-5) 在非參數(shù)核密度估計的情況下,收益率的期望和方差為: (6-6) (6-7) (6-8)通過公式(6-6),(6-7),(6-8),可以計算出核估計密度函數(shù)的期望與方差,見表1:表1 上證A股指數(shù)收益率非參數(shù)估計與實際的收益率的統(tǒng)計特征比較核估計均值核估計方差實際均值實際方差0.0.0.0.從表1可以看出,核估計收益率的期望與原來數(shù)據(jù)的均

12、值是相等的,但是方差卻不同,核估計的方差比實際數(shù)據(jù)的方差偏大。由于本案例采用的是高斯核(正態(tài)核)函數(shù),所以可以推導(dǎo)出核估計條件下的收益率分布函數(shù)是: (6-9)由公式(6-9)可以知道在核估計密度函數(shù)下的收益率分布函數(shù)形式,因此我們就可以計算出收益率落在不同區(qū)間時概率值的大小,計算結(jié)果見表2:表2 上證A股指數(shù)收益率的區(qū)間概率值區(qū)間(-,-0.05)(-0.05,0)(0,0.05)(0.05,+)概率值0.02195 0.43042 0.53271 0.01491表2的計算結(jié)果表明:上證A股指數(shù)的收益率下跌大于0.05的可能性是2.193%,而上漲大于0.05的可能性是1.574%,下跌的可

13、能性大于上漲的可能性。這說明近年來我國上證A股市場不景氣,我們認(rèn)為可能是受到金融危機(jī)的影響。(五)結(jié)論非參數(shù)回歸函數(shù)估計方法是近20年來現(xiàn)代統(tǒng)計學(xué)發(fā)展的一個重要方向,它改變了傳統(tǒng)統(tǒng)計學(xué)的格局,對未知分布的數(shù)據(jù)模型的處理及不完全數(shù)據(jù)的處理提供了一種新的統(tǒng)計方法。在非參數(shù)估計時,不固定函數(shù)的形式,也不設(shè)置參數(shù),函數(shù)在每一點的值都由數(shù)據(jù)決定,因而有較大適應(yīng)性。同時,在抽取樣本對總體進(jìn)行估計時,不必依賴于樣本所從屬的總體的分布樣式,可以廣泛地運(yùn)用于不同類型的總體。所以,非參數(shù)估計方法在廣泛的基礎(chǔ)上,得出更加帶有普遍性的結(jié)論。本案例利用非參數(shù)核密度估計法對上證A股指數(shù)的收益率分布形式進(jìn)行了實證研究。研究

14、發(fā)現(xiàn),非參數(shù)核密度估計方法能夠較好地描述股票收益率分布尖峰厚尾的特征,對收益率分布給出一個比較準(zhǔn)確的擬合效果。在此基礎(chǔ)上,本案例通過計算還得到了在非參數(shù)估計下的收益率的期望和方差,以及收益率落在各個區(qū)間的概率值。通過比較分析各個區(qū)間的概率值,揭示了近年來上證A股市場的特征。參考文獻(xiàn):1李子奈,葉阿忠.高等計量經(jīng)濟(jì)學(xué)M.北京:清華大學(xué)出版社,2000.2葉阿忠.非參數(shù)計量經(jīng)濟(jì)學(xué)M.天津:南開大學(xué)出版社,1995.3羅素戴.維森,詹姆斯.G.麥金農(nóng).計量經(jīng)濟(jì)理論和方法M.上海財經(jīng)大學(xué)出版社,2006.4張世趟,程小軍,蘇明.基于非參數(shù)方法的A股指數(shù)估計J.南方金融,2009, (1):25-27.

15、5薛毅,陳立萍.R軟件建模與R軟件M.清華大學(xué)出版社,2007.6吳喜之.非參數(shù)統(tǒng)計M.中國統(tǒng)計出版社,2006.7陶亞明,蔡明超,楊朝軍.上海股票市場收益率分布特征的研究J.預(yù)測,1999,(2):57-58.8區(qū)詩得,刑國東.股票收益率密度的非參數(shù)估計及投資策略J.理論新探,2006, (3).9陳啟歡.中國股票市場收益率分布曲線的實證J.數(shù)理統(tǒng)計與管理,2002, (5):9-11.附錄程序命令:(1)在EXCEL中計算收益率;(2)把EXCEL格式的數(shù)據(jù)另存為文本數(shù)據(jù),并命名為shuju.txt,存入C盤;(3)在R軟件中調(diào)入foreign程序包;(4)用R軟件讀入數(shù)據(jù),命令為sj&l

16、t;-read.delim("c:/shuju.txt") #把數(shù)據(jù)賦值給sjx<-sj"收益率"x #把收益率賦值給x,并顯示出x(5) 在R軟件中進(jìn)行正態(tài)性檢驗,命令為shapiro.test(x)結(jié)果為: Shapiro-Wilk normality testdata: x W = 0.8, p-value < 2.2e-16(6)在R軟件中進(jìn)行五數(shù)總括(為下面畫正態(tài)分布和計算窗寬做準(zhǔn)備),命令為 fivenum(x) 結(jié)果: -0. -0. 0. 0. 0.最小值下四分位數(shù) 中位數(shù) 上四分位數(shù) 最大值(7)調(diào)入核函數(shù)軟件包kernsm

17、ooth(8)選擇核函數(shù)形式,三種核函數(shù)與正態(tài)函數(shù)做比較,命令為plot(bkde(x,kernel="normal"),type="l",col="blue") #畫高斯核函數(shù)lines(density(x,kernel=c("epanechnikov"),type="l",col="red") # Epanechnikov核lines(density(x,kernel=c("triangular"),type="l",col="green") #四次方核w<-seq(-0.3,0.4,by=0.0001) #產(chǎn)生等間隔序列l(wèi)ines(w,dnorm(w,mean(x),sd(x),col="purple") #畫正態(tài)分布(9)窗寬選擇 H1= 0. H2= 0.plot(bkde(x,bandwidth=0.),type

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論