序列的統(tǒng)計(jì)量檢驗(yàn)和分布_第1頁
序列的統(tǒng)計(jì)量檢驗(yàn)和分布_第2頁
序列的統(tǒng)計(jì)量檢驗(yàn)和分布_第3頁
序列的統(tǒng)計(jì)量檢驗(yàn)和分布_第4頁
序列的統(tǒng)計(jì)量檢驗(yàn)和分布_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

序列的統(tǒng)計(jì)量檢驗(yàn)和分布1第一頁,共四十三頁,2022年,8月28日

打開工作文件,雙擊一個序列名,即進(jìn)入序列的對話框。單擊“view”可看到菜單分為四個區(qū),第一部分為序列顯示形式,第二和第三部分提供數(shù)據(jù)統(tǒng)計(jì)方法,第四部分是轉(zhuǎn)換選項(xiàng)和標(biāo)簽。2第二頁,共四十三頁,2022年,8月28日§1.1

描述統(tǒng)計(jì)量

以直方圖顯示序列的頻率分布。直方圖將序列的長度按等間距劃分,顯示觀測值落入每一個區(qū)間的個數(shù)。同直方圖一起顯示的還有一些標(biāo)準(zhǔn)的描述統(tǒng)計(jì)量。這些統(tǒng)計(jì)量都是由樣本中的觀測值計(jì)算出來的。如圖(例1.1):3第三頁,共四十三頁,2022年,8月28日例1.3中GDP增長率的統(tǒng)計(jì)量:4第四頁,共四十三頁,2022年,8月28日

均值

(mean)

即序列的平均值,用序列數(shù)據(jù)的總和除以數(shù)據(jù)的個數(shù)。

中位數(shù)

(median)

即從小到大排列的序列的中間值。是對序列分布中心的一個粗略估計(jì)。

最大最小值

(maxandmin)

序列中的最大最小值。

標(biāo)準(zhǔn)差(StandardDeviation)

標(biāo)準(zhǔn)差衡量序列的離散程度。計(jì)算公式如下N是樣本中觀測值的個數(shù),是樣本均值。

5第五頁,共四十三頁,2022年,8月28日

偏度(Skewness)

衡量序列分布圍繞其均值的非對稱性。計(jì)算公式如下

是變量方差的有偏估計(jì)。如果序列的分布是對稱的,S值為0;正的S值意味著序列分布有長的右拖尾,負(fù)的S值意味著序列分布有長的左拖尾。例1.1中X的偏度為0,說明X的分布是對稱的;而例1.3中GDP增長率的偏度是0.78,說明GDP增長率的分布是不對稱的。6第六頁,共四十三頁,2022年,8月28日

峰度(Kurtosis)

度量序列分布的凸起或平坦程度,計(jì)算公式如下分布的凸起程度大于正態(tài)分布;如果K值小于3,序列分布相對于正態(tài)分布是平坦的。例1.1中X的峰度為2.5,說明X的分布相對于正態(tài)分布是平坦的;而例1.3中GDP增長率的峰度為2.14,說明GDP增長率的分布相對于正態(tài)分布也是平坦的。意義同S中,正態(tài)分布的K值為3。如果K值大于3,7第七頁,共四十三頁,2022年,8月28日

Jarque-Bera檢驗(yàn)

檢驗(yàn)序列是否服從正態(tài)分布。統(tǒng)計(jì)量計(jì)算公式如下S為偏度,K為峰度,k是序列估計(jì)式中參數(shù)的個數(shù)。在正態(tài)分布的原假設(shè)下,J-B統(tǒng)計(jì)量是自由度為2的

2分布。J-B統(tǒng)計(jì)量下顯示的概率值(P值)是J-B統(tǒng)計(jì)量超出原假設(shè)下的觀測值的概率。如果該值很小,則拒絕原假設(shè)。當(dāng)然,在不同的顯著性水平下的拒絕域是不一樣的。例1.1中X的J-B統(tǒng)計(jì)量下顯示的概率值(P值)是0.92,接受原假設(shè),X服從正態(tài)分布;而例1.3中GDP增長率的的J-B統(tǒng)計(jì)量的概率值(P值)是0.455,也接受原假設(shè),說明GDP增長率服從正態(tài)分布。8第八頁,共四十三頁,2022年,8月28日§1.2均值、中位數(shù)、方差的假設(shè)檢驗(yàn)

這部分是對序列均值、中位數(shù)、方差的假設(shè)檢驗(yàn)。在序列對象菜單選擇View/testsfordescriptivestats/simplehypothesistests,就會出現(xiàn)下面的序列分布檢驗(yàn)對話框:

9第九頁,共四十三頁,2022年,8月28日1.均值檢驗(yàn)

如果不指定序列x的標(biāo)準(zhǔn)差,EViews將在t–統(tǒng)計(jì)量中使用該標(biāo)準(zhǔn)差的估計(jì)值s

。

是x的樣本估計(jì)值,N是x的觀測值的個數(shù)。在原假設(shè)下,如果x服從正態(tài)分布,t

統(tǒng)計(jì)量是自由度為N-1的t分布。

原假設(shè)是序列x

的期望值m

,備選假設(shè)是≠m

,即10第十頁,共四十三頁,2022年,8月28日

如果給定x的標(biāo)準(zhǔn)差,EViews計(jì)算t統(tǒng)計(jì)量:

是指定的x的標(biāo)準(zhǔn)差。

要進(jìn)行均值檢驗(yàn),在Mean內(nèi)輸入值。如果已知標(biāo)準(zhǔn)差,想要計(jì)算t統(tǒng)計(jì)量,在右邊的框內(nèi)輸入標(biāo)準(zhǔn)差值。可以輸入任何數(shù)或標(biāo)準(zhǔn)EViews表達(dá)式,下頁我們給出檢驗(yàn)的輸出結(jié)果。

11第十一頁,共四十三頁,2022年,8月28日這是檢驗(yàn)例1.7中GDP增長率的均值,檢驗(yàn)H0:X=10%,H1:X≠10%。表中的Probability值是P值(邊際顯著水平)。在雙邊假設(shè)下,如果這個值小于檢驗(yàn)的顯著水平,如0.05則拒絕原假設(shè)。這里我們不能拒絕原假設(shè)。12第十二頁,共四十三頁,2022年,8月28日2.方差檢驗(yàn)

檢驗(yàn)的原假設(shè)為序列x的方差等于

2,備選假設(shè)為雙邊的,x的方差不等于

2

,即

EViews計(jì)算2統(tǒng)計(jì)量,計(jì)算公式如下

N為觀測值的個數(shù),為x的樣本均值。在原假設(shè)下,如果x服從正態(tài)分布,2

統(tǒng)計(jì)量是服從自由度為N-1的2分布。

要進(jìn)行方差檢驗(yàn),在Variance處填入在原假設(shè)下的方差值??梢蕴钊肴魏握龜?shù)或表達(dá)式。

13第十三頁,共四十三頁,2022年,8月28日3.中位數(shù)檢驗(yàn)

原假設(shè)為序列x的中位數(shù)等于m,備選假設(shè)為雙邊假設(shè),x的中位數(shù)不等于m,即

EViews提供了三個以排序?yàn)榛A(chǔ)的無參數(shù)的檢驗(yàn)統(tǒng)計(jì)量。方法的主要參考來自于Conover(1980)和Sheskin(1997)。進(jìn)行中位數(shù)檢驗(yàn),在Median右邊的框內(nèi)輸入中位數(shù)的值,可以輸入任何數(shù)字表達(dá)式。14第十四頁,共四十三頁,2022年,8月28日§1.3

分布函數(shù)

EViews提供了幾種對數(shù)據(jù)進(jìn)行初步分析的方法。在§1.1我們已列出了幾種圖來描述序列分布特征。在本節(jié),列出了幾種散點(diǎn)圖且允許我們可以用有參數(shù)或無參數(shù)過程來做擬合曲線圖。這些圖包含著復(fù)雜計(jì)算和大量的特殊操作,對某些完全技術(shù)性的介紹,不必掌握所有細(xì)節(jié)。EViews中設(shè)置的缺省值除了對極特殊的分析外,對一般分析而言是足夠用的。直接點(diǎn)擊ok鍵接受缺省設(shè)置,就可以輕松的展現(xiàn)出每個圖。15第十五頁,共四十三頁,2022年,8月28日§1.3.1序列分布圖

本節(jié)列出了三種描述序列經(jīng)驗(yàn)分布特征的圖。

1.CDF—Survivor—Quantile圖

這個圖描繪出帶有加或減兩個標(biāo)準(zhǔn)誤差帶的經(jīng)驗(yàn)累積分布函數(shù),殘存函數(shù)和分位數(shù)函數(shù)。在序列菜單中或組菜單中選擇View/Distribution/CDF—Survivor—Quantile…時(組菜單的MultipleGraphs中),就會出現(xiàn)下面的對話框:16第十六頁,共四十三頁,2022年,8月28日

其中,CumulativeDistribution(累積分布)操作用來描繪序列的經(jīng)驗(yàn)累積函數(shù)(CDF)。CDF是序列中觀測值不超過指定值r的概率Survivor(殘存)操作用來描繪序列的經(jīng)驗(yàn)殘存函數(shù)17第十七頁,共四十三頁,2022年,8月28日

Quantile(分位數(shù))操作用來描繪序列的經(jīng)驗(yàn)分位數(shù)。對0q1,X的分位數(shù)x(q)

滿足下式:

,且

分位數(shù)函數(shù)是CDF的反函數(shù),可以通過調(diào)換CDF的橫縱坐標(biāo)軸得到。

All選項(xiàng)包括CDF,Survivor和Quantile函數(shù)。

Savedmatrixname可以允許把結(jié)果保存在一個矩陣內(nèi)。

Includestandarderrors(包括標(biāo)準(zhǔn)誤差)操作標(biāo)繪接近95%的置信區(qū)間的經(jīng)驗(yàn)分布函數(shù)。18第十八頁,共四十三頁,2022年,8月28日工作文件1_3.wf1中GDP增長率的分布圖19第十九頁,共四十三頁,2022年,8月28日2.Quantile—Quantile圖

Quantile—Quantile(QQ圖)對于比較兩個分布是一種簡單但重要的工具。這個圖標(biāo)繪出一個被選序列的分位數(shù)分布相對于另一個序列的分位數(shù)分布或一個理論分布的異同。如果這兩個分布是相同的,則QQ圖將在一條直線上。如果QQ圖不在一條直線上,則這兩個分布是不同的。

當(dāng)選擇View/DistributionGraphs/Quantile-Quantile….下面的QQPlot對話框會出現(xiàn):20第二十頁,共四十三頁,2022年,8月28日

可以選與如下的理論分布的分位數(shù)相比較:Normal(正態(tài))分布:鐘形并且對稱的分布.Uniform(均勻)分布:矩形密度函數(shù)分布.Exponential(指數(shù))分布:聯(lián)合指數(shù)分布是一個有著一條長右尾的正態(tài)分布.Logistic(邏輯)分布:除比正態(tài)分布有更長的尾外是一種近似于正態(tài)的對稱分布.Extremevalue(極值)分布:I型極小值分布是有一條左長尾的負(fù)偏分布,它非常近似于對數(shù)正態(tài)分布.

可以在工作文件中選擇一些序列來與這些典型序列的分位數(shù)相比較,也可以在編輯框中鍵入序列或組的名稱來選擇對照的序列或組,EViews將針對列出的每個序列計(jì)算出QQ圖。21第二十一頁,共四十三頁,2022年,8月28日下圖是GDP增長率和指數(shù)分布的Q-Q圖:22第二十二頁,共四十三頁,2022年,8月28日

3.KernelDensity(核密度)

這個視圖標(biāo)繪出序列分布的核密度估計(jì)。一個序列的分布的最簡單非參數(shù)密度估計(jì)是直方圖。通過選View/DescriptiveStatistics/HistogramandStats可以得到直方圖,直方圖對原點(diǎn)的選擇比較敏感并且是不連續(xù)的。下圖是GDP增長率序列分布的直方圖:

23第二十三頁,共四十三頁,2022年,8月28日核密度估計(jì)用“沖擊”代替了直方圖中的“框”,所以它是平滑的。平滑是通過給遠(yuǎn)離被估計(jì)的點(diǎn)的觀測值以小的權(quán)重來達(dá)到的。一個序列X在點(diǎn)x的核密度估計(jì)為:這里,N是觀測值的數(shù)目,h是帶寬(或平滑參數(shù)),K是合并為一體的核函數(shù)。24第二十四頁,共四十三頁,2022年,8月28日

當(dāng)選View/DistributionGraphs/KernelDensity……會出現(xiàn)下面的核密度對話框:

要展現(xiàn)核密度估計(jì),需要指定如下幾項(xiàng):25第二十五頁,共四十三頁,2022年,8月28日

(1)Kernel(核)

核函數(shù)是一個加權(quán)函數(shù),它決定沖擊的形狀。EViews針對核函數(shù)K提供如下操作:Epanechnikov(default)Triangular(三角形)Uniform(Rectangular)(均勻分布)Normal(Gaussian)(正態(tài)分布)Biweight(Quartic)TriweightCosinus這里u是核函數(shù)的輻角,I(.)是指示函數(shù),輻角為真時,它取1,否則取0。26第二十六頁,共四十三頁,2022年,8月28日

(2)

Bandwidth(帶寬)

帶寬h控制密度估計(jì)的平滑程度;帶寬越大,估計(jì)越平滑。帶寬的選取在密度估計(jì)中非常重要,缺省設(shè)置是一種基于數(shù)據(jù)的自動帶寬,

這里N是觀測值的數(shù)目;s是標(biāo)準(zhǔn)離差;R是序列的分位數(shù)間距;因子k是標(biāo)準(zhǔn)帶寬變換,標(biāo)準(zhǔn)帶寬變換用來調(diào)整帶寬以便對不同的核函數(shù)自動密度估計(jì)有大致相當(dāng)?shù)钠交?。也可以自定帶寬,先點(diǎn)擊UserSpecified,在下面的對話框中鍵入一個非負(fù)數(shù)。

27第二十七頁,共四十三頁,2022年,8月28日下圖是GDP增長率序列分布的核密度估計(jì):28第二十八頁,共四十三頁,2022年,8月28日§1.3.2帶有擬合線的散點(diǎn)圖

通過view/Graph/Scatter打開一個組的視圖菜單包括四種散點(diǎn)圖。

1.SimpleScatter(簡單散點(diǎn)圖)

其第一個序列在水平軸上,其余的在縱軸上。

2.ScatterwithRegression(回歸散點(diǎn)圖)

在組中對第一個序列及第二個序列進(jìn)行總體變換來進(jìn)行二元回歸,選擇Regression后出現(xiàn)對話框:29第二十九頁,共四十三頁,2022年,8月28日工作文件1_5.wf1中的居民消費(fèi)和GDP的帶回歸線的散點(diǎn)圖30第三十頁,共四十三頁,2022年,8月28日

下面是針對二元擬合的序列變換:NoneLogarithmicInversePowerBox-CoxPolynomial

在編輯框中來指定參數(shù)a,b。如果變換是不可以的,會出現(xiàn)錯誤提示,對多項(xiàng)式(Polynomial)的階數(shù)定的過高。EViews會自動降低階數(shù)以避免共線性。點(diǎn)擊ok后,EViews擬合出一條回歸線,可以在FittedYseries編輯框中鍵入一個名稱保存這個擬合的序列。31第三十一頁,共四十三頁,2022年,8月28日

Robustnesslterations(穩(wěn)健疊代)

最小二乘法對一些無關(guān)觀測值的存在非常敏感,穩(wěn)健疊代操作就是產(chǎn)生一種對殘差平方的加權(quán)形式,使無關(guān)的觀測值在估計(jì)參數(shù)時被加最小的權(quán)數(shù)。

這里xi,yi

是變形后的序列,權(quán)值r通過下式得到:其中:

eiyi–a–bxi,m是|ei|

的中間數(shù),大的殘差的觀測值給一個小權(quán)數(shù)。選擇疊代次數(shù)應(yīng)是一個整數(shù)。32第三十二頁,共四十三頁,2022年,8月28日

3.ScatterwithNearestNeighberFit(最鄰近擬合散點(diǎn)圖)

這是一種帶寬基于最鄰近點(diǎn)的局部回歸。簡而言之,對樣本中的每一數(shù)據(jù)點(diǎn),它擬合出一條局部的并經(jīng)加權(quán)的回歸線。局部是說只用鄰近點(diǎn)也就是樣本的子集來一步步回歸,加權(quán)是說鄰近點(diǎn)越遠(yuǎn)給越小的權(quán)數(shù)。當(dāng)選擇后,會出現(xiàn)如下的對話框:33第三十三頁,共四十三頁,2022年,8月28日

因?yàn)橐孔訕颖军c(diǎn)周圍的點(diǎn)來進(jìn)行局部回歸,并來求擬合值,因此specification操作就是確定選擇識別周圍進(jìn)行回歸的觀測值的規(guī)則。

①Bandwidthspan(帶寬范圍)

用來決定在局部回歸中應(yīng)包括哪些觀測值,可以選取在0,1之間的一個數(shù)。

②Polynomialdegree(多項(xiàng)式次數(shù))

選擇多項(xiàng)式的次數(shù)來擬合每一局部回歸。

(1)

Specification(說明操作)34第三十四頁,共四十三頁,2022年,8月28日(2)Method操作

可以選擇在樣本中的每一個數(shù)據(jù)點(diǎn)作局部回歸或在數(shù)據(jù)點(diǎn)的子集中作局部回歸。

·Exact(fullsample)在樣本中的每一數(shù)據(jù)點(diǎn)都作局部回歸

·Clevelandsubsampling在選取的子樣本中進(jìn)行回歸,可以在編輯框中鍵入子樣本的大小。

35第三十五頁,共四十三頁,2022年,8月28日工作文件1_5.wf1中的居民消費(fèi)和GDP的最鄰近點(diǎn)擬合的散點(diǎn)圖36第三十六頁,共四十三頁,2022年,8月28日

4.ScatterwithKernelFit(核擬合分布)

這也是一種局部回歸擬合,不過是無參數(shù)的。另外與最鄰近回歸擬合相比,區(qū)別主要體現(xiàn)在局部帶寬的選取上。最鄰近擬合的有效帶寬可以有很多種,而核擬合則固定帶寬且局部的觀測值通過核函數(shù)來加權(quán)。局部核回歸擬合通過選取參數(shù)使加權(quán)殘差平方和最小。

N是觀測值的個數(shù),h是帶寬(或光滑參數(shù)),K是核函數(shù)。注意:對于不同的x,的估計(jì)值不同。37第三十七頁,共四十三頁,2022年,8月28日

打開Scatterwithkernelfit,出現(xiàn)下面的對話框:

Regression用來指定局部回歸的形式,指定多項(xiàng)式的階數(shù)k。Nadaraya-Watson操作設(shè)置k=0。

Locallinear操作設(shè)置k=1。對于高階多項(xiàng)式,應(yīng)使用Localpolynomial操作,可在下面編輯框中輸入k的值。38第三十八頁,共四十三頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論