《實(shí)驗(yàn)經(jīng)濟(jì)學(xué)》第五講:假設(shè)檢驗(yàn)PPT課件_第1頁(yè)
《實(shí)驗(yàn)經(jīng)濟(jì)學(xué)》第五講:假設(shè)檢驗(yàn)PPT課件_第2頁(yè)
《實(shí)驗(yàn)經(jīng)濟(jì)學(xué)》第五講:假設(shè)檢驗(yàn)PPT課件_第3頁(yè)
《實(shí)驗(yàn)經(jīng)濟(jì)學(xué)》第五講:假設(shè)檢驗(yàn)PPT課件_第4頁(yè)
《實(shí)驗(yàn)經(jīng)濟(jì)學(xué)》第五講:假設(shè)檢驗(yàn)PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1實(shí)驗(yàn)經(jīng)濟(jì)學(xué)第五講:假設(shè)檢驗(yàn)杜寧華上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)學(xué)院,經(jīng)濟(jì)學(xué)實(shí)驗(yàn)室2008 年 3月2 采用什么辦法進(jìn)行假設(shè)檢驗(yàn)與實(shí)驗(yàn)設(shè)置設(shè)計(jì)密切相關(guān)。 前幾講在介紹完全隨機(jī)設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、拉丁方和拉丁矩等各種設(shè)計(jì)方法時(shí),都詳細(xì)討論了如何運(yùn)用該設(shè)計(jì)下的方差分析進(jìn)行假設(shè)檢驗(yàn)。 實(shí)驗(yàn)數(shù)據(jù)與生活中的實(shí)地?cái)?shù)據(jù)的根本區(qū)別在于數(shù)據(jù)的產(chǎn)生過程;而實(shí)驗(yàn)數(shù)據(jù)在處理過程中也有其特殊性。 由于實(shí)驗(yàn)數(shù)據(jù)的樣本容量比較小,進(jìn)行非參數(shù)的檢驗(yàn)往往成為無(wú)法替代的選擇。 3討論的要點(diǎn):關(guān)于均值的參數(shù)檢驗(yàn) 關(guān)于方差和均值差的參數(shù)檢驗(yàn)非參數(shù)的檢驗(yàn)方法4一、關(guān)于均值的參數(shù)檢驗(yàn)51.考慮如下情形:我們得到了一個(gè)隨機(jī)樣本,其樣本容量為n, 且樣本

2、服從正態(tài)分布N(x , x2) ;分布的方差x2已知,而分布的均值x未知。我們所感興趣的理論假設(shè)是x = 0 。相對(duì)應(yīng)于零假設(shè)的備擇假設(shè)有如下三種形式:(i) x 0. (實(shí)際均值僅可能高于0) (iii)x 0. (雙側(cè)檢驗(yàn)) 6檢驗(yàn)上面三種形式的被擇假設(shè)所共用的檢驗(yàn)統(tǒng)計(jì)量為:令z為對(duì)應(yīng)于標(biāo)準(zhǔn)正態(tài)分布的區(qū)間關(guān)鍵值。例如, z0.05=1.65的含義是,對(duì)于服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量Z而言,Z 1.65的概率為0.05。由此得到顯著水平為的Z檢驗(yàn)的拒絕域:0/xXzn7H0H1Critical Regionx = 0 x 0z 0z zx = 0 x 0|z| z/ 282.只有在方差已知的情

3、況下,Z檢驗(yàn)才是“恰當(dāng)”的檢驗(yàn)方法。當(dāng)方差未知,而樣本仍服從正態(tài)分布時(shí),關(guān)于均值的恰當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量為: 0/XTSn2211()1niiSSXXn9對(duì)于T檢驗(yàn)的拒絕域的描述與前面對(duì)Z檢驗(yàn)的拒絕域的描述類似,唯一的區(qū)別是標(biāo)準(zhǔn)正態(tài)分布換成了t分布。例如,雙側(cè)被擇假設(shè)x 0被接受、零假設(shè)x = 0被拒絕的條件為: 0/2|(1)/XTtnSn10例:假設(shè)我們相信在某個(gè)對(duì)策環(huán)境中,某個(gè)特定的納什均衡解出現(xiàn)的概率為p。我們并不知道在實(shí)際操作中p為多少,但理論中對(duì)p的預(yù)測(cè)為25%。這里我們需要檢驗(yàn)的零假設(shè)為p = 0.25,被擇假設(shè)為p 0.25。為了檢驗(yàn)這一假設(shè),我們征召100組實(shí)驗(yàn)對(duì)象進(jìn)行實(shí)驗(yàn),觀察在

4、實(shí)驗(yàn)中納什均衡解是否出現(xiàn)。由此,我們得到100個(gè)服從伯努利分布的、成功率為p的獨(dú)立觀察值。 11服從伯努利分布的隨機(jī)變量的概率密度函數(shù)為: f(x) = px(1 p)1 x , x = 0, 1根據(jù)中心極限定理,對(duì)p的估計(jì)量的極限分布為正態(tài)分布:10011( , (1)/100)100iipxN p pp12假設(shè)我們根據(jù)觀察值得到對(duì)p的估計(jì)量 = 0.2,這也是對(duì)p的估計(jì)量的極限分布的均值的估計(jì)量。同時(shí),我們得到對(duì)p的估計(jì)量的極限分布的方差的估計(jì)量,0.2*0.8/100 = 0.0016。由此,我們可以構(gòu)造出檢驗(yàn)零假設(shè)的Z檢驗(yàn)統(tǒng)計(jì)量,并將該統(tǒng)計(jì)量與關(guān)鍵值相比較:我們無(wú)法在5%的顯著水平下拒

5、絕零假設(shè)。 p0.025|0.20.25|1.251.960.0016z13二、關(guān)于方差和均值差的參數(shù)檢驗(yàn)141.我們從某個(gè)方差未知的正態(tài)分布中得到含有n個(gè)觀察值的隨機(jī)樣本。如果我們需要檢驗(yàn)的零假設(shè)為該分布的方差等于100,相應(yīng)的備擇假設(shè)為雙側(cè)假設(shè),那么在零假設(shè)為真的前提下會(huì)有 (n 1)S2/1002(n 1)。因此,我們可以通過比較統(tǒng)計(jì)量S2與2(n 1)分布來(lái)檢驗(yàn)零假設(shè)是否為真。零假設(shè)的拒絕域?yàn)椋?或221/2100(1)1Snn22/2100(1)1Snn152.從兩個(gè)獨(dú)立的正態(tài)分布X和Y中我們分別得到m和n個(gè)觀察值。我們需要檢驗(yàn)的零假設(shè)是分布X和分布Y的方差相同,被擇假設(shè)為雙側(cè)假設(shè)。

6、 (n 1)SX2/x2 2(n 1) 且 (m 1)SY2/Y2 2(m 1),在零假設(shè)為真的前提下我們有x2 = Y2 ,因此SX2/SY2 F (n 1, m 1) 。163.從兩個(gè)獨(dú)立的正態(tài)分布X和Y中我們分別得到m和n個(gè)觀察值。假設(shè)我們已知兩個(gè)分布的方差相同,我們需要檢驗(yàn)的零假設(shè)是分布X和分布Y的均值相同,被擇假設(shè)為雙側(cè)假設(shè)。為檢驗(yàn)這一假設(shè),我們需要構(gòu)造的統(tǒng)計(jì)量為:: 該統(tǒng)計(jì)量服從自由度為n + m 2的t分布。 22(1)(1)/(2)(1/1/)XYXYTnSmSnmnm174.當(dāng)兩個(gè)獨(dú)立的正態(tài)分布X和Y的方差不相同時(shí),我們很難運(yùn)用傳統(tǒng)的方法檢驗(yàn)這兩個(gè)分布的均值是否相同。(其原因

7、是我們?cè)跇?gòu)造統(tǒng)計(jì)量時(shí)無(wú)法直接剔除方差的影響,這一問題被稱作Behrens-Fisher問題。) 18檢驗(yàn)這一假設(shè)的近似統(tǒng)計(jì)量為 該統(tǒng)計(jì)量近似服從自由度為n + m 2的t分布。樣本容量越大,該統(tǒng)計(jì)量的近似效果越好。當(dāng)樣本容量足夠大時(shí),t檢驗(yàn)可以被z檢驗(yàn)替代。當(dāng)分布X和分布Y的方差為已知量X2和Y2時(shí),我們可以用X2和Y2替代Sx2和SY2 ,此時(shí)的統(tǒng)計(jì)量準(zhǔn)確服從自由度為n + m 2的t分布。22()XYXYTSSnm19三、非參數(shù)檢驗(yàn)方法Siegel and Castellan, 1988. Nonparametric Statistics for the Behavioral Scienc

8、es. 201. 非參數(shù)統(tǒng)計(jì)檢驗(yàn)的優(yōu)勢(shì) 在小樣本的情況下,我們無(wú)法用正態(tài)分布描述數(shù)據(jù)生成過程。非參數(shù)檢驗(yàn)成了無(wú)法替代的選擇。 易于執(zhí)行秩檢驗(yàn)運(yùn)用非參數(shù)檢驗(yàn)易于比較來(lái)自不同分布的均值,非參數(shù)方法能夠很好地解決前面提到的Behrens-Fisher問題。 對(duì)統(tǒng)計(jì)量的構(gòu)造直觀212.非參數(shù)檢驗(yàn)的劣勢(shì) 由于非參數(shù)檢驗(yàn)不對(duì)樣本的來(lái)源總體的分布進(jìn)行任何假設(shè),其檢驗(yàn)強(qiáng)度要低于參數(shù)檢驗(yàn)(即相同的顯著水平下,非參數(shù)檢驗(yàn)“取偽”的可能性更大)。 223. 常用的非參數(shù)檢驗(yàn)方法 2契合度檢驗(yàn)契合度檢驗(yàn) 用于檢驗(yàn)?zāi)硺颖臼欠穹哪撤N特定的分布。 H0:樣本服從概率密度函數(shù)為f的分布。 H1:其它情況。 23檢驗(yàn)的統(tǒng)計(jì)量

9、為: Oi:落入第i個(gè)類別的觀察值的數(shù)量 Ei:當(dāng)零假設(shè)為真時(shí)預(yù)期落入第i個(gè)類別的觀察值的數(shù)量 k:類別的數(shù)量 當(dāng)顯著水平為、且 2(k 1)時(shí),零假設(shè)被拒絕。221()(1)kiiiiOEkE24例: 某實(shí)驗(yàn)記錄了n個(gè)實(shí)驗(yàn)參與者在多回合的重復(fù)對(duì)策中的序列決策。 Period/ChoiceABCD125%10%50%15%225%40%25%10%350%40%0%10%40%60%20%20%25Yjk = G(X1jk,,Xnjk,),j=1,4,k=A,D j:對(duì)策的回合 k:實(shí)驗(yàn)參與者可能的選擇 Y:頻率 X1至Xn:描述實(shí)驗(yàn)參與者特征的向量:參數(shù)向量現(xiàn)研究人員需要評(píng)價(jià)參數(shù)模型G()能

10、否很好地解釋在實(shí)驗(yàn)中實(shí)驗(yàn)參與者在各回合做出各種不同決策的頻率。26用2契合度檢驗(yàn)來(lái)回答這一問題: 估計(jì)參數(shù)模型。根據(jù)觀察值X1Xn,Y得到參數(shù)向量的點(diǎn)估計(jì) 。根據(jù)估計(jì)量 和參數(shù)模型得到在各回合中所有實(shí)驗(yàn)參與者總的選擇各種決策的頻率的估計(jì)值(在這個(gè)例子中的“類別”,就是表中的各單元)。最后,計(jì)算統(tǒng)計(jì)量并將其與分布2(15)相比較。 27 統(tǒng)計(jì)量只是漸進(jìn)服從2分布。 當(dāng)數(shù)據(jù)量較小、特別是當(dāng)實(shí)驗(yàn)者所劃分的每個(gè)類別內(nèi)的觀察值少于5個(gè)時(shí),實(shí)驗(yàn)者應(yīng)適當(dāng)合并類別以增加每個(gè)類別內(nèi)的觀察值數(shù)量。 當(dāng)類別數(shù)量和類別內(nèi)的觀察值數(shù)量都很少時(shí),該檢驗(yàn)的結(jié)果可能會(huì)不準(zhǔn)確。28配對(duì)排列檢驗(yàn)相對(duì)實(shí)驗(yàn)中檢驗(yàn)實(shí)驗(yàn)效果的有效檢驗(yàn)。

11、零假設(shè):在不同實(shí)驗(yàn)條件下所觀察到的實(shí)驗(yàn)結(jié)果差異完全不是因?yàn)閷?shí)驗(yàn)條件的變化造成的。 29 研究人員希望了解A和B兩種市場(chǎng)機(jī)制下的平均交易價(jià)格有無(wú)顯著差異。 獨(dú)立地征召10組實(shí)驗(yàn)參與者共進(jìn)行10次實(shí)驗(yàn),每次實(shí)驗(yàn)分別在A和B兩種市場(chǎng)機(jī)制下讓實(shí)驗(yàn)參與者進(jìn)行交易。 投擲硬幣決定機(jī)制實(shí)施次序。 用H表示先A后B,用T表示先B后A。 30參與者(組) 機(jī)制A下的交易價(jià)格PA 機(jī)制B下的交易價(jià)格PB PB PA 1 (H)13.214.0.82 (H)8.28.8.63 (T)10.911.2.34 (H)14.314.2-.15 (T)10.711.81.16 (H)6.66.4-.27 (H)9.59.8

12、.38 (H)10.811.3.59 (T)8.89.3.510 (H)13.313.6.3Mean: 0.4131 如果零假設(shè)為真,則各組參與者調(diào)換實(shí)施機(jī)制A和機(jī)制B的次序,所造成的交易價(jià)格差PB PA的變化僅體現(xiàn)在正負(fù)符號(hào)上。 10組參與者一共有210 = 1024種實(shí)施實(shí)驗(yàn)的可能。 對(duì)其它1023種可能的實(shí)施方案下的結(jié)果,在零假設(shè)為真的前提下,如果某組參與者實(shí)施A和B的次序與真實(shí)的實(shí)驗(yàn)次序一致,則預(yù)期的價(jià)格差與真實(shí)的實(shí)驗(yàn)結(jié)果一致;如果實(shí)施A和B的次序與真實(shí)的實(shí)驗(yàn)次序相反,則預(yù)期的價(jià)格差與真實(shí)的實(shí)驗(yàn)結(jié)果符號(hào)相反。32 1023種方案下的1023個(gè)預(yù)期平均價(jià)格差就構(gòu)成了零假設(shè)下的取樣分布。

13、將實(shí)驗(yàn)中得到的平均價(jià)格差與其它的1023個(gè)預(yù)期平均價(jià)格差相比較,實(shí)驗(yàn)者就得到了實(shí)驗(yàn)所得平均價(jià)格差在配對(duì)排列檢驗(yàn)中的P值(P值是在零假設(shè)為真的前提下,預(yù)期的平均價(jià)格差高于實(shí)驗(yàn)所得平均價(jià)格差的機(jī)率)。 33 1023個(gè)預(yù)期平均價(jià)格差當(dāng)中僅僅有3個(gè)預(yù)期平均價(jià)格差高于0.41,僅僅有4個(gè)預(yù)期平均價(jià)格差等于0.41。實(shí)驗(yàn)者所實(shí)施的配對(duì)排列檢驗(yàn)的P值為7/1024,約等于0.7%。 實(shí)驗(yàn)效果非常顯著,實(shí)驗(yàn)者應(yīng)當(dāng)拒絕零假設(shè)。 34 由于配對(duì)排列檢驗(yàn)運(yùn)用樣本中的全部信息,在非參數(shù)檢驗(yàn)方法中配對(duì)排列檢驗(yàn)是檢驗(yàn)強(qiáng)度較高的檢驗(yàn)方法。 缺點(diǎn): 觀察值的數(shù)量較大時(shí)該檢驗(yàn)方法的計(jì)算負(fù)擔(dān)較繁重。 與配對(duì)排列檢驗(yàn)方法類似、計(jì)

14、算量又相對(duì)較小的非參數(shù)檢驗(yàn)方法是Wilcoxon符號(hào)秩檢驗(yàn),有時(shí)該方法也被稱作配對(duì)符號(hào)秩檢驗(yàn)。 只考慮實(shí)驗(yàn)結(jié)果差異的符號(hào)、并不記錄實(shí)驗(yàn)結(jié)果差異的真實(shí)值。 35中位數(shù)檢驗(yàn)中位數(shù)檢驗(yàn)用于檢驗(yàn)兩個(gè)獨(dú)立的樣本是否具有相同的中位數(shù)。由于中位數(shù)檢驗(yàn)不對(duì)兩個(gè)獨(dú)立樣本背后的分布作出很強(qiáng)的假設(shè),該檢驗(yàn)適用范圍很廣。 36將兩個(gè)獨(dú)立樣本合并、得到合并樣本的中位數(shù),然后構(gòu)建下表: 樣本I 樣本II大于合并樣本中位數(shù)的觀察值數(shù)量 AB小于合并樣本中位數(shù)的觀察值的數(shù)量 CD觀察值數(shù)量 mn37令觀察值總量為N,N = m + n,則取樣分布的近似統(tǒng)計(jì)量為 中位數(shù)檢驗(yàn)的零假設(shè)為兩個(gè)獨(dú)立樣本的中位數(shù)相同。在零假設(shè)為真的前提

15、下,統(tǒng)計(jì)量v服從分布2(1)。樣本容量越大,統(tǒng)計(jì)量v的近似效果越好。2()/2()()()()NADBCNvAB CD AC BD38 Wilcoxon-Mann-Whitney檢驗(yàn)是與中位數(shù)檢驗(yàn)相類似的非參數(shù)檢驗(yàn)方法。 Wilcoxon-Mann-Whitney檢驗(yàn)的強(qiáng)度要高于中位數(shù)檢驗(yàn)的強(qiáng)度,但代價(jià)是 Wilcoxon-Mann-Whitney檢驗(yàn)要作出更強(qiáng)的假設(shè),比如兩個(gè)獨(dú)立樣本所服從的分布的方差相同。 39Jonckheere檢驗(yàn)假設(shè)實(shí)驗(yàn)者從k個(gè)獨(dú)立的總體中得到k個(gè)數(shù)據(jù)集,令第i個(gè)總體的中位數(shù)為i,Jonckheere檢驗(yàn)可用于檢驗(yàn)下面的假設(shè):零假設(shè)H0:各總體的分布相同。 備擇假設(shè)H1:各個(gè)總體的中位數(shù)不同,其次序?yàn)? k, 且至少有一個(gè) 不等式為嚴(yán)格不等式。40為進(jìn)行Jonckheere檢驗(yàn),首先我們需要構(gòu)建下面的表格: 數(shù)據(jù)集1(中位數(shù)最小的數(shù)據(jù)集) 數(shù)據(jù)集2(中位數(shù)次小的數(shù)據(jù)集) 數(shù)據(jù)集k(中位數(shù)最大的數(shù)據(jù)集) X(1,1)X(1,2)X(1,k)X(2,1)X(2,2)X(2,k)X(n1,1)X(n2,2)X(nk,k) 表中各列由小到大排序 41Jonckheere檢驗(yàn)的統(tǒng)計(jì)量J*: 對(duì)表中前k1列中的每一個(gè)觀察值X(i,j),構(gòu)造與其相對(duì)應(yīng)的N(i,j)。N(i,j)是第j

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論