假設(shè)的檢定兩個(gè)變量的相關(guān)

上傳人：活*** IP屬地：寧夏上傳時(shí)間：2021-10-22 格式：PPT 頁(yè)數(shù)：76 大?。?68.50KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩71頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十章第十章假設(shè)的檢定假設(shè)的檢定兩個(gè)變量的相關(guān)兩個(gè)變量的相關(guān) 第一節(jié)第一節(jié)n兩個(gè)定類變項(xiàng)兩個(gè)定類變項(xiàng)定類或定序ppt上考至少考一個(gè)例題定距n 倘若要研究倘若要研究x x與與y y這兩個(gè)變項(xiàng)是否相關(guān)，則在這兩個(gè)變項(xiàng)是否相關(guān)，則在抽取了一個(gè)隨機(jī)樣本以后便首先運(yùn)用前面所介紹抽取了一個(gè)隨機(jī)樣本以后便首先運(yùn)用前面所介紹的方法，簡(jiǎn)化樣本中的資料，從而計(jì)算的方法，簡(jiǎn)化樣本中的資料，從而計(jì)算x x與與y y的相的相關(guān)程度和方向。但是，即使在樣本中關(guān)程度和方向。但是，即使在樣本中x x與與y y是相關(guān)是相關(guān)的，卻可能是由的，卻可能是由抽樣誤差抽樣誤差所引起，不一定是在總所引起，不一定是在總體中也相關(guān)。由于我們

2、所關(guān)心的是總體的情況不體中也相關(guān)。由于我們所關(guān)心的是總體的情況不是樣本的情況，因此，需要作統(tǒng)計(jì)推論，本章的是樣本的情況，因此，需要作統(tǒng)計(jì)推論，本章的目的是目的是介紹怎樣運(yùn)用樣本的資料來(lái)檢定假設(shè)，在介紹怎樣運(yùn)用樣本的資料來(lái)檢定假設(shè)，在總體中總體中x x與與y y是相關(guān)的。是相關(guān)的。n 在介紹計(jì)算相關(guān)系數(shù)時(shí)，我們強(qiáng)調(diào)要特別注在介紹計(jì)算相關(guān)系數(shù)時(shí)，我們強(qiáng)調(diào)要特別注意變項(xiàng)的測(cè)量層次，同樣，在選用相關(guān)的檢定法意變項(xiàng)的測(cè)量層次，同樣，在選用相關(guān)的檢定法時(shí)，也要特別注意該檢定法所要求的時(shí)，也要特別注意該檢定法所要求的測(cè)量層次測(cè)量層次。一、交互分類表中變量的相互獨(dú)立性一、交互分類表中變量的相互獨(dú)立性研究定類

3、變量之間的關(guān)系，實(shí)際上就是通過(guò)研究定類變量之間的關(guān)系，實(shí)際上就是通過(guò)條件分布條件分布的的比較進(jìn)行的，下面我們首先通過(guò)條件分布表來(lái)看一看兩變項(xiàng)比較進(jìn)行的，下面我們首先通過(guò)條件分布表來(lái)看一看兩變項(xiàng)的相互獨(dú)立性。的相互獨(dú)立性。老老年年中中年年青青年年邊緣和邊緣和戲曲戲曲20/27=0.7420/27=0.7410/40=0.2510/40=0.252/57=0.042/57=0.0432/124=0.2632/124=0.26歌舞歌舞5/27=0.185/27=0.1820/40=0.5020/40=0.5035/57=0.6135/57=0.6160/124=0.4860/124=0.48問(wèn)

4、題是，如何進(jìn)行比較呢？問(wèn)題是，如何進(jìn)行比較呢？根據(jù)上表中的根據(jù)上表中的每一行每一行，可以比較三代人的喜愛(ài)是，可以比較三代人的喜愛(ài)是否有所不同，首先對(duì)戲曲來(lái)說(shuō)，三代人的百分比分別否有所不同，首先對(duì)戲曲來(lái)說(shuō)，三代人的百分比分別是：是：0.740.740.250.250.040.04；歌舞為：歌舞為：0.180.180.500.500.610.61；球賽為：球賽為：0.080.080.250.250.350.35。可見(jiàn)，隨著代際的年輕化，對(duì)戲曲喜愛(ài)逐漸下降，可見(jiàn)，隨著代際的年輕化，對(duì)戲曲喜愛(ài)逐漸下降，而歌舞和球賽越來(lái)越受到歡迎，從而得出節(jié)目的喜愛(ài)而歌舞和球賽越來(lái)越受到歡迎，從而得出節(jié)目的喜愛(ài)

5、與代際相關(guān)的結(jié)論，也就是變量與代際相關(guān)的結(jié)論，也就是變量y(y(節(jié)目的喜愛(ài)節(jié)目的喜愛(ài)) )與變量與變量x(x(代際代際) )是有關(guān)的。是有關(guān)的。相關(guān)系數(shù)計(jì)算結(jié)果是否如此？相關(guān)系數(shù)計(jì)算結(jié)果是否如此？n 現(xiàn)在設(shè)想，如果統(tǒng)計(jì)的結(jié)果顯示，三代人的現(xiàn)在設(shè)想，如果統(tǒng)計(jì)的結(jié)果顯示，三代人的百分比是不變的，即：百分比是不變的，即：n 戲曲：戲曲：0.740.74、0.740.74、0.740.74n 歌舞：歌舞：0.180.18、0.180.18、0.180.18n 球賽：球賽：0.080.08、0.080.08、0.080.08n 那么，又該作出什么結(jié)論呢？那么，又該作出什么結(jié)論呢？n 顯然，如果選擇顯然，

6、如果選擇“喜愛(ài)節(jié)目喜愛(ài)節(jié)目”的比例對(duì)于三的比例對(duì)于三代人都是一樣的話，那就表示變量代人都是一樣的話，那就表示變量“節(jié)目節(jié)目”與變與變量量“代際代際”之間沒(méi)有關(guān)系的，這種情況稱變量之之間沒(méi)有關(guān)系的，這種情況稱變量之間是間是相互獨(dú)立的相互獨(dú)立的。如果變量間是相互獨(dú)立的話，。如果變量間是相互獨(dú)立的話，通過(guò)上例可以看出，必須存在通過(guò)上例可以看出，必須存在變量的條件分布和變量的條件分布和它的邊緣分布相同它的邊緣分布相同。即：即：nnnnnnnnnnrr*1*13*132*121*11nnnnnnnnnncc*2*23*232*221*21 x x y yx x1 1x x2 2x x3 3 x xc c

7、y y1 1n n1111n n2121n n3131 n nc1c1n n* *1 1y y2 2 n n1212 n n2222 n n3232 n nc2c2 n n* *2 2 y yr rn n1r1rn n2r2rn n3r3rn ncrcrn n* *r rn n1 1* *n n2 2* *n n3 3* *n nc c* *n nnnnnnnnnnnrccrrrr*33*22*11用一個(gè)通式來(lái)表示用一個(gè)通式來(lái)表示，即：，即：nnnnijji*(i=1,2(i=1,2 r r，j=1,2 j=1,2 c)c) 上式分子分母均乘以上式分子分母均乘以n n：nnnnnnijij*

8、ijijpnn*iipnnjjpnn*1 可見(jiàn)，如果交互類表中的變量是相互獨(dú)立的，可見(jiàn)，如果交互類表中的變量是相互獨(dú)立的，邊緣分布和條件分布存在以下關(guān)系。邊緣分布和條件分布存在以下關(guān)系。 x y x1 x2 xc 行邊緣 y1 p11 = p*1 p1*. p12 = p*2 p1* p1c =p*.cp1* p1* y2 p2 1=p*1 p2* p22 = p*2 p2* p2 c=p*.cp2* p2* yr p r 1=p*1. p r * p r 2= p*2pr* prc =p*c.p*r p r * 列邊緣 p*1 p*2 p*c pij=1 二、交互分類表二、交互分類表的原假設(shè)

9、的原假設(shè)n 交互分類表檢驗(yàn)是將總體中變量間無(wú)關(guān)系，或相互獨(dú)立交互分類表檢驗(yàn)是將總體中變量間無(wú)關(guān)系，或相互獨(dú)立作為檢驗(yàn)的原假設(shè)。即：作為檢驗(yàn)的原假設(shè)。即：n h h0 0：變量：變量x x與變量與變量y y無(wú)關(guān)（總體）無(wú)關(guān)（總體）n h h1 1：變量：變量x x與變量與變量y y有關(guān)（總體）有關(guān)（總體）n h h0 0：p pijij =p =pi i* *.p.p* *j j （i=1,2i=1,2c c；j=1,2j=1,2r r）n 由于由于p pi i和和p pj j是總體的邊緣分布，一般都是未知的，因此，是總體的邊緣分布，一般都是未知的，因此，可以可以用樣本中的邊緣頻率分布作為它的點(diǎn)

10、估計(jì)值用樣本中的邊緣頻率分布作為它的點(diǎn)估計(jì)值： n 列邊緣：列邊緣： i=1,2i=1,2c cn 行邊緣：行邊緣： j=1,2j=1,2c cn 這里小寫字母這里小寫字母n ni i，n nj j，n n表示樣本頻次。表示樣本頻次。nnppiii*nnppjij*三、交互分類表檢驗(yàn)的統(tǒng)計(jì)量三、交互分類表檢驗(yàn)的統(tǒng)計(jì)量x x2 2n 運(yùn)用統(tǒng)計(jì)量運(yùn)用統(tǒng)計(jì)量 2 2來(lái)進(jìn)行檢驗(yàn)。來(lái)進(jìn)行檢驗(yàn)。 2 2檢驗(yàn)要求：檢驗(yàn)要求：1 1）樣本是用隨機(jī)方法抽取的；樣本是用隨機(jī)方法抽取的；2 2）兩個(gè)變量）兩個(gè)變量都是有定類的性質(zhì)。都是有定類的性質(zhì)。n 交互分類檢驗(yàn)的程序和單變量檢驗(yàn)是相同交互分類檢驗(yàn)的程序和單變量檢

11、驗(yàn)是相同的：確定原假設(shè)；選擇適當(dāng)?shù)慕y(tǒng)計(jì)量，定出顯的：確定原假設(shè)；選擇適當(dāng)?shù)慕y(tǒng)計(jì)量，定出顯著性水平后根據(jù)樣本值進(jìn)行判斷。著性水平后根據(jù)樣本值進(jìn)行判斷。n 交互分類表統(tǒng)計(jì)量的確定是通過(guò)在原假設(shè)交互分類表統(tǒng)計(jì)量的確定是通過(guò)在原假設(shè)成立的條件下，用總體和樣本一系列值的比較成立的條件下，用總體和樣本一系列值的比較來(lái)進(jìn)行的，具體步驟是：來(lái)進(jìn)行的，具體步驟是：n求出列聯(lián)表中各格的期望頻次求出列聯(lián)表中各格的期望頻次n1 1）原假設(shè)：）原假設(shè)：h h0 0：p pijij=p=pi i* *.p.p* *j jn用樣本的邊緣和求出用樣本的邊緣和求出p pi i* *和和p p* *j jn（式中的第二個(gè)符號(hào)是根

12、據(jù)原假設(shè)（式中的第二個(gè)符號(hào)是根據(jù)原假設(shè)h h0 0得來(lái)的。得來(lái)的。n第三個(gè)近似是根據(jù)邊緣頻率分布的點(diǎn)估計(jì)值得來(lái)的。）第三個(gè)近似是根據(jù)邊緣頻率分布的點(diǎn)估計(jì)值得來(lái)的。）e eijij=np=npijij=np=np* *i i.p.p* *j jnjnin*.* 于是，在原假設(shè)于是，在原假設(shè)h h0 0成立條件下成立條件下的期望頻次交互分類表有下表的期望頻次交互分類表有下表1 1： x x y yx x1 1x x2 2x xc cy y1 1y y2 2 y yr re e1111e e2121e ec1c1e e1212e e2222e ec2c2 e e1r1re e2r2re ecrcr

13、不仿設(shè)想，在不仿設(shè)想，在h h0 0成立的條件下，作無(wú)數(shù)成立的條件下，作無(wú)數(shù)次抽樣，每次抽樣可得到一個(gè)實(shí)例的頻次交次抽樣，每次抽樣可得到一個(gè)實(shí)例的頻次交互分類表，如下表互分類表，如下表2 2： x x y y x x1 1x x2 2x xc cy y1 1n n1111n n2121n nc c1 1y y2 2n n1212n n2222n nc c2 2 y yr rn n1r1rn n2 2r rn nc cr r 比較表比較表1 1和表和表2 2，可以想象如果總體中，可以想象如果總體中h h0 0為真為真的話，那么實(shí)例頻次列聯(lián)表的格值和期望頻次的話，那么實(shí)例頻次列聯(lián)表的格值和期望頻次

14、列聯(lián)表中的格值相差不多的可能性較大。反之，列聯(lián)表中的格值相差不多的可能性較大。反之，如果兩表的格值差距很大。如果兩表的格值差距很大。上述的討論可用以下的統(tǒng)計(jì)量來(lái)表示：上述的討論可用以下的統(tǒng)計(jì)量來(lái)表示：分子取平方是為了取其絕對(duì)分子取平方是為了取其絕對(duì)差值，而分母差值，而分母e eijij是為了平衡是為了平衡e eijij數(shù)值本身的大小，否則，數(shù)值本身的大小，否則，如果如果e eijij本身數(shù)值很小的話，本身數(shù)值很小的話，則即使則即使(n(nijij-e-eijij) )2 2與與e eij ij 相比已相比已經(jīng)很大，但在總平方和中仍然經(jīng)很大，但在總平方和中仍然是微不足道。是微不足道。n 上述

15、統(tǒng)計(jì)量，經(jīng)過(guò)數(shù)學(xué)計(jì)算可知，當(dāng)上述統(tǒng)計(jì)量，經(jīng)過(guò)數(shù)學(xué)計(jì)算可知，當(dāng)n n很大，很大，每格每格e eijij都不太小，服從自由度都不太小，服從自由度k=(r-1)(c-1)k=(r-1)(c-1)的的 2 2分分布。布。n注意，注意，下面就交互分類表的統(tǒng)計(jì)量進(jìn)行討論下面就交互分類表的統(tǒng)計(jì)量進(jìn)行討論：n 1.1.對(duì)于對(duì)于2 2 2 2表，由于格數(shù)過(guò)少，為減少偏差，表，由于格數(shù)過(guò)少，為減少偏差，要作連續(xù)性修正，尤其在有某一個(gè)或多個(gè)格的預(yù)期要作連續(xù)性修正，尤其在有某一個(gè)或多個(gè)格的預(yù)期次數(shù)等于或小于次數(shù)等于或小于5 5時(shí)必須修正：時(shí)必須修正： 2 2. .以上以上 2 2檢驗(yàn)的討論，也適用于單變檢驗(yàn)的討論，也

16、適用于單變量二項(xiàng)總體或多項(xiàng)總體的假設(shè)檢驗(yàn)。量二項(xiàng)總體或多項(xiàng)總體的假設(shè)檢驗(yàn)。 n（1 1）二項(xiàng)總體。）二項(xiàng)總體。n 在單總體假設(shè)檢驗(yàn)中，曾談到對(duì)于大在單總體假設(shè)檢驗(yàn)中，曾談到對(duì)于大樣本總體成數(shù)的假設(shè)檢驗(yàn)，可用：樣本總體成數(shù)的假設(shè)檢驗(yàn)，可用：n z= z= 作為總體成數(shù)的原假設(shè)作為總體成數(shù)的原假設(shè) nh h0 0：p=pp=p0 0的統(tǒng)計(jì)量。的統(tǒng)計(jì)量。npppp)1 (000n 但是通過(guò)列聯(lián)表的討論，可引出另一件與但是通過(guò)列聯(lián)表的討論，可引出另一件與 2 2等價(jià)的檢驗(yàn)方式：改等價(jià)的檢驗(yàn)方式：改h h0 0：p=pp=p0 0(p(p0 0為總體成數(shù)為總體成數(shù)) )。n 于是對(duì)于樣本容量為于是對(duì)于樣

17、本容量為n n的抽樣，其理論上的抽樣，其理論上期望頻次為：期望頻次為：e e1 1=np=np0 0 n 而理論上非期望出現(xiàn)的頻次為：而理論上非期望出現(xiàn)的頻次為：e e2 2=n(1-=n(1-p p0 0) )。n 與此同時(shí)，相對(duì)應(yīng)的實(shí)際觀測(cè)值為與此同時(shí)，相對(duì)應(yīng)的實(shí)際觀測(cè)值為n n1 1和和n n2 2(n(n1 1+n+n2 2=n)=n)。n 引用引用 2 2檢驗(yàn)有：檢驗(yàn)有： n 可以證明，當(dāng)可以證明，當(dāng)n n較大時(shí)，較大時(shí)， 2 2分布近似地為分布近似地為自由度自由度k=1k=1的的 2 2分布，根據(jù)連續(xù)修正，上述分布，根據(jù)連續(xù)修正，上述 2 2為：為：222212112)()(een

18、eenx222212112)5 . 011 ()5 . 011 (eeneenx（2）多項(xiàng)總體）多項(xiàng)總體n 多項(xiàng)分布是單項(xiàng)二項(xiàng)分布的自然擴(kuò)展，如果變量多項(xiàng)分布是單項(xiàng)二項(xiàng)分布的自然擴(kuò)展，如果變量a a共共有有r r類：類：a a1 1、a a2 2、a ar r。n 設(shè)總體種各類的概率為：設(shè)總體種各類的概率為：p p1 1、p p2 2、p pr r。于是總體。于是總體的原假設(shè)的原假設(shè)h h0 0為：為：h h0 0:p:pi i=p=pi0 i0 （i=1,2i=1,2r r）n 對(duì)于樣本容量為對(duì)于樣本容量為n n的抽樣，其理論是期望頻次分布為：的抽樣，其理論是期望頻次分布為：e ei i=n

19、p=npi0i0。n 與此同時(shí)，相對(duì)應(yīng)的各類實(shí)際觀測(cè)值為：與此同時(shí)，相對(duì)應(yīng)的各類實(shí)際觀測(cè)值為：n n1 1、n n2 2n nr r。則則 2 2值為：值為：n 可以證明，可以證明， 2 2近似地滿足自由度近似地滿足自由度k=r-1k=r-1的的 2 2分布。分布。riiiirxeenx122) 1()( 3. 3. 使用統(tǒng)計(jì)量使用統(tǒng)計(jì)量 2 2對(duì)對(duì)rcrc表進(jìn)行檢驗(yàn)，每一表進(jìn)行檢驗(yàn)，每一格值的格值的e eijij要保持在一定數(shù)目上。要保持在一定數(shù)目上。q 如果其中有的格值如果其中有的格值e eijij過(guò)小，在計(jì)算過(guò)小，在計(jì)算q值時(shí)，值時(shí)， 2 2值的波動(dòng)就會(huì)過(guò)大。值的波動(dòng)就會(huì)過(guò)大。q e

20、eijij應(yīng)該取多大，根據(jù)要求的精確程度不同，不應(yīng)該取多大，根據(jù)要求的精確程度不同，不同研究者給出的限制不同。同研究者給出的限制不同。q 對(duì)于二項(xiàng)總體，要求對(duì)于二項(xiàng)總體，要求npnp 5 5，n(1-p)n(1-p) 5 5。也就是。也就是如果只有兩個(gè)格值的話，必須要求所有如果只有兩個(gè)格值的話，必須要求所有e eijij 5 5。q 有的研究者認(rèn)為有的研究者認(rèn)為e eijij 5 5的要求適合所有的要求適合所有r r c c的交的交互分類表。但也有人認(rèn)為對(duì)于互分類表。但也有人認(rèn)為對(duì)于r r c c 交互分類表，交互分類表，e eijij 3 3就可以了。另外，還有人指出就可以了。另外，還有人指

21、出e eijij小于小于5 5的格數(shù)的格數(shù)不應(yīng)超過(guò)總格數(shù)不應(yīng)超過(guò)總格數(shù)20%20%，當(dāng)小于，當(dāng)小于5 5的格值過(guò)多會(huì)引起判的格值過(guò)多會(huì)引起判斷的失誤。斷的失誤。ijijijeen2)(舉例：設(shè)實(shí)例值和期望值共有舉例：設(shè)實(shí)例值和期望值共有7 7個(gè)格值個(gè)格值。eij 321138724241nij 301108623554 從直現(xiàn)來(lái)判斷，實(shí)例值和期望值相差不從直現(xiàn)來(lái)判斷，實(shí)例值和期望值相差不大，可以接受原有假設(shè)。但如何用大，可以接受原有假設(shè)。但如何用 2值進(jìn)行顯值進(jìn)行顯著性檢驗(yàn)?zāi)?？（著性檢驗(yàn)?zāi)?？?=0.05=0.05）。）。 01.141) 14 (4) 45 (2) 25 (24)2423(

22、87)8786(113)113110(32)3230(22222222x592.12) 17(01.1405. 022xx 檢驗(yàn)表明：有顯著性差異。檢驗(yàn)表明：有顯著性差異。為什么會(huì)出現(xiàn)感覺(jué)和為什么會(huì)出現(xiàn)感覺(jué)和x x2 2檢驗(yàn)不符的情況呢？主要檢驗(yàn)不符的情況呢？主要因?yàn)樵谝驗(yàn)樵? 7個(gè)格值中就有個(gè)格值中就有3 3個(gè)期望值小于個(gè)期望值小于5 5，占總數(shù)的，占總數(shù)的43%43%。因此因此 2 2計(jì)算值偏大當(dāng)出現(xiàn)上述情況時(shí)，可將期望值偏計(jì)算值偏大當(dāng)出現(xiàn)上述情況時(shí)，可將期望值偏小的格值合并。小的格值合并。eij 32 113 8724 7 nij 30 110 86 23 14 2 = 87)8786

23、(113)113110(32)3230(22226. 77)714(24)2423(22臨界值：臨界值：49.9)15(05.02x49. 9) 15(26. 705. 022xx 接受接受h h0 0，作出直觀感覺(jué)和，作出直觀感覺(jué)和 2 2檢驗(yàn)相符的結(jié)論。檢驗(yàn)相符的結(jié)論。例：例：某鎮(zhèn)研究職業(yè)代際流動(dòng)，調(diào)查了某鎮(zhèn)研究職業(yè)代際流動(dòng)，調(diào)查了共共140人，其結(jié)果如下：人，其結(jié)果如下：解：解：h h0 0：子輩職業(yè)與父輩職業(yè)無(wú)關(guān)：子輩職業(yè)與父輩職業(yè)無(wú)關(guān) h h1 1：子輩職業(yè)與父輩職業(yè)有關(guān)：子輩職業(yè)與父輩職業(yè)有關(guān) 得期望頻次表得期望頻次表4.4. 2 2檢驗(yàn)就其檢驗(yàn)的內(nèi)容來(lái)看是雙邊檢驗(yàn)，檢驗(yàn)就其檢

24、驗(yàn)的內(nèi)容來(lái)看是雙邊檢驗(yàn)，就檢驗(yàn)的形式來(lái)看，又象右邊檢驗(yàn)。就檢驗(yàn)的形式來(lái)看，又象右邊檢驗(yàn)。n 從上面所舉例中的從上面所舉例中的h h0 0和和h h1 1就可以看出，它所判斷的內(nèi)容僅就可以看出，它所判斷的內(nèi)容僅是變量間是否存在關(guān)系。至于關(guān)系的方向，由于列聯(lián)表屬定是變量間是否存在關(guān)系。至于關(guān)系的方向，由于列聯(lián)表屬定類變量，因此是不存在的。但從列聯(lián)表類變量，因此是不存在的。但從列聯(lián)表 2 2的統(tǒng)計(jì)量的公式來(lái)看，的統(tǒng)計(jì)量的公式來(lái)看，只有期望頻次和實(shí)測(cè)頻次的絕對(duì)值愈大，才能否定變量間關(guān)只有期望頻次和實(shí)測(cè)頻次的絕對(duì)值愈大，才能否定變量間關(guān)系的原假設(shè)即：系的原假設(shè)即： 2 2 2 2。n 因此，列聯(lián)表檢驗(yàn)從

25、形式來(lái)看，卻又很像右側(cè)單邊檢驗(yàn)：因此，列聯(lián)表檢驗(yàn)從形式來(lái)看，卻又很像右側(cè)單邊檢驗(yàn)：x2(r-l)(c-1) 5. 交互分類的檢驗(yàn)是通過(guò)頻次而不是通過(guò)相交互分類的檢驗(yàn)是通過(guò)頻次而不是通過(guò)相對(duì)頻次的比較進(jìn)行的。對(duì)頻次的比較進(jìn)行的。表表1 1的的 2 2值：值：表表2 2的的 2 2值值表表3 3的的 2 2值值252525)25252510(502525)50252515(222x2252525)25252515(502525)25252510(22505050)100505020(1005050)50505030(222x41005050)100505030(1005050)100505020(

26、22200100100)20010010040(200100100)20010010060(222x8200100100)20010010060(200100100)20010010040(22n如果選擇如果選擇a=0.05a=0.05，查表得：，查表得： n x x2 20.050.05(1)=3.841=3.84(1)=3.841=3.84n 則表則表1 1判斷為無(wú)顯著性差異，表判斷為無(wú)顯著性差異，表2 2和表和表3 3則判斷為有顯著性差異，可見(jiàn)，相對(duì)頻次則判斷為有顯著性差異，可見(jiàn)，相對(duì)頻次相同的交互分類表，在統(tǒng)計(jì)檢驗(yàn)中，其顯相同的交互分類表，在統(tǒng)計(jì)檢驗(yàn)中，其顯著性并不相同，特別是當(dāng)總體中

27、兩變量相著性并不相同，特別是當(dāng)總體中兩變量相關(guān)并不很大時(shí)，如果樣本容量較小，很可關(guān)并不很大時(shí)，如果樣本容量較小，很可能呈現(xiàn)無(wú)顯著性差異，但當(dāng)樣本容量增大能呈現(xiàn)無(wú)顯著性差異，但當(dāng)樣本容量增大時(shí)，時(shí)， 2 2將增大，這時(shí)雖然列聯(lián)表的相對(duì)頻將增大，這時(shí)雖然列聯(lián)表的相對(duì)頻次沒(méi)有改變，但很可能呈現(xiàn)有顯著性差異，次沒(méi)有改變，但很可能呈現(xiàn)有顯著性差異，這時(shí)因?yàn)檫@時(shí)因?yàn)?2 2的臨界值并不變化。的臨界值并不變化。通過(guò)上面的例子，可以看出，當(dāng)樣通過(guò)上面的例子，可以看出，當(dāng)樣本容量增加本容量增加k k倍時(shí)，倍時(shí)，由此可見(jiàn)如果相對(duì)由此可見(jiàn)如果相對(duì)頻次不變，當(dāng)樣本容量增加頻次不變，當(dāng)樣本容量增加k k倍時(shí)，倍時(shí)，

28、2 2值將增加值將增加k k倍。倍。2222)()(kxeenkkekeknxijijijijijij 實(shí)際上，這也是容易理解的，因?yàn)楫?dāng)樣本容量增加之后，實(shí)際上，這也是容易理解的，因?yàn)楫?dāng)樣本容量增加之后，如果仍然保持原有的比例的關(guān)系，則說(shuō)明它出于隨機(jī)誤差的可如果仍然保持原有的比例的關(guān)系，則說(shuō)明它出于隨機(jī)誤差的可能性減少，也就是確認(rèn)其比例關(guān)系的把握增大。這也是為什么能性減少，也就是確認(rèn)其比例關(guān)系的把握增大。這也是為什么相對(duì)頻次的統(tǒng)計(jì)表必須注明調(diào)查總數(shù)的緣故。相對(duì)頻次的統(tǒng)計(jì)表必須注明調(diào)查總數(shù)的緣故。例：例：某工廠為了解職工對(duì)廠內(nèi)福某工廠為了解職工對(duì)廠內(nèi)福利是否滿意，作如下抽樣調(diào)查：利是否滿意，作

29、如下抽樣調(diào)查：依依h h0 0及樣本邊緣次數(shù)分布，計(jì)算期望頻數(shù)及樣本邊緣次數(shù)分布，計(jì)算期望頻數(shù)臨界值：由于臨界值：由于a=0.05 ,k=(2-1)(2-1)=1a=0.05 ,k=(2-1)(2-1)=1nx x2 20.050.05(1)=3.84(1)=3.84n x x2 2=9.27x=9.27x2 20.050.05(1)=3.84(1)=3.84n 拒絕拒絕h h0 0，接受，接受h h1 1，即男女職工，即男女職工對(duì)廠內(nèi)福利的滿意與否是有顯著差對(duì)廠內(nèi)福利的滿意與否是有顯著差異的，顯著性水平達(dá)到異的，顯著性水平達(dá)到0.050.05。作業(yè)：1 1根據(jù)某攤販的上報(bào)，每天平均營(yíng)業(yè)額為根

30、據(jù)某攤販的上報(bào)，每天平均營(yíng)業(yè)額為5555元。經(jīng)過(guò)元。經(jīng)過(guò)6 6天的抽查，其營(yíng)業(yè)額為（設(shè)天的抽查，其營(yíng)業(yè)額為（設(shè)營(yíng)業(yè)額滿足正態(tài)分布）：營(yíng)業(yè)額滿足正態(tài)分布）： 59.259.2，68.368.3，57.857.8，36.536.5，63.763.7，57.3 57.3 單位為元單位為元問(wèn)：原攤販上報(bào)的數(shù)字是否可信問(wèn)：原攤販上報(bào)的數(shù)字是否可信顯著顯著性水平為性水平為0.050.05？作業(yè) 2 2某學(xué)校對(duì)新生數(shù)學(xué)成績(jī)進(jìn)行摸底檢查，某學(xué)校對(duì)新生數(shù)學(xué)成績(jī)進(jìn)行摸底檢查，自自100100名經(jīng)濟(jì)專業(yè)的學(xué)生中抽出名經(jīng)濟(jì)專業(yè)的學(xué)生中抽出1212份考卷，份考卷，得平均分?jǐn)?shù)為得平均分?jǐn)?shù)為7070分，標(biāo)準(zhǔn)差分，標(biāo)準(zhǔn)差

31、3 3分；自分；自5050名管名管理專業(yè)的學(xué)生中抽取理專業(yè)的學(xué)生中抽取1010份考卷，得平均分份考卷，得平均分?jǐn)?shù)為數(shù)為6060分，標(biāo)準(zhǔn)差分，標(biāo)準(zhǔn)差4 4分，若已知總體服從正分，若已知總體服從正態(tài)分布且方差相等，問(wèn)兩專業(yè)學(xué)生之?dāng)?shù)學(xué)態(tài)分布且方差相等，問(wèn)兩專業(yè)學(xué)生之?dāng)?shù)學(xué)成績(jī)是否有顯著差別成績(jī)是否有顯著差別顯著性水平為顯著性水平為0.010.01。3 3、為研究?jī)煞N教學(xué)方法的效果，選擇了、為研究?jī)煞N教學(xué)方法的效果，選擇了6 6對(duì)智商、對(duì)智商、年齡、閱讀能力、家庭條件都相同的兒童進(jìn)行了實(shí)年齡、閱讀能力、家庭條件都相同的兒童進(jìn)行了實(shí)驗(yàn)，結(jié)果如下表。問(wèn)：能否認(rèn)為新教學(xué)法優(yōu)于原教驗(yàn)，結(jié)果如下表。問(wèn)：能否認(rèn)為

32、新教學(xué)法優(yōu)于原教學(xué)法（顯著度水平學(xué)法（顯著度水平=0.05=0.05）配對(duì)號(hào)配對(duì)號(hào)新教學(xué)法新教學(xué)法原教學(xué)法原教學(xué)法1 1838378 78 2 2696965653 3878788 88 4 4939391915 5787872 72 6 6595959 59 作業(yè)4 4、為了研究飲食習(xí)慣與地區(qū)之關(guān)系。作了共為了研究飲食習(xí)慣與地區(qū)之關(guān)系。作了共100人的隨機(jī)抽樣調(diào)查人的隨機(jī)抽樣調(diào)查資料如下表資料如下表，問(wèn)飲食習(xí)慣是，問(wèn)飲食習(xí)慣是否與地區(qū)有關(guān)否與地區(qū)有關(guān)(=0.05)？關(guān)系程度如何？關(guān)系程度如何？地區(qū)飲食習(xí)慣南方北方邊緣和面食米食10 3040 20 40 60邊緣和 50 50 1

33、00第二節(jié)第二節(jié)等級(jí)相關(guān)等級(jí)相關(guān)兩個(gè)定序變量?jī)蓚€(gè)定序變量一、一、r rs s的統(tǒng)計(jì)檢驗(yàn)的統(tǒng)計(jì)檢驗(yàn)n斯皮爾曼等級(jí)相關(guān)系數(shù)斯皮爾曼等級(jí)相關(guān)系數(shù): :n 其中，其中，ddi i2 2=(x=(xi i-y-yi i) )2 2 n n 當(dāng)當(dāng)r rs s是根據(jù)抽樣數(shù)據(jù)計(jì)算得來(lái)時(shí)，必須是根據(jù)抽樣數(shù)據(jù)計(jì)算得來(lái)時(shí)，必須進(jìn)行假設(shè)檢驗(yàn)，以確定總體中也存在等級(jí)進(jìn)行假設(shè)檢驗(yàn)，以確定總體中也存在等級(jí)相關(guān)。相關(guān)。) 1(6122nndrisr rs s的統(tǒng)計(jì)檢驗(yàn)步驟的統(tǒng)計(jì)檢驗(yàn)步驟n hoho：總體中變量：總體中變量x x與變量與變量y y等級(jí)無(wú)關(guān)，等級(jí)無(wú)關(guān)，p ps s=0=0n h1 h1：總體中變量：總體中變量x

34、x與變量與變量y y相關(guān)，相關(guān)，p ps s00n 根據(jù)根據(jù)hoho變量的條件下，不妨設(shè)想從總體中抽取無(wú)數(shù)個(gè)樣變量的條件下，不妨設(shè)想從總體中抽取無(wú)數(shù)個(gè)樣本容量為本容量為n n的樣本。根據(jù)每一個(gè)樣本，都可以計(jì)算出一個(gè)樣本的樣本。根據(jù)每一個(gè)樣本，都可以計(jì)算出一個(gè)樣本的等級(jí)相關(guān)系數(shù)的等級(jí)相關(guān)系數(shù)r rs s。由于抽樣誤差的存在，各次樣本的。由于抽樣誤差的存在，各次樣本的r rs s是是不等的，不等的，r rs s是隨機(jī)變量?？梢宰C明：當(dāng)是隨機(jī)變量。可以證明：當(dāng)n n 1010時(shí)，統(tǒng)計(jì)量：時(shí)，統(tǒng)計(jì)量： n 自由度自由度k kf f=n-2=n-2)2(122ntrnrtssn 正如一般正如一般t t分

35、布所具有的性質(zhì)，分布所具有的性質(zhì)，n n 3030，r rs s也可使用統(tǒng)計(jì)量也可使用統(tǒng)計(jì)量z z進(jìn)行檢驗(yàn)，在要求不十進(jìn)行檢驗(yàn)，在要求不十分嚴(yán)格的情況下，分嚴(yán)格的情況下，n n 1010亦可使用亦可使用z z值。值。110nrzs說(shuō)明：說(shuō)明：n 等級(jí)相關(guān)適用于等級(jí)相關(guān)適用于定序變量定序變量，研究的是變量間，研究的是變量間的等級(jí)是否存在相互關(guān)系。但對(duì)于的等級(jí)是否存在相互關(guān)系。但對(duì)于定距變量定距變量，在，在計(jì)算相關(guān)系數(shù)時(shí)，如果某些計(jì)算相關(guān)系數(shù)時(shí)，如果某些基本條件基本條件不能滿足不能滿足（如要求變量分布滿足正態(tài)分布），這時(shí)可以降（如要求變量分布滿足正態(tài)分布），這時(shí)可以降低變量層次，作為定序變量處理，

36、因?yàn)榈妥兞繉哟?，作為定序變量處理，因?yàn)榈燃?jí)相關(guān)等級(jí)相關(guān)系數(shù)對(duì)總體變量分布不作要求的系數(shù)對(duì)總體變量分布不作要求的。n 斯皮爾曼等級(jí)相關(guān)是斯皮爾曼等級(jí)相關(guān)是以變量沒(méi)有相同等級(jí)為以變量沒(méi)有相同等級(jí)為前提前提的，但如果相同等級(jí)不太多，可采用的，但如果相同等級(jí)不太多，可采用平均等平均等級(jí)的方法級(jí)的方法計(jì)算斯皮爾曼等級(jí)相關(guān)。計(jì)算斯皮爾曼等級(jí)相關(guān)。例：例：為了研究生育率與平均受教育程度之間的關(guān)系，為了研究生育率與平均受教育程度之間的關(guān)系，設(shè)隨機(jī)抽查了設(shè)隨機(jī)抽查了1010個(gè)縣，以下是按等級(jí)設(shè)計(jì)的結(jié)果，問(wèn)生個(gè)縣，以下是按等級(jí)設(shè)計(jì)的結(jié)果，問(wèn)生育率與受教育程度之間是否相關(guān)？（育率與受教育程度之間是否相關(guān)？（ =0

37、.05=0.05）縣號(hào)縣號(hào)生育率等級(jí)生育率等級(jí)受教育等級(jí)受教育等級(jí)等級(jí)差等級(jí)差didi didi2 21 16 63 33 39 92 24 41 13 39 93 39 97.57.51.51.52.252.254 48 87.57.50.50.50.250.255 51 15 5-4-416166 62.52.52 20.50.50.250.257 72.52.56 6-3.5-3.512.2512.258 87 71010-3-39 99 910109 91 11 1解：解：d di i2 2=60=60。r rs s不具有不具有prepre性質(zhì)，屬對(duì)稱測(cè)量。性質(zhì)，屬對(duì)稱測(cè)量。 636.

38、 09903601) 110(106061) 1(61222nndris334. 2636. 01210636. 01222ssrnrt統(tǒng)計(jì)量： h h0 0：ps=0 (ps=0 (總體中生育率與平均受教育無(wú)關(guān)總體中生育率與平均受教育無(wú)關(guān)) ) h h1 1：ps0ps0 臨界值臨界值t t0.05/20.05/2(10-2)(10-2)=2.306=2.306 因?yàn)橐驗(yàn)?t=2.334tt=2.334t0.05/20.05/2=2.306=2.306 因此，拒絕因此，拒絕h h0 0，接受，接受h h1 1，即可認(rèn)為生育率，即可認(rèn)為生育率與平均受教育是有關(guān)的，相關(guān)系數(shù)為與平均受教育是有關(guān)的

39、，相關(guān)系數(shù)為0.6360.636。二、二、gammagamma系數(shù)的檢驗(yàn)系數(shù)的檢驗(yàn) n h h0 0：總體中：總體中g(shù)=0g=0n h h1 1：總體中：總體中g(shù)0g0（或（或g0g0或或g0g0g0或或g0gzz=14.05z0.05/20.05/2=1.96=1.96。所以拒絕所以拒絕h h0 0，接受，接受h h1 1，即文化程度與代際流，即文化程度與代際流動(dòng)相關(guān)，用文化程度解釋代際流動(dòng)可消減動(dòng)相關(guān)，用文化程度解釋代際流動(dòng)可消減78%78%的的誤差，誤差，a=0.05a=0.05。注意：注意： n g g的的z z檢定公式檢定公式較為保守較為保守，通常略為低估了，通常略為低估了檢定值檢

40、定值(z)(z)。當(dāng)所算得的檢定值非常接近所要。當(dāng)所算得的檢定值非常接近所要求的否定域數(shù)值，就要用較為精確的求的否定域數(shù)值，就要用較為精確的s s因子檢因子檢驗(yàn)公式驗(yàn)公式。n 較為精確的做法是不用理會(huì)較為精確的做法是不用理會(huì)g g值，而直接值，而直接檢定（檢定（ns-ndns-nd）這個(gè)稱為）這個(gè)稱為s s因子的數(shù)值。因?yàn)橐蜃拥臄?shù)值。因?yàn)間 g分?jǐn)?shù)的公式是以分?jǐn)?shù)的公式是以s=ns-nds=ns-nd作為分子，因此作為分子，因此s=0s=0，即即g=0g=0。n 研究假設(shè)研究假設(shè)h h1 1為為s0(s0(或或s0s0或或s0),s0s0 由于由于n=44n=44，r=2r=2，c=4c=4，則

41、，則67.352)14)(12(244|360|s z z0.001/20.001/2=3.09=3.09，z=4.31zz=4.31z0.001/20.001/2=3.09=3.09所以拒絕所以拒絕h h0 0，接受，接受h h1 1。84.81)244)(144(4405104) 144(4451044800716144480716)2)(1() 1(133233222sennnbannbabanbase31. 484.8167.352sesz又因?yàn)椋河忠驗(yàn)椋?a a2 2=8=8 14+814+8 12+812+8 10+1410+14 12+1412+14 10+1210+12 10=

42、71610=716 b b2 2=20=20 24=48024=480 a a3 3=8=8 1414 12+812+8 1414 10+810+8 1212 10+1410+14 1212 10=510410=5104 b b3 3=0=0 ？因這只有兩個(gè)邊緣次數(shù)。因這只有兩個(gè)邊緣次數(shù)。5)85. 01 (443239285. 0)1 (22zgnndnsgz計(jì)算如果用同上題，如果用同上題，如果用z z檢驗(yàn)：檢驗(yàn)：注意注意n 許多定序相關(guān)測(cè)量法如許多定序相關(guān)測(cè)量法如dydy系數(shù)和肯德系數(shù)和肯德?tīng)柕臓柕膖autau系數(shù)，其公式都是以系數(shù)，其公式都是以“s=ns-nd”s=ns-nd”作為分子的

43、，因此它們都可以通過(guò)作為分子的，因此它們都可以通過(guò)s s的檢定的檢定來(lái)推論總體的情況。來(lái)推論總體的情況。n 由于都是以由于都是以s s作分子，故此在總體中如作分子，故此在總體中如果果s=0s=0，則，則g=dy=tau=0g=dy=tau=0，可見(jiàn)這三種相關(guān)系，可見(jiàn)這三種相關(guān)系數(shù)的檢定是有共同性的。數(shù)的檢定是有共同性的。第三節(jié)第三節(jié)兩個(gè)定距變量的檢驗(yàn)兩個(gè)定距變量的檢驗(yàn)不考一、回歸方程的檢驗(yàn)一、回歸方程的檢驗(yàn)n 用用最小二乘法最小二乘法求直線回歸的方法，求直線回歸的方法，是基于是基于線性回歸模型的基本假定線性回歸模型的基本假定進(jìn)行的。進(jìn)行的。因此在配置回歸直線之前，必須對(duì)總體因此在配置回歸直線

44、之前，必須對(duì)總體變量間是否存在線性相關(guān)關(guān)系進(jìn)行檢驗(yàn)。變量間是否存在線性相關(guān)關(guān)系進(jìn)行檢驗(yàn)。對(duì)于不存在線性關(guān)系的總體，配置回歸對(duì)于不存在線性關(guān)系的總體，配置回歸直線是毫無(wú)意義的。直線是毫無(wú)意義的。 1 1、檢驗(yàn)的原假設(shè)、檢驗(yàn)的原假設(shè)n 總體變量總體變量x x和總體變量和總體變量y y存在線性關(guān)系，即存在線性關(guān)系，即存在關(guān)系式：存在關(guān)系式：e(ye(yi i)=)= + + x xi in 因此，總體的線性回歸指的是當(dāng)因此，總體的線性回歸指的是當(dāng)x=xx=xi i時(shí)，時(shí)，y y的均值的均值e(ye(yi i) )是線性函數(shù)：是線性函數(shù)：e(ye(yi i)= )= + + x xi i關(guān)于關(guān)于 x

45、x與與y y關(guān)系式的基本假定關(guān)系式的基本假定：n 自變量自變量x x可以是隨機(jī)變量，也可是非隨機(jī)變量?？梢允请S機(jī)變量，也可是非隨機(jī)變量。x x值的測(cè)量值的測(cè)量可以認(rèn)為是沒(méi)有誤差的，或者說(shuō)誤差是可以忽略不計(jì)的。可以認(rèn)為是沒(méi)有誤差的，或者說(shuō)誤差是可以忽略不計(jì)的。n 由于由于x x和和y y之間存在的是非確定性的相關(guān)關(guān)系。因此，對(duì)于之間存在的是非確定性的相關(guān)關(guān)系。因此，對(duì)于x x的每一個(gè)值的每一個(gè)值x xi i，y yi i是隨機(jī)變量，或稱作是是隨機(jī)變量，或稱作是y y的子總體。要求的子總體。要求y y的所有的所有子總體子總體y y1 1、y y2 2y yi iy yn n，其方差都相等。，其方差

46、都相等。 d(yd(y1 1)=d(y)=d(y2 2)=)=d(yd(yn n) )n 如果如果y y的所有子總體，其均值的所有子總體，其均值e(ye(y1 1) )；e(ye(y2 2) )e(ye(yn n) )都在一條直線上，則稱作線性假定，其數(shù)學(xué)表達(dá)式為：都在一條直線上，則稱作線性假定，其數(shù)學(xué)表達(dá)式為：e(ye(yi i)=)= + + x xi i。由于。由于、對(duì)所有總體都一樣，所以對(duì)所有總體都一樣，所以和和是總是總體參數(shù)。體參數(shù)。n 要求隨機(jī)變量要求隨機(jī)變量 y yi i是統(tǒng)計(jì)獨(dú)立的，即是統(tǒng)計(jì)獨(dú)立的，即y y1 1的數(shù)值不影響的數(shù)值不影響y y2 2的數(shù)值，各的數(shù)值，各y

47、 y值之間都沒(méi)有關(guān)系。值之間都沒(méi)有關(guān)系。n 出于檢驗(yàn)的需要，除了上述假定或要求外，還要求出于檢驗(yàn)的需要，除了上述假定或要求外，還要求y y值的每一個(gè)子總體都滿足正態(tài)分布。值的每一個(gè)子總體都滿足正態(tài)分布。上述總體假定的數(shù)據(jù)結(jié)構(gòu)為上述總體假定的數(shù)據(jù)結(jié)構(gòu)為n （1 1）隨機(jī)變量隨機(jī)變量y yi i是統(tǒng)計(jì)獨(dú)立的，具有：均值是統(tǒng)計(jì)獨(dú)立的，具有：均值e(ye(yi i)=)= + + x xi i；方；方差差d(yd(yi i)=)= 2 2 ；（2 2）y yi i與與x xi i有如下關(guān)系式：有如下關(guān)系式：y y1 1= = + + x x1 1+e+e1 1 ；y y2 2= = + + x x2

48、2+e+e2 2；.y yn n= = + + x xn n+e+en n。其中其中e e1 1、e e2 2e en n是隨機(jī)變量，它們是隨機(jī)變量，它們相互獨(dú)立，具有：相互獨(dú)立，具有：e(ee(ei i)=0)=0，d(ed(ei i)=)= 2 2。根據(jù)前面的基本假設(shè)，對(duì)于總體線性檢根據(jù)前面的基本假設(shè)，對(duì)于總體線性檢驗(yàn)的假設(shè)可寫成如下形式驗(yàn)的假設(shè)可寫成如下形式：當(dāng)總體具有上述假定時(shí)，即根據(jù)樣本運(yùn)用最小二乘法所求解的方程：當(dāng)總體具有上述假定時(shí)，即根據(jù)樣本運(yùn)用最小二乘法所求解的方程：g=a+bxg=a+bx將是總體線性回歸方程：將是總體線性回歸方程：e(y)= e(y)= + + x x

49、的最佳線性無(wú)偏估計(jì)方程，的最佳線性無(wú)偏估計(jì)方程，a a和和b b是是和和的最佳無(wú)偏估計(jì)量。的最佳無(wú)偏估計(jì)量。另外，另外，e1e1、e2e2enen是隨機(jī)變量，它們相互獨(dú)立，具都服從相同的正是隨機(jī)變量，它們相互獨(dú)立，具都服從相同的正態(tài)分布態(tài)分布n(0n(0， 2 2) ) 2 2未知。未知。nh h0 0: : =0=0nh h1 1： 00n依據(jù)假設(shè)，可以根據(jù)平方和分解求出檢驗(yàn)的統(tǒng)計(jì)量。依據(jù)假設(shè)，可以根據(jù)平方和分解求出檢驗(yàn)的統(tǒng)計(jì)量。 2 2、線性回歸的平方和分解、線性回歸的平方和分解 n 總偏差平方和總偏差平方和tsstssn tsstss反映了觀測(cè)值反映了觀測(cè)值y yi i圍繞均值圍繞

50、均值 n tsstss同時(shí)還是同時(shí)還是prepre中的中的e e1 1，當(dāng)不知，當(dāng)不知y y和和x x及及關(guān)系時(shí)，對(duì)關(guān)系時(shí)，對(duì)y y的的最佳估計(jì)只能是最佳估計(jì)只能是y y，而每一個(gè)真實(shí)的，而每一個(gè)真實(shí)的y yi i值和估計(jì)值值和估計(jì)值y y之差，就之差，就構(gòu)成首次估計(jì)的誤差。構(gòu)成首次估計(jì)的誤差。niyyitss12)(niyiny11總的分散程度剩余平方和剩余平方和rssrssn 其中其中i i由回歸直線，由回歸直線，=a+bx=a+bx所確定所確定n rssrss反映了反映了y yi i偏離回歸直線偏離回歸直線i i的程度的程度, ,也就是也就是prepre定義中的定義中的e e2 2。r

51、ssrss反映了知道反映了知道y y與與x x有關(guān)系后，估有關(guān)系后，估計(jì)計(jì)y y值時(shí)所產(chǎn)生的總誤差，即通過(guò)回歸直線進(jìn)行估值時(shí)所產(chǎn)生的總誤差，即通過(guò)回歸直線進(jìn)行估計(jì)之后，仍然未能消除或未被解釋的誤差，又稱殘計(jì)之后，仍然未能消除或未被解釋的誤差，又稱殘差平方和。它的存在，說(shuō)明了除差平方和。它的存在，說(shuō)明了除x x對(duì)對(duì)y y的線性影響外，的線性影響外，還有其它未被考慮的因素，這些因素往往是十分復(fù)還有其它未被考慮的因素，這些因素往往是十分復(fù)雜的。雜的。 21)(niiiyyrss 回歸平方和回歸平方和rssrrssr n rssr=tss-rss n tss=rss+rssr 3 3、統(tǒng)計(jì)量、統(tǒng)計(jì)量n

52、設(shè)總體滿足原假設(shè)：設(shè)總體滿足原假設(shè)：h h0 0 ： =0=0，即分，即分別從別從 =0=0的總體中，如果無(wú)數(shù)次進(jìn)行樣本容的總體中，如果無(wú)數(shù)次進(jìn)行樣本容量為量為n n的抽樣，可以證明：的抽樣，可以證明：n統(tǒng)計(jì)量統(tǒng)計(jì)量：n統(tǒng)計(jì)量：統(tǒng)計(jì)量：n統(tǒng)計(jì)量統(tǒng)計(jì)量：) 1(22nxtss分布的滿足自由度為2221) 1 (xxrssr) 2(22nxrss)2, 1 (22/1/22nfnrssrssrnrssrssr對(duì)統(tǒng)計(jì)量對(duì)統(tǒng)計(jì)量 n 當(dāng)樣本幾個(gè)觀察點(diǎn)當(dāng)樣本幾個(gè)觀察點(diǎn)(x(xi i、y yi i) )確定后，確定后，tsstss則為定值。因此若剩余平方和則為定值。因此若剩余平方和rssrss大，則回歸

53、平方和大，則回歸平方和rssrrssr必小。反之，必小。反之，若剩余平方和若剩余平方和rssrss小，則回歸平方和小，則回歸平方和rssrrssr必大。而必大。而rssrrssr大，則說(shuō)明引入回大，則說(shuō)明引入回歸直線后，所能解釋掉的誤差大。歸直線后，所能解釋掉的誤差大。作定性的解釋2nrssrssrf 例：例：為了研究受教育年限和職業(yè)聲望為了研究受教育年限和職業(yè)聲望之間的關(guān)系，設(shè)以下是之間的關(guān)系，設(shè)以下是8 8名抽樣的名抽樣的結(jié)果，進(jìn)結(jié)果，進(jìn)行回歸直線的檢驗(yàn)行回歸直線的檢驗(yàn)( ( =0.05) =0.05) ：調(diào)查對(duì)象調(diào)查對(duì)象x(年年)y(聲望聲望)11270216803950419865219061065754481275708560133104yx99.5)28 , 1(8.5722.176)28(28.170

人人文庫(kù)> 全部分類> 行業(yè)資料 > 農(nóng)林牧漁

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

假設(shè)的檢定兩個(gè)變量的相關(guān)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

假設(shè)的檢定兩個(gè)變量的相關(guān)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔