第4講兩組平均水平的統(tǒng)計檢驗_第1頁
第4講兩組平均水平的統(tǒng)計檢驗_第2頁
第4講兩組平均水平的統(tǒng)計檢驗_第3頁
第4講兩組平均水平的統(tǒng)計檢驗_第4頁
第4講兩組平均水平的統(tǒng)計檢驗_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、Stata軟件基本操作和數(shù)據(jù)分析入門第四講兩組計量資料平均水平的統(tǒng)計檢驗一、配對設計的平均水平檢驗 統(tǒng)計方法選擇原則: 如果配對的差值服從近似正態(tài)分布(小樣本)或大樣本,則用配對t 檢驗 小樣本的情況下,配對差值呈明顯偏態(tài)分布,則用配對秩符號檢 驗(matched-p airs sig ned-ra nks test)例1 10例男性矽肺患者經(jīng)克矽平治療,其血紅蛋白(g/dL )如下:表10例男性矽肺患者血紅蛋白值(g/dL)病例號12345678910治療前11.315.015.013.512.810.011.012.013.012.3治療后14.013.814.013.513.512.01

2、4.711.413.812.0問:治療前后的血紅蛋白的平均水平有沒有改變 這是一個典型的前后配對設計的研究(但不提倡,因為對結(jié)果的解 釋可能會有問題)Stata數(shù)據(jù)輸入結(jié)構(gòu)11.3141513.8151413.513.512.813.510121114.71211.41313.812.312X1X2操作如下:gen d=x1-x2產(chǎn)生配對差值的變量dswilk d正態(tài)性檢驗正態(tài)性檢驗結(jié)果如下:.sktest dSkew ness/Kurtosis tests for NormalityjointVariable | Pr(Skew ness) P r(Kurtosis) adj chi2(2)

3、 P rob>chi2+d |0.2790.7741.430.4885正態(tài)性檢驗的無效假設為:資料正態(tài)分布相應的備選假設為:資料非正態(tài)分布a=0.05,由于正態(tài)性檢驗的P值=0.40189>R,故可以認為資料近似服從正態(tài)分布。ttest d=0配對 t 檢驗:Ho:Pd=O vs HiFdHO,0=0.05結(jié)果如下:On e-sa mple t testVariable |-uObsMea n Std. Err. Std. Dev. 95% Con f. I ntervald |10 -.6799999.52042721.645735-1.857288.4972881Degrees

4、 of freedom: 9Ho: mea n(d) = 0Ha: mean < 0t = -1.3066Ha: mean = 0 t = -1.3066Ha: mean > 0 t = -1.3066P < t = 0.1119P > |t| = 0.2237P > t = 0.8881P值=0.2237>g,故認為治療前后的血紅蛋白的平均數(shù)差異沒有統(tǒng)計學意義。即:沒有足夠的證據(jù)可以認為治療前后的血紅蛋白的總體平均數(shù)不同。如果已知差值的樣本量,樣本均數(shù)和樣本標準差,可以用立即命令如 下(如,已知樣本量為10,差值的樣本均數(shù)為-0.66,差值的標準差 為1.

5、65,則輸入命令如下:ttesti 樣本量樣本均數(shù)樣本標準差0 本例為:ttesti 10 -0.66 1.65 0Ha: mean > 0 t = 1.2649P > t = 0.1188得到下列結(jié)果如下:| Obs丄Mea n Std. Err. Std. Dev. 95% Co nf. In tervalx |10.66.52177581.65 -.52033891.840339.ttesti 10 .66 1.65 0 On e-sa mple t testDegrees of freedom: 9Ho: mean(x) = 0Ha: mean < 0Ha: mean

6、 = 0t = 1.2649t = 1.2649P < t = 0.8812 P > |t| = 0.2377結(jié)果解釋與結(jié)論同上述相同。如果對于小樣本的情況下,差值不滿足正態(tài)分布,則用Match-Sign-rank test,操作如下: signrank 差值變量名=0 假如本例不滿足正態(tài)分布(為了借用上例資料,而假定的,實際上本 例滿足正態(tài)分布)則Ho:差值的中位數(shù)=0 (其意義是治療前的血紅蛋白配 大于治療后的血紅蛋白的 概率=治療 前的血紅蛋白小于治療后的血紅蛋白的 概率)已:差值的中位數(shù)工00=0.05本例為 signrank d=0Wilcox on sig ned-ra

7、 nk testsign |-uobssum ranksexp ectedpo sitive |41827n egative |53627zero |111丄all |105555un adjusted varia nee96.25adjustme nt for ties0.00adjustme nt for zeros-0.25adjusted varia nee96.00Ho: d = 0z = -0.919Prob > |z| = 0.3583P值=0.3583>>a,故沒有足夠的證據(jù)說明兩個總體不同。二、平行對照設計的兩組資料平均水平統(tǒng)計檢驗統(tǒng)計方法選擇原則:如果兩組

8、資料的方差齊性和相互獨立的,并且每組資料服從正態(tài)分布(大樣本資料可以忽略正態(tài)性問題),則用成組t檢驗,否則可以用成組 Wilcoxon秩和檢驗。例2為研究噪聲對紡織女工子代智能是否有影響,一研究人員在某紡織廠隨機抽取接觸噪聲95dB( A)、接觸工齡5年以上的紡織女工及同一單位、條件與接觸組相近但不接觸噪聲的女職工,其子女(學前幼兒)作為研究對象,按韋氏學前兒童智力量表(中國修訂版)測定兩組幼兒智商,結(jié)果如下。問噪聲對紡織女工子代智能有無影響?(接觸組group=0,不接觸組group=1)資料及其結(jié)果如下:groupx0790930910920940770930740910101083073

9、088010209001000810910830106084078087095010111011100111418611061107110719418911041981110189110318911211941951921109198198112011041110方差齊性檢驗Ho: CT 1=cr 2 vs 比2嚴2a=0.1兩組方差齊性的檢驗命令(僅適合兩組方差齊性檢驗)sdtest x,by(group)Varia nee ratio testGroup | Obs Mea n Std. Err. Std. Dev. 95% Co nf. In terval+0 |2589.08 1.82

10、29289.11464 85.31766 92.842341 |25101.52 1.900982 9.504911 97.59657 105.4434-+comb ined |5095.3 1.577456 11.1543 92.12998 98.470020.920Ho: sd(0) = sd(1)F(24,24) observed = F_obsF(24,24) lower tail = F_L = F_obs =0.920F(24,24) upper tail = F_U = 1/F_obs =1.087Ha: sd(0) < sd(1)Ha: sd(0) = sd(1) Ha:

11、 sd(0) > sd(1)P < F_obs = 0.4195P < F_L + P > F_U = 0.8389 P > F_obs = 0.5805P值=0.8389>>a,因此可以認為兩組方差齊性的。正態(tài)性檢驗:H。:資料服從正態(tài)分布 vs H1:資料偏態(tài)分布。=0.05每一組資料正態(tài)性檢驗.swilk x if gro up=1Sha piro-Wilk W test for normal dataVariable | Obs W V z P rob>z+x |250.974030.722-0.667 0.74747 .swilk x

12、if group=0Sha piro-Wilk W test for normal dataVariable | Obs W V zP rob>z+x |25 0.971990.778-0.513 0.69588P值均大于因此可以認為兩組資料都服從正態(tài)分布Ho: 41=P2 vs H1:卩#20=0.05ttest x,by(group)Two-sa mple t test with equal varia ncesGroup | Obs Mea n Std. Err. Std. Dev. 95% Co nf. In terval+0 |2589.08 1.8229289.11464 8

13、5.31766 92.842341 |25101.52 1.900982 9.504911 97.59657 105.4434-一+comb ined |5095.3 1.577456 11.1543 92.12998 98.47002+diff |-12.442.633781-17.73557 -7.144429Degrees of freedom: 48Ho: mean(0) - mean (1) = diff = 0Ha: diff < 0Ha: diff > 0Ha: diff = 0t = -4.7232P < t = 0.0000t = -4.7232P >

14、 |t| =t = -4.72320.0000P > t = 1.0000P 值(<0.0001)< 口,并且有卩0»1 的 95%可信區(qū)間為(-17.73557,-7.144429)ttesti 樣本量1例如:本例第第2組n2=25均數(shù)2=101.52標準差2=9.505可以知道,不接觸組幼兒的平均智商高于接觸組的幼兒平均智商, 且差別有統(tǒng)計學意義。如果已知兩組的樣本量、樣本均數(shù)和樣本標準差,也可以用立即命令進行統(tǒng)計檢驗樣本均數(shù)1樣本標準差1樣本量2樣本均數(shù)2樣本標準差21 組 n1=25 均數(shù) 1=89.08 標準差 1=9.115則 ttesti 25 89.

15、08 9.115 25 101.52 9.505Two-sa mple t test with equal varia ncesx |y |-+ObsMea nStd. Err. Std. Dev. 95% Co nf. In terval2589.081.8239.11585.3175192.8424925101.521.9019.50597.59653105.4435|combi ned |5095.3 1.577482 11.15448 92.12993 98.47007+diff |-12.442.633843-17.7357 -7.144303Ha: diff < 0t = -

16、4.7231Ha: diff > 0t = -4.7231P < t = 0.0000P > |t| = 0.0000P > t = 1.0000Degrees of freedom: 48Ho: mean(x) - mean(y) = diff = 0Ha: diff = 0 t = -4.7231結(jié)果解釋同上。方差不齊的情況,(小樣本時,資料正態(tài)分布)還可以用t'僉驗 命令:ttest觀察變量名,by(分組變量名)unequal 立即命令為 ttesti樣本量1均數(shù)1標準差1樣本量2均數(shù)2標準差2,unequal假定本例的資料方差不齊(實際為方差不齊的),則

17、要用t'僉驗如下ttest x,by(gro up) un equalTwo-sa mple t test with un equal varia ncesGroup | ObsMea n Std. Err. Std. Dev. 95% Co nf. I nterval+0 |2589.081.8229289.1146485.3176692.842341 |25101.521.9009829.50491197.59657105.4434+comb ined |5095.31.57745611.154392.1299898.47002+diff |-12.442.633781-17.73

18、581 -7.144189Satterthwaite's degrees of freedom:47.9159Ho: mean(0) - mean (1) = diff = 0Ha: diff < 0Ha: diff = 0Ha: diff > 0t = -4.7232t = -4.7232t = -4.7232P < t = 0.0000P > |t| = 0.0000P > t = 1.0000結(jié)果解釋同上。t'檢驗有許多方法,這里介紹的Satterthwaite 方法,主要根據(jù)兩個樣本方差差異的程度校正相應的自由度, 由于本例的兩個樣本方差比

19、較接近,故自由度幾乎沒有減少(t檢驗的自由度為48,而本例t '自由度為47.9159)。由于t檢驗要求的兩組總體方差相同(稱為方差齊性),以及由于抽樣誤差的原因,樣本方差一般不會相等,但是方差齊性的情況下,樣本方差表現(xiàn)為兩個樣本方差之比7。(注意:兩個樣本方差之差很小,仍可能方差不齊。如:第一個樣本標準差為0.1,樣本量為100,第2個樣本標準差為0.01,樣本量為100,兩個樣本標準差僅差0.09,但是兩個樣本方差之比為100。故用方差齊性檢驗的結(jié)果如下:方差齊性的立即命令為sdtesti 樣本量1 . 標準差1樣本量2 .標準差2sdtesti 100 . 0.1 100 . 0

20、.01Varia nee ratio test|丄ObsMea n Std. Err. Std. Dev. 95% Con f. I ntervalx |100 .01.1 . .y |100 .001.01 . .-ucomb ined |200. . .Ho: sd(x) = sd(y)=100.0000.010100.000F(99,99) observed = F_obsF(99,99) lower tail = F_L = 1/F_obs =F(99,99) upper tail = F_U = F_obs =Ha: sd(x) > sd(y)U = 0.0000P >

21、F_obs = 0.0000Ha: sd(x) < sd(y) Ha: sd(x) = sd(y)P < F_obs = 1.0000P < F_L + P > F_iP值0.0001,因此認為兩組的方差不齊。故方差齊性是考察兩個樣本方差之比是否接近1。如果本例的資料不滿足t檢驗要求(注:實際是滿足的,只是想用本例介紹成組秩和檢驗),則用秩和檢驗(Wilcoxon Ranksum test)。Ho:兩組資料所在總體相同H1:兩組資料所在總體不同命令:ranksum觀察變量名,by(分組變量)本例為 ranksum x,by(group).ran ksum x,by(gr

22、o up)Two-sa mp le Wilcox on ran k-sum (Ma nn-Whit ney) testgroup I obs rank sum exp eeted+0 I25437637.51 I25838637.5+comb ined |5012751275un adjusted varia nee adjustme nt for ties2656.25-3.70adjusted varia nee2652.55Ho: x(gro up=0) = x(gro up=1)z = -3.893Prob > |z| = 0.0001P值v0.0001va,故認為兩個總體不同練

23、習題一、某地隨機抽樣調(diào)查了部分健康成人紅細胞數(shù)和血紅蛋白量,結(jié)果如下,請就此資料統(tǒng) 計分析:指標性別例數(shù)均數(shù)標準差標準值紅細胞數(shù)(1012/l )男3604.660.584.84女2554.180.294.33血紅蛋白(g/L)男360134.507.10140.20女255117.6010.20124.70該地健康成年男女血紅蛋白含量有無差別?該地男女兩項血液指標是否均低于上表的標準值(若測定方法相同)?為了解聾啞學生學習成績與血清鋅含量的關系,某人按年齡、性別和班級在聾啞學校 隨機抽取成績優(yōu)、差的 14對學生進行配對研究,得其結(jié)果如下。問聾啞學生學習成績與血 清鋅含量有無關系?表14對學生

24、的血清鋅含量(卩g/mL)編號優(yōu)生組 差生組編號優(yōu)生組 差生組1.201.310.800.8620.991.3490.840.7231.031.10100.850.8840.900.72111.050.8151.220.92121.081.3060.901.34131.150.8570.970.98140.900.80教學應用:考察影響t檢驗結(jié)果的各種因素1.首先把程序ttest2.ado 和程序ttestexp.ado 復制到stata所在的目錄下adobase(例如:Stata軟件安裝在D:stata ,則把這兩個程序復制到d:stataadobase目錄下。然后輸入連接命令STAT環(huán)境下

25、,輸入net set ado路徑 stataadobase徑表示Stata所在的盤符和目錄)每個樣2.程序ttest2.ado是模擬在正態(tài)總體中隨機抽10000個樣本,本有2組,兩組的樣本量、正態(tài)分布的總體均數(shù)和標準差由讀者選擇輸入,考察a=0.05的情況下,考察當兩個總體均數(shù)相同時拒絕H的比例(拒絕的頻率估計第一類錯誤)是否接近0.05和當兩個總體均數(shù)不同時接受H的比例(估計發(fā)生第二類錯誤的概率)。運行ttest2.ado的輸入命令為:ttest2 樣本量1均數(shù)1標準差1樣本量2均數(shù)2標準差2例如:考察兩組樣本量均為30,總體均數(shù)均為100,標準差均為6的拒絕Hfc(已二卩2)比例,結(jié)果如下

26、:.ttest2 30 100 6 30 100 6兩樣本t檢驗模擬程序輸入 樣本量1均數(shù)1標準差1樣本量2均數(shù)2標準差2sig |丄Freq.P erce ntCum.receive |950695.0695.06refuse |丄4944.94100.00Total 110000 100.00Variable |丄ObsMea n Std. Dev.MinMaxaverage1| 1000099.99388 1.083106 95.77671 104.2778sd1 |100005.942067 .7764423 3.245709 8.692573average2| 1000099.996

27、75 1.086406 95.91508 103.8237sd2 |100005.949536 .7776711 3.276635 9.546211t | 10000-.0036441.0035 -4.327873.602131-Bino m. 1 nterp.-Variable |-uObs Percen tileCen tile95% Conf. In terval -l- t| 100002.5-2.001922-2.077161-1.955956|50-.0115932-.0389369.0137221|97.51.9923171.9333082.033179average1| 100

28、002.597.8590497.7923697.93009|5099.9893699.96717100.0172|97.5102.1116102.0614102.1734average2| 100002.597.8611997.8074997.91781|5099.986899.96412100.0107|97.5102.1835102.1131102.2403在隨機抽10000個樣本中,計算了 10000個t值,結(jié)果有494次拒絕H)(已=卩2),因此非常接近Ct =0.05 O建議讀者運行程序ttest2考察下列情況目的1: 41訣2時,不同的樣本量,考察下列不同情況下的接受 H的比例(估

29、計P)以及兩組樣本量之比不同的情況對檢驗結(jié)果的影響。兩組的總體標準差c=2卩1 = 100 卩 2=99卩 1=100 卩 2=98卩 1=10042=97ni: n210:1010:1010:10ni: n220:2030:3020:20ni: n230:3010:5030:30ni: n240:4040:4040:40ni: n230:5030:5030:50ni: n220:6020:6020:60ni: n210:7010:7010:70目的2:考察方差不齊對t檢驗(不是t'檢驗)結(jié)果的影響卩 1=100比=100卩 1=100卩 2=98卩 1=100#2=976 = 16=

30、9cr1=96=16=52=5m: n240:1040:1040:10m: n210:4010:4010:40m: n260:3060:3060:30n1: n230:6030:6030:60m: n230:3030:3030:30n1: n240:4040:4040:40m: n240:4040:4040:40目的3:通過運行程序ttestexp.ado ,考察資料非正態(tài)分布對結(jié)果的影響。3.程序ttestexp.ado是模擬在指數(shù)分布總體中隨機抽10000個樣本,每個樣本有2組,兩組的樣本量和總體均數(shù)由讀者選擇輸入, 考察0=0.05的情況下,考察當兩個總體均數(shù)相同時拒絕 H的比例(拒絕的

31、頻率估計第一類錯誤)是否接近0.05和當兩個總體均數(shù)不同時接受H的比例(估計發(fā)生第二類錯誤的概率)。運行ttestex p.ado 的輸入命令為:ttestexp 樣本量1均數(shù)1 樣本量2均數(shù)2 例如:考察兩組樣本量均為10,總體均數(shù)均為1的拒絕二卩2)的比 例,結(jié)果如下:.ttestex P 5 1 5 1指數(shù)分布輸入樣本量1均數(shù)1樣本量2均數(shù)2Variable |J- _ObsMea nStd. Dev.MinMaxaverage1 | 10000.9942006.444696 .12237833.46752sd1 | 10000 .8637844 .5004927 .0310705 4.281092 average2 | 100001.007233 .4560518 .0613991 3.577513sd2 | 100

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論