![第4講兩組平均水平的統(tǒng)計(jì)檢驗(yàn)_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/25/5c185fc0-329f-4d82-8fd2-921720943b54/5c185fc0-329f-4d82-8fd2-921720943b541.gif)
![第4講兩組平均水平的統(tǒng)計(jì)檢驗(yàn)_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/25/5c185fc0-329f-4d82-8fd2-921720943b54/5c185fc0-329f-4d82-8fd2-921720943b542.gif)
![第4講兩組平均水平的統(tǒng)計(jì)檢驗(yàn)_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/25/5c185fc0-329f-4d82-8fd2-921720943b54/5c185fc0-329f-4d82-8fd2-921720943b543.gif)
![第4講兩組平均水平的統(tǒng)計(jì)檢驗(yàn)_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/25/5c185fc0-329f-4d82-8fd2-921720943b54/5c185fc0-329f-4d82-8fd2-921720943b544.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Stata軟件基本操作和數(shù)據(jù)分析入門第四講兩組計(jì)量資料平均水平的統(tǒng)計(jì)檢驗(yàn)一、配對(duì)設(shè)計(jì)的平均水平檢驗(yàn)統(tǒng)計(jì)方法選擇原則:如果配對(duì)的差值服從近似正態(tài)分布(小樣本 )或大樣本,則用配對(duì)t檢驗(yàn)小樣本的情況下,配對(duì)差值呈明顯偏態(tài)分布,則用配對(duì)秩符號(hào)檢驗(yàn)(matched-pairs signed-ranks test)。例 1 10 例男性矽肺患者經(jīng)克矽平治療,其血紅蛋白(g/dL )如下:表 10 例男性矽肺患者血紅蛋白值( g/dL )病例號(hào)12345678910治療前11.315.015.013.512.810.011.012.013.012.3治療后14.013.814.013.513.512.01
2、4.711.413.812.0問:治療前后的血紅蛋白的平均水平有沒有改變這是一個(gè)典型的前后配對(duì)設(shè)計(jì)的研究 ( 但不提倡,因?yàn)閷?duì)結(jié)果的解釋可能會(huì)有問題 )Stata 數(shù)據(jù)輸入結(jié)構(gòu)X1X211.3141513.8151413.513.512.813.5101211 14.712 11.413 13.812.312操作如下:gen d=x1-x2產(chǎn)生配對(duì)差值的變量dswilkd正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)結(jié)果如下:. sktest dSkewness/Kurtosis tests for Normality- joint -Variable | Pr(Skewness)Pr(Kurtosis) adj ch
3、i2(2)-+-d |0.2790.7741.430.4885Probchi2正態(tài)性檢驗(yàn)的無效假設(shè)為:資料正態(tài)分布相應(yīng)的備選假設(shè)為:資料非正態(tài)分布=0.05,由于正態(tài)性檢驗(yàn)的P 值=0.40189 ,故可以認(rèn)為資料近似服從正態(tài)分布。ttest d=0配對(duì)t 檢驗(yàn) :H0: d=0vs H1: d 0,=0.05結(jié)果如下:One-sample t test-Variable |ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-d |10-.6799999.52042721.645735-1.857288.4972881-Degrees of freedo
4、m: 9Ho: mean(d) = 0Ha: mean 0t = -1.3066P |t| =0.2237Ha: mean 0t = -1.3066P t =0.8881P 值=0.2237 ,故認(rèn)為治療前后的血紅蛋白的平均數(shù)差異沒有統(tǒng)計(jì)學(xué)意義。即:沒有足夠的證據(jù)可以認(rèn)為治療前后的血紅蛋白的總體平均數(shù)不同。如果已知差值的樣本量, 樣本均數(shù)和樣本標(biāo)準(zhǔn)差, 可以用立即命令如下( 如,已知樣本量為 10,差值的樣本均數(shù)為 -0.66 ,差值的標(biāo)準(zhǔn)差為 1.65 ,則輸入命令如下:ttesti樣本量樣本均數(shù)樣本標(biāo)準(zhǔn)差 0本例為: ttesti 10 -0.66 1.65 0得到下列結(jié)果如下:. tte
5、sti 10 .66 1.65 0One-sample t test-|ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-x |10.66.52177581.65-.52033891.840339-Degrees of freedom: 9Ho: mean(x) = 0Ha: mean 0t =1.2649t =1.2649t =1.2649P |t| =0.2377P t =0.1188結(jié)果解釋與結(jié)論同上述相同。如果對(duì)于小樣本的情況下,差值不滿足正態(tài)分布,則用Match-Sign-rank test,操作如下:signrank差值變量名 =0假如本例
6、不滿足正態(tài)分布(為了借用上例資料,而假定的,實(shí)際上本例滿足正態(tài)分布 )則H0:差值的中位數(shù) 0(其意義是治療前的血紅蛋白配 大于治療后的血紅蛋白的 概率治療前的血紅蛋白 小于治療后的血紅蛋白的 概率 )H1:差值的中位數(shù)0=0.05本例為signrankd=0Wilcoxon signed-rank testsign |obs sum ranksexpected-+-positive |41827negative |53627zero |111-+-all |105555unadjusted variance96.25adjustment for ties0.00adjustment for
7、zeros-0.25-adjusted variance96.00Ho: d = 0z =-0.919Prob |z| = 0.3583P 值 =0.3583 ,故沒有足夠的證據(jù)說明兩個(gè)總體不同。二、平行對(duì)照設(shè)計(jì)的兩組資料平均水平統(tǒng)計(jì)檢驗(yàn)統(tǒng)計(jì)方法選擇原則:如果兩組資料的方差齊性和相互獨(dú)立的,并且每組資料服從正態(tài)分布 (大樣本資料可以忽略正態(tài)性問題),則用成組 t 檢驗(yàn),否則可以用成組 Wilcoxon 秩和檢驗(yàn)。例 2 為研究噪聲對(duì)紡織女工子代智能是否有影響,一研究人員在某紡織廠隨機(jī)抽取接觸噪聲 95dB(A)、接觸工齡 5 年以上的紡織女工及同一單位、條件與接觸組相近但不接觸噪聲的女職工,其
8、子女(學(xué)前幼兒)作為研究對(duì)象,按韋氏學(xué)前兒童智力量表(中國(guó)修訂版)測(cè)定兩組幼兒智商,結(jié)果如下。問噪聲對(duì)紡織女工子代智能有無影響? (接觸組 group=0,不接觸組 group=1)資料及其結(jié)果如下:groupx0790930910920940770930740910101083073088010209001000810910830106084078087095010111011100111418611061107110719418911041981110189110318911211941951921109198198112011041110方差齊性檢驗(yàn)H0:1 2vsH 1: 12=0.1
9、兩組方差齊性的檢驗(yàn)命令(僅適合兩組方差齊性檢驗(yàn))sdtestx,by(group)Variance ratio test-Group |ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-0 |2589.081.8229289.1146485.3176692.842341 |25101.521.9009829.50491197.59657105.4434-+-combined |5095.31.577456 11.154392.12998 98.47002-Ho: sd(0) = sd(1)F(24,24) observed= F_obs=0.920F(
10、24,24) lower tail = F_L= F_obs =0.920F(24,24) upper tail = F_U= 1/F_obs =1.087Ha: sd(0) sd(1)P F_obs = 0.4195P F_U = 0.8389 P F_obs = 0.5805P 值=0.8389 ,因此可以認(rèn)為兩組方差齊性的。正態(tài)性檢驗(yàn): H0:資料服從正態(tài)分布vsH1:資料偏態(tài)分布=0.05每一組資料正態(tài)性檢驗(yàn). swilk x if group=1Shapiro-Wilk W test for normal dataVariable |ObsWVzProbz-+-x |250.9740
11、30.722-0.667 0.74747. swilk x if group=0Shapiro-Wilk W test for normal dataVariable |ObsWVzProbz-+-x |250.971990.778-0.513 0.69588P 值均大于,因此可以認(rèn)為兩組資料都服從正態(tài)分布H0: 1 2vsH1: 12=0.05ttestx,by(group)Two-sample t test with equal variances-Group |ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-0 |2589.081.822928
12、9.1146485.3176692.842341 |25101.521.9009829.50491197.59657105.4434-+-combined |5095.31.577456 11.154392.12998 98.47002-+-diff |-12.442.633781-17.73557 -7.144429-Degrees of freedom: 48Ho: mean(0) - mean(1) = diff = 0Ha: diff 0t = -4.7232t =-4.7232t =-4.7232P |t| =0.0000P t = 1.0000P 值(0.0001), 并且有01的
13、 95%可信區(qū)間為 ( -17.73557,-7.144429)可以知道,不接觸組幼兒的平均智商高于接觸組的幼兒平均智商,并且差別有統(tǒng)計(jì)學(xué)意義。如果已知兩組的樣本量、 樣本均數(shù)和樣本標(biāo)準(zhǔn)差, 也可以用立即命令進(jìn)行統(tǒng)計(jì)檢驗(yàn)ttesti樣本量 1 樣本均數(shù)1 樣本標(biāo)準(zhǔn)差1 樣本量 2 樣本均數(shù)2 樣本標(biāo)準(zhǔn)差2例如:本例第 1 組 n1=25 均數(shù) 1=89.08 標(biāo)準(zhǔn)差 1=9.115第 2 組 n2=25 均數(shù) 2=101.52 標(biāo)準(zhǔn)差 2=9.505則 ttesti 25 89.08 9.115 25 101.52 9.505Two-sample t test with equal varia
14、nces-|ObsMeanStd. Err.Std. Dev. 95% Conf. Interval-+-x |2589.081.8239.11585.3175192.84249y |25101.521.9019.50597.59653105.4435-+-combined |5095.31.577482 11.15448 92.12993 98.47007-+-diff |-12.442.633843-17.7357-7.144303-Degrees of freedom: 48Ho: mean(x) - mean(y) = diff = 0Ha: diff 0t = -4.7231t =-
15、4.7231t = -4.7231P |t| = 0.0000P t =1.0000結(jié)果解釋同上。方差不齊的情況, (小樣本時(shí),資料正態(tài)分布 )還可以用 t檢驗(yàn)命令: ttest 觀察變量名, by(分組變量名 ) unequal立即命令為ttesti 樣本量 1 均數(shù) 1 標(biāo)準(zhǔn)差 1 樣本量 2 均數(shù) 2 標(biāo)準(zhǔn)差 2,unequal假定本例的資料方差不齊(實(shí)際為方差不齊的 ),則要用 t檢驗(yàn)如下ttest x,by(group) unequalTwo-sample t test with unequal variances-Group |ObsMeanStd. Err.Std. Dev.95
16、% Conf. Interval-+-0 |2589.081.8229289.11464 85.3176692.842341 |25101.521.9009829.50491197.59657105.4434-+-combined |5095.31.577456 11.154392.12998 98.47002-+-diff |-12.442.633781-17.73581 -7.144189-Satterthwaites degrees of freedom:47.9159Ho: mean(0) - mean(1) = diff = 0Ha: diff 0t = -4.7232t =-4.7
17、232t =-4.7232P |t| = 0.0000P t = 1.0000結(jié)果解釋同上。t 檢驗(yàn)有許多方法,這里介紹的Satterthwaite方法,主要根據(jù)兩個(gè)樣本方差差異的程度校正相應(yīng)的自由度, 由于本例的兩個(gè)樣本方差比較接近,故自由度幾乎沒有減少 (t 檢驗(yàn)的自由度為 48, 而本例 t 自由度為 47.9159) 。由于 t 檢驗(yàn)要求的兩組總體方差相同 ( 稱為方差齊性 ) ,以及由于抽樣誤差的原因,樣本方差一般不會(huì)相等,但是方差齊性的情況下,樣本方差表現(xiàn)為兩個(gè)樣本方差之比1。( 注意:兩個(gè)樣本方差之差很小,仍可能方差不齊。如:第一個(gè)樣本標(biāo)準(zhǔn)差為0.1 ,樣本量為 100, 第 2
18、 個(gè)樣本標(biāo)準(zhǔn)差為 0.01 ,樣本量為 100,兩個(gè)樣本標(biāo)準(zhǔn)差僅差 0.09 ,但是兩個(gè)樣本方差之比為 100。故用方差齊性檢驗(yàn)的結(jié)果如下:方差齊性的立即命令為sdtesti樣本量 1 .標(biāo)準(zhǔn)差 1 樣本量 2 .標(biāo)準(zhǔn)差 2sdtesti 100 . 0.1100 . 0.01Variance ratio test-|ObsMeanStd. Err.Std. Dev.95% Conf. Interval-+-x |100.01.1.y |100.001.01.-+-combined |200.-Ho: sd(x) = sd(y)F(99,99) observed= F_obs= 100.000
19、F(99,99) lower tail = F_L= 1/F_obs =0.010F(99,99) upper tail = F_U= F_obs= 100.000Ha: sd(x) sd(y) P sd(y) P F_U = 0.0000P F_obs = 0.0000P 值 |z| =0.0001P 值0.0001 ,故認(rèn)為兩個(gè)總體不同練習(xí)題一、 某地隨機(jī)抽樣調(diào)查了部分健康成人紅細(xì)胞數(shù)和血紅蛋白量,結(jié)果如下,請(qǐng)就此資料統(tǒng)計(jì)分析:指標(biāo)性別例數(shù)均數(shù)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)值紅細(xì)胞數(shù)( 1012男3604.660.584.84/L)2554.180.294.33女男360134.507.10140.20血紅蛋
20、白( g/L )255117.6010.20124.70女( 1) 該地健康成年男女血紅蛋白含量有無差別?( 2) 該地男女兩項(xiàng)血液指標(biāo)是否均低于上表的標(biāo)準(zhǔn)值(若測(cè)定方法相同)?二、 為了解聾啞學(xué)生學(xué)習(xí)成績(jī)與血清鋅含量的關(guān)系,某人按年齡、性別和班級(jí)在聾啞學(xué)校隨機(jī)抽取成績(jī)優(yōu)、差的 14 對(duì)學(xué)生進(jìn)行配對(duì)研究,得其結(jié)果如下。問聾啞學(xué)生學(xué)習(xí)成績(jī)與血清鋅含量有無關(guān)系?編號(hào)表 14 對(duì)學(xué)生的血清鋅含量(優(yōu)生組差生組編號(hào) g/mL )優(yōu)生組差生組11.201.3180.800.8620.991.3490.840.7231.031.10100.850.8840.900.72111.050.8151.220.9
21、2121.081.3060.901.34131.150.8570.970.98140.900.80教學(xué)應(yīng)用:考察影響t檢驗(yàn)結(jié)果的各種因素1.首先把程序ttest2.ado和程序 ttestexp.ado復(fù)制到 stata所在的目錄下 adobase( 例如:Stata 軟件安裝在 D:stata,則把這兩個(gè)程序復(fù)制到d:stataadobase目錄下。然后輸入連接命令: 在STATA環(huán)境下,輸入 net set ado路徑 stataadobase。( 路徑表示 Stata所在的盤符和目錄)2. 程序 ttest2.ado 是模擬在正態(tài)總體中隨機(jī)抽 10000個(gè)樣本,每個(gè)樣本有 2組,兩組的樣
22、本量、 正態(tài)分布的總體均數(shù)和標(biāo)準(zhǔn)差由讀者選擇輸入,考察 =0.05 的情況下,考察當(dāng)兩個(gè)總體均數(shù)相同時(shí)拒絕H0的比例 ( 拒絕的頻率估計(jì)第一類錯(cuò)誤 ) 是否接近 0.05 和當(dāng)兩個(gè)總體均數(shù)不同時(shí)接受 H0的比例 ( 估計(jì)發(fā)生第二類錯(cuò)誤的概率 ) 。運(yùn)行 ttest2.ado 的輸入命令為:ttest2樣本量 1 均數(shù) 1 標(biāo)準(zhǔn)差 1 樣本量 2 均數(shù) 2 標(biāo)準(zhǔn)差 2例如:考察兩組樣本量均為 30,總體均數(shù)均為 100,標(biāo)準(zhǔn)差均為 6 的拒絕 H0( 1= 2) 比例,結(jié)果如下:. ttest2 30 100 6 30 100 6兩樣本 t 檢驗(yàn)?zāi)M程序輸入 樣本量 1 均數(shù)1標(biāo)準(zhǔn)差 1樣本量
23、2均數(shù)2 標(biāo)準(zhǔn)差 2sig |Freq.PercentCum.-+-receive |950695.0695.06refuse |4944.94100.00-+-Total |10000100.00Variable |ObsMeanStd. Dev.MinMax-+-average1 | 1000099.993881.08310695.77671104.2778sd1 |100005.942067.77644233.2457098.692573average2 | 1000099.996751.08640695.91508103.8237sd2 |100005.949536.77767113.
24、2766359.546211t | 10000-.0036441.0035-4.32787 3.602131- Binom. Interp. -Variable |ObsPercentileCentile95% Conf. Interval-+-t|100002.5-2.001922-2.077161-1.955956|50-.0115932-.0389369.0137221|97.51.9923171.9333082.033179average1|100002.597.8590497.7923697.93009|5099.9893699.96717100.0172|97.5102.11161
25、02.0614102.1734average2|100002.597.8611997.8074997.91781|5099.986899.96412100.0107|97.5102.1835102.1131102.2403在隨機(jī)抽 10000個(gè)樣本中,計(jì)算了 10000個(gè)t 值,結(jié)果有 494次拒絕 H0( 1= 2) ,因此非常接近 =0.05 。建議讀者運(yùn)行 程序 ttest2 考察下列情況目的 1: 12時(shí),不同的樣本量,考察下列不同情況下的接受H0的比例( 估計(jì)) 以及兩組樣本量之比不同的情況對(duì)檢驗(yàn)結(jié)果的影響。兩組的總體標(biāo)準(zhǔn)差=21=1002=99=100=98=100=971212n
26、 :n210:1010:1010:101n1:n220:2030:3020:20n1:n230:3010:5030:30n :n240:4040:4040:401n1:n230:5030:5030:50n :n220:6020:6020:601n1:n210:7010:7010:70目的 2:考察方差不齊對(duì) t 檢驗(yàn) ( 不是 t 檢驗(yàn) ) 結(jié)果的影響1 =1002=1001=1002=981=1002=971=1=91=92=1=5=5212n :n240:1040:1040:101n :n210:4010:4010:401n :n260:3060:3060:301n1:n230:6030:
27、6030:60n1:n230:3030:3030:30n1:n240:4040:4040:40n :n240:4040:4040:401目的 3:通過運(yùn)行程序 ttestexp.ado,考察資料非正態(tài)分布對(duì)結(jié)果的影響。3. 程序 ttestexp.ado 是模擬在指數(shù)分布總體中隨機(jī)抽 10000個(gè)樣本,每個(gè)樣本有 2組,兩組的樣本量和總體均數(shù)由讀者選擇輸入, 考察=0.05 的情況下,考察當(dāng)兩個(gè)總體均數(shù)相同時(shí)拒絕 H0的比例 ( 拒絕的頻率估計(jì)第一類錯(cuò)誤 ) 是否接近 0.05 和當(dāng)兩個(gè)總體均數(shù)不同時(shí)接受 H0的比例 ( 估計(jì)發(fā)生第二類錯(cuò)誤的概率) 。運(yùn)行 ttestexp.ado的輸入命令為
28、:ttestexp樣本量 1 均數(shù)1樣本量 2 均數(shù)2例如:考察兩組樣本量均為10,總體均數(shù)均為 1的拒絕 H0(1=2) 的比例,結(jié)果如下:. ttestexp 5 1 5 1指數(shù)分布輸入 樣本量 1均數(shù) 1樣本量 2均數(shù) 2Variable |ObsMeanStd. Dev.MinMax-+-average1 |10000.9942006.444696.12237833.46752sd1 |10000.8637844 .5004927 .0310705 4.281092average2 |100001.007233.4560518.06139913.577513sd2 |10000.8707893.5053219.03536764.620248t | 10000-.01770691.115122 -5.645
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2012建筑租賃合同范本
- 人防租賃轉(zhuǎn)讓合同范本
- 分項(xiàng)勞務(wù)合同范本
- 加盟銷售合同范例
- 人情補(bǔ)償寫合同范本
- 出租車司機(jī)加盟合同范本
- 2025年中國(guó)恒轉(zhuǎn)矩變頻器行業(yè)市場(chǎng)深度研究及投資戰(zhàn)略規(guī)劃報(bào)告
- 上海建筑施工合同范本
- 2025年中國(guó)工業(yè)防水插座行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 公司聯(lián)營(yíng)股合同范本
- 中國(guó)氫內(nèi)燃機(jī)行業(yè)發(fā)展環(huán)境、市場(chǎng)運(yùn)行格局及前景研究報(bào)告-智研咨詢(2024版)
- 開學(xué)季初三沖刺中考開學(xué)第一課為夢(mèng)想加油課件
- 《自然保護(hù)區(qū)劃分》課件
- 中日合同范本
- T-CARM 002-2023 康復(fù)醫(yī)院建設(shè)標(biāo)準(zhǔn)
- 《康復(fù)按摩知識(shí)》課件
- 封條模板A4直接打印版
- 立式加工中心說明書
- 唐太宗李世民
- 作文紙格子信紙
- 第八版神經(jīng)病學(xué)配套課件-12-中樞神經(jīng)系統(tǒng)感染性疾病
評(píng)論
0/150
提交評(píng)論