版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1 1 推斷統(tǒng)計(jì)的一般概念推斷統(tǒng)計(jì)的一般概念1.1 推斷統(tǒng)計(jì)的含義及類型:推斷統(tǒng)計(jì)的含義及類型:(1)含義:推斷統(tǒng)計(jì)是指用概率分布的方法,)含義:推斷統(tǒng)計(jì)是指用概率分布的方法,由由樣本的統(tǒng)計(jì)量樣本的統(tǒng)計(jì)量推斷推斷總體參數(shù)總體參數(shù)的統(tǒng)計(jì)方式。的統(tǒng)計(jì)方式。樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量:樣本中某個(gè)變量的統(tǒng)計(jì)值。如此次調(diào):樣本中某個(gè)變量的統(tǒng)計(jì)值。如此次調(diào)查中高中文化程度的人占查中高中文化程度的人占32%。樣本樣本 32%總體參數(shù)總體參數(shù):與樣本中某個(gè)變量的統(tǒng)計(jì)值相對(duì)應(yīng)的:與樣本中某個(gè)變量的統(tǒng)計(jì)值相對(duì)應(yīng)的總體中的統(tǒng)計(jì)值。如全市人口中高中比例為總體中的統(tǒng)計(jì)值。如全市人口中高中比例為38%。總體總體38 樣本統(tǒng)計(jì)量
2、有可能等于總體參數(shù),也有可能樣本統(tǒng)計(jì)量有可能等于總體參數(shù),也有可能不等于總體參數(shù),但二者之間有著某種概率關(guān)不等于總體參數(shù),但二者之間有著某種概率關(guān)系。系。推斷統(tǒng)計(jì)就是教會(huì)我們?nèi)绾卫眠@種概率推斷統(tǒng)計(jì)就是教會(huì)我們?nèi)绾卫眠@種概率關(guān)系來(lái)由樣本統(tǒng)計(jì)量推估總體參數(shù)。關(guān)系來(lái)由樣本統(tǒng)計(jì)量推估總體參數(shù)。為了區(qū)別樣本和總體的不同,樣本的平均數(shù)用為了區(qū)別樣本和總體的不同,樣本的平均數(shù)用x來(lái)表示,標(biāo)準(zhǔn)差用來(lái)表示,標(biāo)準(zhǔn)差用S表示;總體的平均數(shù)用表示;總體的平均數(shù)用表表示,標(biāo)準(zhǔn)差用示,標(biāo)準(zhǔn)差用表示。因此,推斷統(tǒng)計(jì)往往表示。因此,推斷統(tǒng)計(jì)往往可以看作是由可以看作是由x推斷推斷。樣本樣本 32%總體總體= ?(2)類型:
3、推斷統(tǒng)計(jì)分為)類型:推斷統(tǒng)計(jì)分為參數(shù)估計(jì)參數(shù)估計(jì)和和假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)兩大類。兩大類。參數(shù)估計(jì)參數(shù)估計(jì):根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)估計(jì)總:根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)估計(jì)總體參數(shù)。即已知樣本,估計(jì)總體。體參數(shù)。即已知樣本,估計(jì)總體。x假設(shè)檢驗(yàn)假設(shè)檢驗(yàn):先假定總體參數(shù)為:先假定總體參數(shù)為 ,用一個(gè)隨機(jī)樣,用一個(gè)隨機(jī)樣本的統(tǒng)計(jì)量本的統(tǒng)計(jì)量 來(lái)檢驗(yàn)總體參數(shù)為來(lái)檢驗(yàn)總體參數(shù)為的假設(shè)是否成的假設(shè)是否成立。立??傮w總體=38%樣本樣本 32%xx? ?1.2推斷統(tǒng)計(jì)的原理:推斷統(tǒng)計(jì)的原理:參數(shù)估計(jì)和假設(shè)檢驗(yàn)都是利用參數(shù)估計(jì)和假設(shè)檢驗(yàn)都是利用正態(tài)分布正態(tài)分布的概率特的概率特征來(lái)進(jìn)行的。征來(lái)進(jìn)行的。(1)正態(tài)分布
4、正態(tài)分布(,):正態(tài)分布是一種統(tǒng)計(jì)分布,它有如下幾個(gè)特征:正態(tài)分布是一種統(tǒng)計(jì)分布,它有如下幾個(gè)特征:A 單峰對(duì)稱;單峰對(duì)稱;B 平均數(shù)、中位數(shù)、眾數(shù)合一,都在峰點(diǎn);平均數(shù)、中位數(shù)、眾數(shù)合一,都在峰點(diǎn);C 1.96包含了包含了95的面積;的面積; 1.65包含了包含了90的面積;的面積;即面積和標(biāo)即面積和標(biāo)準(zhǔn)差之間有一個(gè)固定換算。準(zhǔn)差之間有一個(gè)固定換算。正態(tài)分布正態(tài)分布 N(,) 1.96 平均數(shù)170 1.96*10(170,10)例:某校同學(xué)的身高為正態(tài)分布,平均值為例:某校同學(xué)的身高為正態(tài)分布,平均值為170cm,標(biāo)準(zhǔn),標(biāo)準(zhǔn)差為差為10cm。問(wèn):。問(wèn):1)高于平均數(shù))高于平均數(shù)1.5個(gè)標(biāo)準(zhǔn)
5、差的同學(xué)身高是多少?個(gè)標(biāo)準(zhǔn)差的同學(xué)身高是多少?2)162cm身高的同學(xué)距平均數(shù)有幾個(gè)標(biāo)準(zhǔn)差身高的同學(xué)距平均數(shù)有幾個(gè)標(biāo)準(zhǔn)差?3)95%的同學(xué)身高會(huì)在什么范圍內(nèi)?的同學(xué)身高會(huì)在什么范圍內(nèi)?解1:Xi=+Z*=170+1.5*10=185cm;解2: Z=(Xi - )/ =(162-170)/10=-0.8;解3: Xi = -Z * =170-1.96*10=150.4 Xi = +Z * =170+1.96*10=189.6 (150.4189.6)由上可得出:由上可得出:ixZ 其中其中Xi為分布中任何一個(gè)值,為分布中任何一個(gè)值, 是平均數(shù);是平均數(shù); 是標(biāo)是標(biāo)準(zhǔn)差。準(zhǔn)差。Z是是Xi距離平均
6、數(shù)距離平均數(shù)的標(biāo)準(zhǔn)差單位,又稱的標(biāo)準(zhǔn)差單位,又稱Z分分?jǐn)?shù),同時(shí)也表示數(shù),同時(shí)也表示Xi與平均數(shù)與平均數(shù)之間的面積。之間的面積。(2)標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(Z分布):分布):N(0,1)標(biāo)準(zhǔn)化了的正態(tài)分布。即平均數(shù)標(biāo)準(zhǔn)化了的正態(tài)分布。即平均數(shù)=0,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差=1的正態(tài)分布。的正態(tài)分布。( 0,1) =1(3)總體分布總體分布:D( , )總體中某變量的幾何)總體中某變量的幾何分布。有可能是正態(tài)分布,也可能不是正態(tài)分布。分布。有可能是正態(tài)分布,也可能不是正態(tài)分布。AGE9383736353433323AGEFrequency5004003002001000Std. Dev = 15.00M
7、ean = 45N = 1254.00(4)樣本分布樣本分布: D(x ,S)樣本中某變量的統(tǒng)計(jì)分布,和總體分布一樣,樣本中某變量的統(tǒng)計(jì)分布,和總體分布一樣,它有可能是正態(tài)分布,也可能不是正態(tài)分布。它有可能是正態(tài)分布,也可能不是正態(tài)分布。AGE9383736353433323AGEFrequency5004003002001000nx(5)樣本平均數(shù)的抽樣分布:)樣本平均數(shù)的抽樣分布:N( ,)從總體中多次重復(fù)抽取容量為從總體中多次重復(fù)抽取容量為n的樣本,每個(gè)樣本平的樣本,每個(gè)樣本平均數(shù)的所形成的統(tǒng)計(jì)分布。是由多個(gè)均數(shù)的所形成的統(tǒng)計(jì)分布。是由多個(gè)組成的。組成的。總體分布樣本平均數(shù)的抽樣分布D(
8、, )N(,n)樣本平均數(shù)的抽樣分布的特點(diǎn)樣本平均數(shù)的抽樣分布的特點(diǎn):xixnA 是由多個(gè)是由多個(gè) 組成,組成,B 正態(tài)分布。正態(tài)分布。C 它的平均數(shù)就等于總體的平均數(shù)它的平均數(shù)就等于總體的平均數(shù),標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差則是總體標(biāo)準(zhǔn)差則是總體標(biāo)準(zhǔn)差的的 倍。即倍。即 ,又被稱作,又被稱作標(biāo)準(zhǔn)誤(標(biāo)準(zhǔn)誤(Standard Error,S . E)因此,我們所作的任何一次抽樣的平均數(shù)因此,我們所作的任何一次抽樣的平均數(shù) 都都可看作是樣本平均數(shù)的抽樣分布中的一個(gè)點(diǎn)。它可看作是樣本平均數(shù)的抽樣分布中的一個(gè)點(diǎn)。它會(huì)有會(huì)有95的概率落在的概率落在 1.96 的范圍內(nèi)。的范圍內(nèi)。n1n總體分布總體分布( , )樣本
9、分布( , s)x樣本平均數(shù)的抽樣分布(, )n三種分布的關(guān)系三種分布的關(guān)系推斷統(tǒng)計(jì)的原理就是推斷統(tǒng)計(jì)的原理就是:利用樣本平均數(shù)的抽樣分布的正態(tài)特征,以及利用樣本平均數(shù)的抽樣分布的正態(tài)特征,以及 與與的包含關(guān)系,來(lái)從樣本統(tǒng)計(jì)量推估總體參數(shù)的包含關(guān)系,來(lái)從樣本統(tǒng)計(jì)量推估總體參數(shù)(即參數(shù)估計(jì)),或用樣本統(tǒng)計(jì)量檢驗(yàn)有關(guān)總體(即參數(shù)估計(jì)),或用樣本統(tǒng)計(jì)量檢驗(yàn)有關(guān)總體參數(shù)的假設(shè)(假設(shè)檢驗(yàn))。參數(shù)的假設(shè)(假設(shè)檢驗(yàn))。由此可見(jiàn),參數(shù)估計(jì)和假設(shè)檢驗(yàn)實(shí)際是相同的。由此可見(jiàn),參數(shù)估計(jì)和假設(shè)檢驗(yàn)實(shí)際是相同的。在實(shí)際調(diào)查中,我們便是利用這一原理,用一次在實(shí)際調(diào)查中,我們便是利用這一原理,用一次調(diào)查的結(jié)果來(lái)推斷總體的參
10、數(shù)。我們把某一次調(diào)調(diào)查的結(jié)果來(lái)推斷總體的參數(shù)。我們把某一次調(diào)查的結(jié)果看作是同樣樣本規(guī)模的無(wú)數(shù)次調(diào)查中的查的結(jié)果看作是同樣樣本規(guī)模的無(wú)數(shù)次調(diào)查中的一次,它是樣本平均數(shù)的抽樣分布中的一個(gè)點(diǎn),一次,它是樣本平均數(shù)的抽樣分布中的一個(gè)點(diǎn),可用來(lái)估計(jì)總體參數(shù)可用來(lái)估計(jì)總體參數(shù) 。ixix2 參數(shù)估計(jì)的步驟參數(shù)估計(jì)的步驟1)求出樣本的平均數(shù)、標(biāo)準(zhǔn)差;)求出樣本的平均數(shù)、標(biāo)準(zhǔn)差;2)求出總體的標(biāo)準(zhǔn)差(如未知,可用樣本的)求出總體的標(biāo)準(zhǔn)差(如未知,可用樣本的標(biāo)準(zhǔn)差代替)標(biāo)準(zhǔn)差代替)3)設(shè)定參數(shù)估計(jì)的)設(shè)定參數(shù)估計(jì)的置信區(qū)間置信區(qū)間即參數(shù)估計(jì)的把即參數(shù)估計(jì)的把握性握性(90%?95%?)的?)的Z值(值(1.65
11、? 1.96?)4)根據(jù)根據(jù)ESZxi.計(jì)算出計(jì)算出的所在范圍。的所在范圍。例:已知某學(xué)校的學(xué)生每天課外活動(dòng)時(shí)間的標(biāo)準(zhǔn)差為例:已知某學(xué)校的學(xué)生每天課外活動(dòng)時(shí)間的標(biāo)準(zhǔn)差為15分鐘?,F(xiàn)從學(xué)生中隨機(jī)抽取分鐘?,F(xiàn)從學(xué)生中隨機(jī)抽取25人,得知他們的課外人,得知他們的課外活動(dòng)時(shí)間平均為活動(dòng)時(shí)間平均為60分鐘,問(wèn)該校學(xué)生總體平均每天的分鐘,問(wèn)該校學(xué)生總體平均每天的課外活動(dòng)時(shí)間會(huì)是多少?(選擇課外活動(dòng)時(shí)間會(huì)是多少?(選擇95%的置信區(qū)間)的置信區(qū)間)解:x=60S.E=15 / 25 1/2Z=1.96ESZxi.=605.886065466例:在此次調(diào)查中,男性共例:在此次調(diào)查中,男性共630人,平均年齡為
12、人,平均年齡為45歲,標(biāo)準(zhǔn)差為歲,標(biāo)準(zhǔn)差為15;女性共;女性共620人,平均年齡為人,平均年齡為44歲,歲,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為14。問(wèn):。問(wèn):1)男性與女性各自平均年齡的總體參數(shù)是多少?)男性與女性各自平均年齡的總體參數(shù)是多少?(95%的置信區(qū)間)的置信區(qū)間)解:解:男性男性63015*96. 145.ESZxi=45 1.17643.82446.176女性女性:62014*96. 144.ESZxi=44 1.142.945.12) 從總體上看,男女年齡是否有差異?從總體上看,男女年齡是否有差異?解:比較男女平均年齡的總體參數(shù)的區(qū)間,解:比較男女平均年齡的總體參數(shù)的區(qū)間,男男(43.8,46.
13、1)女女(42.9,45.1)二者有交集,故總體年齡在二者有交集,故總體年齡在95%的置信度上的置信度上沒(méi)有差異沒(méi)有差異。3 比例數(shù)的參數(shù)估計(jì):比例數(shù)的參數(shù)估計(jì):當(dāng)樣本的統(tǒng)計(jì)量不是平均數(shù),而是以比例的形式出當(dāng)樣本的統(tǒng)計(jì)量不是平均數(shù),而是以比例的形式出現(xiàn)時(shí),比如,共青團(tuán)員在調(diào)查中占現(xiàn)時(shí),比如,共青團(tuán)員在調(diào)查中占9.4%,也可以用,也可以用=XiZ*S.E公式的變形:公式的變形:P總總=Pi Z*S.E來(lái)推斷總體參數(shù)。來(lái)推斷總體參數(shù)。其中,其中, Pi為比例數(shù)形式的樣本統(tǒng)計(jì)量,為比例數(shù)形式的樣本統(tǒng)計(jì)量, nppESii)1 (.示例:在此次抽樣調(diào)查的在此次抽樣調(diào)查的1254人中,共青團(tuán)員的比例為人
14、中,共青團(tuán)員的比例為9.4%,求總,求總體中共青團(tuán)員的比例參數(shù)(置信度為體中共青團(tuán)員的比例參數(shù)(置信度為95%)。)。解:解: P總總=Pi Z*S.E016. 0094. 01254)094. 01 (094. 096. 1094. 0(0.078, 0.11)總體中共青團(tuán)員的比例有總體中共青團(tuán)員的比例有95%的可能性在的可能性在7.8% 11%的區(qū)間內(nèi)。的區(qū)間內(nèi)。4 假設(shè)檢驗(yàn)的步驟:假設(shè)檢驗(yàn)的步驟:示例示例:納稅起征線的規(guī)定是根據(jù)當(dāng)?shù)鼐用竦钠骄率杖爰{稅起征線的規(guī)定是根據(jù)當(dāng)?shù)鼐用竦钠骄率杖胫贫ǖ?。有關(guān)部門認(rèn)為某地的起征線應(yīng)為制定的。有關(guān)部門認(rèn)為某地的起征線應(yīng)為800元,元,因?yàn)楦鶕?jù)經(jīng)驗(yàn)當(dāng)
15、地居民平均月收入應(yīng)不低于此數(shù)。因?yàn)楦鶕?jù)經(jīng)驗(yàn)當(dāng)?shù)鼐用衿骄率杖霊?yīng)不低于此數(shù)。在當(dāng)?shù)剡M(jìn)行的一次在當(dāng)?shù)剡M(jìn)行的一次400人的隨機(jī)抽樣表明,居民月人的隨機(jī)抽樣表明,居民月收入為收入為790元,標(biāo)準(zhǔn)差為元,標(biāo)準(zhǔn)差為100元,請(qǐng)用此調(diào)查結(jié)果元,請(qǐng)用此調(diào)查結(jié)果在在95的置信水平上檢驗(yàn)居民月收入為的置信水平上檢驗(yàn)居民月收入為800元的說(shuō)元的說(shuō)法是否成立。法是否成立。 假設(shè)假設(shè) m m =8008001.96*5m m =800,樣本容量為,樣本容量為400時(shí)的樣本平均數(shù)的抽樣分時(shí)的樣本平均數(shù)的抽樣分布:布: N(800,5)樣本:樣本:X=7904.1 假設(shè)檢驗(yàn)的分布算法假設(shè)檢驗(yàn)的分布算法1)確定有關(guān)總體參數(shù))
16、確定有關(guān)總體參數(shù)m m的假設(shè);如假設(shè)總體平均收入為的假設(shè);如假設(shè)總體平均收入為800元;元;2)確定檢驗(yàn)此假設(shè)的概率標(biāo)準(zhǔn),即置信區(qū)間為)確定檢驗(yàn)此假設(shè)的概率標(biāo)準(zhǔn),即置信區(qū)間為P=90?P=95?(?(Z1.65? Z=1.96?)3) 抽取一個(gè)隨機(jī)樣本,計(jì)算出抽取一個(gè)隨機(jī)樣本,計(jì)算出(平均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤,即樣本平均數(shù)抽樣分布的標(biāo)準(zhǔn)差)。(平均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤,即樣本平均數(shù)抽樣分布的標(biāo)準(zhǔn)差)。4) 以以為中心,作出樣本平均數(shù)抽樣分布的給定概率區(qū)為中心,作出樣本平均數(shù)抽樣分布的給定概率區(qū)間。間。 5)看在這一區(qū)間內(nèi)是否包括了)看在這一區(qū)間內(nèi)是否包括了 x、S、S.Ex,如果包括,如果包括,就
17、可以說(shuō),在給定的置信區(qū)間中(或在給定的概率條件下),就可以說(shuō),在給定的置信區(qū)間中(或在給定的概率條件下),驗(yàn)證(接受)了原假設(shè);如未包含,則說(shuō)明原假設(shè)在給定的驗(yàn)證(接受)了原假設(shè);如未包含,則說(shuō)明原假設(shè)在給定的概率水平上不成立(被否定),或說(shuō)原假設(shè)在給定的顯著度概率水平上不成立(被否定),或說(shuō)原假設(shè)在給定的顯著度水平(水平(1給定概率)上被否定。給定概率)上被否定。解:1) 確定有關(guān)總體參數(shù)的假設(shè)確定有關(guān)總體參數(shù)的假設(shè)H0 : m m 800; H1 : m m 800;2) 確定檢驗(yàn)此假設(shè)的概率標(biāo)準(zhǔn):確定檢驗(yàn)此假設(shè)的概率標(biāo)準(zhǔn):置信度為95,顯著度為5,即Z1.963) 計(jì)算樣本的有關(guān)統(tǒng)計(jì)量計(jì)
18、算樣本的有關(guān)統(tǒng)計(jì)量 790;S100;S.E= =100/20=54) 以以m m為中心,作出樣本平均數(shù)抽樣分布的給定概率區(qū)間。為中心,作出樣本平均數(shù)抽樣分布的給定概率區(qū)間。( 8001.965),即(),即(790.2 809.8)5) 結(jié)論:此區(qū)間未包含樣本統(tǒng)計(jì)量結(jié)論:此區(qū)間未包含樣本統(tǒng)計(jì)量790,因此在,因此在5的顯著的顯著水平上推翻原假設(shè)。當(dāng)?shù)鼐用竦钠骄率杖胄∮谒缴贤品僭O(shè)。當(dāng)?shù)鼐用竦钠骄率杖胄∮?00元。元。xns4.2 假設(shè)檢驗(yàn)的公式算法:假設(shè)檢驗(yàn)的公式算法: 從上一算法中可以看出,從上一算法中可以看出,Xi距距m m的距離是檢驗(yàn)假設(shè)的距離是檢驗(yàn)假設(shè)的關(guān)鍵指標(biāo):的關(guān)鍵指標(biāo):
19、 Xi如果落在如果落在m m的的95%的置信區(qū)間之外,的置信區(qū)間之外,這時(shí)這時(shí)|Zxi|Z95%,即,即|Zxi|1.96。則原假設(shè)被否定的概。則原假設(shè)被否定的概率率95%,或者說(shuō),原假設(shè)成立的概率,或者說(shuō),原假設(shè)成立的概率5%,我們我們稱為在稱為在5%的顯著水平上否定了原假設(shè)。的顯著水平上否定了原假設(shè)。 Xi如果落在如果落在m m的的95%的置信區(qū)間之內(nèi),這時(shí)的置信區(qū)間之內(nèi),這時(shí)|Zxi|Z95%,即,即|Zxi|1.96。我們稱為在我們稱為在5%的顯著水平上不的顯著水平上不能否定原假設(shè)。能否定原假設(shè)。因此,可以利用因此,可以利用nsxZim來(lái)直接計(jì)算出來(lái)直接計(jì)算出|Zxi|是否大于是否大于
20、Z95%。解:解:1) 確定有關(guān)總體參數(shù)的假設(shè)確定有關(guān)總體參數(shù)的假設(shè) H0 : m m 800; H1 : m m 800; 2) 確定檢驗(yàn)此假設(shè)的概率標(biāo)準(zhǔn):確定檢驗(yàn)此假設(shè)的概率標(biāo)準(zhǔn): 置信度為置信度為95,顯著度為,顯著度為5,即,即Z1.96 3)計(jì)算)計(jì)算Zxi25800790.ESxzixi 4)判定:)判定:Zxi=-2,絕對(duì)值大于,絕對(duì)值大于Z95%,因此在,因此在5%的顯著水平上否定原假設(shè)的顯著水平上否定原假設(shè)m m 800。 假設(shè)假設(shè) m m =800樣本樣本1:X1795;S10m m!1.96S.E樣本樣本2:X2790;S10接受區(qū)95拒絕區(qū)52022-5-125.5.均
21、值比較與均值比較與T T檢驗(yàn)檢驗(yàn) 5.1 5.1 均值比較與均值比較的檢驗(yàn)過(guò)程均值比較與均值比較的檢驗(yàn)過(guò)程 5.2 MEANS 5.2 MEANS 過(guò)程過(guò)程 5.3 5.3 單一樣本的單一樣本的T T檢驗(yàn)檢驗(yàn) 5.4 5.4 獨(dú)立樣本的獨(dú)立樣本的T T檢驗(yàn)檢驗(yàn) 5.5 5.5 配對(duì)樣本配對(duì)樣本T T檢驗(yàn)檢驗(yàn)注意數(shù)據(jù)結(jié)構(gòu)的不同注意數(shù)據(jù)結(jié)構(gòu)的不同5.1.1 均值比較的概念 在研究中常常采取抽樣研究的方法,即從總體中隨機(jī)抽取一在研究中常常采取抽樣研究的方法,即從總體中隨機(jī)抽取一定數(shù)量的樣本進(jìn)行研究來(lái)推斷總體的特性。由于總體中的每定數(shù)量的樣本進(jìn)行研究來(lái)推斷總體的特性。由于總體中的每個(gè)個(gè)體間均存在差異,
22、即使嚴(yán)格遵守隨機(jī)抽樣原則也會(huì)由于個(gè)個(gè)體間均存在差異,即使嚴(yán)格遵守隨機(jī)抽樣原則也會(huì)由于多抽到一些數(shù)值較大或較小的個(gè)體致使樣本統(tǒng)計(jì)量與總體參多抽到一些數(shù)值較大或較小的個(gè)體致使樣本統(tǒng)計(jì)量與總體參數(shù)之間有所不同。又由于實(shí)驗(yàn)者測(cè)量技術(shù)的差別或測(cè)量?jī)x器數(shù)之間有所不同。又由于實(shí)驗(yàn)者測(cè)量技術(shù)的差別或測(cè)量?jī)x器精確程度的差別等也會(huì)造成一定的偏差,使樣本統(tǒng)計(jì)量與總精確程度的差別等也會(huì)造成一定的偏差,使樣本統(tǒng)計(jì)量與總體參數(shù)之間存在差異。由此可以得到這樣的認(rèn)識(shí):體參數(shù)之間存在差異。由此可以得到這樣的認(rèn)識(shí):均值不相均值不相等的兩組樣本不一定來(lái)自均值不同的總體。等的兩組樣本不一定來(lái)自均值不同的總體。 能否用樣本均值估計(jì)總體
23、均值??jī)蓚€(gè)變量均值接近的樣本是能否用樣本均值估計(jì)總體均值??jī)蓚€(gè)變量均值接近的樣本是否來(lái)自均值相同的總體?否來(lái)自均值相同的總體?換句話說(shuō),兩組樣本某變量均值不換句話說(shuō),兩組樣本某變量均值不同,其差異是否具有統(tǒng)計(jì)意義?能否說(shuō)明總體差異?這是各同,其差異是否具有統(tǒng)計(jì)意義?能否說(shuō)明總體差異?這是各種研究工作中經(jīng)常提出的問(wèn)題。這就要進(jìn)行均值比較。種研究工作中經(jīng)常提出的問(wèn)題。這就要進(jìn)行均值比較。5.1.2 進(jìn)行均值比較及檢驗(yàn)的過(guò)程進(jìn)行均值比較及檢驗(yàn)的過(guò)程 MEANS過(guò)程:過(guò)程:不同水平下(不同組)的描述統(tǒng)計(jì)量不同水平下(不同組)的描述統(tǒng)計(jì)量 T test 過(guò)程:對(duì)樣本進(jìn)行過(guò)程:對(duì)樣本進(jìn)行T檢驗(yàn)的過(guò)程檢驗(yàn)的
24、過(guò)程n單一樣本的單一樣本的T檢驗(yàn):檢驗(yàn)單個(gè)變量的均值是否與給定的檢驗(yàn):檢驗(yàn)單個(gè)變量的均值是否與給定的常數(shù)之間存在差異。常數(shù)之間存在差異。n獨(dú)立樣本的獨(dú)立樣本的T檢驗(yàn):檢驗(yàn)兩組不相關(guān)的樣本是否來(lái)自具檢驗(yàn):檢驗(yàn)兩組不相關(guān)的樣本是否來(lái)自具有相同均值的總體(均值是否相同,如男女的平均收入有相同均值的總體(均值是否相同,如男女的平均收入是否相同,是否有顯著性差異)是否相同,是否有顯著性差異)n配對(duì)配對(duì)T檢驗(yàn):檢驗(yàn)兩組相關(guān)的樣本是否來(lái)自具有相同均檢驗(yàn):檢驗(yàn)兩組相關(guān)的樣本是否來(lái)自具有相同均值的總體值的總體(前后比較,如訓(xùn)練效果前后比較,如訓(xùn)練效果) One-Way ANOVA:一元一元(單因素單因素)方差分
25、析,用于檢方差分析,用于檢驗(yàn)幾個(gè)(三個(gè)或三個(gè)以上)獨(dú)立的組,是否來(lái)自均值相同驗(yàn)幾個(gè)(三個(gè)或三個(gè)以上)獨(dú)立的組,是否來(lái)自均值相同的總體。的總體。 如果分析變量明顯是非正態(tài)分布的,應(yīng)該選擇非參數(shù)檢驗(yàn)如果分析變量明顯是非正態(tài)分布的,應(yīng)該選擇非參數(shù)檢驗(yàn)過(guò)程。過(guò)程。5.2 MEANS 過(guò)程過(guò)程 功能:功能:分組計(jì)算、比較指定變量的描述統(tǒng)計(jì)量。包括均值、標(biāo)準(zhǔn)差、分組計(jì)算、比較指定變量的描述統(tǒng)計(jì)量。包括均值、標(biāo)準(zhǔn)差、總和、觀測(cè)數(shù)、方差等等,還可以給出方差分析表和線性檢驗(yàn)結(jié)果。總和、觀測(cè)數(shù)、方差等等,還可以給出方差分析表和線性檢驗(yàn)結(jié)果。 Analyze- Compare Means-MeansnDepende
26、nt List:因變量(分析變量,一般為定距或定序變量):因變量(分析變量,一般為定距或定序變量)nIndependent List:自變量(分組變量,為分類變量,注意可分層:自變量(分組變量,為分類變量,注意可分層)n選項(xiàng):統(tǒng)計(jì)量選擇項(xiàng),對(duì)第一層每個(gè)控制變量的分析(選項(xiàng):統(tǒng)計(jì)量選擇項(xiàng),對(duì)第一層每個(gè)控制變量的分析(方差分析和線方差分析和線性度檢驗(yàn))性度檢驗(yàn)) 例子:例子:P128的學(xué)生身高的學(xué)生身高data08-01(不同性別、不同年齡不同性別、不同年齡); 發(fā)育階段發(fā)育階段相同年齡的男孩和女孩是否身高有所不同?是否身高隨年齡的增長(zhǎng)呈線相同年齡的男孩和女孩是否身高有所不同?是否身高隨年齡的增長(zhǎng)
27、呈線性關(guān)系。性關(guān)系。5.3 單一樣本的單一樣本的T檢驗(yàn)檢驗(yàn) 概念:概念:檢驗(yàn)單個(gè)變量的均值是否與給定的常數(shù)檢驗(yàn)單個(gè)變量的均值是否與給定的常數(shù)(指定的檢驗(yàn)值指定的檢驗(yàn)值)之間存之間存在顯著差異。如:研究人員想知道一組學(xué)生的在顯著差異。如:研究人員想知道一組學(xué)生的IQ平均分與平均分與100分的差異。分的差異。要求樣本來(lái)自正態(tài)分布總體。要求樣本來(lái)自正態(tài)分布總體。 菜單:菜單:Analyze - Compare Means- One-Samples T test Test Variable(s):要求平均值的變量(一般是定距變量):要求平均值的變量(一般是定距變量) Test Value:常數(shù):常數(shù)
28、零假設(shè)零假設(shè)H0:樣本均值:樣本均值Mean=常數(shù)(檢驗(yàn)值);常數(shù)(檢驗(yàn)值); 結(jié)果中比較有用的值:結(jié)果中比較有用的值:Mean和和Sig顯著性概率值顯著性概率值 例子例子 :某地區(qū)某地區(qū)12歲男孩的平均身高為歲男孩的平均身高為142.5cm,現(xiàn)有某市現(xiàn)有某市測(cè)量測(cè)量120名名12歲男孩身高資料,檢驗(yàn)該市歲男孩身高資料,檢驗(yàn)該市12歲男孩平均身歲男孩平均身高與該地區(qū)高與該地區(qū)12歲男孩平均身高是否有顯著性差異。歲男孩平均身高是否有顯著性差異。5.4 獨(dú)立樣本的獨(dú)立樣本的T檢驗(yàn)檢驗(yàn) 要求:要求:a. 被比較的兩組樣本彼此獨(dú)立被比較的兩組樣本彼此獨(dú)立, 沒(méi)有配對(duì)沒(méi)有配對(duì)關(guān)系關(guān)系 b. 兩組樣本均來(lái)
29、自兩組樣本均來(lái)自正態(tài)總體正態(tài)總體 兩組樣本方差相等和不等時(shí)使用的計(jì)算兩組樣本方差相等和不等時(shí)使用的計(jì)算t t值的公式不同值的公式不同。因。因此應(yīng)該先對(duì)方差進(jìn)行齊次性檢驗(yàn)。此應(yīng)該先對(duì)方差進(jìn)行齊次性檢驗(yàn)。SPSSSPSS的輸出,在給出方的輸出,在給出方差齊和不齊兩種計(jì)算結(jié)果的差齊和不齊兩種計(jì)算結(jié)果的t t值,和值,和t t檢驗(yàn)的顯著性概率的檢驗(yàn)的顯著性概率的同時(shí),還給出對(duì)方差齊次性檢驗(yàn)的同時(shí),還給出對(duì)方差齊次性檢驗(yàn)的F F值和值和F F檢驗(yàn)的顯著性概檢驗(yàn)的顯著性概率。用戶需要根據(jù)率。用戶需要根據(jù)F F檢驗(yàn)的結(jié)果自己判斷選擇檢驗(yàn)的結(jié)果自己判斷選擇t t檢驗(yàn)輸出中檢驗(yàn)輸出中的哪個(gè)結(jié)果,得出最后結(jié)論。的哪個(gè)結(jié)果,得出最后結(jié)論。 方差齊次檢驗(yàn)方差齊次檢驗(yàn)使用使用F F檢驗(yàn)。零假設(shè)是檢驗(yàn)。零假設(shè)是: :兩組樣本方差相等。兩組樣本方差相等。概
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《消防器材使用方法》課件
- 小學(xué)一年級(jí)20以內(nèi)的進(jìn)位加法口算練習(xí)題
- 小學(xué)五年級(jí)數(shù)學(xué)下冊(cè)第五單元《分?jǐn)?shù)混合運(yùn)算》測(cè)試題
- 金融工程試題及答案
- 計(jì)算機(jī)組裝與維護(hù)第五版課后習(xí)題參考答案(工業(yè))
- 2020年計(jì)算機(jī)軟考《信息系統(tǒng)項(xiàng)目管理師》基礎(chǔ)練習(xí)及答案
- 小學(xué)數(shù)學(xué)二年級(jí)整十整百整千數(shù)加減法口算練習(xí)990道
- 高三寫作點(diǎn)悟
- 《神經(jīng)系統(tǒng)的認(rèn)識(shí)》課件
- 《化工開(kāi)放設(shè)計(jì)》課件
- 2024地理知識(shí)競(jìng)賽試題
- 《城市軌道交通工程盾構(gòu)吊裝技術(shù)規(guī)程》(征求意見(jiàn)稿)
- 【新教材】統(tǒng)編版(2024)七年級(jí)上冊(cè)語(yǔ)文期末復(fù)習(xí)課件129張
- 欽州市浦北縣2022-2023學(xué)年七年級(jí)上學(xué)期期末語(yǔ)文試題
- 古典時(shí)期鋼琴演奏傳統(tǒng)智慧樹知到期末考試答案章節(jié)答案2024年星海音樂(lè)學(xué)院
- 樂(lè)山市市中區(qū)2022-2023學(xué)年七年級(jí)上學(xué)期期末地理試題【帶答案】
- 兩人合伙人合作協(xié)議合同
- 蘇教版一年級(jí)上冊(cè)數(shù)學(xué)期末測(cè)試卷含答案(完整版)
- 2024年中考?xì)v史復(fù)習(xí)-中國(guó)古代史專項(xiàng)試題
- DZ/T 0462.5-2023 礦產(chǎn)資源“三率”指標(biāo)要求 第5部分:金、銀、鈮、鉭、鋰、鋯、鍶、稀土、鍺(正式版)
- 大學(xué)生餐飲職業(yè)生涯規(guī)劃書
評(píng)論
0/150
提交評(píng)論