計(jì)量資料統(tǒng)計(jì)推斷_第1頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第2頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第3頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第4頁(yè)
計(jì)量資料統(tǒng)計(jì)推斷_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)量資料的統(tǒng)計(jì)推斷,統(tǒng)計(jì)推斷:用樣本信息推斷總體特征。 包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。 參數(shù)估計(jì):用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo) (參數(shù),一、抽樣分布與抽樣誤差,1.樣本均數(shù)的抽樣分布與抽樣誤差,從正態(tài)總體N(155.4,5.32)抽樣得到的100個(gè) 樣本均數(shù)的頻數(shù)分布(,樣本均數(shù)的分布規(guī)律: 1.各樣本均數(shù)未必等于總體均數(shù)。 2.樣本均數(shù)之間存在差異。 3.樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多,兩邊少,左右基本對(duì)稱,也服從正態(tài)分布。 4.樣本均數(shù)的變異較之原變量的變異大大縮小,均數(shù)的抽樣誤差:由抽樣造成的樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù)與總體均數(shù)之間的差異,稱為抽樣誤差。 樣本均數(shù)的標(biāo)

2、準(zhǔn)誤(standard error of mean,SE):用于描述均數(shù)抽樣誤差大小的指標(biāo)叫樣本均數(shù)的標(biāo)準(zhǔn)差,通常也稱為樣本均數(shù)的標(biāo)準(zhǔn)誤。它反映樣本均數(shù)的離散程度,也反映樣本均數(shù)抽樣誤差的大小。用 表示,中心極限定理一:在均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中作隨機(jī)抽樣,則樣本均數(shù)服從正態(tài)分布,樣本均數(shù)的均數(shù)為,標(biāo)準(zhǔn)差為 ,即,在實(shí)際應(yīng)用中,總體標(biāo)準(zhǔn)差常常未知,需要用樣本標(biāo)準(zhǔn)差S來(lái)估計(jì)。即樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為,中心極限定理二:在非正態(tài)分布的總體中隨機(jī)抽樣,樣本均數(shù)的均數(shù)仍等于原來(lái)的總體均數(shù),樣本均數(shù)的標(biāo)準(zhǔn)誤 ,但是當(dāng)樣本量較小時(shí),樣本均數(shù)的分布并非正態(tài)分布,而當(dāng)樣本量足夠大時(shí),樣本均數(shù)的分布近似正態(tài)

3、分布,例4-1 2000年某研究者隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。 解,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的關(guān)系:區(qū)別 1.意義:標(biāo)準(zhǔn)差描述個(gè)體觀察值間變異,即觀察值間的離散度。 標(biāo)準(zhǔn)誤描述統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度。 2.用途:標(biāo)準(zhǔn)差常用于: 表示觀察值之間的波動(dòng)大小。當(dāng)資料服從正態(tài)分布時(shí),可結(jié)合均數(shù)估計(jì)正常值范圍,如計(jì)算雙側(cè)95%正常值范圍。 標(biāo)準(zhǔn)誤常用于: 表示抽樣誤差的大小。估計(jì)參數(shù)的可信區(qū)間,如計(jì)算總體均數(shù)的95%可信區(qū)間。 3.標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤與樣本含量的關(guān)系:標(biāo)準(zhǔn)差隨著樣本含量的增多,逐漸趨于穩(wěn)

4、定,標(biāo)準(zhǔn)誤隨著樣本含量的增加逐漸減小,若樣本含量趨近于總體例數(shù),則標(biāo)準(zhǔn)誤趨近于0,抽樣誤差幾乎消失,聯(lián)系: 1.標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤都是變異指標(biāo),說(shuō)明個(gè)體值之間的變異用標(biāo)準(zhǔn)差,說(shuō)明統(tǒng)計(jì)量之間的變異用標(biāo)準(zhǔn)誤。 2.當(dāng)樣本含量不變時(shí),標(biāo)準(zhǔn)差越大標(biāo)準(zhǔn)誤越大,即均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比,二、t 分布,大樣本、小樣本概念:30、50、100。 量變引起質(zhì)變:當(dāng)樣本容量較大時(shí),其統(tǒng)計(jì)量的抽樣分布近似為正態(tài)分布。隨著N的增大,越來(lái)越接近于正態(tài)分布(樣本均數(shù)的分布)。 但當(dāng)樣本量小于100時(shí),抽樣分布不能再用正態(tài)分布來(lái)近似,隨著N的減小,與正態(tài)分布的差別越來(lái)越大,需要用小樣本理論來(lái)解釋(樣本均數(shù)的分布,1.概念

5、從正態(tài)分布N(,2)抽得的樣本均數(shù) 服從態(tài)分布 ,對(duì)樣本均數(shù) 做標(biāo)準(zhǔn)化變換,英國(guó)統(tǒng)計(jì)學(xué)家W.S.Gosset證明它服從自由度 的t分布,即,t 分布曲線的特征 單峰分布,以0為中心,左右對(duì)稱,類似于標(biāo)準(zhǔn)正態(tài)分布。 自由度越小,則 越大,t 值越分散,曲線的峰部越矮,尾部越粗。 隨著自由度逐漸增大,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)趨于時(shí),t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布。故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例,三、假設(shè)檢驗(yàn),顯著性檢驗(yàn); 科研數(shù)據(jù)處理的重要工具; 某事發(fā)生了:是由于碰巧?還是由于必然的原因?統(tǒng)計(jì)學(xué)家運(yùn)用顯著性檢驗(yàn)來(lái)處理這類問(wèn)題,假設(shè)檢驗(yàn): 1、原因 2、目的 3、原理 4、過(guò)程(步驟) 5、結(jié)果

6、,1. 假設(shè)檢驗(yàn)的原因,由于個(gè)體差異的存在,即使從同一總體中嚴(yán)格的隨機(jī)抽樣,X1、X2、X3、X4,不同。因此,X1、X2 不同有兩種(而且只有兩種)可能: (1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無(wú)顯著性 。 (2)分別所代表的總體均數(shù)不同。差別有顯著性,判斷是由于何種原因造成的不同,以便做出決策,2. 假設(shè)檢驗(yàn)的目的,3.假設(shè)檢驗(yàn)的原理/思想,反證法:當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實(shí)A,這時(shí)否定另一種可能B,則間接的肯定了A。 概率論(小概率):如果一件事情發(fā)生的概率很小,那么在進(jìn)行一次試驗(yàn)時(shí),我們說(shuō)這個(gè)事件是“不

7、會(huì)發(fā)生的”。從一般的常識(shí)可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯(cuò)誤的時(shí)候,因?yàn)楦怕试傩∫彩怯锌赡馨l(fā)生的,4. 假設(shè)檢驗(yàn)的一般步驟,建立假設(shè)(反證法): 確定顯著性水平( ): 計(jì)算統(tǒng)計(jì)量:u,t,2 確定概率值: 做出推論,1)建立假設(shè): 檢驗(yàn)假設(shè)或者稱無(wú)效假設(shè)(null hypothesis),用H0表示, H0假設(shè)是假設(shè)兩總體均數(shù)相等。 備擇假設(shè)(alternative hypothesis),用H1表示。 H1是與H0相反的假設(shè),假設(shè)兩總體均數(shù)不相等,2)確定顯著性水平(significance level ) 顯著性水平()就是我們用來(lái)區(qū)分大概率事件和小概率事件的標(biāo)準(zhǔn),是人

8、為規(guī)定的。當(dāng)某事件發(fā)生的概率小于時(shí),則認(rèn)為該事件為小概率事件,是不太可能發(fā)生的事件。通常取0.05或0.01,3)計(jì)算統(tǒng)計(jì)量 根據(jù)資料類型與分析目的選擇適當(dāng)?shù)墓接?jì)算出統(tǒng)計(jì)量,比如計(jì)算出 u 值 或 t 值。 注意:在檢驗(yàn)假設(shè)成立的情況下,才會(huì)出現(xiàn)的分布類型或公式,4)確定概率值(P) 將計(jì)算得到的u值或t值與查表得到u或t,比較,得到P值的大小。根據(jù)u分布和t分布我們知道,如果|u|u或|t|u,則 P,5)作出推斷結(jié)論 如果p,認(rèn)為在檢驗(yàn)假設(shè)H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計(jì)量u值或t值的可能性大于,不屬于小概率事件,則不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,結(jié)論是不認(rèn)為兩總體均數(shù)不相等。如果

9、p,我們認(rèn)為在檢驗(yàn)假設(shè)H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計(jì)量u值或t值的可能性小于,可判斷為小概率事件,則拒絕H0,接受H1,差別有統(tǒng)計(jì)意義,結(jié)論是兩總體均數(shù)不相等,或者某一總體均數(shù)大于(或小于)另一總體均數(shù),5. 假設(shè)檢驗(yàn)的結(jié)果,接受檢驗(yàn)假設(shè) 拒絕檢驗(yàn)假設(shè) 正確理解結(jié)論的概率性(都隱含著犯錯(cuò)誤的可能性,四、未知總體與已知總體均數(shù)的比較,1. 大樣本 一般女性平均身高160.1cm。某大學(xué)隨機(jī)抽取100名女大學(xué)生,測(cè)量其身高,身高的均數(shù)是163.74cm,標(biāo)準(zhǔn)差是3.80cm。請(qǐng)問(wèn)某大學(xué)18歲女大學(xué)生身高是否與一般女性不同,目的:比較樣本均數(shù)所代表的未知總體均數(shù) 與已知的總體均數(shù)有無(wú)差別

10、計(jì)算公式:u(統(tǒng)計(jì)量),適用條件: (1) 已知一個(gè)總體均數(shù); (2) 可得到一個(gè)樣本均數(shù); (3) 可得到該樣本標(biāo)準(zhǔn)誤; (4) 樣本量不小于100,例題: (1) 一個(gè)總體均數(shù):160.1cm; (2) 一個(gè)樣本均數(shù):163.74cm; (3) 可計(jì)算出樣本標(biāo)準(zhǔn)誤:3.8/100=0.38; (4) n=100,假設(shè)檢驗(yàn): 建立假設(shè): 檢驗(yàn)假設(shè):某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)相同; H0:=0; 備擇假設(shè) :某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同; H1:0 確定顯著性水平():0.05,做出推論: u=9.581.96, p0.05=,小概率事件發(fā)生了,原假設(shè)不成立;拒絕H0

11、 , 接受H1,可認(rèn)為:某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同;某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)差別有顯著性,計(jì)算統(tǒng)計(jì)量:u 統(tǒng)計(jì)量: u,確定概率值: |u|=9.58,u=1.96,uu,p=0.05,2、小樣本 已知中學(xué)一般男生的心率平均為74次/分鐘。為了研究常參加體育鍛煉的中學(xué)生心臟功能是否與一般的中學(xué)生相同,在某地區(qū)中學(xué)生中隨機(jī)抽取常年參加體育鍛煉的男生16名,測(cè)量他們的心率,結(jié)果平均心率為65.63次/分,標(biāo)準(zhǔn)差為7.2次/分。有體育鍛煉的男生心率是否與一般男生不同,目的:比較一個(gè)小樣本均數(shù)所代表的未知總體均數(shù) 與已知的總體均數(shù)有無(wú)差別。 計(jì)算公式: t 統(tǒng)計(jì)量:t=

12、自由度:=n-1,適用條件: (1)已知一個(gè)總體均數(shù); (2)可得到一個(gè)樣本均數(shù)及該樣本標(biāo)準(zhǔn)誤; (3)樣本量小于100; (4)樣本來(lái)自正態(tài)或近似正態(tài)總體,例題: 已知: (1) 一個(gè)總體均數(shù):74次/分 ; (2) 一個(gè)樣本均數(shù):65.63次/分 ; (3) 可計(jì)算出樣本標(biāo)準(zhǔn)誤:7.2/16=1.8 (4) n=16100,假設(shè)檢驗(yàn): 建立假設(shè): 檢驗(yàn)假設(shè):常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生相等; H0:=0; 備擇假設(shè) :常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生不同;H1:0 確定顯著性水平():0.05,計(jì)算統(tǒng)計(jì)量: t= : t=4.65 確定概率值: n=16, 自由度=

13、n1=15, t0.05(15) = 2.131 tt0.05(25) , p0.05 做出推論: p0.05, 小概率事件發(fā)生了,原假設(shè)不成立;拒絕H0 , 接受H1,可認(rèn)為:常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生不同;常參加體育鍛煉的中學(xué)男生的心率比一般中學(xué)生心率慢;常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生差別有顯著性,五、完全隨機(jī)設(shè)計(jì)兩總體均數(shù)的比較,例題: 一個(gè)工作組調(diào)查了兩個(gè)縣農(nóng)民住房面積,試比較這兩縣農(nóng)民人均住房面積(T-test-Ex1.sav,目的:由兩個(gè)樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無(wú)差別。 計(jì)算公式及意義: t統(tǒng)計(jì)量: t= 自由度= n1+n2-2,適

14、用條件: (1)已知/可計(jì)算兩個(gè)樣本均數(shù)及它們的標(biāo)準(zhǔn)差 ; (2)兩個(gè)樣本之一的例數(shù)少于100,例題: 已知: 一個(gè)樣本: 均數(shù)31.73, 標(biāo)準(zhǔn)差3.51; 另一個(gè)樣本:均數(shù)34.17, 標(biāo)準(zhǔn)差1.96; (2) n1=30; n2=30,假設(shè)檢驗(yàn): 建立假設(shè): 檢驗(yàn)假設(shè):兩縣農(nóng)民人均住房面積相同; 備擇假設(shè) :兩縣農(nóng)民人均住房面積不同; 確定顯著性水平():0.05,計(jì)算統(tǒng)計(jì)量:t 統(tǒng)計(jì)量: t=3.34; 自由度:30+30-2=58 表中:t0.05(58)=2.026 確定概率值:tt0.05(58),p0.05; 做出推論: 因?yàn)閜0.05, 拒絕H0: 認(rèn)為兩縣農(nóng)民人均住房面積不

15、同,六、配對(duì)設(shè)計(jì)資料均數(shù)的比較,什么是配對(duì)設(shè)計(jì)資料:將可能影響指標(biāo)的一些特征相同或近似的兩個(gè)個(gè)體配成一對(duì),然后按照隨機(jī)化方法將每個(gè)對(duì)子內(nèi)的兩個(gè)個(gè)體用不同的兩種方法進(jìn)行處理。對(duì)處理的結(jié)果進(jìn)行分析,1比較目的:通過(guò)對(duì)兩組配對(duì)資料的比較,判斷不同的處理效果是否有差別,或某種治療方法是否起作用。2公式: t = = 自由度:=對(duì)子數(shù)-13.適用條件:將人或動(dòng)物進(jìn)行配對(duì),配好的每對(duì)個(gè)體分別隨機(jī)地分到兩個(gè)不同的處理組中去,接受不同處理。觀察同一批病人在治療前后的變化,治療前的數(shù)值和治療后的數(shù)值也是配對(duì)資料。同一批病人或動(dòng)物用不同的方法處理,例題:為考察一種新型透析療法的效果,隨機(jī)抽取了10名病人測(cè)量透析前

16、后的血中尿素氮含量如下表,請(qǐng)根據(jù)本實(shí)驗(yàn)資料對(duì)此療法進(jìn)行評(píng)價(jià)(數(shù)據(jù)見(jiàn)下表),H0:d=0 H1:d0 確定顯著性水平 =0.05 計(jì)算統(tǒng)計(jì)量: t=7.826 確定概率:=10-1=9。查表t0.05(9)=2.262 t=7.826t0.05(9) p0.05 判斷結(jié)果:因?yàn)閜0.05,故拒絕檢驗(yàn)假設(shè)H0,10名病人透析前后血中尿素氮含量差異有顯著性,即透析可以降低血中尿素氮含量,1. 正確理解假設(shè)檢驗(yàn)的結(jié)論(概率性) 假設(shè)檢驗(yàn)的結(jié)論是根據(jù)概率推斷的,所以不是絕對(duì)正確的: 當(dāng)p, 不能拒絕H0, 不能接受H1,按不能接受H1下結(jié)論,也可能犯錯(cuò)誤,七、均數(shù)假設(shè)檢驗(yàn)的注意事項(xiàng),2. 第I類錯(cuò)誤和第II類錯(cuò)誤 假設(shè)檢驗(yàn)的結(jié)果有兩種: (1)當(dāng)拒絕H0時(shí),可能犯錯(cuò)誤,可能拒絕了實(shí)際上成立的H0,稱為類錯(cuò)誤(“棄真”的錯(cuò)誤),其概率大小用表示。 (2)當(dāng)不能拒絕H0 時(shí),也可

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論