數(shù)值變量資料的統(tǒng)計推斷課件_第1頁
數(shù)值變量資料的統(tǒng)計推斷課件_第2頁
數(shù)值變量資料的統(tǒng)計推斷課件_第3頁
數(shù)值變量資料的統(tǒng)計推斷課件_第4頁
數(shù)值變量資料的統(tǒng)計推斷課件_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)值變量資料的統(tǒng)計推斷

第三章教學(xué)要求掌握標(biāo)準(zhǔn)誤計算公式及意義熟悉t分布的特征掌握總體均數(shù)的估計方法掌握均數(shù)的假設(shè)檢驗方法統(tǒng)計推斷的過程總體樣本抽樣總體均值、比例、方差統(tǒng)計推斷樣本均數(shù)、率、標(biāo)準(zhǔn)差統(tǒng)計量參數(shù)現(xiàn)實生活中的抽樣現(xiàn)象炒菜時嘗嘗咸淡評價河水污染情況就醫(yī)時做血常規(guī)檢驗

假設(shè)正常成年男子紅細胞N(5.00,0.502)的正態(tài)分布總體,從該總體中重復(fù)進行1000次抽樣,樣本量分別為5,10,30。計算其均數(shù)和標(biāo)準(zhǔn)差。1000份樣本抽樣計算結(jié)果總體均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)的標(biāo)準(zhǔn)差n=55.000.504.9870.23000.2236n=105.000.505.0110.15860.1581n=305.000.505.0000.09200.0913各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)的變異較之原變量的變異大大縮??;4.樣本均數(shù)分布很有規(guī)律,圍繞著總體均數(shù),中間多,兩邊少,左右基本對稱,服從正態(tài)分布。當(dāng)S一定時,n越大,即樣本量越大,標(biāo)準(zhǔn)誤越小;故:我們可以通過增加樣本量來減小抽樣誤差。例2003年某地20歲應(yīng)征男青年中隨機抽取85人,平均身高為171.2cm,標(biāo)準(zhǔn)差為5.3cm,計算當(dāng)?shù)?0歲應(yīng)征男青年身高的標(biāo)準(zhǔn)誤。來自同一正態(tài)總體的樣本:來自同一非正態(tài)總體的樣本:小樣本非正態(tài)分布大樣本(n≥30)服從正態(tài)分布中心極限定理:以數(shù)值變量為例,若從正態(tài)總體中以固定n反復(fù)多次抽樣,所得樣本均數(shù)的分布是正態(tài)分布;即使從偏態(tài)總體中抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布

標(biāo)準(zhǔn)差VS標(biāo)準(zhǔn)誤第二節(jié)t分布以0為中心,左右對稱,類似于標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布相比,曲線峰值較矮,兩尾部翹得高;自由度越小,t值越分散,曲線峰值越小。隨著自由度逐漸增大,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度趨于無窮,t分布即為標(biāo)準(zhǔn)正態(tài)分布。t分布曲線下面積規(guī)律:1.同一下,P值越小,t值越大

2.同一P值下,越大,t值越小0第三節(jié)總體均數(shù)的估計區(qū)間估計置信上限可信/置信區(qū)間(區(qū)間估計)置信下限樣本統(tǒng)計量

(點估計)95%CI的含義:從總體中作隨機抽樣,例如作100次抽樣,每個樣本可算得一個可信區(qū)間,得100個可信區(qū)間,平均有95個可信區(qū)間包括總體均數(shù)(估計正確),只有5個可信區(qū)間不包括總體均數(shù)(估計不正確)。實際中,只作一次抽樣,只得到一個可信區(qū)間,作為未知總體均數(shù)的可能范圍的估計,理論上有95%的可能是正確的,而5%的可能發(fā)生錯誤。

設(shè)某人群的身高值X~N(155.4,5.32),現(xiàn)從該總體中隨機抽出一個n=10的樣本,算得均數(shù)為158.36cm,S=3.83cm,求得m的95%可信區(qū)間為(155.62,161.10),發(fā)現(xiàn)該區(qū)間未包含總體均數(shù)m=155.4cm。若隨機從該總體抽取n=10的樣本200個,每次都求95%可信區(qū)間,問大約有多少個可信區(qū)間不包括總體均數(shù)m=155.4cm在內(nèi)?s未知:2003年某地20歲應(yīng)征男青年中隨機抽取85人,平均身高為171.2cm,標(biāo)準(zhǔn)差為5.3cm,估計2003年當(dāng)?shù)?0歲應(yīng)征男青年身高總體均數(shù)的95%的可信區(qū)間。解:

,求總體均數(shù)的95%可信區(qū)間。影響區(qū)間寬度的因素數(shù)據(jù)的離散程度,用S或來測度樣本容量,置信水平(1-),影響

的大小可信區(qū)間95%CI99%CI公式范圍

窄寬估計錯誤概率

大(0.05)小(0.01)精確度準(zhǔn)確度1-a在準(zhǔn)確度一定的情況下,如何提高精確度?

可信區(qū)間參考值范圍含義

當(dāng)=0.05時,CI以95%的可能性包含總體均數(shù)。

“正常人”的解剖、生理、生化某項指標(biāo)個體值的波動范圍。計算公式s未知:

正態(tài)分布:

s已知或s未知但為大樣本:

偏態(tài)分布:PX~P100X

用途

總體均數(shù)的區(qū)間估計

絕大多數(shù)(如95%)觀察對象某項指標(biāo)的分布范圍

某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)男性工人的血紅蛋白是否不同于正常成年男性平均值140g/L?n=36已知總體未知總體第四節(jié)假設(shè)檢驗的基本步驟?造成樣本均數(shù)與已知總體不等的原因:

非同一總體,即

是同一總體,即,差異是由于抽樣誤差造成的;

如果與很接近,其差別可用抽樣誤差解釋,可認為來自總體;

如果與相差甚遠,不宜用抽樣誤差來解釋,則懷疑不是來自總體。如果與相差較遠,t值就大,P值就小。假設(shè)成立,當(dāng)P小于或等于預(yù)先規(guī)定的概率(如0.05),則有理由懷疑原假設(shè)不成立,認為其對立面成立。該結(jié)論犯錯誤的風(fēng)險僅為。一、假設(shè)檢驗的概念及基本原理概念:事先對總體參數(shù)或分布類型作出某種假設(shè),判斷這種假設(shè)是否成立的方法。特點:反證法;小概率原理。原理:先假定提出的關(guān)于總體的假設(shè)成立,樣本是通過合理設(shè)計獲得的總體的代表,那么樣本應(yīng)體現(xiàn)總體的特點,如樣本均數(shù)的值應(yīng)在總體均數(shù)值附近,如果偏離太遠,則根據(jù)反證法和小概率原理拒絕原假設(shè)。鏈接:反證法即兩種說法非A即B,要證明A或B真,只需證明對立方偽。小概率原理:當(dāng)某事件發(fā)生的概率P≤0.05時,稱為小概率事件,表示某事件發(fā)生的可能性很小,是幾乎不可能發(fā)生的事件。二、假設(shè)檢驗的基本步驟建立檢驗假設(shè)無效假設(shè):又稱零假設(shè),用H0表示。一般是假設(shè)總體參數(shù)相等或服從某種分布。備擇假設(shè):用H1表示。一般是假設(shè)總體參數(shù)不等或不服從某種分布。①檢驗假設(shè)是針對總體而言,而不是針對樣本;如

或。對于檢驗假設(shè)需要注意的幾個問題:②H1的內(nèi)容直接反映了檢驗單雙側(cè)。假設(shè)雙側(cè)檢驗單側(cè)檢驗H0H1假設(shè)檢驗單雙側(cè)之分,需根據(jù)研究目的和專業(yè)知識而定。目的是推斷兩總體均數(shù)是否不等雙側(cè)檢驗H0:=0,H1:≠0;若從專業(yè)知識已知不會出現(xiàn)0的情況(或已知不會出現(xiàn)0的情況)單側(cè)檢驗H0:=0,H1:0(或0)雙側(cè)檢驗的例子單側(cè)檢驗的例子確定顯著性水平又稱檢驗水準(zhǔn),是預(yù)先規(guī)定的概率值,它確定了小概率事件的標(biāo)準(zhǔn)。當(dāng)某事件發(fā)生的概率P≤時,則認為該事件為小概率事件。在實際工作中常取=0.05或0.01??筛鶕?jù)不同研究目的給予不同設(shè)置。計算統(tǒng)計量不同的檢驗方法采用不同的檢驗統(tǒng)計量例如:確定概率值P查表得到檢驗水平所對應(yīng)的界值,將計算得到的統(tǒng)計量與之比較,得到P值大小。

做出推斷結(jié)論根據(jù)獲得的事后概率P與事先規(guī)定的檢驗水準(zhǔn)進行比較,看其是否為小概率事件而得出結(jié)論。一般來說,推斷結(jié)論應(yīng)該包含統(tǒng)計結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計結(jié)論只說明差別有無統(tǒng)計學(xué)意義,而不能說明專業(yè)上的差異大小。要與專業(yè)結(jié)論有機地結(jié)合,才能得出恰當(dāng)?shù)耐茢嘟Y(jié)論。

若,按所取檢驗水準(zhǔn),拒絕,接受,樣本統(tǒng)計量差別有統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論)。可以認為總體參數(shù)不等或不同(專業(yè)結(jié)論)。

若,按所取檢驗水準(zhǔn),不拒絕,樣本統(tǒng)計量差別無統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論)。還不能認為總體參數(shù)不等或不同(專業(yè)結(jié)論)。第五節(jié)均數(shù)的假設(shè)檢驗單個樣本均數(shù)的假設(shè)檢驗設(shè)計:樣本均數(shù)與一已知總體均數(shù)的比較目的:推斷樣本均數(shù)(代表未知總體均數(shù))和已知總體均數(shù)(理論值、標(biāo)準(zhǔn)值、穩(wěn)定值)有無差別。檢驗方法:根據(jù)樣本來自的總體的分布類型、樣本含量n的大小及總體標(biāo)準(zhǔn)差是否已知選擇t檢驗、u檢驗或其他檢驗方法。計算公式:n60或已知時,用u檢驗n60時,用t檢驗

某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)男性工人的血紅蛋白是否不同于正常成年男性平均值140g/L?n=36已知總體未知總體?(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)H0:

=0=140g/L,即從事鉛作業(yè)的男性工人平均血紅蛋白含量與正常成年男性平均值相等H1:≠0=140g/L,即從事鉛作業(yè)的男性工人平均血紅蛋白含量與正常成年男性平均值不等=0.05(2)計算檢驗統(tǒng)計量本例n=36,=130.83g/L,S=25.74g/L,=140g/L。按公式(3)確定P值,作出推斷結(jié)論按=0.05水準(zhǔn),拒絕H0,接受H1,36名從事鉛作業(yè)男性工人的平均血紅蛋白含量與正常成年男性血紅蛋白含量平均值差別有統(tǒng)計學(xué)意義,可認為從事鉛作業(yè)的男性工人血紅蛋白含量均數(shù)與正常成年男性血紅蛋白含量均數(shù)不同。

隨機抽樣調(diào)查泉州市區(qū)某醫(yī)院20名男嬰出生體重,其均數(shù)為3.34㎏,標(biāo)準(zhǔn)差為0.42㎏。已知泉州市區(qū)男嬰出生體重均數(shù)為3.29㎏。試比較該院男嬰出生體重均數(shù)與全市男嬰出生體重均數(shù)是否不同?在郊區(qū)抽查20名男嬰出生體重,均數(shù)為3.23㎏,標(biāo)準(zhǔn)差0.47㎏,問市區(qū)和郊區(qū)男嬰出生體重均數(shù)是否不同?二、兩個獨立樣本均數(shù)的假設(shè)檢驗設(shè)計:兩個獨立樣本均數(shù)的比較目的:通過比較兩個樣本均數(shù)的大小,推斷兩樣本均數(shù)所代表的總體均數(shù)是否相同。檢驗方法:根據(jù)兩樣本來自的總體分布類型、例數(shù)的大小及兩樣本所代表的總體方差是否相同來選擇t檢驗、u檢驗或其他檢驗方法。計算公式:兩樣本含量均≥60,用U檢驗樣本含量n1和/或n2<60,用t檢驗兩總體方差相同兩總體方差不同,校正t檢驗為了解氨甲喋呤對外周血IL-2水平的影響,某醫(yī)生將60名哮喘患者隨機分為兩組。其中對照組29例,采用安慰劑;實驗組31例,采用小劑量氨甲喋呤進行治療。測得對照組治療前IL-2的均數(shù)為20.00IU/ml,標(biāo)準(zhǔn)差為7.00IU/ml;試驗組治療前IL-2的均數(shù)為17.00IU/ml,標(biāo)準(zhǔn)差為8.50IU/ml。問兩組總體均數(shù)有無差別?

判斷兩組治療前IL-2的總體方差是否齊性?

本例:(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)(2)計算檢驗統(tǒng)計量

(3)確定P值,作出推斷結(jié)論

按α=0.05水準(zhǔn),不拒絕H0,兩組治療前IL-2均數(shù)差異無統(tǒng)計學(xué)意義,尚不能認為兩組治療前IL-2水平不同。一般正常成年男子血紅蛋白的平均值為155g/L,某研究者隨機抽取144名高原地區(qū)成年男性進行檢查,得到血紅蛋白均數(shù)為165g/L,標(biāo)準(zhǔn)差25g/L。問:高原地區(qū)居民的血紅蛋白與一般正常成年男子是否相同?某研究表明新研制的一種安眠藥比舊安眠藥增加睡眠時間。某醫(yī)師從已確診的神經(jīng)衰弱病人中隨機抽取40例病人并進行隨機分組,一組20例病人服用該種新藥,計算得到平均睡眠時間為6.39小時,標(biāo)準(zhǔn)差為2.24小時;另一組20例病人服用舊藥,計算得到平均睡眠時間為6.45小時,標(biāo)準(zhǔn)差為2.51小時。試比較新安眠藥與舊安眠藥平均睡眠時間是否不同?同樣研究新安眠藥與舊安眠藥睡眠時間。另一位醫(yī)師也從已確診的神經(jīng)衰弱病人中隨機抽取40例病人,按病人體重、神經(jīng)衰弱嚴重程度相近配成對子,共20對。每對的病人隨機分至新藥組與舊藥組。試比較新安眠藥與舊安眠藥平均睡眠時間是否不同?三、配對設(shè)計資料的假設(shè)檢驗設(shè)計:配對設(shè)計,具體形式有將研究對象按某種特征(主要非處理因素)配成對,同對的兩對象隨機分別接受不同處理同一對象接受不同的處理同一對象接受某種處理前后目的:控制可能存在的非處理因素的影響,判斷不同處理效果或同一處理前后效果是否有差別。某單位研究飲食中缺乏維生素E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近者配成對子,共8對,并將每對中的兩只大白鼠隨機分到正常飼料組和維生素E缺乏組。用簡便法和常規(guī)法分別對12份人尿進行尿鉛含量測定為觀察靜脈注射人血丙種球蛋白治療小兒急性毛細支氣管炎,某兒科分別測量患兒用藥前后血清免疫球蛋白含量。檢驗方法:根據(jù)資料類型不同,選擇不同的檢驗方法公式:配對t檢驗

ν=對子數(shù)-1為比較兩種方法對乳酸飲料中脂肪含量測定結(jié)果是否不同,某人隨機抽取了10份乳酸飲料制品,分別用脂肪酸水解法和哥特里-羅紫法測定,其結(jié)果見下表。問兩法測定結(jié)果是否不同?n=10已知總體未知總體?(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)

H0:d=0,即兩種方法的測定結(jié)果相同

H1:d≠0,即兩種方法的測定結(jié)果不同=0.05

(2)計算檢驗統(tǒng)計量(3)確定P值,作出推斷結(jié)論查t界值表得P<0.05。按=0.05水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計學(xué)意義。認為兩種方法對脂肪含量的測定結(jié)果不同,哥特里-羅紫法測定結(jié)果較高。小白鼠編號12345678910隨機數(shù)18242207295733496592排序號24315867910分組乙乙甲甲甲乙乙甲甲乙將10只小白鼠按成組設(shè)計分成兩組,分組方法見下表:獨立樣本資料比較的數(shù)據(jù)格式對照組實驗組.........

n1

n2糖尿病加釩組糖尿病組26.4646.8925.1947.2128.7042.4223.7047.7024.4840.7525.1941.0328.0145.9823.7043.4626.1044.3424.6245.32

在探討硫酸氧釩降糖作用的實驗中,測得兩組動物每日進食量如表所示。試問兩組動物每日進食量是否相同?配對號12345小白鼠12345678910隨機數(shù)18242207295733496592排序號1221121212分組甲乙乙甲甲乙甲乙甲乙將10只小白鼠按配對設(shè)計分成兩組,分組方法見下表:對子號對照組實驗組差值d1...2...3...4...5...........合計...成對樣本均數(shù)比較的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論