假設(shè)檢驗基礎(chǔ)_第1頁
假設(shè)檢驗基礎(chǔ)_第2頁
假設(shè)檢驗基礎(chǔ)_第3頁
假設(shè)檢驗基礎(chǔ)_第4頁
假設(shè)檢驗基礎(chǔ)_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章第七章 假設(shè)檢驗基礎(chǔ)假設(shè)檢驗基礎(chǔ) 第一節(jié)第一節(jié) 假設(shè)檢驗的概念與原理假設(shè)檢驗的概念與原理l對所估計的總體首先提出一個假設(shè)對所估計的總體首先提出一個假設(shè),然后通過然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè),稱為假設(shè)稱為假設(shè)檢驗檢驗(hypothesis testing)。l為什么要進行假設(shè)檢驗?為什么要進行假設(shè)檢驗?l假設(shè)檢驗假設(shè)檢驗?zāi)軌蛱幚砟男﹩栴}?能夠處理哪些問題?l假設(shè)檢驗的假設(shè)檢驗的原理是什么?原理是什么?l假設(shè)檢驗的假設(shè)檢驗的基本步驟基本步驟有哪些?有哪些?l應(yīng)用假設(shè)檢驗應(yīng)用假設(shè)檢驗還要涉及哪些問題還要涉及哪些問題?一、假設(shè)檢驗的思維邏輯一、假設(shè)檢驗的思

2、維邏輯l實例:實例:欲探討男性成人肺炎患者的血紅蛋白同男性健康成人有無區(qū)別欲探討男性成人肺炎患者的血紅蛋白同男性健康成人有無區(qū)別,如如果能夠測量所有的男性成人肺炎患者和男性健康成人的血紅蛋白數(shù)值,果能夠測量所有的男性成人肺炎患者和男性健康成人的血紅蛋白數(shù)值,我們通過計算均數(shù)就可以進行大小的比較??墒俏覀兺ㄟ^計算均數(shù)就可以進行大小的比較??墒?男性成人肺炎患者和男男性成人肺炎患者和男性健康成人的群體是無限大的,其血紅蛋白值構(gòu)成的總體也是無限的。性健康成人的群體是無限大的,其血紅蛋白值構(gòu)成的總體也是無限的。l因此,若隨機抽取兩個樣本,各因此,若隨機抽取兩個樣本,各10例:例:l10例男性成人肺炎患

3、者的血紅蛋白例男性成人肺炎患者的血紅蛋白(g/dl)測量值:測量值:l11.9,10.9,10.1,10.2,9.8,9.9,10.3,9.3,9.8,8.9;l10例男性健康成人的血紅蛋白例男性健康成人的血紅蛋白(g/dl)測量值:測量值:l13.9,14.2,14.0,14.3,13.7,13.9,14.1,14.7,13.5,13.6。l算得算得10例男性成人例男性成人肺炎患者的血紅蛋白均數(shù)肺炎患者的血紅蛋白均數(shù)為為10.11(g/dl),l 10例男性例男性健康成人的血紅蛋白均數(shù)為健康成人的血紅蛋白均數(shù)為 13.99(g/dl), l差別的原因?差別的原因?l差別的原因可能有兩種:差別

4、的原因可能有兩種:l本質(zhì)上的差異本質(zhì)上的差異l抽樣誤差抽樣誤差l只要個體之間存在差異,抽樣誤差就不可避免。只要個體之間存在差異,抽樣誤差就不可避免。l欲想知道差別到底是本質(zhì)上的差異還是純粹的欲想知道差別到底是本質(zhì)上的差異還是純粹的抽樣誤差,需進行假設(shè)檢驗。抽樣誤差,需進行假設(shè)檢驗。 l借助抽樣誤差的分布規(guī)律:借助抽樣誤差的分布規(guī)律:l 均數(shù)的分布、均數(shù)的分布、t 分布、分布、z分布、分布、/2,t/2,ttP1接受無效假設(shè)拒絕H0拒絕H0tt假設(shè)檢驗的原理:圖7-1 假設(shè)檢驗原理示意圖l假設(shè)檢驗假設(shè)檢驗(hypothesis test)l也稱顯著性檢驗(也稱顯著性檢驗(significance

5、 test),采用的是),采用的是小小概率反證法的思想概率反證法的思想,即是,即是事先對樣本統(tǒng)計量的分布和事先對樣本統(tǒng)計量的分布和總體參數(shù)作出某種假設(shè),總體參數(shù)作出某種假設(shè),l然后判定樣本統(tǒng)計量在總體分布所處的位置和對應(yīng)的然后判定樣本統(tǒng)計量在總體分布所處的位置和對應(yīng)的概率值概率值,l如果樣本統(tǒng)計量(如)在總體分布中的位置遠離假定如果樣本統(tǒng)計量(如)在總體分布中的位置遠離假定的參數(shù),的參數(shù),相對應(yīng)的相對應(yīng)的P值也?。ㄈ缧∮谥狄残。ㄈ缧∮?.05)。)。l根據(jù)根據(jù)“小概率事件在一次試驗中一般不可能發(fā)生小概率事件在一次試驗中一般不可能發(fā)生”的的原理,原理,統(tǒng)計學(xué)有理由認(rèn)為樣本統(tǒng)計量不是來自事先假統(tǒng)計

6、學(xué)有理由認(rèn)為樣本統(tǒng)計量不是來自事先假定的總體。定的總體。 二、假設(shè)檢驗的基本步驟二、假設(shè)檢驗的基本步驟l 例例7-1 已知北方農(nóng)村兒童前囟門閉合月齡為已知北方農(nóng)村兒童前囟門閉合月齡為14.1月。某月。某研究人員從東北某縣抽取研究人員從東北某縣抽取36名兒童,得囟門閉合月齡均值名兒童,得囟門閉合月齡均值為為14.3月,標(biāo)準(zhǔn)差為月,標(biāo)準(zhǔn)差為5.08月。問該縣兒童前囟門閉合月齡月。問該縣兒童前囟門閉合月齡的均數(shù)是否大于一般兒童?的均數(shù)是否大于一般兒童? l1.選擇檢驗方法,建立檢驗假設(shè)并確定檢驗水準(zhǔn)選擇檢驗方法,建立檢驗假設(shè)并確定檢驗水準(zhǔn) l 根據(jù)研究目的、研究設(shè)計的類型和資料特點(變量種類、根據(jù)研

7、究目的、研究設(shè)計的類型和資料特點(變量種類、樣本大?。┑纫蛩剡x擇合適的檢驗方法。并且將需要推斷樣本大小)等因素選擇合適的檢驗方法。并且將需要推斷的問題表述為一對關(guān)于總體特征的假設(shè)。的問題表述為一對關(guān)于總體特征的假設(shè)。l原假設(shè)(原假設(shè)(null hypothesis),又稱無效假設(shè),記為),又稱無效假設(shè),記為H0;l對立假設(shè)對立假設(shè)(alternative hypothesis),又稱備擇假設(shè),記,又稱備擇假設(shè),記為為 H1。lH1的內(nèi)容直接反映了檢驗的內(nèi)容直接反映了檢驗單雙側(cè)單雙側(cè)。若。若H1中只中只是是 0 或或 14.1(月),意為(月),意為“該縣兒童前囟門該縣兒童前囟門閉合月齡的平均水

8、平高于一般兒童的平均水平閉合月齡的平均水平高于一般兒童的平均水平”。l檢驗水準(zhǔn)(檢驗水準(zhǔn)(size of a test),用希臘字母),用希臘字母表示。實表示。實踐中常取踐中常取0.05或或0.01等數(shù)值。它將小概率事件具體化,等數(shù)值。它將小概率事件具體化,即規(guī)定概率不超過即規(guī)定概率不超過就是小概率。就是小概率。 第二節(jié)第二節(jié) t檢驗檢驗l一、單樣本資料的一、單樣本資料的t檢驗檢驗l推斷該樣本來自的總體均數(shù)推斷該樣本來自的總體均數(shù)與已知的某一總與已知的某一總體均數(shù)體均數(shù)0(常為理論值或標(biāo)準(zhǔn)值)(常為理論值或標(biāo)準(zhǔn)值) 有無差別。有無差別。 nsXsXtx00(7-1)l例例7-1的假設(shè)檢驗的假設(shè)

9、檢驗l對立假設(shè)卻可以有所選擇。例對立假設(shè)卻可以有所選擇。例7-1是單側(cè)檢驗,對立假是單側(cè)檢驗,對立假設(shè)設(shè)H1是單向不等式(是單向不等式(0)。雙側(cè)檢驗時的檢驗假設(shè))。雙側(cè)檢驗時的檢驗假設(shè)形式為形式為lH0:總體均數(shù)為總體均數(shù)為0,即,即=0lH1:0.l其對立假設(shè)其對立假設(shè)H1包括包括0和和0.450.45l =0.05 =0.05l本例n=180,p=117/180=0.65l查u界值表(t界值表中V為的一行)得單側(cè) 。按 =0.05水準(zhǔn),拒絕H0,接受H1,即新的治療方法比常規(guī)療法的效果好。0005. 0P394. 5180)45. 01 (45. 045. 065. 0ul二、兩組獨立資

10、料的二、兩組獨立資料的u u檢驗檢驗l兩樣本率的比較兩樣本率的比較,目的在于對相應(yīng)的兩總體率進目的在于對相應(yīng)的兩總體率進行統(tǒng)計推斷。行統(tǒng)計推斷。l設(shè)兩樣本率分別為設(shè)兩樣本率分別為p p1 1和和p p2 2,當(dāng),當(dāng)n n1 1與與n n2 2均較大,且均較大,且p p1 1、1- 1-p p1 1及及p p2 2、1- 1-p p2 2均不太小,如均不太小,如n n1 1p p1 1、n n1 1(1-(1-p p1 1) )及及n n2 2p p2 2、n n2 2(1-(1-p p2 2) )均大于均大于5 5時,可利用時,可利用樣本率的分布近似正樣本率的分布近似正態(tài)分布,以及獨立的兩個正

11、態(tài)變量之差也服從正態(tài)分布,以及獨立的兩個正態(tài)變量之差也服從正態(tài)分布的性質(zhì),態(tài)分布的性質(zhì),采用正態(tài)采用正態(tài)近似法近似法對兩總體率作統(tǒng)對兩總體率作統(tǒng)計推斷。計推斷。l檢驗統(tǒng)計量檢驗統(tǒng)計量u u的計算公式為:的計算公式為: 21212121)11)(1 (nnXXpcnnppppuccl當(dāng)樣本含量不能滿足要求時進行連續(xù)性矯正當(dāng)樣本含量不能滿足要求時進行連續(xù)性矯正)11)(1 ()11(5 . 0212121nnppnnppuccl例例7-8 7-8 為研究某職業(yè)人群頸椎病發(fā)病的性別差異,為研究某職業(yè)人群頸椎病發(fā)病的性別差異,今隨機抽查了該職業(yè)人群男性今隨機抽查了該職業(yè)人群男性120120人和女性人和

12、女性110110人,人,發(fā)現(xiàn)男性中有發(fā)現(xiàn)男性中有3636人患有頸椎病,女性中有人患有頸椎病,女性中有2222人患人患有頸椎病。試作統(tǒng)計推斷。有頸椎病。試作統(tǒng)計推斷。l記該職業(yè)人群頸椎病的患病率男性為記該職業(yè)人群頸椎病的患病率男性為1 1,女,女性為性為2 2,其檢驗假設(shè)為,其檢驗假設(shè)為lH H0 0:1 1=2 2lH H1 1:1 12 2l =0.05 =0.05本例n1=120,X1=36,p1=X1/n1=36/120=0.30; n2=110,X2=22,p2=X2/n2=22/110=0.20 查查u u界值表得界值表得0.050.05P P0.100.10。按。按 =0.05=0

13、.05水準(zhǔn),不拒絕水準(zhǔn),不拒絕H H0 0,即尚不,即尚不能認(rèn)為該能認(rèn)為該職業(yè)人群頸椎病的發(fā)病有性別差異。職業(yè)人群頸椎病的發(fā)病有性別差異。 745.1)11011201)(25.01 (25.020.030.01101202236upc第四節(jié)第四節(jié) Poisson分布資料的分布資料的Z檢驗檢驗(二)兩組獨立樣本資料的(二)兩組獨立樣本資料的Z檢驗檢驗第五節(jié)第五節(jié) 假設(shè)檢驗與區(qū)間估計的關(guān)系假設(shè)檢驗與區(qū)間估計的關(guān)系l一、置信區(qū)間具有假設(shè)檢驗的主要功能一、置信區(qū)間具有假設(shè)檢驗的主要功能l 配對資料差值配對資料差值 d雙側(cè)雙側(cè)95%置信區(qū)間置信區(qū)間l 兩獨立樣本資料總體均數(shù)差值(兩獨立樣本資料總體均數(shù)

14、差值( 1- 2)的雙側(cè)()的雙側(cè)(1- )置信區(qū)間:)置信區(qū)間:l nStdd, 2/)11()()(212, 2/21, 2/2121nnStXXStXXcXXl利用例利用例7-2資料,估計兒童血紅蛋白在健康教育干預(yù)資料,估計兒童血紅蛋白在健康教育干預(yù)措施措施前后前后差值的總體均數(shù)的可信區(qū)間為:差值的總體均數(shù)的可信區(qū)間為:l 利用例利用例7-4計算計算兩個總體均數(shù)間差值兩個總體均數(shù)間差值的置信區(qū)間為:的置信區(qū)間為:)%77.17,56. 3(1218.11201. 267.1011,2/05. 0nStdd)/(5708.7,1627.3)151151(693488.8048.2)127.

15、4493.9()11()(212,2/21mlngnnStXXc2.置信區(qū)間可提供假設(shè)檢驗沒有提供的信息置信區(qū)間可提供假設(shè)檢驗沒有提供的信息 圖圖7-2 置信區(qū)間可以提供的信息置信區(qū)間可以提供的信息3.假設(shè)檢驗提供,而置信區(qū)間不提供的信息假設(shè)檢驗提供,而置信區(qū)間不提供的信息l在統(tǒng)計推斷結(jié)論為在統(tǒng)計推斷結(jié)論為拒絕拒絕H0時,時,假設(shè)檢驗可以報告確切的假設(shè)檢驗可以報告確切的P值,值,從而從而較為較為精確地說明檢驗結(jié)論的概率保證精確地說明檢驗結(jié)論的概率保證。置信區(qū)間只能在預(yù)先確定。置信區(qū)間只能在預(yù)先確定的置信度的置信度100(1-)%水平上進行推斷。水平上進行推斷。l在在不能拒絕不能拒絕H0的場合,

16、的場合,假設(shè)檢驗可以對檢驗的功效做出估計假設(shè)檢驗可以對檢驗的功效做出估計,從,從而可以而可以評價是否在識別差異能力較強的情形下不拒絕評價是否在識別差異能力較強的情形下不拒絕H0的。而置的。而置信區(qū)間并不提供這方面的信息。信區(qū)間并不提供這方面的信息。l根據(jù)以上的討論,根據(jù)以上的討論,置信區(qū)間與相應(yīng)的假設(shè)檢驗既能提供相互等價置信區(qū)間與相應(yīng)的假設(shè)檢驗既能提供相互等價的信息,又有各自不同的功能的信息,又有各自不同的功能。把置信區(qū)間與假設(shè)檢驗結(jié)合起來,把置信區(qū)間與假設(shè)檢驗結(jié)合起來,可以提供更為全面、完整的信息??梢蕴峁└鼮槿妗⑼暾男畔?。因此國際上規(guī)定,在報告假設(shè)因此國際上規(guī)定,在報告假設(shè)檢驗結(jié)論的同

17、時,必須報告相應(yīng)區(qū)間估計的結(jié)果。檢驗結(jié)論的同時,必須報告相應(yīng)區(qū)間估計的結(jié)果。 第六節(jié)第六節(jié) 假設(shè)檢驗的功效假設(shè)檢驗的功效l一、假設(shè)檢驗的兩類錯誤一、假設(shè)檢驗的兩類錯誤 H1: 0為正偏態(tài),為正偏態(tài), 100為尖峭峰,為尖峭峰, 2 200.500.50,偏度,偏度P P0.500.50。按。按 =0.10=0.10水準(zhǔn),水準(zhǔn),不拒絕不拒絕H H0 0,無統(tǒng)計學(xué)意義。還不能認(rèn)為這些樣,無統(tǒng)計學(xué)意義。還不能認(rèn)為這些樣本均數(shù)的總體不服從正態(tài)分布。本均數(shù)的總體不服從正態(tài)分布。 第八節(jié)第八節(jié) 中英文結(jié)果報告中英文結(jié)果報告l某職業(yè)病防治所為了檢驗不同工種氟作業(yè)工人的尿氟含量有無差別。某職業(yè)病防治所為了檢驗

18、不同工種氟作業(yè)工人的尿氟含量有無差別。隨機測定了某工廠不同工種兩個車間各隨機測定了某工廠不同工種兩個車間各10名氟作業(yè)工人的尿氟含量名氟作業(yè)工人的尿氟含量(mol/L),均數(shù)均數(shù)標(biāo)準(zhǔn)差分別為:標(biāo)準(zhǔn)差分別為:127.120023.4467(mol/L)、)、91.107021.3553(mol/L)。)。lAn occupational disease dispensary randomly selected 10 workers who put in work on the fluoride in each workshop and measured the content of their

19、urinary fluoride in order to distinguish the differences between different types of work. The (mean standard deviation)s of the two groups were:(127.120023.4467) umol/L、(91.107021.3553) umol/L.l由兩組獨立設(shè)計樣本資料的由兩組獨立設(shè)計樣本資料的t檢驗比較,得檢驗比較,得t=-3.591, 0.02P0.005,差異有統(tǒng)計學(xué)意義差異有統(tǒng)計學(xué)意義(P0.05)。可以認(rèn)為兩工種氟作業(yè)工人的)。可以認(rèn)為兩工種氟作

20、業(yè)工人的尿氟含量尿氟含量(mol/L)有差別。有差別。 lThe results of two independent-samples t test resulted in t=-3.591, 0.02p0.05; the differences in the content of urinary fluoride between the two groups were statistically significant (p0.05). l1. 假設(shè)檢驗是依據(jù)樣本提供的假設(shè)檢驗是依據(jù)樣本提供的有限信息對總有限信息對總體作推斷的統(tǒng)計學(xué)方法,體作推斷的統(tǒng)計學(xué)方法,是在對研究總體的是在對研究總體的兩種對立的判斷之間做選擇的決策程序。兩種對立的判斷之間做選擇的決策程序。l2. 假設(shè)檢驗的過程是:假設(shè)檢驗的過程是:建立檢驗假設(shè)建立檢驗假設(shè)計算計算統(tǒng)計量統(tǒng)計量確定確定P值并與給定的值并與給定的比較比較作出推作出推斷結(jié)論。斷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論