第七章-假設檢驗.ppt_第1頁
第七章-假設檢驗.ppt_第2頁
第七章-假設檢驗.ppt_第3頁
第七章-假設檢驗.ppt_第4頁
第七章-假設檢驗.ppt_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第七章假設檢驗,宋沈超,假設檢驗在統(tǒng)計方法中的地位,參數(shù)估計和假設檢驗,參數(shù)估計和假設檢驗是統(tǒng)計推斷的兩個組成部分,都是利用樣本對總體進行某種推斷,但推斷的角度不同。 參數(shù)估計討論的是用樣本統(tǒng)計量估計總體參數(shù)的方法。 假設檢驗討論的是用樣本信息去檢驗對總體參數(shù)的某種假設是否成立的程序和方法。,教學內(nèi)容,第一節(jié) 假設檢驗基本思想 第二節(jié) 假設檢驗基本步驟 第三節(jié) I型錯誤與II型錯誤 第四節(jié) 單側(cè)檢驗與雙側(cè)檢驗 第五節(jié) 假設檢驗需要注意的問題 第六節(jié) 假設檢驗與區(qū)間估計的聯(lián)系,教學目標,掌握:假設檢驗的基本思想和基本步驟,掌握并理解I型錯誤與II型錯誤、檢驗效能的概念 熟悉:假設檢驗需要注意的問

2、題,單側(cè)檢驗與雙側(cè)檢驗的概念和正確選擇;理解假設檢驗與區(qū)間估計的聯(lián)系。,第一節(jié) 假設檢驗基本思想,一、 假設檢驗問題的提出 例1 已知一個暗箱中有100個白色與黑色球,不知各有多少個。現(xiàn)有人猜測其中有95個白色球,是否能相信他的猜測呢?,他相當于提出假設: p=P(A)=0.05,A=任取一球是黑球.,可有兩種解釋:,現(xiàn)隨機從中抽出一個球, 發(fā)現(xiàn)是黑球, 怎樣 解釋這一事實?,1)他的猜測是正確的,恰抽得黑球是隨機性 所致;,2)他的猜測錯了.,應接受哪一種呢?,根據(jù)小概率事件原理, 事件A(黑球)的發(fā)生不能不使人們懷疑他的猜測,更傾向于認為箱中白球個數(shù)不是95個.,例2 某醫(yī)院用新藥與常規(guī)藥

3、物治療嬰幼兒貧血,將20名貧血患兒隨機等分兩組,分別接受兩種藥物治療,測得血紅蛋白增加量(g/L)見表7-1。問新藥與常規(guī)藥的療效有無差別? 表7-1 兩種藥物治療嬰幼兒貧血結(jié)果 治療藥物 血紅蛋白增加量(g/L) 新藥組24 36 25 14 26 34 23 20 15 19 常規(guī)藥組14 18 20 15 22 24 21 25 27 23,由于事先對兩種藥品療效(總體)情況一無所知,目前所關心的問題是如何根據(jù)兩組樣本患者治療后血紅蛋白增加量推斷兩種藥品的療效有無差異。可假設兩組患者(總體)治療后血紅蛋白平均增加量無差異,即假設 然后,利用兩組樣本患者治療后血紅蛋白平均增加量來檢驗這一假

4、設是否正確。,例3:根據(jù)1989年的統(tǒng)計資料,某地女性新生兒的平均體重為3190克。1990年從該地女性新生兒中隨機抽取30人,測得其平均體重為3210克。從樣本數(shù)據(jù)看,1990年女新生兒體重比1989年略高。究竟是否存在顯著差異? 差異產(chǎn)生的兩種可能(假設): 隨機誤差導致的差異: 生活水平提高使孕婦營養(yǎng)狀況改善導致新生兒體重實質(zhì)性增加: 利用樣本信息檢驗假設能否成立的過程稱為假設檢驗。,上述案例的共同特點是:樣本統(tǒng)計量與總體參數(shù)之間,或不同組樣本統(tǒng)計量之間出現(xiàn)差異,這就提出了需要解決的問題:差異產(chǎn)生的原因(假設)?由兩種誤差導致: 由隨機誤差導致樣本來自同一總體, 非本質(zhì)差異 不是隨機誤差

5、導致樣本來自另一總體, 本質(zhì)差異 用樣本信息檢驗(推斷)上述假設哪個正確?,統(tǒng)計假設,假設檢驗,如何正確區(qū)分這兩種誤差, 是解決問題的關鍵。,假設檢驗就是處理這一類 問題的一種科學方法 它所根據(jù)的原理是小概率原理。,二、小概率原理,假設檢驗所依據(jù)的基本原理是小概率原理。 什么是小概率? 概率是01之間的一個數(shù),因此小概率就是接近0的一個數(shù),一般指概率在0.05以下的事件。 著名的英國統(tǒng)計家Ronald Fisher 把20分之1作為標準,也就是0.05,從此0.05或比0.05小的概率都被認為是小概率。Fisher沒有任何深奧的理由解釋他為什么選擇0.05,只是說他忽然想起來的,什么是小概率原

6、理?,小概率原理發(fā)生概率很小的隨機事件(小概率事件)在一次實驗中幾乎是不可能發(fā)生的。在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設。 根據(jù)這一原理,可以先假設總體參數(shù)的某項取值為真,也就是假設其發(fā)生的可能性很大,然后抽取一個樣本進行觀察,如果樣本信息顯示出現(xiàn)了與事先假設相反的結(jié)果且與原假設差別很大,則說明原來假定的小概率事件在一次實驗中發(fā)生了,這是一個違背小概率原理的不合理現(xiàn)象,因此有理由懷疑和拒絕原假設;否則不能拒絕原假設。 檢驗中使用的小概率由研究者在檢驗前事先確定。,小概率原理舉例:,某工廠質(zhì)檢部門規(guī)定該廠產(chǎn)品次品率不超過4方能出廠。今從1000件產(chǎn)品中抽出10件,經(jīng)檢驗有4件次

7、品,問這批產(chǎn)品是否能出廠? 如果假設這批產(chǎn)品的次品率P4,則可計算事件“抽10件產(chǎn)品有4件次品”的出現(xiàn)概率為: 可見,概率是相當小的,1萬次實驗中可能出現(xiàn)4次,然而概率如此小的事件,在一次實驗中居然發(fā)生了,這是不合理的,而不合理的根源在于假設這批產(chǎn)品次品率P4 ,因而認為假設次品率P4是不能成立的,故按質(zhì)檢部門的規(guī)定,這批產(chǎn)品不能出廠。,又例 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L? 如果從事鉛作業(yè)不會影響工人的血紅蛋白含量,則說明樣本均數(shù)130.83g/L

8、與總體均數(shù)140g/L的差異是由抽樣誤差引起的,即=0=140g/L,鉛作業(yè)男性工人的平均血紅蛋白含量與正常成年男性的相等。,據(jù)此,可提出原假設:H0: =0=140g/L 若原假設成立,事件 應該是一個小概率事件(發(fā)生的概率為)?,F(xiàn)在 |2.138| t0.05/2,35=2.030 P 0.05,這說明小概率事件在一次試驗中發(fā)生了,而這一事件的概率僅為0.05,即平均每20次試驗才出現(xiàn)一次現(xiàn)在我們只作了一次試驗,居然就發(fā)生了,因此我們有理由懷疑假設 “鉛作業(yè)男性工人的平均血紅蛋白含量與正常成年男性的相等”的原假設,即可認為從事鉛作業(yè)會影響工人的血紅蛋白含量。,三、假設檢驗的基本思想,假設樣

9、本是從原總體中抽取的,在此假設下構(gòu)造一個小概率事件。若假設成立,則小概率事件一般是不會發(fā)生的。但在一次抽樣中,如果小概率事件居然就發(fā)生了,則有理由懷疑假設的正確性,此時拒絕接受這個假設;而一次抽樣中小概率事件沒有發(fā)生,則沒有理由懷疑假設的正確性,于是接受這個假設,認為樣本仍來源于原總體。,假設檢驗的基本思想,. 因此我們拒絕假設 1=0= 50,樣本均值,m0,= 50,抽樣分布,H0,假設檢驗的過程,通過上述實例可以看出,假設檢驗的目的是推斷樣本統(tǒng)計量之差是由于總體參數(shù)存在差異造成的,抑或是由于抽樣誤差造成的。假設檢驗的基本思想是在總體參數(shù)相等這一假設成立的前提下,計算出現(xiàn)等于及大于(或等于

10、及小于)現(xiàn)有樣本統(tǒng)計量的可能性(P值)。如果P值很小,小于等于事先規(guī)定的一個界值(例如5%),結(jié)論就是拒絕假設“總體參數(shù)相等”,認為總體參數(shù)之間存在差異。如果P值大于事先規(guī)定的界值,就不能拒絕這個假設,尚不能認為總體參數(shù)之間存在差異。,假設檢驗的兩個特點:,第一,假設檢驗采用邏輯上的反證法,即為了檢驗一個假設是否成立,首先假設它是真的,然后對樣本進行觀察,如果發(fā)現(xiàn)出現(xiàn)了不合理現(xiàn)象,則可以認為假設是不合理的,拒絕假設。否則可以認為假設是合理的,接受假設。,第二,假設檢驗采用的反證法帶有概率性質(zhì)。所謂假設的不合理不是絕對的,而是基于實踐中廣泛采用的小概率事件幾乎不可能發(fā)生的原則。至于事件的概率小到

11、什么程度才算是小概率事件,并沒有統(tǒng)一的界定標準,而是必須根據(jù)具體問題而定。 如果一旦判斷失誤,錯誤地拒絕原假設會造成巨大損失,那么拒絕原假設的概率就應定的小一些;如果一旦判斷失誤,錯誤地接受原假設會造成巨大損失,那么拒絕原假設的概率就應定的大一些。,小概率通常用表示,又稱為檢驗的顯著性水平。通常取0.05或0.01,即把概率不超過0.05或0.01的事件當作小概率事件。,第二節(jié) 假設檢驗基本步驟,提出(建立)檢驗假設 確定適當?shù)臋z驗統(tǒng)計量 規(guī)定顯著性水平 計算檢驗統(tǒng)計量的值 確定P值,作出統(tǒng)計推斷(決策),一、提出(建立)檢驗假設, 檢驗假設分為原假設與備擇假設,是根據(jù)問題的需要提出的一對對立

12、的假設。 什么是原假設?(null hypothesis) 是待檢驗的假設,又稱“零假設”、“無效假設”、“無差異假設”。 是研究者想收集證據(jù)予以反對的假設 3.總是有等號 , 或 4.表示為 H0 H0: 某一數(shù)值 指定為 = 號,即 或 例如, H0: 3190(克), 什么是備擇假設?(alternative hypothesis) 與原假設H0對立的假設,也稱“研究假設” 研究者想收集證據(jù)予以支持的假設,總是有不等號: , 或 ;備擇假設的方向與想要證明其正確性的方向一致 表示為 H1 H1: 某一數(shù)值,或 某一數(shù)值 例如, H0:=3910(克),H1: 3910(克) H0:=0,

13、 H1: 0; H0:=0, H1: =1; H0:0, H1: 0;,一、提出(建立)檢驗假設,原假設和備擇假設的確定,(1)對于總體均值是否等于某一確定值的原假設可以表示為: H0: (如H0: 3190克) 其對應的備擇假設則表示為: H1: (如H1: 3190克) (2)對于總體均值X是否大于某一確定值X0 的原假設可以表示為:H0:XX0 (如H0:X2000克) 其對應的備擇假設則表示為: H1:XX0 (如H1: X 2000克) (3)對于總體均值X是否小于某一確定值X0的原假設可以表示為:H0:XX0 (如H0:X 5) 其對應的備擇假設則表示為: H1:XX0 (如H1:

14、X5) 注意:原假設總是有等號: 或 或。,原假設和備擇假設是一個完備事件組,而且相互對立 在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立 先確定備擇假設,再確定原假設 等號“=”總是放在原假設上 因研究目的不同,對同一問題可能提出不同的假設(也可能得出不同的結(jié)論),提出假設 (結(jié)論與建議), 什么檢驗統(tǒng)計量(test statistic) ? 1.根據(jù)樣本觀測結(jié)果計算得到的,并據(jù)以對原假設和備擇假設作出假設檢驗統(tǒng)計推斷的某個樣本統(tǒng)計量,如Z值、t值、F值、2值等。 2.選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知 檢驗統(tǒng)計量的基本形式為,

15、二、確定適當?shù)臋z驗統(tǒng)計量(選擇合適的檢驗方法),三、規(guī)定顯著性水平(significant level), 什么是顯著性水平? 1.是一個概率值(小概率事件發(fā)生的概率值) 2.原假設為真時,拒絕原假設的概率 被稱為抽樣分布的拒絕域 3.表示為 (alpha) 常用的 值有0.01, 0.05, 0.10 4.由研究者事先確定,假設檢驗中的拒絕域和接受域,什么是拒絕域?(rejection region) 能夠拒絕原假設的檢驗統(tǒng)計量的所有可能取值范圍 區(qū)域大小由顯著性水平?jīng)Q定 什么是臨界值?(critical value) 根據(jù)給定的顯著性水平確定的拒絕域的邊界值。臨界值將統(tǒng)計量的所有可能取值區(qū)

16、間分為兩個互不相交的部分,即原假設的拒絕域和接受域。 常用的 值有0.01, 0.05, 0.10 查表得出相應的臨界值z或z/2, t或t/2 對于正態(tài)總體,總體均值的假設檢驗可有如下圖示,正態(tài)總體,總體均值假設檢驗圖示:(1) 雙側(cè)檢驗,設H0:XX0 , H1:XX0,有兩個臨界值,兩個拒絕域,每個拒絕域的面積為/2。也稱雙尾檢驗。,雙側(cè)檢驗示意圖,X0,雙側(cè)檢驗示意圖(顯著性水平與拒絕域 ),雙側(cè)檢驗示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計量,雙側(cè)檢驗示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計量,雙側(cè)檢驗示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計量,(2)單側(cè)檢驗有

17、一個臨界值,一個拒絕域,拒絕域的面積為。分為左側(cè)檢驗和右側(cè)檢驗兩種情況。 單側(cè)檢驗示意圖(顯著性水平與拒絕域),左側(cè)檢驗,設H0:XX0 ,H1:XX0;臨界值和拒絕域均在左側(cè)。也稱下限檢驗。,X0,左側(cè)檢驗示意圖(顯著性水平與拒絕域 ),左側(cè)檢驗示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計量,右側(cè)檢驗,設H0 :XX0 ,H1:XX0; 臨界值和拒絕域均在右側(cè)。也稱上限檢驗。,X0,右側(cè)檢驗示意圖(顯著性水平與拒絕域 ),右側(cè)檢驗示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計量,四、計算檢驗統(tǒng)計量,根據(jù)選定的適宜檢驗方法,計算相應的檢驗統(tǒng)計量,如Z值、t值等。,五、確定P值,作出統(tǒng)計推

18、斷(決策),決策規(guī)則 給定顯著性水平,查表得出相應的臨界值z或z/2, t 或 t/2 將檢驗統(tǒng)計量的值與 水平的臨界值進行比較 作出統(tǒng)計推斷(決策) 雙側(cè)檢驗:|統(tǒng)計量| 臨界值,拒絕H0 左側(cè)檢驗: 統(tǒng)計量 臨界值,拒絕H0 右側(cè)檢驗: 統(tǒng)計量 臨界值,拒絕H0,利用P值進行決策,什么是P 值?(P-value),是一個概率值 如果原假設為真,P-值是抽樣分布中出現(xiàn)大于或小于樣本統(tǒng)計量的概率 左側(cè)檢驗時,P-值為曲線上方小于等于 檢驗統(tǒng)計量部分的面積 右側(cè)檢驗時,P-值為曲線上方大于等于 檢驗統(tǒng)計量部分的面積 被稱為觀察到的(或?qū)崪y的)顯著性水平 H0 能被拒絕的最小值,雙側(cè)檢驗的P 值,

19、左側(cè)檢驗的P 值,右側(cè)檢驗的P 值,利用 P 值進行檢驗(決策準則),單側(cè)檢驗 若p-值 ,不拒絕 H0 若p-值 /2, 不拒絕 H0 若p /2 -值 /2, 拒絕 H0,假設檢驗結(jié)論的表述,假設檢驗的目的就在于試圖找到拒絕原假設的理由,而不在于證明什么是正確的 拒絕原假設時結(jié)論是清楚的 例如,H0:=3190,拒絕H0時,我們可以說3190 當不拒絕原假設時 并非肯定原假設 含義是 “不否定原假設” 或 “保留原假設” 例如,當不拒絕H0:=3190,我們并未說它就是3190,但也未說它不是3190。我們只能說樣本提供的證據(jù)還不足以推翻原假設,假設檢驗結(jié)論的表述,報告結(jié)果時,首先須給出檢

20、驗統(tǒng)計量,如U值、t值、自由度、P值,然后報告是否拒絕H0,最后結(jié)合問題的具體背景給出專業(yè)結(jié)論。 拒絕原假設時,表述為“差異有統(tǒng)計學意義”,簡稱“有統(tǒng)計學意義”。 不拒絕H0時,表述為“差異無統(tǒng)計學意義”,簡稱“無統(tǒng)計學意義”,第三節(jié) I型錯誤與II型錯誤(決策風險),根據(jù)假設檢驗做出判斷無非下述四種情況: 1、原假設真實, 并接受原假設,判斷正確; 2、原假設不真實,且拒絕原假設,判斷正確; 3、原假設真實, 但拒絕原假設,判斷錯誤; 4、原假設不真實,卻接受原假設,判斷錯誤。,假設檢驗的兩類錯誤,假設檢驗是依據(jù)樣本提供的信息進行判斷,有犯錯誤的可能。所犯錯誤有兩種類型: 第一類錯誤是原假設

21、H0為真時,檢驗結(jié)果把它當成不真而拒絕了。犯這種錯誤的概率用表示,也稱作錯誤(error)或棄真錯誤。 第二類錯誤是原假設H0不為真時,檢驗結(jié)果把它當成真而接受了。犯這種錯誤的概率用表示,也稱作錯誤(error)或取偽錯誤。,假設檢驗的兩類錯誤正確決策和犯錯誤的概率可以歸納為下表:,假設檢驗中各種可能結(jié)果的概率,假設檢驗兩類錯誤關系的圖示以單側(cè)上限檢驗為例,設H0 :XX0 ,H1:XX0,從上圖可以看出,如果臨界值沿水平方向右移,將變小而變大,即若減小錯誤,就會增大犯錯誤的機會;如果臨界值沿水平方向左移,將變大而變小,即若減小錯誤,也會增大犯錯誤的機會。,圖(a) XX0 H0為真 圖(b)

22、 XX1X0 H0為偽, 錯誤和 錯誤的關系,在樣本容量n一定的情況下,假設檢驗不能同時做到犯和兩類錯誤的概率都很小。若減小錯誤,就會增大犯錯誤的機會;若減小錯誤,也會增大犯錯誤的機會。要使和同時變小只有增大樣本容量。但樣本容量增加要受人力、經(jīng)費、時間等很多因素的限制,無限制增加樣本容量就會使抽樣調(diào)查失去意義。因此假設檢驗需要慎重考慮對兩類錯誤進行控制的問題。,兩類錯誤的控制準則,假設檢驗中人們普遍執(zhí)行同一準則:首先控制棄真錯誤(錯誤)。假設檢驗的基本法則以為顯著性水平就體現(xiàn)了這一原則。 兩個理由: 統(tǒng)計推斷中大家都遵循統(tǒng)一的準則,討論問題會比較方便。 更重要的是: 原假設常常是明確的,而備擇

23、假設往往是模糊的。如H0:XX0很清楚, 而H1:XX0則不太清楚,是XX0還是XX0 ?大多少小多少都不清楚。對含義清晰的數(shù)量標準進行檢驗更容易被接受。 因此,第一類錯誤成為控制兩類錯誤的重點。,第四節(jié) 單側(cè)檢驗與雙側(cè)檢驗,根據(jù)假設的形式不同,假設檢驗可以分為雙側(cè)假設檢驗(two-tailed test) 和單側(cè)假設檢驗(one-tailed test)。 若原假設是總體參數(shù)等于某一數(shù)值,如H0: X X0 ,即備擇假設H1: X X 0,那么只要X X 0和X X 0 二者中有一個成立,就可以否定原假設。這種假設檢驗稱為雙側(cè)檢驗。,例如,某研究試圖了解甲、乙兩地7歲男童身高是否有差異,該研

24、究只想證明(檢驗)這種差異是否存在,不在乎哪個地區(qū)7歲男童身高更高 建立的原假設與備擇假設應為 H0: 1 = 2 H1: 1 2,雙側(cè)檢驗示意圖(顯著性水平與拒絕域 ),若原假設是總體參數(shù)大于等于或小于等于某一數(shù)值,如H0: X X 0 (即H1:XX0);或H0 :XX0 (即H1:XX0),那么對于前者當XX0時,對于后者當XX0 時,可以否定原假設。這種假設檢驗稱為單側(cè)檢驗??梢苑譃樽髠?cè)檢驗和右側(cè)檢驗。 將研究者想收集證據(jù)予以支持的假設作為備擇假設H1 將研究者想收集證據(jù)證明其不正確的假設作為原假設H0 先確立備擇假設H1,例:研究表明,采用新療法后,將會使某種癌癥患者的期望壽命延長1

25、0年以上。檢驗這一結(jié)論是否成立 研究者總是想證明自己的研究結(jié)論(壽命延長)是正確的 備擇假設的方向為“”(壽命延長) 建立的原假設與備擇假設應為 H0: 10 H1: 10,單側(cè)檢驗有一個臨界值,一個拒絕域,拒絕域的面積為。分為左側(cè)檢驗和右側(cè)檢驗兩種情況。 左側(cè)檢驗示意圖(顯著性水平與拒絕域),右側(cè)檢驗示意圖(顯著性水平與拒絕域 ),雙側(cè)檢驗與單側(cè)檢驗 (假設的形式),第五節(jié) 假設檢驗需要注意的問題,1.要有嚴密的研究設計 組間應均衡,具有可比性。除對比的主要因素(如臨床試驗用新藥和對照藥)外,其它可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應相同或相近。,配對設計計量資料:

26、配對t檢驗。 完全隨機設計兩樣本計量資料: 小樣本(任一ni60)且方差齊: 兩樣本t檢驗 方差不齊: 近似t檢驗 大樣本(所有ni60): u檢驗。,2.不同資料應選用不同檢驗方法,3.正確理解“significance”一詞的含義 過去稱差別有或無“顯著性”,易造成兩樣本統(tǒng)計量之間比較相差很大的誤解。 現(xiàn)在稱差別有或無“統(tǒng)計學意義”,相應推斷為:可以認為或還不能認為兩個或多個總體參數(shù)有差別。,4.結(jié)論不能絕對化 因統(tǒng)計結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。 在報告結(jié)論時,最好列出檢驗統(tǒng)計量的值,盡量寫出具體P值,而不簡單寫成P0.05,以便讀者與同類研究進行比較或進

27、行循證醫(yī)學時采用Meta分析。,P ,拒絕H0,不能認為H0肯定不成立,因為雖然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率雖小,但仍有可能出現(xiàn); 同理,P ,不拒絕H0,更不能認為H0肯定成立。由此可見,假設檢驗的結(jié)論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生錯誤,即第一類錯誤或第二類錯誤,5.統(tǒng)計“有意義”與醫(yī)學“有意義” 統(tǒng)計“有意義”對應統(tǒng)計結(jié)論,醫(yī)學“有意義”對應專業(yè)結(jié)論。 統(tǒng)計結(jié)論有意義,專業(yè)結(jié)論無意義,最終結(jié)論沒有意義,樣本含量過大或設計存在問題。 統(tǒng)計結(jié)論無意義,專業(yè)結(jié)論有意義,檢查設計是否合理、樣本含量是否足夠。,第六節(jié) 假設檢驗與區(qū)間估計的聯(lián)系,參數(shù)估計與假

28、設檢驗都是統(tǒng)計推斷的重要內(nèi)容。參數(shù)估計是根據(jù)樣本統(tǒng)計量估計總體參數(shù)的真值;假設檢驗是根據(jù)樣本統(tǒng)計量來檢驗對總體參數(shù)的檢驗假設是否成立。,一、區(qū)間估計與假設檢驗的主要區(qū)別 1.區(qū)間估計通常求得的是以樣本估計值為中心的雙側(cè)置信區(qū)間,而假設檢驗以假設總體參數(shù)值為基準,不僅有雙側(cè)檢驗也有單側(cè)檢驗; 2.區(qū)間估計立足于大概率,通常以較大的把握程度(置信水平)1-去保證總體參數(shù)的置信區(qū)間。而假設檢驗立足于小概率,通常是給定很小的顯著性水平去檢驗對總體參數(shù)的先驗假設是否成立。,二、區(qū)間估計與假設檢驗的聯(lián)系,1.區(qū)間估計與假設檢驗都是根據(jù)樣本信息對總體參數(shù)進行推斷,都是以抽樣分布為理論依據(jù),都是建立在概率基礎

29、上的推斷,推斷結(jié)果都有一定的可信程度或風險。 2.對同一問題的參數(shù)進行推斷,二者使用同一樣本、同一統(tǒng)計量、同一分布,因而二者可以相互轉(zhuǎn)換。區(qū)間估計問題可以轉(zhuǎn)換成假設問題,假設問題也可以轉(zhuǎn)換成區(qū)間估計問題。區(qū)間估計中的置信區(qū)間對應于假設檢驗中的接受區(qū)域,置信區(qū)間以外的區(qū)域就是假設檢驗中的拒絕域。因此,利用置信區(qū)間可以進行假設檢驗。,練習,1、兩樣本比較時,分別取以下檢驗水準,哪一個的第二類錯誤最小 A.=0.05 B.=0.01 C.=0.10 D.=0.20 E.=0.02 2、在假設檢驗中,P值和 的關系為 A.P值越大, 值就越大 B.P值越大, 值就越小 C. P值和 值均可由研究者事先

30、設定 D. P值和 值都不可以由研究者事先設定 E. P值的大小與 值的大小無關,3、假設檢驗中的第二類錯誤是指 A.拒絕了實際上成立的H0 B.不拒絕實際上成立的H0 C.拒絕了實際上成立的H1 D.不拒絕實際上不成立的H0 E.拒絕時所犯的錯誤 4、統(tǒng)計推斷的內(nèi)容是 A用樣本指標推斷總體指標 B檢驗統(tǒng)計上的“假設”CA、B均不是 DA、B均是,是非題,1進行兩均數(shù)差別的假設檢驗時,當P0.05時,則拒絕H0;當P0.05時,則接受H0,認為兩總體均數(shù)無差別。,答案:錯誤。當P 0.05,拒絕H0時,我們是依據(jù)這一小概率來下結(jié)論的。而當P 0.05時,我們對兩總體均數(shù)無差別這一結(jié)論無任何概率保證,因此不能貿(mào)然下無差別的結(jié)論。正確的說法是,按所取檢驗水準,接受H1的統(tǒng)計證據(jù)不足,或尚不能認為兩總體均數(shù)有差別。,2通常單側(cè)檢驗較雙側(cè)檢驗更為靈敏,更易檢驗出差別,應此宜廣泛使用。,答案:錯誤。根據(jù)專業(yè)知識推斷兩個總體是否有差別時,是甲高于乙,還是乙高于甲,當兩種可能都存在時,一般選雙側(cè);若根據(jù)專業(yè)知識,如果甲不會低于乙,或者研究者僅關心其中一種可能時,可選用單側(cè)。一般來講,雙側(cè)檢驗較為穩(wěn)妥。單側(cè)檢驗,應以專業(yè)知識為依據(jù),它充分利用了另一側(cè)的不可能性,故檢出率高,但應慎用。,3只要增加樣本含量到足夠大,就可以避

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論