版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、置信水平出自 MBA智庫(kù)百科()置信水平(Confidence level) 目錄顯示· 1 什么是置信水平· 2 置信水平的確定· 3 置信水平的置信度· 4 相關(guān)條目編輯什么是置信水平 置信水平來(lái)表示樣本統(tǒng)計(jì)值的精確度,它是指樣本統(tǒng)計(jì)值落在參數(shù)值某一正負(fù)區(qū)間內(nèi)的概率。 編輯置信水平的確定 但確定置信水平究竟是百分之幾,則主要決定于以下兩個(gè)要素: 第要素是內(nèi)部控制的健全狀況和運(yùn)用狀況如何。也就是說(shuō),在內(nèi)部控制的完備狀況和運(yùn)用狀況均屬良好的情況下,選擇80的置信水平就可以了,但當(dāng)內(nèi)部控制的完備狀況和運(yùn)用狀況并不充:分時(shí),就必須選擇95乃至99的置信水平。
2、 影響確定置信水平的另一要素是受審查公司的環(huán)境條件。這種環(huán)境條件是指一般的經(jīng)濟(jì)條件、特殊的經(jīng)濟(jì)法律條件、受審查公司的經(jīng)營(yíng)組織和財(cái)務(wù)構(gòu)成等。在這些條件對(duì)受審查公司不利4如銷售收入明顯下降)的情況下,就應(yīng)決定在依據(jù)性試驗(yàn)中選擇較高的置信水平。 、 但是,因?yàn)榄h(huán)境條件的內(nèi)容是多種多樣的,所以,審計(jì)人員必領(lǐng)以高度的專業(yè)能力來(lái)進(jìn)行判斷,并根據(jù)這種判斷來(lái)認(rèn)真研究環(huán)境的條件,以決定置信水平的選擇。 編輯置信水平的置信度 置信度也稱為可靠度,或置信水平、置信系數(shù),即在抽樣對(duì)總體參數(shù)作出估計(jì)時(shí),由于樣本的隨機(jī)性,其結(jié)論總是不確定的。因此,采用一種概率的陳述方法,也就是數(shù)理統(tǒng)計(jì)中的區(qū)間估計(jì)法,即估計(jì)值與總體參數(shù)在
3、一定允許的誤差范圍以內(nèi),其相應(yīng)的概率有多大,這個(gè)相應(yīng)的概率稱作置信度。 置信水平是描述GIS中線元素與面元素的位置不確定性的重要指標(biāo)之一。置信水平表示區(qū)間估計(jì)的把握程度,置信區(qū)間的跨度是置信水平的正函數(shù),即要求的把握程度越大,勢(shì)必得到一個(gè)較寬的置信區(qū)間,這就相應(yīng)降低了估計(jì)的準(zhǔn)確程度。 置信區(qū)間出自 MBA智庫(kù)百科()置信區(qū)間(Confidence interval) 目錄顯示· 1 什么是置信區(qū)間· 2 置信區(qū)間的概述· 3 置信區(qū)間的計(jì)算步驟· 4 關(guān)于置信區(qū)間的寬窄· 5 置信區(qū)間與置信水平、樣本量的關(guān)系· 6 相關(guān)條目編輯什么是
4、置信區(qū)間 置信區(qū)間又稱估計(jì)區(qū)間,是用來(lái)估計(jì)參數(shù)的取值范圍的。常見(jiàn)的52%-64%,或8-12,就是置信區(qū)間(估計(jì)區(qū)間)。 編輯置信區(qū)間的概述 1、對(duì)于具有特定的發(fā)生概率的隨機(jī)變量,其特定的價(jià)值區(qū)間:一個(gè)確定的數(shù)值范圍(“一個(gè)區(qū)間”)。 2、在一定置信水平時(shí),以測(cè)量結(jié)果為中心,包括總體均值在內(nèi)的可信范圍。 3、該區(qū)間包含了參數(shù)真值的可信程度。 4、參數(shù)的置信區(qū)間可以通過(guò)點(diǎn)估計(jì)量構(gòu)造,也可以通過(guò)假設(shè)檢驗(yàn)構(gòu)造。 編輯置信區(qū)間的計(jì)算步驟 第一步:求一個(gè)樣本的均值 第二步:計(jì)算出抽樣誤差。 人們經(jīng)過(guò)實(shí)踐,通常認(rèn)為調(diào)查: 100個(gè)樣本的抽樣誤差為±10%; 500個(gè)樣本的抽樣誤差為±5
5、%; 1,200個(gè)樣本時(shí)的抽樣誤差為±3%; 第三步:用第一步求出的“樣本均值”加、減第二步計(jì)算的“抽樣誤差”,得出置信區(qū)間的兩個(gè)端點(diǎn)。 編輯關(guān)于置信區(qū)間的寬窄 窄的置信區(qū)間比寬的置信區(qū)間能提供更多的有關(guān)總體參數(shù)的信息。 假設(shè)全班考試的平均分?jǐn)?shù)為65分,則 置 信 區(qū)間 間隔 寬窄度 表 達(dá) 的 意 思 0-100分 100 寬 等于什么也沒(méi)告訴你 30-80分 50 較窄 你能估出大概的平均分了(55分) 60-70分 10 窄 你幾乎能判定全班的平均分了(65分) 編輯置信區(qū)間與置信水平、樣本量的關(guān)系 1.樣本量對(duì)置信區(qū)間的影響:在置信水平固定的情況下,樣本量越多,置信區(qū)間越窄。
6、 實(shí)例分析: 經(jīng)過(guò)實(shí)踐計(jì)算的樣本量與置信區(qū)間關(guān)系的變化表(假設(shè)置信水平相同): 樣本量置信區(qū)間間隔寬窄度 10050%-70%20寬 80056.2%63.2%7較窄 1,60057.5%-63%5.5較窄 3,20058.5%-62%3.5更窄 由上表得出: 1、在置信水平相同的情況下,樣本量越多,置信區(qū)間越窄。 2、置信區(qū)間變窄的速度不像樣本量增加的速度那么快,也就是說(shuō)并不是樣本量增加一倍,置信區(qū)間也變窄一倍(實(shí)踐證明,樣本量要增加4倍,置信區(qū)間才能變窄一倍),所以當(dāng)樣本量達(dá)到一個(gè)量時(shí)(通常是1,200,如上例三個(gè)國(guó)家各抽了1,200個(gè)消費(fèi)者),就不再增加樣本了。 通過(guò)置信區(qū)間的計(jì)算公式來(lái)
7、驗(yàn)證置信區(qū)間與樣本量的關(guān)系 置信區(qū)間=樣本的推斷值±(可靠程度系數(shù)× ) 從上述公式中可以看出: 在其他因素不變的情況下,樣本量越多(大),置信區(qū)間越窄(?。?。 2.置信水平對(duì)置信區(qū)間的影響:在樣本量相同的情況下,置信水平越高,置信區(qū)間越寬。 實(shí)例分析: 美國(guó)做了一項(xiàng)對(duì)總統(tǒng)工作滿意度的調(diào)查。在調(diào)查抽取的1,200人中,有60%的人贊揚(yáng)了總統(tǒng)的工作,抽樣誤差為±3%,置信水平為95%;如果將抽樣誤差減少為±2.3%,置信水平降到為90%。則兩組數(shù)字的情況比較如下: 抽樣誤差置信水平置信區(qū)間間隔寬窄度 ±39560±357-636寬
8、177;2.39060±2.357.7-62.34.6窄 由上表得出: 在樣本量相同的情況下(都是1,200人),置信水平越高(95%),置信區(qū)間越寬。 抽樣誤差(Sampling error) 編輯什么是抽樣誤差 在抽樣檢查中,由于用樣本指標(biāo)代替全及指標(biāo)所產(chǎn)生的誤差可分為兩種:一種是由于主觀因素破壞了隨機(jī)原則而產(chǎn)生的誤差,稱為系統(tǒng)性誤差;另一種是由于抽樣的隨機(jī)性引起的偶然的代表性誤差。抽樣誤差僅僅是指后一種由于抽樣的隨機(jī)性而帶來(lái)的偶然的代表性誤差,而不是指前一種因不遵循隨機(jī)性原則而造成的系統(tǒng)性誤差。 總的說(shuō)來(lái),抽樣誤差是指樣本指標(biāo)與全及總體指標(biāo)之間的絕對(duì)誤差。在進(jìn)行抽樣檢查時(shí)不可避
9、免會(huì)產(chǎn)生抽樣誤差,因?yàn)閺目傮w中隨機(jī)抽取的樣本,其結(jié)構(gòu)不可能和總體完全一致。例如樣本平均數(shù)與總體平均數(shù)之差,樣本成數(shù)與總體成數(shù)之差 | p P | 。雖然抽樣誤差不可避免,但可以運(yùn)用大數(shù)定律的數(shù)學(xué)公式加以精確地計(jì)算,確定它具體的數(shù)量界限,并可通過(guò)抽樣設(shè)計(jì)加以控制。 抽樣誤差也是衡量抽樣檢查準(zhǔn)確程度的指標(biāo)。抽樣誤差越大,表明抽樣總體對(duì)全及總體的代表性越小,抽樣檢查的結(jié)果越不可靠。反之,抽樣誤差越小,說(shuō)明抽樣總體對(duì)全及總體的代表性越大,抽樣檢查的結(jié)果越準(zhǔn)確可靠。在統(tǒng)計(jì)學(xué)中把抽樣誤差分為抽樣平均誤差和抽樣極限誤差,下面就這兩種誤差分別進(jìn)行闡釋。為使推理過(guò)程簡(jiǎn)化,這里不對(duì)屬性總體進(jìn)行分析,而僅對(duì)變量總體
10、進(jìn)行分析計(jì)算。 編輯抽樣誤差的計(jì)算 1、表現(xiàn)形式:平均數(shù)指標(biāo)抽樣誤差;成數(shù)(比重)抽樣誤差。 2、平均數(shù)指標(biāo)的抽樣誤差 1)重復(fù)抽樣的條件下: 2)不重復(fù)抽樣的條件下: 3、成數(shù)指標(biāo)的抽樣誤差 1)重復(fù)抽樣的條件下: 2)不重復(fù)抽樣的條件下: 編輯抽樣誤差的控制措施 抽樣誤差則是不可避免的,但可以減少,其措施有: 1、增加樣本個(gè)案數(shù)。 2、適應(yīng)選擇抽樣方式。 例如,在同樣條件下,又重復(fù)抽樣比重復(fù)抽樣的抽樣誤差小,又如在總體現(xiàn)象分類比較明顯時(shí),采用分層隨機(jī)抽樣比其它方法的抽樣誤差小。由于總體真正的參數(shù)值未知,真正的抽樣誤差也未知,所以抽樣誤差的計(jì)算一般都以抽樣平均誤差來(lái)代表真正的抽樣誤差。 顯著
11、性水平出自 MBA智庫(kù)百科()(重定向自顯著水平)顯著性水平(Significance Level) 編輯什么是顯著性水平 假設(shè)檢驗(yàn)是圍繞對(duì)原假設(shè)內(nèi)容的審定而展開(kāi)的。如果原假設(shè)正確我們接受了(同時(shí)也就拒絕了備擇假設(shè)),或原假設(shè)錯(cuò)誤我們拒絕了(同時(shí)也就接受了備擇假設(shè)),這表明我們作出了正確的決定。但是,由于假設(shè)檢驗(yàn)是根據(jù)樣本提供的信息進(jìn)行推斷的,也就有犯錯(cuò)誤的可能。有這樣一種情況,原假設(shè)正確,而我們卻把它當(dāng)成錯(cuò)誤的加以拒絕。犯這種錯(cuò)誤的概率用表示,統(tǒng)計(jì)上把稱為假設(shè)檢驗(yàn)中的顯著性水平,也就是決策中所面臨的風(fēng)險(xiǎn)。 顯著性水平是假設(shè)檢驗(yàn)中的一個(gè)概念,是指當(dāng)原假設(shè)為正確時(shí)人們卻把它拒絕了的概率或風(fēng)險(xiǎn)。它
12、是公認(rèn)的小概率事件的概率值,必須在每一次統(tǒng)計(jì)檢驗(yàn)之前確定,通常取0.05或0.01。這表明,當(dāng)作出接受原假設(shè)的決定時(shí),其正確的可能性(概率)為95或99。 顯著性水平代表的意義是在一次試驗(yàn)中小概率事物發(fā)生的可能性大小。 編輯顯著性水平的理解 顯著性水平是在進(jìn)行假設(shè)檢驗(yàn)時(shí)事先確定一個(gè)可允許的作為判斷界限的小概率標(biāo)準(zhǔn)。檢驗(yàn)中,依據(jù)顯著性水平大小把概率劃分為二個(gè)區(qū)間,小于給定標(biāo)準(zhǔn)的概率區(qū)間稱為拒絕區(qū)間,大于這個(gè)標(biāo)準(zhǔn)則為接受區(qū)間。事件屬于接受區(qū)間,原假設(shè)成立而無(wú)顯著性差異;事件屬于拒絕區(qū)間,拒絕原假設(shè)而認(rèn)為有顯著性差異。對(duì)顯著水平的理解必須把握以下二點(diǎn): 1、顯著性水平不是一個(gè)固定不變的數(shù)值,依據(jù)拒絕
13、區(qū)間所可能承擔(dān)的風(fēng)險(xiǎn)來(lái)決定。 2、統(tǒng)計(jì)上所講的顯著性與實(shí)際生活工作中的顯著性是不一樣的。 顯著性差異出自 MBA智庫(kù)百科()顯著性差異(Significance Difference) 編輯什么是顯著性差異 顯著性差異是一個(gè)統(tǒng)計(jì)學(xué)名詞。它是統(tǒng)計(jì)學(xué)(Statistics)上對(duì)數(shù)據(jù)差異性的評(píng)價(jià)。當(dāng)數(shù)據(jù)之間具有了顯著性差異,就說(shuō)明參與比對(duì)的數(shù)據(jù)不是來(lái)自于同一總體(Population),而是來(lái)自于具有差異的兩個(gè)不同總體,這種差異可能因參與比對(duì)的數(shù)據(jù)是來(lái)自不同實(shí)驗(yàn)對(duì)象的。 如比西一般能力測(cè)驗(yàn)中,大學(xué)學(xué)歷被試組的成績(jī)與小學(xué)學(xué)歷被試組會(huì)有顯著性差異。也可能來(lái)自于實(shí)驗(yàn)處理對(duì)實(shí)驗(yàn)對(duì)象造成了根本性狀改變,因而前
14、測(cè)后測(cè)的數(shù)據(jù)會(huì)有顯著性差異。例如,記憶術(shù)研究發(fā)現(xiàn),被試學(xué)習(xí)某記憶法前的成績(jī)和學(xué)習(xí)記憶法后的記憶成績(jī)會(huì)有顯著性差異,這一差異很可能來(lái)自于學(xué)××記憶法對(duì)被試記憶能力的改變。 編輯顯著性差異的評(píng)析 顯著性差異是一種有量度的或然性評(píng)價(jià)。比如,我們說(shuō)A、B兩數(shù)據(jù)在0.05水平上具備顯著性差異,這是說(shuō)兩組數(shù)據(jù)具備顯著性差異的可能性為95。兩個(gè)數(shù)據(jù)所代表的樣本還有5的可能性是沒(méi)有差異的。這5的差異是由于隨機(jī)誤差造成的。 P-value是原假設(shè)H0真實(shí)的結(jié)論時(shí),我們觀察到樣本的值有多大的概率,簡(jiǎn)稱P值。如果此值小,就下原假設(shè)為不真實(shí)的結(jié)論。統(tǒng)計(jì)學(xué)上稱為小概率事件,即樣本不是從原假設(shè)的分布中
15、抽出的。一般P值大于,則無(wú)法拒絕原假設(shè),相反,P值小于,則拒絕原假設(shè)。通常情況下,實(shí)驗(yàn)結(jié)果達(dá)到0.05水平或0.01水平,才可以說(shuō)數(shù)據(jù)之間具備了顯著性差異。在作結(jié)論時(shí),應(yīng)確實(shí)描述方向性(例如顯著大于或顯著小于)。 如果我們是檢驗(yàn)?zāi)硨?shí)驗(yàn)(Hypothesis Test)中測(cè)得的數(shù)據(jù),那么當(dāng)數(shù)據(jù)之間具備了顯著性差異,實(shí)驗(yàn)的虛無(wú)假設(shè)(Null Hypothesis)就可被推翻,對(duì)立假設(shè)(Alternative Hypothesis)得到支持;反之若數(shù)據(jù)之間不具備顯著性差異,則實(shí)驗(yàn)的備則假設(shè)可以被推翻,虛無(wú)假設(shè)得到支持。 假設(shè)檢驗(yàn)出自 MBA智庫(kù)百科()假設(shè)檢驗(yàn)(Hypothesis Testing)
16、 目錄顯示· 1 什么是假設(shè)檢驗(yàn)· 2 假設(shè)檢驗(yàn)的基本思想· 3 假設(shè)檢驗(yàn)的原理· 4 假設(shè)檢驗(yàn)的種類· 5 假設(shè)檢驗(yàn)的基本思想· 6 假設(shè)檢驗(yàn)規(guī)則與兩類錯(cuò)誤· 7 假設(shè)檢驗(yàn)的一般步驟· 8 假設(shè)檢驗(yàn)應(yīng)注意的問(wèn)題· 9 假設(shè)檢驗(yàn)與置信區(qū)間的關(guān)系· 10 幾種常見(jiàn)假設(shè)檢驗(yàn)· 11 假設(shè)檢驗(yàn)的應(yīng)用分析 o 11.1 案例一:假設(shè)檢驗(yàn)設(shè)備判斷中的應(yīng)用1o 11.2 案例二:假設(shè)檢驗(yàn)在卷煙質(zhì)量判斷中的應(yīng)用2· 12 相關(guān)條目· 13 參考文獻(xiàn)編輯什么是假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)是用
17、來(lái)判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。其基本原理是先對(duì)總體的特征作出某種假設(shè),然后通過(guò)抽樣研究的統(tǒng)計(jì)推理,對(duì)此假設(shè)應(yīng)該被拒絕還是接受作出推斷。 生物現(xiàn)象的個(gè)體差異是客觀存在,以致抽樣誤差不可避免,所以我們不能僅憑個(gè)別樣本的值來(lái)下結(jié)論。當(dāng)遇到兩個(gè)或幾個(gè)樣本均數(shù)(或率)、樣本均數(shù)(率)與已知總體均數(shù)(率)有大有小時(shí),應(yīng)當(dāng)考慮到造成這種差別的原因有兩種可能:一是這兩個(gè)或幾個(gè)樣本均數(shù)(或率)來(lái)自同一總體,其差別僅僅由于抽樣誤差即偶然性所造成;二是這兩個(gè)或幾個(gè)樣本均數(shù)(或率)來(lái)自不同的總體,即其差別不僅由抽樣誤差造成,而主要是由實(shí)驗(yàn)因素不同所引起的。假設(shè)檢驗(yàn)的
18、目的就在于排除抽樣誤差的影響,區(qū)分差別在統(tǒng)計(jì)上是否成立,并了解事件發(fā)生的概率。 在質(zhì)量管理工作中經(jīng)常遇到兩者進(jìn)行比較的情況,如采購(gòu)原材料的驗(yàn)證,我們抽樣所得到的數(shù)據(jù)在目標(biāo)值兩邊波動(dòng),有時(shí)波動(dòng)很大,這時(shí)你如何進(jìn)行判定這些原料是否達(dá)到了我們規(guī)定的要求呢?再例如,你先后做了兩批實(shí)驗(yàn),得到兩組數(shù)據(jù),你想知道在這兩試實(shí)驗(yàn)中合格率有無(wú)顯著變化,那怎么做呢?這時(shí)你可以使用假設(shè)檢驗(yàn)這種統(tǒng)計(jì)方法,來(lái)比較你的數(shù)據(jù),它可以告訴你兩者是否相等,同時(shí)也可以告訴你,在你做出這樣的結(jié)論時(shí),你所承擔(dān)的風(fēng)險(xiǎn)。假設(shè)檢驗(yàn)的思想是,先假設(shè)兩者相等,即:0,然后用統(tǒng)計(jì)的方法來(lái)計(jì)算驗(yàn)證你的假設(shè)是否正確。 編輯假設(shè)檢驗(yàn)的基本思想1.小概率
19、原理 如果對(duì)總體的某種假設(shè)是真實(shí)的,那么不利于或不能支持這一假設(shè)的事件A(小概率事件)在一次試驗(yàn)中幾乎不可能發(fā)生的;要是在一次試驗(yàn)中A竟然發(fā)生了,就有理由懷疑該假設(shè)的真實(shí)性,拒絕這一假設(shè)。 2.假設(shè)的形式 H0原假設(shè), H1備擇假設(shè) 雙尾檢驗(yàn):H0: = 0 , 單尾檢驗(yàn): ,H1: < 0 , H1: > 0 假設(shè)檢驗(yàn)就是根據(jù)樣本觀察結(jié)果對(duì)原假設(shè)(H0)進(jìn)行檢驗(yàn),接受H0,就否定H1;拒絕H0,就接受H1。 編輯假設(shè)檢驗(yàn)的原理 一般地說(shuō),對(duì)總體某項(xiàng)或某幾項(xiàng)作出假設(shè),然后根據(jù)樣本對(duì)假設(shè)作出接受或拒絕的判斷,這種方法稱為假設(shè)檢驗(yàn)。 假設(shè)檢驗(yàn)使用了一種類似于“反證法”的推理方法,它的特
20、點(diǎn)是: (1)先假設(shè)總體某項(xiàng)假設(shè)成立,計(jì)算其會(huì)導(dǎo)致什么結(jié)果產(chǎn)生。若導(dǎo)致不合理現(xiàn)象產(chǎn)生,則拒絕原先的假設(shè)。若并不導(dǎo)致不合理的現(xiàn)象產(chǎn)生,則不能拒絕原先假設(shè),從而接受原先假設(shè)。 (2)它又不同于一般的反證法。所謂不合理現(xiàn)象產(chǎn)生,并非指形式邏輯上的絕對(duì)矛盾,而是基于小概率原理:概率很小的事件在一次試驗(yàn)中幾乎是不可能發(fā)生的,若發(fā)生了,就是不合理的。至于怎樣才算是“小概率”呢?通??蓪⒏怕什怀^(guò)0.05的事件稱為“小概率事件”,也可視具體情形而取0.1或0.01等。在假設(shè)檢驗(yàn)中常記這個(gè)概率為,稱為顯著性水平。而把原先設(shè)定的假設(shè)成為原假設(shè),記作H0。把與H0相反的假設(shè)稱為備擇假設(shè),它是原假設(shè)被拒絕時(shí)而應(yīng)接受
21、的假設(shè),記作H1。 編輯假設(shè)檢驗(yàn)的種類假設(shè)檢驗(yàn)可分為正態(tài)分布檢驗(yàn)、正態(tài)總體均值分布檢驗(yàn)、非參數(shù)檢驗(yàn)三類。 正態(tài)分布檢驗(yàn)包括三類:JB檢驗(yàn)、KS檢驗(yàn)、Lilliefors檢驗(yàn),用于檢驗(yàn)樣本是否來(lái)自于一個(gè)正態(tài)分布總體。 正態(tài)總體均值檢驗(yàn)檢驗(yàn)分析方法和分析結(jié)果的準(zhǔn)確度,考察系統(tǒng)誤差對(duì)測(cè)試結(jié)果的影響。從統(tǒng)計(jì)意義上來(lái)說(shuō),各樣本均值之差應(yīng)在隨機(jī)誤差允許的范圍之內(nèi)。反之,如果不同樣本的均值之差超過(guò)了允許的范圍,這就說(shuō)明除了隨機(jī)誤差之外,各均值之間還存在系統(tǒng)誤差,使得各均值之間出現(xiàn)了顯著性差異。 正態(tài)總體均值檢驗(yàn)分為兩種情況, t檢驗(yàn)是用小樣本檢驗(yàn)總體參數(shù),特點(diǎn)是在均方差不知道的情況下,可以檢驗(yàn)樣本平均數(shù)的顯
22、著性,分為單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)。當(dāng)為雙樣本檢驗(yàn)時(shí),在兩樣本t檢驗(yàn)中要用到F檢驗(yàn)。 從兩研究總體中隨機(jī)抽取樣本,要對(duì)這兩個(gè)樣本進(jìn)行比較的時(shí)候,首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用t檢驗(yàn),若不等,可采用t'檢驗(yàn)或變量變換或秩和檢驗(yàn)等方法。 Z檢驗(yàn)是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗(yàn)的方法。 上面所述的檢驗(yàn)都是基于樣本來(lái)自正態(tài)總體的假設(shè),在實(shí)際工作中,有時(shí)并不明確知道樣本是否來(lái)自正態(tài)總體,這就為假設(shè)檢驗(yàn)帶來(lái)難度。非參數(shù)檢驗(yàn)方法,對(duì)樣本是否來(lái)自正態(tài)總體不做嚴(yán)格的限制,而且計(jì)算簡(jiǎn)單。統(tǒng)計(jì)工具箱提供了符號(hào)檢驗(yàn)和秩和檢驗(yàn)兩種非參數(shù)檢驗(yàn)方法。 編輯假設(shè)檢
23、驗(yàn)的基本思想 假設(shè)檢驗(yàn)的基本思想是小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立,若可能性大,則還不能認(rèn)為假設(shè)不成立。 編輯假設(shè)檢驗(yàn)規(guī)則與兩類錯(cuò)誤 1.確定檢驗(yàn)規(guī)則 檢驗(yàn)過(guò)程是比較樣本觀察結(jié)果與總體假設(shè)的差異。差異顯著,超過(guò)了臨界點(diǎn),拒絕H0;反之,差異不顯著,接受H0。 差異臨界點(diǎn)判斷 c拒絕H0 c接受H0 怎樣確定c? 2.兩類錯(cuò)誤 接受或拒絕H0,都可能犯錯(cuò)誤 I類錯(cuò)誤棄真錯(cuò)誤,發(fā)生的概率為 II類錯(cuò)誤取偽錯(cuò)誤
24、,發(fā)生的概率為 檢驗(yàn)決策H0為真H0非真 拒絕H0犯I類錯(cuò)誤()正確 接受H0正確犯II類錯(cuò)誤() 大就小,小就大 基本原則:力求在控制前提下減少 顯著性水平,取值:0.1, 0.05, 0.001, 等。如果犯I類錯(cuò)誤損失更大,為減少損失,值取??;如果犯II類錯(cuò)誤損失更大,值取大。 確定,就確定了臨界點(diǎn)c。 設(shè)有總體:XN(,2),2已知。 隨機(jī)抽樣:樣本均值barXN(mu,sigma2/n)。 標(biāo)準(zhǔn)化: 確定值, 查概率表,知臨界值 計(jì)算Z值,作出判斷。 編輯假設(shè)檢驗(yàn)的一般步驟 編輯假設(shè)檢驗(yàn)應(yīng)注意的問(wèn)題 1、做假設(shè)檢驗(yàn)之前,應(yīng)注意資料本身是否有可比性。 2、當(dāng)差別有統(tǒng)計(jì)學(xué)意義時(shí)應(yīng)注意這樣
25、的差別在實(shí)際應(yīng)用中有無(wú)意義。 3、根據(jù)資料類型和特點(diǎn)選用正確的假設(shè)檢驗(yàn)方法。 4、根據(jù)專業(yè)及經(jīng)驗(yàn)確定是選用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。 5、當(dāng)檢驗(yàn)結(jié)果為拒絕無(wú)效假設(shè)時(shí),應(yīng)注意有發(fā)生I類錯(cuò)誤的可能性,即錯(cuò)誤地拒絕了本身成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是知道的,即檢驗(yàn)水準(zhǔn)那么大;當(dāng)檢驗(yàn)結(jié)果為不拒絕無(wú)效假設(shè)時(shí),應(yīng)注意有發(fā)生II類錯(cuò)誤的可能性,即仍有可能錯(cuò)誤地接受了本身就不成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯(cuò)誤的大小有關(guān)系。 6、判斷結(jié)論時(shí)不能絕對(duì)化,應(yīng)注意無(wú)論接受或拒絕檢驗(yàn)假設(shè),都有判斷錯(cuò)誤的可能性。 7、報(bào)告結(jié)論時(shí)是應(yīng)注意說(shuō)明所用的統(tǒng)計(jì)量,檢驗(yàn)的單雙側(cè)及P值的確切范圍
26、。 編輯假設(shè)檢驗(yàn)與置信區(qū)間的關(guān)系假設(shè)檢驗(yàn)與置信區(qū)間有密切的聯(lián)系,我們往往可以由某參數(shù)的顯著性水平為的檢驗(yàn),得到該參數(shù)的置信度為1的置信區(qū)間,反之亦然。例如,顯著性水平的均值的雙側(cè)檢驗(yàn)問(wèn)題: H0: = 0, 與置信度為1- 的置信區(qū)間之間有著這樣的關(guān)系;若檢驗(yàn)在水平下接受H0,則的1 - 的置信區(qū)間必須包含0;反之,若檢驗(yàn)在 水平下拒絕H0,則的1-的置信區(qū)間必定不包含0。因此,我們可以用構(gòu)造的1-置信區(qū)間的方法來(lái)檢驗(yàn)上述假設(shè),如果構(gòu)造出來(lái)的置信區(qū)間包含0,就接受H0;如果不包含0就拒絕H0。同樣給定顯著水平 ,可以從構(gòu)造檢驗(yàn)規(guī)則的過(guò)程中,得到的 1-置信區(qū)間。 如上例,的置信度為95%的置信
27、區(qū)間為: 即置信區(qū)間為(80.55 , 85.45),因?yàn)? = 80,不在這個(gè)區(qū)間內(nèi),拒絕H0 編輯幾種常見(jiàn)假設(shè)檢驗(yàn)考慮下面三種類型的假設(shè)檢驗(yàn): (4.12) (1)(雙邊檢驗(yàn)) (2)(右側(cè)單邊檢驗(yàn)) (3)(左側(cè)單邊檢驗(yàn)) 編輯假設(shè)檢驗(yàn)的應(yīng)用分析 編輯案例一:假設(shè)檢驗(yàn)設(shè)備判斷中的應(yīng)用1例如:某公司想從國(guó)外引進(jìn)一種自動(dòng)加工裝置。這種裝置的工作溫度X服從正態(tài)分布(,52),廠方說(shuō)它的平均工作溫度是80度。從該裝置試運(yùn)轉(zhuǎn)中隨機(jī)測(cè)試16次,得到的平均工作溫度是83度。該公司考慮,樣本結(jié)果與廠方所說(shuō)的是否有顯著差異?廠方的說(shuō)法是否可以接受? 類似這種根據(jù)樣本觀測(cè)值來(lái)判斷一個(gè)有關(guān)總體的假設(shè)是否成立的
28、問(wèn)題,就是假設(shè)檢驗(yàn)的問(wèn)題。我們把任一關(guān)于單體分布的假設(shè),統(tǒng)稱為統(tǒng)計(jì)假設(shè),簡(jiǎn)稱假設(shè)。上例中,可以提出兩個(gè)假設(shè):一個(gè)稱為原假設(shè)或零假設(shè),記為H0:=80(度);另一個(gè)稱為備擇假設(shè)或?qū)α⒓僭O(shè),記為H1 :80(度)這樣,上述假設(shè)檢驗(yàn)問(wèn)題可以表示為: H0:=80H1:80 原假設(shè)與備擇假設(shè)相互對(duì)立,兩者有且只有一個(gè)正確,備擇假設(shè)的含義是,一旦否定原假設(shè)H0,備擇假設(shè)H1備你選擇。所謂假設(shè)檢驗(yàn)問(wèn)題就是要判斷原假設(shè)H0是否正確,決定接受還是拒絕原假設(shè),若拒絕原假設(shè),就接受備擇假設(shè)。 應(yīng)該如何作出判斷呢?如果樣本測(cè)定的結(jié)果是100度甚至更高(或很低),我們從直觀上能感到原假設(shè)可疑而否定它,因?yàn)樵僭O(shè)是真實(shí)
29、時(shí),在一次試驗(yàn)中出現(xiàn)了與80度相距甚遠(yuǎn)的小概率事件幾乎是不可能的,而現(xiàn)在竟然出現(xiàn)了,當(dāng)然要拒絕原假設(shè)H0?,F(xiàn)在的問(wèn)題是樣本平均工作溫度為83度,結(jié)果雖然與廠方說(shuō)的80度有差異,但樣本具有隨機(jī)性,80度與83度之間的差異很可能是樣本的隨機(jī)性造成的。在這種情況下,要對(duì)原假設(shè)作出接受還是拒絕的抉擇,就必須根據(jù)研究的問(wèn)題和決策條件,對(duì)樣本值與原假設(shè)的差異進(jìn)行分析。若有充分理由認(rèn)為這種差異并非是由偶然的隨機(jī)因素造成的,也即認(rèn)為差異是顯著的,才能拒絕原假設(shè),否則就不能拒絕原假設(shè)。假設(shè)檢驗(yàn)實(shí)質(zhì)上是對(duì)原假設(shè)是否正確進(jìn)行檢驗(yàn),因此,檢驗(yàn)過(guò)程中要使原假設(shè)得到維護(hù),使之不輕易被否定,否定原假設(shè)必須有充分的理由;同時(shí)
30、,當(dāng)原假設(shè)被接受時(shí),也只能認(rèn)為否定它的根據(jù)不充分,而不是認(rèn)為它絕對(duì)正確。 編輯案例二:假設(shè)檢驗(yàn)在卷煙質(zhì)量判斷中的應(yīng)用2在卷煙生產(chǎn)企業(yè)經(jīng)常會(huì)遇到如下的問(wèn)題:卷煙檢驗(yàn)標(biāo)準(zhǔn)中要求煙支的某項(xiàng)缺陷的不合格品率P不能超過(guò)3%,現(xiàn)從一批產(chǎn)品中隨機(jī)抽取50支卷煙進(jìn)行檢驗(yàn),發(fā)現(xiàn)有2支不合格品,問(wèn)此批產(chǎn)品能否放行?按照一般的習(xí)慣性思維:50支中有2支不合格品,不合格品率就是4%,超過(guò)了原來(lái)設(shè)置的3%的不合格品率,因此不能放行。但如果根據(jù)假設(shè)檢驗(yàn)的理論,在0.05的顯著性水平下,該批產(chǎn)品應(yīng)該可以放行。這是為什么呢? 最關(guān)鍵的是由于我們是在一批產(chǎn)品中進(jìn)行抽樣檢驗(yàn),用抽樣樣本的質(zhì)量水平來(lái)判別整批的質(zhì)量水平,這里就有一個(gè)
31、抽樣風(fēng)險(xiǎn)的問(wèn)題。舉例來(lái)說(shuō),我們的這批產(chǎn)品共有10000支卷煙,里面有4支不合格品,不合格品率是0.04%,遠(yuǎn)低于3%的合格放行不合格品率。但我們的檢驗(yàn)要求是隨機(jī)抽樣50支,用這50支的質(zhì)量水平來(lái)判別整批 10000支的質(zhì)量水平。如果在50支中恰好抽到了2支甚至更多的不合格品,簡(jiǎn)單地用抽到的不合格品數(shù)除以50來(lái)作為不合格品率來(lái)判斷,那我們就會(huì)對(duì)這批質(zhì)量水平合格的產(chǎn)品進(jìn)行誤判。 如何科學(xué)地進(jìn)行判斷呢?這就要用到假設(shè)檢驗(yàn)的理論。 步驟1:建立假設(shè) 要檢驗(yàn)的假設(shè)是不合格品率P是否不超過(guò)3%,因此立假設(shè) H0:P0.03 這是原假設(shè),其意是:與檢驗(yàn)標(biāo)準(zhǔn)一致。 H1:P0.03 步驟2:選擇檢驗(yàn)統(tǒng)計(jì)量,給
32、出拒絕域的形式 若把比例P看作n=1的二項(xiàng)分別b(1,p)中成功的概率,則可在大樣本場(chǎng)合(一般n25)獲得參數(shù)p的近似的檢驗(yàn),可得樣本統(tǒng)計(jì)量:近似服從N(0,1) 其中2/500.04,p=0.03,n50 步驟3:給出顯著性水平,常取0.05。 步驟4:定出臨界值,寫出拒絕域W。 根據(jù)0.05及備擇假設(shè)知道拒絕域W為 步驟5:由樣本觀測(cè)值,求得樣本統(tǒng)計(jì)量,并判斷。 結(jié)論:在0.05時(shí),樣本觀測(cè)值未落在拒絕域,所以不能拒絕原假設(shè),應(yīng)允許這批產(chǎn)品出廠。 假設(shè)檢驗(yàn)中的兩類錯(cuò)誤。 進(jìn)一步研究一下這個(gè)例子,在50個(gè)樣品中抽到多少個(gè)不合格品,就要拒絕入庫(kù)呢?我們?nèi)匀?.05,根據(jù)上述公式,得出,解得x&
33、gt;3.48,也就是在50個(gè)樣品中抽到4個(gè)不合格品才能判整批為不合格。 而如果我們改變的取值,也就是我們定義的小概率的取值,比如說(shuō)取0.01,認(rèn)為概率不超過(guò)0.01的事件發(fā)生了就是不合理的了,那又會(huì)怎樣呢?還是用上面的公式計(jì)算,則得出,解得x>4.30,也就是在50個(gè)樣品中抽到5個(gè)不合格品才能判整批為不合格。檢驗(yàn)要求是不合格品率P不能超過(guò)3%,而現(xiàn)在根據(jù)0.01,算出來(lái)50個(gè)樣品中抽到5個(gè)不合格品才能判整批為不合格,會(huì)不會(huì)犯錯(cuò)誤??!假設(shè)檢驗(yàn)是根據(jù)樣本的情況作的統(tǒng)計(jì)推斷,是推斷就會(huì)犯錯(cuò)誤,我們的任務(wù)是控制犯錯(cuò)誤的概率。在假設(shè)檢驗(yàn)中,錯(cuò)誤有兩類: 第一類錯(cuò)誤(拒真錯(cuò)誤):原假設(shè)H0為真(批
34、產(chǎn)品質(zhì)量是合格的),但由于抽樣的隨機(jī)性(抽到過(guò)多的不合格品),樣本落在拒絕域W內(nèi),從而導(dǎo)致拒絕H0(根據(jù)樣本的情況把批質(zhì)量判斷為不合格)。其發(fā)生的概率記為,也就是顯著性水平??刂频钠鋵?shí)是生產(chǎn)方的風(fēng)險(xiǎn),控制的是生產(chǎn)方所承擔(dān)的批質(zhì)量合格而不被接受的風(fēng)險(xiǎn)。 第二類錯(cuò)誤(取偽錯(cuò)誤):原假設(shè)H0不真(批產(chǎn)品質(zhì)量是不合格的),但由于抽樣的隨機(jī)性(抽到過(guò)少的不合格品),樣本落在W外,從而導(dǎo)致接受H0(根據(jù)樣本的情況把批質(zhì)量判斷為合格)。其發(fā)生的概率記為??刂频钠鋵?shí)是使用方的風(fēng)險(xiǎn),控制的是使用方所承擔(dān)的接受質(zhì)量不合格批的風(fēng)險(xiǎn)。 再回到剛剛計(jì)算的上例的情況,由0.05變化為0.01,我們對(duì)批質(zhì)量不合格的判斷由5
35、0 個(gè)樣本中出現(xiàn)4個(gè)不合格變化為5個(gè),批質(zhì)量是合格的而不被接受的風(fēng)險(xiǎn)就小了,犯第一類錯(cuò)誤的風(fēng)險(xiǎn)小了,也就是生產(chǎn)方的風(fēng)險(xiǎn)小了;但同時(shí)隨著的減小對(duì)批質(zhì)量不合格的判斷條件其實(shí)放寬了50個(gè)樣本中出現(xiàn)4個(gè)不合格變化為5個(gè),批質(zhì)量是不合格的而被接受的風(fēng)險(xiǎn)大了;犯第二類錯(cuò)誤的風(fēng)險(xiǎn)大了,也就是使用方的風(fēng)險(xiǎn)大了。在相同樣本量下,要使小,必導(dǎo)致大;要使小,必導(dǎo)致大,要同時(shí)兼顧生產(chǎn)方和使用方的風(fēng)險(xiǎn)是不可能的。要使、皆小,只有增大樣本量,這又增加了質(zhì)量成本。 因此綜上所述,假設(shè)檢驗(yàn)可以告訴我們?nèi)绾慰茖W(xué)地進(jìn)行質(zhì)量合格判定,又告訴我們要兼顧生產(chǎn)方和使用方的質(zhì)量風(fēng)險(xiǎn),同時(shí)考慮質(zhì)量和成本的問(wèn)題。 顯著性檢驗(yàn)出自 MBA智庫(kù)百
36、科()顯著性檢驗(yàn)(Significance Testing) 目錄顯示· 1 什么是顯著性檢驗(yàn)· 2 顯著性檢驗(yàn)的含義· 3 顯著性檢驗(yàn)的原理· 4 顯著性檢驗(yàn)的相關(guān)概念 o 4.1 原假設(shè)和備擇假設(shè)o 4.2 雙尾檢驗(yàn)和單尾檢驗(yàn)· 5 顯著性檢驗(yàn)的作用· 6 顯著性檢驗(yàn)的基本思想· 7 顯著性檢驗(yàn)的兩類錯(cuò)誤· 8 顯著性檢驗(yàn)的P值1· 9 顯著性檢驗(yàn)的結(jié)果· 10 顯著性檢驗(yàn)中的總體和樣本· 11 顯著性檢驗(yàn)的步驟· 12 總體均值為某定值的顯著性檢驗(yàn)· 13 總
37、體比例為某定值的顯著性檢驗(yàn)· 14 顯著性檢驗(yàn)應(yīng)注意的問(wèn)題· 15 常用顯著性檢驗(yàn)· 16 顯著性檢驗(yàn)的應(yīng)用2· 17 顯著性檢驗(yàn)的實(shí)例分析 o 17.1 案例一:大豆籽粒品種檢驗(yàn)分析· 18 相關(guān)系數(shù)顯著性檢驗(yàn)表· 19 相關(guān)條目編輯什么是顯著性檢驗(yàn) 顯著性檢驗(yàn)就是事先對(duì)總體(隨機(jī)變量)的參數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷這個(gè)假設(shè)(原假設(shè))是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否顯著地有差異?;蛘哒f(shuō),顯著性檢驗(yàn)要判斷樣本與我們對(duì)總體所做的假設(shè)之間的差異是純屬機(jī)會(huì)變異,還是由我們所做的假設(shè)與總體真實(shí)情況之間不一致
38、所引起的。 顯著性檢驗(yàn)是針對(duì)我們對(duì)總體所做的假設(shè)做檢驗(yàn),其原理就是“小概率事件實(shí)際不可能性原理”來(lái)接受或否定假設(shè)。 抽樣實(shí)驗(yàn)會(huì)產(chǎn)生抽樣誤差,對(duì)實(shí)驗(yàn)資料進(jìn)行比較分析時(shí),不能僅憑兩個(gè)結(jié)果(平均數(shù)或率)的不同就作出結(jié)論,而是要進(jìn)行統(tǒng)計(jì)學(xué)分析,鑒別出兩者差異是抽樣誤差引起的,還是由特定的實(shí)驗(yàn)處理引起的。 編輯顯著性檢驗(yàn)的含義 顯著性檢驗(yàn)即用于實(shí)驗(yàn)處理組與對(duì)照組或兩種不同處理的效應(yīng)之間是否有差異,以及這種差異是否顯著的方法。 常把一個(gè)要檢驗(yàn)的假設(shè)記作H0,稱為原假設(shè)(或零假設(shè)) (null hypothesis) ,與H0對(duì)立的假設(shè)記作H1,稱為備擇假設(shè)(alternative hypothesis)
39、。 在原假設(shè)為真時(shí),決定放棄原假設(shè),稱為第一類錯(cuò)誤,其出現(xiàn)的概率通常記作; 在原假設(shè)不真時(shí),決定接受原假設(shè),稱為第二類錯(cuò)誤,其出現(xiàn)的概率通常記作。 通常只限定犯第一類錯(cuò)誤的最大概率, 不考慮犯第二類錯(cuò)誤的概率。這樣的假設(shè) 檢驗(yàn)又稱為顯著性檢驗(yàn),概率稱為顯著性水平。 最常用的值為0.01、0.05、0.10等。一般情況下,根據(jù)研究的問(wèn)題,如果犯棄真錯(cuò)誤損失大,為減少這類錯(cuò)誤,取值小些 ,反之,取值大些。 編輯顯著性檢驗(yàn)的原理 · 無(wú)效假設(shè) 顯著性檢驗(yàn)的基本原理是提出“無(wú)效假設(shè)”和檢驗(yàn)“無(wú)效假設(shè)”成立的機(jī)率(P)水平的選擇。所謂“無(wú)效假設(shè)”,就是當(dāng)比較實(shí)驗(yàn)處理組與對(duì)照組的結(jié)果時(shí),假設(shè)兩組
40、結(jié)果間差異不顯著,即實(shí)驗(yàn)處理對(duì)結(jié)果沒(méi)有影響或無(wú)效。經(jīng)統(tǒng)計(jì)學(xué)分析后,如發(fā)現(xiàn)兩組間差異系抽樣引起的,則“無(wú)效假設(shè)”成立,可認(rèn)為這種差異為不顯著(即實(shí)驗(yàn)處理無(wú)效)。若兩組間差異不是由抽樣引起的,則“無(wú)效假設(shè)”不成立,可認(rèn)為這種差異是顯著的(即實(shí)驗(yàn)處理有效)。 · “無(wú)效假設(shè)”成立的機(jī)率水平 檢驗(yàn)“無(wú)效假設(shè)”成立的機(jī)率水平一般定為5%(常寫為p0.05),其含義是將同一實(shí)驗(yàn)重復(fù)100次,兩者結(jié)果間的差異有5次以上是由抽樣誤差造成的,則“無(wú)效假設(shè)”成立,可認(rèn)為兩組間的差異為不顯著,常記為p>0.05。若兩者結(jié)果間的差異5次以下是由抽樣誤差造成的,則“無(wú)效假設(shè)”不成立,可認(rèn)為兩組間的差異為
41、顯著,常記為p0.05。如果p0.01,則認(rèn)為兩組間的差異為非常顯著。 編輯顯著性檢驗(yàn)的相關(guān)概念 編輯原假設(shè)和備擇假設(shè) 1、原假設(shè):對(duì)總體所作的論斷或推測(cè),指觀察到的差異只反映機(jī)會(huì)變異。記作H0。 2、備擇假設(shè):是指觀察到的差異是真實(shí)的。記作H1。 3、原假設(shè)和備擇假設(shè)合在一起,應(yīng)涵蓋我們所研究的總體特征的所有可能性。 編輯雙尾檢驗(yàn)和單尾檢驗(yàn) 采用雙尾檢驗(yàn)還是采用單尾檢驗(yàn)(以及左單尾還是右單尾),取決于備擇假設(shè)的形式。 表1:拒絕域的單、雙尾與備擇假設(shè)之間的對(duì)應(yīng)關(guān)系 拒絕域位置原假設(shè)備擇假設(shè) 雙尾H0: = 0左單尾(不可能有 > 0時(shí),H0: = 0)H1: < 0 右單尾(不可
42、能有 < 0時(shí),H0: = 0)H1: > 0 編輯顯著性檢驗(yàn)的作用 分析工作者常常用標(biāo)準(zhǔn)方法與自己所用的分析方法進(jìn)行對(duì)照試驗(yàn),然后用統(tǒng)計(jì)學(xué)方法檢驗(yàn)兩種結(jié)果是否存在顯著性差異。若存在顯著性差異而又肯定測(cè)定過(guò)程中沒(méi)有錯(cuò)誤,可以認(rèn)定自己所用的方法有不完善之處,即存在較大的系統(tǒng)誤差。 因此分析結(jié)果的差異需進(jìn)行統(tǒng)計(jì)檢驗(yàn)或顯著性檢驗(yàn)。 編輯顯著性檢驗(yàn)的基本思想 顯著性檢驗(yàn)的基本思想可以用小概率原理來(lái)解釋。 1、小概率原理:小概率事件在一次試驗(yàn)中是幾乎不可能發(fā)生的,假若在一次試驗(yàn)中事件 事實(shí)上發(fā)生了。那只能認(rèn)為事件 不是來(lái)自我們假設(shè)的總體,也就是認(rèn)為我們對(duì)總體所做的假設(shè)不正確。 2、觀察到的顯
43、著水平:由樣本資料計(jì)算出來(lái)的檢驗(yàn)統(tǒng)計(jì)量觀察值所截取的尾部面積為。這個(gè)概率越小,反對(duì)原假設(shè),認(rèn)為觀察到的差異表明真實(shí)的差異存在的證據(jù)便越強(qiáng),觀察到的差異便越加理由充分地表明真實(shí)差異存在。 3、檢驗(yàn)所用的顯著水平:針對(duì)具體問(wèn)題的具體特點(diǎn),事先規(guī)定這個(gè)檢驗(yàn)標(biāo)準(zhǔn)。 4、在檢驗(yàn)的操作中,把觀察到的顯著性水平與作為檢驗(yàn)標(biāo)準(zhǔn)的顯著水平標(biāo)準(zhǔn)比較,小于這個(gè)標(biāo)準(zhǔn)時(shí),得到了拒絕原假設(shè)的證據(jù),認(rèn)為樣本數(shù)據(jù)表明了真實(shí)差異存在。大于這個(gè)標(biāo)準(zhǔn)時(shí),拒絕原假設(shè)的證據(jù)不足,認(rèn)為樣本數(shù)據(jù)不足以表明真實(shí)差異存在。 5、檢驗(yàn)的操作可以用稍許簡(jiǎn)便一點(diǎn)的作法:根據(jù)所提出的顯著水平查表得到相應(yīng)的 值,稱作臨界值,直接用檢驗(yàn)統(tǒng)計(jì)量的觀察值與臨
44、界值作比較,觀察值落在臨界值所劃定的尾部?jī)?nèi),便拒絕原假設(shè);觀察值落在臨界值所劃定的尾部之外,則認(rèn)為拒絕原假設(shè)的證據(jù)不足。 編輯顯著性檢驗(yàn)的兩類錯(cuò)誤 1、顯著性檢驗(yàn)中的第一類錯(cuò)誤及其概率 顯著性檢驗(yàn)中的第一類錯(cuò)誤是指,原假設(shè)H0: = 0事實(shí)上正確,可是檢驗(yàn)統(tǒng)計(jì)量的觀察值卻落入拒絕域,因而否定了本來(lái)正確的假設(shè)。這是棄真的錯(cuò)誤。 發(fā)生第一類錯(cuò)誤的概率(記作 )也就是當(dāng)原假設(shè)H0: = 0正確時(shí)檢驗(yàn)統(tǒng)計(jì)量的觀察值落入拒絕域的概率。顯然,在雙尾檢驗(yàn)時(shí)是兩個(gè)尾部的拒絕域面積之和;在單尾檢驗(yàn)時(shí)是單尾拒絕域的面積。 2、顯著性檢驗(yàn)中的第二類錯(cuò)誤及其概率 顯著性檢驗(yàn)中的第二類錯(cuò)誤是指,原假設(shè)H0: = 0不正
45、確,而備擇假設(shè)H1: < 0或H1: > 0是正確的,可是檢驗(yàn)統(tǒng)計(jì)量的觀察值卻落入了接受域,因而沒(méi)有否定本來(lái)不正確的原假設(shè)。這是取偽的錯(cuò)誤。 發(fā)生第二類錯(cuò)誤的概率(記作 )是指,把來(lái)自的總體的樣本值代入檢驗(yàn)統(tǒng)計(jì)量所得結(jié)果落入接受域的概率。 3、和的關(guān)系 當(dāng)樣本容量一定時(shí),越小,就越大;反之,越大,就越小。 編輯顯著性檢驗(yàn)的P值1若用計(jì)算機(jī)統(tǒng)計(jì)軟件進(jìn)行假設(shè)檢驗(yàn), 我們會(huì)見(jiàn)到P值。將算得檢驗(yàn)統(tǒng)計(jì)量樣本值查表得的概率是就是P值(在那里我們稱之為觀察到的顯著水平)。 P值是怎么來(lái)的 從某總體中抽樣所得的樣本,其參數(shù)會(huì)與總體參數(shù)有所不同,這可能是由于兩種原因: 、這一樣本是由該總體抽出,其差
46、別是由抽樣誤差所致; 、這一樣本不是從該總體抽出,所以有所不同。 如何判斷是那種原因呢?統(tǒng)計(jì)學(xué)中用顯著性檢驗(yàn)賴判斷。其步驟是: 、建立檢驗(yàn)假設(shè)(又稱無(wú)效假設(shè),符號(hào)為H0):如要比較A藥和B藥的療效是否相等,則假設(shè)兩組樣本來(lái)自同一總體,即A藥的總體療效和B藥相等,差別僅由抽樣誤差引起的碰巧出現(xiàn)的。 、選擇適當(dāng)?shù)慕y(tǒng)計(jì)方法計(jì)算H0成立的可能性即概率有多大,概率用P值表示。 、根據(jù)選定的顯著性水平(0.05或0.01),決定接受還是拒絕H0。 如果P0.05,不能否定“差別由抽樣誤差引起”,則接受H0;如果P0.05或P 0.01,可以認(rèn)為差別不由抽樣誤差引起,可以拒絕H0,則可以接受令一種可能性的假
47、設(shè)(又稱備選假設(shè),符號(hào)為H1),即兩樣本來(lái)自不同的總體,所以兩藥療效有差別。 統(tǒng)計(jì)學(xué)上規(guī)定的P值意義見(jiàn)下表 P值碰巧的概率對(duì)無(wú)效假設(shè)統(tǒng)計(jì)意義 P0.05碰巧出現(xiàn)的可能性大于5%不能否定無(wú)效假設(shè)兩組差別無(wú)顯著意義 P0.05碰巧出現(xiàn)的可能性小于5%可以否定無(wú)效假設(shè)兩組差別有顯著意義 P 0.01碰巧出現(xiàn)的可能性小于1%可以否定無(wú)效假設(shè)兩者差別有非常顯著意義 理解P值,下述幾點(diǎn)必須注意: P的意義不表示兩組差別的大小,P反映兩組差別有無(wú)統(tǒng)計(jì)學(xué)意義,并不表示差別大小。因此,與對(duì)照組相比,C藥取得P0.05,D藥取得P 0.01并不表示D的藥效比C強(qiáng)。 P0.05時(shí),差異無(wú)顯著意義,根據(jù)統(tǒng)計(jì)學(xué)原理可知
48、,不能否認(rèn)無(wú)效假設(shè),但并不認(rèn)為無(wú)效假設(shè)肯定成立。在藥效統(tǒng)計(jì)分析中,更不表示兩藥等效。哪種將“兩組差別無(wú)顯著意義”與“兩組基本等效”相同的做法是缺乏統(tǒng)計(jì)學(xué)依據(jù)的。 統(tǒng)計(jì)學(xué)主要用上述三種P值表示,也可以計(jì)算出確切的P值,有人用P 0.001,無(wú)此必要。 顯著性檢驗(yàn)只是統(tǒng)計(jì)結(jié)論。判斷差別還要根據(jù)專業(yè)知識(shí)。 編輯顯著性檢驗(yàn)的結(jié)果 關(guān)于顯著性檢驗(yàn)的結(jié)果: (一)顯著性檢驗(yàn)回答什么問(wèn)題 我們所觀察到的差異(是純屬于機(jī)會(huì)變異,還是反映了真實(shí)的差異? 1、如果顯著性檢驗(yàn)得到差異顯著的結(jié)論這時(shí)并不能評(píng)價(jià)差異的大小和重要性。 2、顯著性檢驗(yàn)只能告訴我們差異是否在事實(shí)上存在,而不能回答差異產(chǎn)生的原因。 3、顯著性檢
49、驗(yàn)不能檢查我們對(duì)實(shí)驗(yàn)所作的設(shè)計(jì)是否有缺陷 (二)顯著性檢驗(yàn)回答問(wèn)題的方式 在表述顯著性檢驗(yàn)結(jié)論的時(shí)候,應(yīng)與檢驗(yàn)的邏輯推理相符。 當(dāng)檢驗(yàn)統(tǒng)計(jì)量的觀察值落在拒絕域時(shí),我們應(yīng)該說(shuō),樣本資料顯著地(或高度顯著地)表明,差異是存在的。 (三)對(duì)觀察到的顯著水平數(shù)值的評(píng)價(jià) 編輯顯著性檢驗(yàn)中的總體和樣本 1、顯著性檢驗(yàn)的對(duì)象是無(wú)限總體。 2、大樣本可能會(huì)使檢驗(yàn)統(tǒng)計(jì)量過(guò)分敏感。 3、從有限總體中抽取樣本用于顯著性檢驗(yàn)時(shí),必須作概率抽樣。 編輯顯著性檢驗(yàn)的步驟 顯著性檢驗(yàn)的一般步驟或格式,如下: 1、提出假設(shè) H0:_ H1:_ 同時(shí),與備擇假設(shè)相應(yīng),指出所作檢驗(yàn)為雙尾檢驗(yàn)還是左單尾或右單尾檢驗(yàn)。 2、構(gòu)造檢驗(yàn)
50、統(tǒng)計(jì)量,收集樣本數(shù)據(jù),計(jì)算檢驗(yàn)統(tǒng)計(jì)量的樣本觀察值。 3、根據(jù)所提出的顯著水平 ,確定臨界值和拒絕域。 4、作出檢驗(yàn)決策。 把檢驗(yàn)統(tǒng)計(jì)量的樣本觀察值和臨界值比較,或者把觀察到的顯著水平與顯著水平標(biāo)準(zhǔn)比較;最后按檢驗(yàn)規(guī)則作出檢驗(yàn)決策。當(dāng)樣本值落入拒絕域時(shí),表述成:“拒絕原假設(shè)”,“顯著表明真實(shí)的差異存在”;當(dāng)樣本值落入接受域時(shí),表述成:“沒(méi)有充足的理由拒絕原假設(shè)”,“沒(méi)有充足的理由表明真實(shí)的差異存在”。另外,在表述結(jié)論之后應(yīng)當(dāng)注明所用的顯著水平。 編輯總體均值為某定值的顯著性檢驗(yàn)總體均值的顯著性檢驗(yàn)可有雙尾、左單尾、右單尾三種不同的情況。下面就總體分布的不同情況,總體方差是否已知的不同情況以及樣本
51、大小的不同情況分別介紹檢驗(yàn)統(tǒng)計(jì)量和檢驗(yàn)規(guī)則。 一、總體為正態(tài)分布,總體方差已知,樣本不論大小 對(duì)于假設(shè):H0: = 0,在H0成立的前提下,有檢驗(yàn)統(tǒng)計(jì)量 如果規(guī)定顯著性水平為 ,在雙尾,左單尾,右單尾三種不同情形下,拒絕域分別為: 和;。 二、總體分布未知,總體方差已知,大樣本 對(duì)于假設(shè)H0: = 0,在H0成立的前提下,如果樣本足夠大(n30),近似地有檢驗(yàn)統(tǒng)計(jì)量 如果規(guī)定顯著性水平為a,在雙尾,左單尾,右單尾三種不同情形下,拒絕域分別為和;。 三、總體為正態(tài)分布,總體方差未知,小樣本 對(duì)于假設(shè)H0: = 0,在H0成立的前提下,有檢驗(yàn)統(tǒng)計(jì)量 如果規(guī)定顯著性水平為a,在雙尾,左單尾,右單尾三
52、種不同情形下,拒絕域分別為:和;。 四、總體分布未知,總體方差未知,大樣本 對(duì)于假設(shè)H0: = 0,在H0成立的前提下,如果總體偏斜適度,且樣本足夠大,近似地有檢驗(yàn)統(tǒng)計(jì)量 如果規(guī)定顯著性水平為a,在雙尾,左單尾,右單尾三種不同情形下,拒絕域分別為: 和; ; 編輯總體比例為某定值的顯著性檢驗(yàn)總體比例指的是隨機(jī)試驗(yàn)中某種指定事件出現(xiàn)的概率。隨機(jī)試驗(yàn)中某種指定事件出現(xiàn)叫做“成功”,把一次試驗(yàn)中成功的概率記作。 對(duì)于假設(shè)H0: = 0,在H0成立的前提下,如果,并且樣本容量足夠大,大到足以滿足時(shí),近似地有檢驗(yàn)統(tǒng)計(jì)量 其中p是樣本比例。 如果規(guī)定顯著性水平為a,在雙尾,左單尾,右單尾三種不同情形下,拒
53、絕域分別為: 和;。 編輯顯著性檢驗(yàn)應(yīng)注意的問(wèn)題 進(jìn)行顯著性檢驗(yàn)還應(yīng)注意以下幾個(gè)問(wèn)題: 1、要有合理的試驗(yàn)設(shè)計(jì)和準(zhǔn)確的試驗(yàn)操作,避免系統(tǒng)誤差、降低試驗(yàn)誤差,提高試驗(yàn)的準(zhǔn)確性和精確性。 2、選用的顯著性檢驗(yàn)方法要符合其應(yīng)用條件。由于研究變量的類型、問(wèn)題的性質(zhì)、條件、試驗(yàn)設(shè)計(jì)方法、樣本大小等的不同,所選用的顯著性檢驗(yàn)方法也不同,因而在選用檢驗(yàn)方法時(shí),應(yīng)認(rèn)真考慮其應(yīng)用條件和適用范圍。 3、選用合理的統(tǒng)計(jì)假設(shè)。進(jìn)行顯著性檢驗(yàn)時(shí),無(wú)效假設(shè)和備擇假設(shè)的選用,決定了采用兩尾檢驗(yàn)或是一尾檢驗(yàn)。4、正確理解顯著性檢驗(yàn)結(jié)論的統(tǒng)計(jì)意義。顯著性檢驗(yàn)結(jié)論中的“差異顯著”或“差異極顯著”不應(yīng)該誤解為相差很大或非常大,也不
54、能認(rèn)為在實(shí)際應(yīng)用上一定就有重要或很重要的價(jià)值?!帮@著”或“極顯著”是指表面差異為試驗(yàn)誤差可能性小于0.05或0.01,已達(dá)到了可以認(rèn)為存在真實(shí)差異的顯著水平。有些試驗(yàn)結(jié)果雖然表面差異大,但由于試驗(yàn)誤差大,也許還不能得出“差異顯著”的結(jié)論,而有些試驗(yàn)的結(jié)果雖然表面差異小,但由于試驗(yàn)誤差小,反而可能推斷為“差異顯著”。 顯著水平的高低只表示下結(jié)論的可靠程度的高低,即在0.01水平下否定無(wú)效假設(shè)的可靠程度為99,而在0.05水平下否定無(wú)效假設(shè)的可靠程度為95%。 “差異不顯著”是指表面差異為試驗(yàn)誤差可能性大于統(tǒng)計(jì)上公認(rèn)的概率水平0.05,不能理解為沒(méi)有差異。下“差異不顯著”的結(jié)論時(shí),客觀上存在兩種可能:一是無(wú)本質(zhì)差異,二是有本質(zhì)差異,但被試驗(yàn)誤差所掩蓋,表現(xiàn)不出差異的顯著性來(lái)。如果減小試驗(yàn)誤差或增大樣本容量,則可能表現(xiàn)出差異顯著性。顯著性檢驗(yàn)只是用來(lái)確定無(wú)效假設(shè)能否被否定,而不能證明無(wú)效假設(shè)是正確的。 5、統(tǒng)計(jì)分析結(jié)論的應(yīng)用,還要與經(jīng)濟(jì)效益等結(jié)合起來(lái)綜合考慮。 編輯常用顯著性檢驗(yàn) 1.t檢驗(yàn) 適用于計(jì)量資料、正態(tài)分布、方差具有齊性的兩組間小樣本比較。包括配對(duì)資料間、樣本與均數(shù)間、兩樣本均數(shù)間比較三種,三者的計(jì)算公式不能混淆。 2.t'檢驗(yàn) 應(yīng)用條件與t檢驗(yàn)大致相同,但t檢驗(yàn)用于兩組間方差不齊時(shí),t檢驗(yàn)的計(jì)算公式實(shí)際上是方差不齊時(shí)t檢
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年園林景觀工程施工監(jiān)理合同范本3篇
- 2024年度高端養(yǎng)生浴池租賃合作協(xié)議3篇
- 2024年標(biāo)準(zhǔn)協(xié)議免責(zé)條款模板版B版
- 2024年度文化旅游資源招商引資居間合同3篇
- 2024年度知識(shí)產(chǎn)權(quán)交易與評(píng)估合同范本3篇
- 2024年度校企合作人才培養(yǎng)與科研項(xiàng)目合作合同范本3篇
- 貴州省前期物業(yè)服務(wù)合同2025
- 定制代加工合同范例
- 火燒店加盟合同范例
- 網(wǎng)店運(yùn)營(yíng)兼職合同范例
- 2024年度院線電影導(dǎo)演聘請(qǐng)合同書(shū)3篇
- 《腦出血的診斷和治》課件
- 參加團(tuán)干部培訓(xùn)心得體會(huì)
- 中華民族共同體概論專家講座第一講中華民族共同體基礎(chǔ)理論
- 高中政治8.3.1 《區(qū)域性國(guó)際組織》(歐洲聯(lián)盟、亞太經(jīng)合組織)教學(xué)設(shè)計(jì)
- 通信網(wǎng)絡(luò)練習(xí)題庫(kù)+參考答案
- 專項(xiàng)11-角度計(jì)算的綜合大題-專題訓(xùn)練(培優(yōu)+拔尖)30道
- 2024青海海東市水務(wù)集團(tuán)限責(zé)任公司招聘27人高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 國(guó)有企業(yè)考勤制度管理辦法
- 人教版六年級(jí)上冊(cè)道德與法治知識(shí)點(diǎn)
- 人工智能學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
評(píng)論
0/150
提交評(píng)論