假設(shè)檢驗完全課件_第1頁
假設(shè)檢驗完全課件_第2頁
假設(shè)檢驗完全課件_第3頁
假設(shè)檢驗完全課件_第4頁
假設(shè)檢驗完全課件_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

假設(shè)檢驗假設(shè)檢驗是在兩種互相對立的行動之間,通過對樣本的試驗,在一定的保證條件下進行決策的統(tǒng)計分析方法。

假設(shè)檢驗在統(tǒng)計方法中的地位統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗(一)假設(shè)檢驗的意義和程序1.設(shè)立假設(shè)。2.作檢驗統(tǒng)計量。3.確定顯著性水平α及相應(yīng)的t值。4.確定拒絕域。5.作出決策。(二)假設(shè)檢驗的內(nèi)容1.雙側(cè)檢驗2.單側(cè)檢驗(一)假設(shè)檢驗的意義假設(shè)檢驗是抽樣推斷中的一項重要內(nèi)容。它是根據(jù)原資料作出一個總體指標是否等于某一個數(shù)值,某一隨機變量是否服從某種概率分布的假設(shè),然后利用樣本資料采用一定的統(tǒng)計方法計算出有關(guān)檢驗的統(tǒng)計量,依據(jù)一定的概率原則,以較小的風(fēng)險來判斷估計數(shù)值與總體數(shù)值(或者估計分布與實際分布)是否存在顯著差異,是否應(yīng)當(dāng)接受原假設(shè)選擇的一種檢驗方法。

(二)假設(shè)檢驗的步驟1.問題的提出:對問題詳加調(diào)查研究之后,根據(jù)試驗或觀察數(shù)據(jù)來選擇一個適宜的概率模型2.假設(shè)的設(shè)立:陳述假設(shè),即提出一個零假設(shè)和一個備擇假設(shè)3.確定檢驗統(tǒng)計量:識別被檢驗的統(tǒng)計量及其分布4.確定顯著性水平5.作出判斷:計算被檢驗的實際統(tǒng)計量之值,用實際統(tǒng)計量之值與臨界值比較,以確定接受或拒絕1.什么是假設(shè)檢驗假設(shè)檢驗是推論統(tǒng)計的重要內(nèi)容,是先對總體的未知數(shù)量特征作出某種假設(shè),然后抽取樣本,利用樣本信息對假設(shè)的正確性進行判斷的過程。統(tǒng)計假設(shè)有參數(shù)假設(shè)、總體分布假設(shè)、相互關(guān)系假設(shè)(兩個變量是否獨立,兩個分布是否相同)等。參數(shù)假設(shè)是對總體參數(shù)的一種看法??傮w參數(shù)包括總體均值、總體比例、總體方差等。分析之前必需陳述。我認為該企業(yè)生產(chǎn)的零件的平均長度為4厘米!例1:根據(jù)1989年的統(tǒng)計資料,某地女性新生兒的平均體重為3190克。為判斷該地1990年的女性新生兒體重與1989年相比有無顯著差異,從該地1990年的女性新生兒中隨機抽取30人,測得其平均體重為3210克。從樣本數(shù)據(jù)看,1990年女新生兒體重比1989年略高,但這種差異可能是由于抽樣的隨機性帶來的,也許這兩年新生兒的體重并沒有顯著差異。究竟是否存在顯著差異?可以先假設(shè)這兩年新生兒的體重沒有顯著差異,然后利用樣本信息檢驗這個假設(shè)能否成立。

這是一個關(guān)于總體均值的假設(shè)檢驗問題。例2:某種大量生產(chǎn)的袋裝食品,按規(guī)定每袋重量不得少于250克,現(xiàn)從一批該種食品中任意抽取50袋,發(fā)現(xiàn)有6袋重量低于250克。若規(guī)定食品不符合標準的比例達到5%就不得出廠,問該批食品能否出廠??梢韵燃僭O(shè)該批食品的不合格率不超過5%,然后用樣本不合格率來檢驗假設(shè)是否正確。這是一個關(guān)于總體比例的假設(shè)檢驗問題。什么是小概率原理?小概率原理——發(fā)生概率很小的隨機事件(小概率事件)在一次實驗中幾乎是不可能發(fā)生的。根據(jù)這一原理,可以先假設(shè)總體參數(shù)的某項取值為真,也就是假設(shè)其發(fā)生的可能性很大,然后抽取一個樣本進行觀察,如果樣本信息顯示出現(xiàn)了與事先假設(shè)相反的結(jié)果且與原假設(shè)差別很大,則說明原來假定的小概率事件在一次實驗中發(fā)生了,這是一個違背小概率原理的不合理現(xiàn)象,因此有理由懷疑和拒絕原假設(shè);否則不能拒絕原假設(shè)。檢驗中使用的小概率是檢驗前人為指定的。下面我們用一例說明這個原則.小概率事件在一次試驗中基本上不會發(fā)生.這里有兩個盒子,各裝有100個球.一盒中的白球和紅球數(shù)99個紅球一個白球…99個另一盒中的白球和紅球數(shù)99個白球一個紅球…99個小概率事件在一次試驗中基本上不會發(fā)生.現(xiàn)從兩盒中隨機取出一個盒子,問這個盒子里是白球99個還是紅球99個?假設(shè)其中真有99個白球,摸出紅球的概率只有1/100,這是小概率事件.這個例子中所使用的推理方法,可以稱為小概率事件在一次試驗中竟然發(fā)生了,不能不使人懷疑所作的假設(shè).帶概率性質(zhì)的反證法不妨稱為概率反證法.小概率事件在一次試驗中基本上不會發(fā)生.它不同于一般的反證法

概率反證法的邏輯是:如果小概率事件在一次試驗中居然發(fā)生,我們就以很大的把握否定原假設(shè).

一般的反證法要求在原假設(shè)成立的條件下導(dǎo)出的結(jié)論是絕對成立的,如果事實與之矛盾,則完全絕對地否定原假設(shè).在假設(shè)檢驗中,我們稱這個小概率為顯著性水平(Levelofsignificance),用表示.常取

簡而言之,我們確定拒絕原假設(shè)時究竟需要多大的把握性,取決于我們所涉及問題的重要性。

的選擇要根據(jù)實際情況而定.假設(shè)檢驗的基本思想...因此我們拒絕假設(shè)

=50...如果這是總體的真實均值樣本均值m=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20假設(shè)檢驗的兩個特點:第一,假設(shè)檢驗采用邏輯上的反證法,即為了檢驗一個假設(shè)是否成立,首先假設(shè)它是真的,然后對樣本進行觀察,如果發(fā)現(xiàn)出現(xiàn)了不合理現(xiàn)象,則可以認為假設(shè)是不合理的,拒絕假設(shè)。否則可以認為假設(shè)是合理的,接受假設(shè)。第二,假設(shè)檢驗采用的反證法帶有概率性質(zhì)。所謂假設(shè)的不合理不是絕對的,而是基于實踐中廣泛采用的小概率事件幾乎不可能發(fā)生的原則。至于事件的概率小到什么程度才算是小概率事件,并沒有統(tǒng)一的界定標準,而是必須根據(jù)具體問題而定。假設(shè)檢驗的兩個特點:

如果一旦判斷失誤,錯誤地拒絕原假設(shè)會造成巨大損失,那么拒絕原假設(shè)的概率就應(yīng)定的小一些;如果一旦判斷失誤,錯誤地接受原假設(shè)會造成巨大損失,那么拒絕原假設(shè)的概率就應(yīng)定的大一些。小概率通常用表示,又稱為檢驗的顯著性水平。通常取α=0.05或α=0.01,即把概率不超過0.05或0.01的事件當(dāng)作小概率事件。原假設(shè)和備擇假設(shè)例2.對于總體均值μ是否小于某一確定值μ0的原假設(shè)可以表示為:

H0:μ≤μ0(如H0:μ≤5%)

其對應(yīng)的備擇假設(shè)則表示為:H1:μ>μ0(如H1:μ>5%)注意:原假設(shè)總是有等號:=或≤或≥4.假設(shè)檢驗:雙側(cè)檢驗和單側(cè)檢驗根據(jù)假設(shè)的形式不同,假設(shè)檢驗可以分為雙側(cè)假設(shè)檢驗和單側(cè)假設(shè)檢驗。若原假設(shè)是總體參數(shù)等于某一數(shù)值,如H0:μ=μ0,即備擇假設(shè)H1:μ≠μ0,那么只要μ<μ0和μ>μ0二者中有一個成立,就可以否定原假設(shè)。這種假設(shè)檢驗稱為雙側(cè)檢驗。5.假設(shè)檢驗中的拒絕域和接受域在規(guī)定了檢驗的顯著性水平α后,根據(jù)容量為n的樣本,按照統(tǒng)計量的理論概率分布規(guī)律,可以確定據(jù)以判斷拒絕和接受原假設(shè)的檢驗統(tǒng)計量的臨界值。臨界值將統(tǒng)計量的所有可能取值區(qū)間分為兩個互不相交的部分,即原假設(shè)的拒絕域和接受域。對于正態(tài)總體,總體均值的假設(shè)檢驗可有如下圖示:正態(tài)總體,總體均值假設(shè)檢驗圖示:

(1)雙側(cè)檢驗設(shè)H0:μ=μ0,H1:μ≠μ0,有兩個臨界值,兩個拒絕域,每個拒絕域的面積為α/2。也稱雙尾檢驗。雙側(cè)檢驗示意圖μ0雙側(cè)檢驗示意圖

(顯著性水平與拒絕域)

抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域1-置信水平雙側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量雙側(cè)檢驗示意圖

(顯著性水平與拒絕域)

H0值臨界值臨界值

a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量雙側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量(2)單側(cè)檢驗

有一個臨界值,一個拒絕域,拒絕域的面積為α。分為左側(cè)檢驗和右側(cè)檢驗兩種情況。

單側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-置信水平1)左側(cè)檢驗設(shè)H0:μ≥μ0,H1:μ<μ0;臨界值和拒絕域均在左側(cè)。也稱下限檢驗。μ0左側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量左側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量2)右側(cè)檢驗設(shè)H0:μ≤μ0,H1:μ>μ0;臨界值和拒絕域均在右側(cè)。也稱上限檢驗。μ0右側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量右側(cè)檢驗示意圖(顯著性水平與拒絕域)

H0值臨界值a樣本統(tǒng)計量接受域抽樣分布1-置信水平拒絕域觀察到的樣本統(tǒng)計量6.假設(shè)檢驗的兩類錯誤根據(jù)假設(shè)檢驗做出判斷無非下述四種情況:原假設(shè)真實,并接受原假設(shè),判斷正確原假設(shè)不真實,且拒絕原假設(shè),判斷正確原假設(shè)真實,但拒絕原假設(shè),判斷錯誤原假設(shè)不真實,卻接受原假設(shè),判斷錯誤6.假設(shè)檢驗的兩類錯誤假設(shè)檢驗是依據(jù)樣本提供的信息進行判斷,有犯錯誤的可能。所犯錯誤有兩種類型:第一類錯誤是原假設(shè)H0為真時,檢驗結(jié)果把它當(dāng)成不真而拒絕了。犯這種錯誤的概率用α表示,也稱作α錯誤(αerror)或棄真錯誤。第二類錯誤是原假設(shè)H0不為真時,檢驗結(jié)果把它當(dāng)成真而接受了。犯這種錯誤的概率用β表示,也稱作β錯誤(βerror)或取偽錯誤。假設(shè)檢驗的兩類錯誤

正確決策和犯錯誤的概率可以歸納為下表:假設(shè)檢驗中各種可能結(jié)果的概率接受H0拒絕H0,接受H1H0

為真 1-α(正確決策)α(棄真錯誤)H0為偽β(取偽錯誤) 1-β(正確決策)假設(shè)檢驗兩類錯誤關(guān)系的圖示

以單側(cè)上限檢驗為例,設(shè)H0:μ≤μ0,H1:μ>μ0棄真錯誤區(qū)

取偽錯誤區(qū)

從上圖可以看出,如果臨界值沿水平方向右移,α將變小而β變大,即若減小α錯誤,就會增大犯β錯誤的機會;如果臨界值沿水平方向左移,α將變大而β變小,即若減小β錯誤,也會增大犯α錯誤的機會。圖(a)

μ≤μ0H0為真圖(b)μ=μ1>μ0H0為偽錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小在樣本容量n一定的情況下,假設(shè)檢驗不能同時做到犯α和β兩類錯誤的概率都很小。若減小α錯誤,就會增大犯β錯誤的機會;若減小β錯誤,也會增大犯α錯誤的機會。要使α和β同時變小只有增大樣本容量。但樣本容量增加要受人力、經(jīng)費、時間等很多因素的限制,無限制增加樣本容量就會使抽樣調(diào)查失去意義。因此假設(shè)檢驗需要慎重考慮對兩類錯誤進行控制的問題。7.假設(shè)檢驗中的P值(P-value)P值是用于確定是否拒絕原假設(shè)的另一重要工具,是現(xiàn)代統(tǒng)計檢驗中常用的檢驗統(tǒng)計量。傳統(tǒng)的統(tǒng)計量檢驗方法是事先確定檢驗的顯著性水平,明確拒絕域,檢驗時只要檢驗統(tǒng)計量的值落入拒絕域就拒絕原假設(shè)。但只給出檢驗結(jié)論可靠性(或犯棄真錯誤)的大致范圍,無法給出某一樣本觀測結(jié)果與原假設(shè)不一致程度的精確度量。P值是當(dāng)原假設(shè)為真時,得到特定樣本觀測結(jié)果及更極端結(jié)果的概率,其具體取值可以用計算機統(tǒng)計軟件計算出來。如果P值很小,說明這種樣本觀測結(jié)果出現(xiàn)的可能性很小,有理由拒絕原假設(shè)。P值越小,拒絕原假設(shè)的理由就越充分。影響P值的因素:樣本數(shù)據(jù)與原假設(shè)值之間的差異樣本量的大小被假設(shè)參數(shù)的總體分布利用P值進行假設(shè)檢驗的準則:將P值與事先確定的檢驗顯著性水平進行比較,若P值小于,說明小概率事件發(fā)生,則拒絕原假設(shè);若P值大于,說明小概率事件沒有發(fā)生,則不能拒絕原假設(shè)。雙側(cè)檢驗的P值圖示/

2

/

2

樣本統(tǒng)計量拒絕拒絕H0值臨界值計算出的統(tǒng)計量值計算出的統(tǒng)計量值臨界值1/2P值1/2P值抽樣分布圖左側(cè)檢驗的P值圖示H0值臨界值a樣本統(tǒng)計量拒絕域抽樣分布圖1-置信水平計算出的統(tǒng)計量值P值右側(cè)檢驗的P值圖示H0值臨界值a拒絕域抽樣分布圖1-置信水平計算出的統(tǒng)計量值P值樣本統(tǒng)計量8.假設(shè)檢驗的步驟1.問題的提出2.根據(jù)研究需要提出原假設(shè)H0和備擇假設(shè)H13.確定適當(dāng)?shù)臋z驗統(tǒng)計量4.確定顯著性水平α和臨界值及拒絕域5.作出拒絕或接受原假設(shè)的決策8.假設(shè)檢驗的步驟(續(xù)1)(一)根據(jù)研究需要提出原假設(shè)H0和備擇假設(shè)H1應(yīng)該注意:⑴對任一假設(shè)檢驗問題,其所有可能結(jié)果均應(yīng)包括在所提出的兩個對立假設(shè)中,原假設(shè)與對立假設(shè)總有一個、也只能有一個成立。⑵原假設(shè)一定要有等號:

或或。

原假設(shè)不是隨意提出的,應(yīng)該本著“不輕易拒絕原假設(shè)”的原則。雙側(cè)檢驗原假設(shè)與備擇假設(shè)的確定雙側(cè)檢驗屬于決策中的假設(shè)檢驗。即不論是拒絕H0還是接受H0,都必需采取相應(yīng)的行動措施。例如,某種零件的尺寸,要求其平均長度為10厘米,大于或小于10厘米均屬于不合格。待檢驗問題是該企業(yè)生產(chǎn)的零件平均長度是10厘米嗎?(屬于決策中的假設(shè))則建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:

=10H1:

10單側(cè)檢驗原假設(shè)與備擇假設(shè)的確定應(yīng)區(qū)別不同情況采取不同的建立假設(shè)方法。對于檢驗?zāi)稠椦芯渴欠襁_到了預(yù)期效果一般是將研究的預(yù)期效果(希望、想要證明的假設(shè))作為備擇假設(shè)H1,將認為研究結(jié)果無效作為原假設(shè)H0。先確立備擇假設(shè)H1。因為只有當(dāng)檢驗結(jié)果與原假設(shè)有明顯差別時才能拒絕原假設(shè)而接受備擇假設(shè),原假設(shè)不會輕易被拒絕,就使得希望得到的結(jié)論不會輕易被接受,從而減少結(jié)論錯誤。單側(cè)檢驗原假設(shè)與備擇假設(shè)的確定例1,有研究預(yù)計,采用新技術(shù)生產(chǎn)后將會使某產(chǎn)品的使用壽命明顯延長到1500小時以上。則建立的原假設(shè)與備擇假設(shè)應(yīng)為:

H0:

1500H1:

1500例2,有研究預(yù)計,改進生產(chǎn)工藝后會使某產(chǎn)品的廢品率降低到2%以下。則建立的原假設(shè)與備擇假設(shè)應(yīng)為:

H0:

2%H1:<2%單側(cè)檢驗原假設(shè)與備擇假設(shè)的確定對于檢驗?zāi)稠椔暶鞯挠行砸话憧蓪⑺鞯穆暶髯鳛樵僭O(shè)。將對該聲明的質(zhì)疑作為備擇假設(shè)。先確立原假設(shè)H0。因為除非有證據(jù)表明“聲明”無效,否則就應(yīng)認為該“聲明”是有效的。例1,某燈泡制造商聲稱,該企業(yè)生產(chǎn)的燈泡平均使用壽命在1000小時以上。通常除非樣本能提供證據(jù)表明使用壽命在1000小時以下,否則就應(yīng)認為廠商的聲稱是正確的。建立的原假設(shè)與備擇假設(shè)應(yīng)為:

H0:

1000H1:

<1000單側(cè)檢驗原假設(shè)與備擇假設(shè)的確定對于上述問題還可以結(jié)合不同背景建立假設(shè)。同樣的問題背景不同可以采用不同的原假設(shè)。例如,一商店經(jīng)常從某工廠購進某種商品,該商品質(zhì)量指標為μ,μ值愈大商品質(zhì)量愈好。商店提出的進貨條件是按批驗收,只有通過假設(shè)“μ≥μ0

”檢驗的批次才能接受。有兩種可能情況:⑴如果根據(jù)過去較長時間購貨記錄,商店相信該廠產(chǎn)品質(zhì)量好,于是同意把原假設(shè)定為μ≥μ0

,而且選擇較低的檢驗顯著性水平。這對工廠是有利的,使得達到質(zhì)量標準的產(chǎn)品以很小的概率被拒收。雖然這會使商店面臨接受不合標準產(chǎn)品的風(fēng)險,但歷史記錄顯示出現(xiàn)這種情況的可能性很小,而且商店也可因此獲得較好的貨源。⑵如果過去一段時期的記錄表明,該廠產(chǎn)品質(zhì)量并不理想,商店則會堅持以μ≤μ0為原假設(shè),并選定較小的檢驗顯著性水平。這對商店是有利的,不會輕易地拒絕原假設(shè),有1-α的可能把劣質(zhì)產(chǎn)品拒之門外。㈡確定適當(dāng)?shù)臋z驗統(tǒng)計量假設(shè)檢驗根據(jù)檢驗內(nèi)容和條件不同需要采用不同的檢驗統(tǒng)計量。在一個正態(tài)總體的參數(shù)檢驗中,Z統(tǒng)計量和t統(tǒng)計量常用于均值和比例的檢驗,2統(tǒng)計量用于方差的檢驗。選擇統(tǒng)計量需考慮的因素有被檢驗的參數(shù)類型、總體方差是否已知、用于檢驗的樣本量大小等。Z檢驗(單尾和雙尾)

t檢驗(單尾和雙尾)Z檢驗(單尾和雙尾)

2檢驗(單尾和雙尾)均值一個總體比例方差㈡確定適當(dāng)?shù)臋z驗統(tǒng)計量假設(shè)檢驗根據(jù)檢驗內(nèi)容和條件不同需要采用不同的檢驗統(tǒng)計量。在一個正態(tài)總體的參數(shù)檢驗中,Z統(tǒng)計量和t統(tǒng)計量常用于均值和比例的檢驗,2統(tǒng)計量用于方差的檢驗。選擇統(tǒng)計量需考慮的因素有被檢驗的參數(shù)類型、總體方差是否已知、用于檢驗的樣本量大小等。Z檢驗(單尾和雙尾)

t檢驗(單尾和雙尾)Z檢驗(單尾和雙尾)

2檢驗(單尾和雙尾)均值一個總體比例方差8.總體均值的假設(shè)檢驗

檢驗統(tǒng)計量的確定總體標準差是否已知?樣本容量n否是z檢驗

t檢驗小用樣本標準差S代替σz檢驗大幾種主要類型的假設(shè)檢驗實例1.總體方差σ2已知時均值的檢驗(歸納)假定條件總體服從正態(tài)分布若總體不服從正態(tài)分布,可用正態(tài)分布來近似(要求n30)使用Z統(tǒng)計量1.1總體方差σ2

已知時均值的雙側(cè)檢驗?zāi)硻C床廠加工一種零件,根據(jù)經(jīng)驗知道,以前加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標準差為=0.025。今換一種新機床進行加工,抽取n=200個零件進行檢驗,得到的橢圓度均值為0.076mm。試問新機床加工零件的橢圓度均值與以前有無顯著差異?(=0.05)屬于決策中的假設(shè)!解:已知:0=0.081mm,=0.025,n=200,

提出假設(shè):假定橢圓度與以前無顯著差異H0:=0.081H1:

0.081=0.05雙側(cè)檢驗/2=0.025

查表得臨界值:Z0.025=±1.96Z01.96-1.960.025拒絕H0拒絕H00.025決策:∵Z值落入拒絕域,∴在=0.05的水平上拒絕H0結(jié)論:有證據(jù)表明新機床加工的零件的橢圓度與以前有顯著差異得兩個拒絕域:

(-∞,-1.96)和(1.96,∞)計算檢驗統(tǒng)計量值:總體方差2

已知均值的檢驗

(P值的計算與應(yīng)用)第1步:進入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數(shù)”點擊第3步:在函數(shù)分類中點擊“統(tǒng)計”,在函數(shù)名的菜單下選擇字符“NORMSDIST”然后確定第4步:將Z的絕對值2.83錄入,得到的函數(shù)值為

0.9976726。表示標準正態(tài)分布曲線下Z值2.83左側(cè)的面積為0.9976726。雙側(cè)檢驗計算P值:2×(1-0.9976726)=0.0046548P值遠小于=0.05

,故拒絕H01.2總體方差σ2

已知時均值的單側(cè)檢驗(歸納)左側(cè):H0:0H1:<0統(tǒng)計量值必須顯著地小于0才能拒絕H0,大于0的值滿足H0,不能拒絕H0Z0拒絕H0右側(cè):H0:0H1:>0統(tǒng)計量值必須顯著地大于0才能拒絕H0,小于μ0的值滿足H0,不能拒絕H0Z0拒絕H01.2總體方差σ2已知時均值的單側(cè)檢驗(左檢驗舉例)某批發(fā)商欲從生產(chǎn)廠家購進一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時。已知燈泡使用壽命服從正態(tài)分布,標準差為20小時。在總體中隨機抽取100只燈泡,測得樣本均值為960小時。批發(fā)商是否應(yīng)該購買這批燈泡?(=0.05)屬于檢驗聲明的有效性!解:已知:0=1000小時,=20,n=100,

提出假設(shè):假定使用壽命平均不低于1000小時H0:1000H1:<1000=0.05左檢驗臨界值為負得臨界值:-Z0.05=-1.645計算檢驗統(tǒng)計量值:∵Z值落入拒絕域,∴在=0.05的顯著性水平上拒絕H0,接受H1有證據(jù)表明這批燈泡的使用壽命低于1000小時決策:結(jié)論:-1.645Z0拒絕域得拒絕域:(-∞,-1.645)1.3總體方差σ2已知時均值的單側(cè)檢驗(右檢驗舉例)根據(jù)過去大量資料,某廠生產(chǎn)的燈泡的使用壽命服從正態(tài)分布N~(1020,1002)?,F(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?(=0.05)屬于研究中的假設(shè)解:已知:0=1020小時,=100,n=16,

提出假設(shè):假定使用壽命沒有顯著提高H0:

1020H1:>1020=0.05右檢驗臨界值為正得臨界值:Z0.05=1.645計算檢驗統(tǒng)計量值:

∵Z值落入拒絕域,∴在=0.05的顯著性水平上拒絕H0,接受H1有證據(jù)表明這批燈泡的使用壽命有顯著提高決策:結(jié)論:Z0拒絕域0.051.645得拒絕域:(1.645,∞)2.1總體方差2未知時均值的雙側(cè)檢驗?zāi)硰S采用自動包裝機分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標準重量為1000克。某日隨機抽查9包,測得樣本平均重量為986克,樣本標準差為24克。試問在0.05的顯著性水平上,能否認為這天自動包裝機工作正常?屬于決策中的假設(shè)!解:已知:0=1000克,s=24,n=9,提出假設(shè):假定每包產(chǎn)品的重量與標準重量無顯著差異H0:=1000H1:

1000=0.05雙側(cè)檢驗/2=0.025df=9-1=8得臨界值:t0.025(8)=±2.306計算檢驗統(tǒng)計量值:

∵t值落入接受域,∴在=0.05的顯著性水平上接受H0有證據(jù)表明這天自動包裝機工作正常決策:結(jié)論:t02.306-2.3060.025拒絕H0拒絕H00.025得兩個拒絕域:

(-∞,-2.306)和(2.306,∞)總體方差2

未知小樣本均值的檢驗

(P值的計算與應(yīng)用)第1步:進入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數(shù)”點擊第3步:在函數(shù)分類中點擊“統(tǒng)計”,在函數(shù)名的菜單中選擇字符“TDIST”,然后確定第4步:在彈出的對話框錄入:在X欄中錄入計算出的t的絕對值1.75在自由度(Deg-freedom)欄中錄入8在Tails欄中錄入2,表明是雙側(cè)檢驗(單測檢驗則在該欄內(nèi)錄入1)顯示計算結(jié)果P值為0.118232783P值大于/2=0.025,故接受H02.2總體方差2未知時均值的單側(cè)檢驗

一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個由20個輪胎組成的隨機樣本作了試驗,測得平均值為41000公里,標準差為5000公里。已知輪胎壽命的公里數(shù)服從正態(tài)分布,我們能否根據(jù)這些數(shù)據(jù)作出結(jié)論,該制造商的產(chǎn)品同他所說的標準相符?(=0.05)屬于檢驗聲明有效性的假設(shè)!解:已知:0=40000公里,s=5000,n=20,

提出假設(shè):假定平均壽命不低于40000公里H0:40000H1:<40000=0.05左檢驗臨界值為負df=20-1=19得臨界值:-t0.05(19)=-1.7291計算檢驗統(tǒng)計量值:∵t值落入接受域,∴在=0.05的顯著性水平上接受H0結(jié)論:

有證據(jù)表明輪胎使用壽命顯著地大于40000公里,可以認為該制造商的聲稱是可信的。決策:

-1.7291t0拒絕域0.05得拒絕域:(-∞,-1.7291)3.總體均值與樣本均值間差異的檢驗例如,一個由50名學(xué)生組成的樣本其平均身高為174.94cm,標準差為6.42cm,假設(shè)樣本是抽自平均身高為172.50cm的總體,這樣樣本的值與總體均值間的誤差為:屬于抽樣誤差?假定顯著性水平為0.05。解:1.陳述假設(shè):2.識別檢驗統(tǒng)計量并計算3.規(guī)定顯著性水平:,則拒絕零假設(shè)。4.雙側(cè)檢驗如果這就是說,在0.05顯著性水平下,由平均身高174.94cm的50個學(xué)生所抽成的樣本,不是抽自平均身高為172.50cm的總體。也就是所觀察到的兩者的誤差,不是抽樣誤差。

5.因為,所以應(yīng)拒絕零假設(shè)。4.用置信區(qū)間進行檢驗一種袋裝食品每包的標準重量應(yīng)為1000克?,F(xiàn)從生產(chǎn)的一批產(chǎn)品中隨機抽取16袋,測得其平均重量為991克。已知這種產(chǎn)品重量服從標準差為50克的正態(tài)分布。試確定這批產(chǎn)品的包裝重量是否合格?(α=0.05)雙側(cè)檢驗解:提出假設(shè):H0:

=1000H1:

1000已知:n=16,σ=50,=0.05雙側(cè)檢驗/2=0.025

臨界值:Z0.025=±1.96置信區(qū)間為決策:結(jié)論:

在置信區(qū)間內(nèi),不拒絕H0可以認為這批產(chǎn)品的包裝重量合格Z01.96-1.960.025拒絕H0拒絕H00.025習(xí)題1:有科學(xué)家提出,如果人們在早餐中食用高纖維的谷物,那么平均而言,與早餐沒有食用谷物的人群相比,食用谷物者在午餐中攝取的熱量(大卡)將會減少.為了驗證這個假設(shè),隨機抽取了35人,詢問他們早餐和午餐的通常食譜,根據(jù)他們的食譜,將其分為二類,一類為經(jīng)常的谷類食用者(總體1),一類為非經(jīng)常谷類食用者(總體2).然后測定每人午餐的大卡攝取量.經(jīng)過一段時間的實驗,得到如下結(jié)果.試檢驗該假設(shè).35人大卡攝取量總體1568681636607555496540539519562589646596617584總體2650569622630596637628706617624563580711480688723651669709632解:所以拒絕,可以認為經(jīng)常的谷類食用者攝取的熱量少于不經(jīng)常食用者.t-檢驗:雙樣本異方差假設(shè).xls

規(guī)定,查表得,由于兩個總體均值之差的檢驗—用Excel進行檢驗第1步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】選項第2步:選擇【t檢驗,雙樣本異方差假設(shè)】

第3步:當(dāng)出現(xiàn)對話框后在【變量1的區(qū)域】方框內(nèi)輸入數(shù)據(jù)A1:A15

在【變量2的區(qū)域】方框內(nèi)輸入數(shù)據(jù)B1:B20

在【假設(shè)平均差】的方框內(nèi)輸入“0”

在【α】框內(nèi)鍵入“0.05”

在【輸出選項】中選擇輸出區(qū)域選擇【確定】

表:

兩個總體均值之差的檢驗習(xí)題2一個以減肥為主要目標的健美俱樂部聲稱,參加其訓(xùn)練班至少可以使肥胖者平均體重減輕8.5kg以上.為了驗證該宣稱是否可信,調(diào)查人員隨機抽取了10名參加者,得到他們的體重記錄如表1.在的水平下,調(diào)查結(jié)果是否支持該俱樂部的聲稱?表1訓(xùn)練前后的體重記錄單位:kg表2:差值樣本構(gòu)造表單位:kg

解:根據(jù)表2的差值,求得所以拒絕,可以認為該俱樂部的宣稱成立.t-檢驗:成對雙樣本均值分析.xls規(guī)定,查表得,由于從而案例:圣經(jīng)里真有密碼嗎?1994年8月,魏茨滕、芮普斯及羅森博格在期刊《StatisticalScience》中發(fā)表了一篇名為《圣經(jīng)創(chuàng)世記里的等距字母序列》的論文(以下簡稱魏文)?!癊quidistantLetterSequencesintheBookofGenesis”,StatisticalScience,429-438等距字母序列(ELS)早期的ELSSTSFGLOHAKEROLTOEIOPNOUAHEIVLSDOTNKEHALOMPHKEROFHARTRNYPMNALEONDDJGALF等距字母序列(ELS)(續(xù))“創(chuàng)世紀”第三十一章第二十八節(jié)為例子Andhastnotsufferedmetokissmysonsandmydaughters?Thouhastnowdonefoolishlyinsodoing.(又不容我與外孫和女兒告別,你所行的真是愚昧!)我們先把空格和標點符號去掉,合并成字符串:AndhastnotsufferedmetokissmysonsandmydaughtersThouhastnowdonefoolishlyinsodoing物理學(xué)家托馬斯(DavidThomas)以英王欽定版(KingJamesVersion)等距字母序列(ELS)(續(xù))AndhastnotsufferedmetokissmysonsandmydaughtersThouhastnowdonefoolishlyinsodoingROSWELL從”daughters”的r開始,跳過三個字母AndhastnotsufferedmetokissmysonsandmydaughtersThouhastnowdonefoolishlyinsodoingUFO提出假設(shè)思考題:魏茨滕、芮普斯及羅森博格應(yīng)該如何設(shè)置他們的假設(shè)???HO:三十二位教士的名字與他們出生死亡日期的排列是偶然的H1:三十二位教士的名字與他們出生死亡日期的排列并不是偶然的魏文的拉比(Rabbi)實驗

(A)選取樣本將希伯來文的創(chuàng)世紀排成無空隙的一長串

L=78,064字G=g1……gL

從EncyclopaediaofGreatMeninIsrael(9世紀至18世紀末)選出32位Rabbi定義:xi=名字;yi=出生、死亡日期取整數(shù)d(skip)及等距字母序列(ELS)

gn,gn+d,….,gn+(k-1)d,1≦n,n+(k-1)d≦L如果有多對相同,取距離最短的那對這樣的配對如此靠近純屬運氣嗎?魏文的拉比(Rabbi)實驗

(B)定義距離—設(shè)置檢驗統(tǒng)計量對一個二維度的字符串(xi,yi)定義一個距離c(xi,yi),目的在于將資料定量化魏文找到了一個距離,但是公式復(fù)雜、抽象,用一個類似的例子來說明假設(shè)現(xiàn)在有8對夫婦共16個人,我們姑且用數(shù)學(xué)上的數(shù)對符號(X1,Y1),(X2,Y2),(X3,Y3),---,(X8,Y8)來稱呼他們,亦即,X1和Y1是夫婦,X2和Y2是夫婦,以此類推,排成兩排吃飯。其中第一排坐先生,第二排坐太太,且假定先生的位置依次坐下,而太太們的作為可以改變。假設(shè)他們的排列次序(P1)如下我們就可以定義這個特定排列P1的距離為:D(P1)=

|1-7|+|2-4|+|3-2|+|4-8|+|5-6|+|6-3|+|7-5|+|8-1|=2612345678X1X2X3X4X5X6X7X8Y7Y4Y2Y8Y6Y3Y5Y1固定共有8!=40320種方法,距離的可能值為:{0,2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32}共有17種,這些距離值在8!中出現(xiàn)的次數(shù)分別為{1,7,33,115,327,765,1523,2553,3696,4852,5708,5892,5452,4212,2844,764,576}

。所以可以算出得到某一距離值的頻率,例如距離值為2的頻率是7/40320=0.000173611,距離值為32的頻率是576/40320=0.0142857。也可以畫出其分布圖。分布圖魏文中拉比實驗的距離試驗(1)魏文一共選擇了32位拉比,那么其排列方式就有32!種,32!》1030。如果用世界上最快的計算機(每秒萬億次)來計算,需要---年不可能完成,如何辦???拉比實驗的距離試驗(2)利用統(tǒng)計學(xué)的抽樣。利用電腦通過“簡單隨機抽樣”方式進行,分別抽取2萬,10萬,100萬個樣本。將樣本中的距離值用條形圖的方式表示出來。就得到后面的三個圖【圖1】樣本數(shù)為2萬個的條形圖,圖中1%的位置為距離值252,5%的位置為距離值278,50%的位置為距離值342,95%的位置為距離值404,99%的位置為距離值428,99.95%的位置為距離值4521%5%99.95%【圖2】樣本數(shù)為10萬個的長條圖,圖中1%的位置為距離值252,5%的位置為距離值278,50%的位置為距離值342,95%的位置為距離值402,99%的位置為距離值426,99.95%的位置為距離值454?!緢D3】樣本數(shù)為100萬個的長條圖,圖中1%的位置為距離值252,5%的位置為距離值278,50%的位置為距離值342,95%的位置為距離值402,99%的位置為距離值426,99.95%的位置為距離值454。從【圖1】至【圖3】可以看出95%以上的距離小于402,99%以上的距離小于426,而距離超過454的機率不會大于0.0005。魏茨滕等人的文章中說明,若以他們所定義的距離去計算那三十二位猶太教士,有關(guān)名字和生日的相關(guān)排列位置,其結(jié)果是應(yīng)該拒絕H0,而且其P值均遠低于0.05(實際上為0.00002),也就是說,那三十二位猶太教士的名字及生日的排列,「鐵定」是不尋常的。戰(zhàn)爭與和平(WarandPeace)對照實驗實驗結(jié)果不顯著LeoTolstoy1997年5月28日,TheNewYorkTimes全頁廣告TheBibleCode(圣經(jīng)密碼)作者:MichaelDrosnin(卓思寧)(前華盛頓郵報,華爾街日報記者)“根據(jù)密碼顯示,拉賓的名字和暗殺連在一起”(1994年9月給拉賓信,1995年11月拉賓死于刺客之下)期刊、數(shù)學(xué)家證明了密碼的存在。(同行審核的)摩西五經(jīng)(創(chuàng)世記、出埃及記、利未記、民數(shù)記、申命記)都發(fā)現(xiàn)藏有圣經(jīng)密碼是有東西在,可是是密碼嗎?對立假設(shè)是什么呢?(H1:三十二位教士的名字與他們出生死亡日期的排列并不是偶然的)批評:(1)Rips認為數(shù)學(xué)家的反應(yīng):F.P.Ramsey定理--宴會問題,完全的無秩序是不可能的戰(zhàn)爭與和平、白鯨記用相同的方法也藏有密碼批評(1)——同門相殘不能預(yù)測,有些“翻譯”的密碼統(tǒng)計意義不顯著數(shù)學(xué)家的反應(yīng)—Ramsey定理FrankPlumptonRamsey(1903-1930)PaulErd?s(1913-1996)Ramsey定理說,“世界上的事物不可能完全無序”。意思就是說,只要點數(shù)夠多,我們就可以在里面“看出”你要的任何圖像,所以你可以在夜空中看到各種星座;同理,叫一只猩猩在打字機上亂打,只要字母夠長,你可以找到你要的任意有意義的句子,Drosnin用計算機做所謂等距密碼,其實道理是一樣的.5.3.3對照實驗—《戰(zhàn)爭與和平》、《白鯨》中的密碼MichaelDrosnin反駁道:“你只要在《白鯨(MobyDick)》中找到密碼,I就服了U”澳大利亞國立大學(xué)的一位計算機教授--BrendanMcKay,找到了印度總理甘地被刺的“信息”:ORWITHAWHITEPNAHABYOUNGMANKLESHISGRANDDDSYETINGENERATHEBLOODYDEEDERMWHALESHEADTTOIMPOSSIBLE

IndianPrimeMinisterIndiraGandhiwaskilledonOct31,1984ORWITHAWHITEPNAHABYOUNGMANKLESHISGRANDDDSYETINGENERATHEBLOODYDEEDERMWHALESHEADTTOIMPOSSIBLE

ORWITHAWHITEPNAHABYOUNGMANKLESHISGRANDDDSYETINGENERATHEBLOODYDEED

ER

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論