統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件

上傳人：l*** IP屬地：貴州上傳時(shí)間：2022-12-25 格式：PPTX 頁數(shù)：196 大?。?.30MB 積分：25 舉報(bào) 版權(quán)申訴

統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第2頁

統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第3頁

統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第4頁

統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件_第5頁

已閱讀5頁，還剩191頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

6-1本資料來源6-1本資料來源6-2統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-2統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-3第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原理第二節(jié)總體均值的假設(shè)檢驗(yàn)第三節(jié)總體比例的假設(shè)檢驗(yàn)第四節(jié)單因子方差分析第五節(jié)雙因子方差分析第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用6-3第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原6-4第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)二、原假設(shè)與備擇假設(shè)三、檢驗(yàn)統(tǒng)計(jì)量四、顯著性水平、P-值與臨界值五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-4第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)6-5一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N（μ,σ2）。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?，F(xiàn)從生產(chǎn)線抽取簡單隨機(jī)樣本n=100袋，測得其平均重量為=149.8克，樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線的裝袋凈重的期望值是否為150克（即問生產(chǎn)線是否處于控制狀態(tài)）?6-5一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線6-6

所謂假設(shè)檢驗(yàn)，就是事先對總體的參數(shù)或總體分布形式做出一個(gè)假設(shè)，然后利用抽取的樣本信息來判斷這個(gè)假設(shè)（原假設(shè)）是否合理，即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異，所以假設(shè)檢驗(yàn)又被稱為顯著性檢驗(yàn)。6-6所謂假設(shè)檢驗(yàn)，就是事先對總體的參數(shù)或總6-7

一個(gè)完整的假設(shè)檢驗(yàn)過程，包括以下幾個(gè)步驟：（1）提出假設(shè)；（2）構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量，并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值；（3）規(guī)定顯著性水平，建立檢驗(yàn)規(guī)則；（4）做出判斷。6-7一個(gè)完整的假設(shè)檢驗(yàn)過程，包括以下幾個(gè)步驟：6-8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示，通常是設(shè)定總體參數(shù)等于某值，或服從某個(gè)分布函數(shù)等；備擇假設(shè)是與原假設(shè)互相排斥的假設(shè)，原假設(shè)與備擇假設(shè)不可能同時(shí)成立。所謂假設(shè)檢驗(yàn)問題實(shí)質(zhì)上就是要判斷H0是否正確，若拒絕原假設(shè)H0

，則意味著接受備擇假設(shè)H1

。如在例6-1中，我們可以提出兩個(gè)假設(shè)：假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒有顯著差異，記為；假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異，記為。6-8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示，通常是設(shè)定總6-9三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量，就是根據(jù)所抽取的樣本計(jì)算的用于檢驗(yàn)原假設(shè)是否成立的隨機(jī)變量。檢驗(yàn)統(tǒng)計(jì)量中應(yīng)當(dāng)含有所要檢驗(yàn)的總體參數(shù)，以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計(jì)量的觀測結(jié)果。檢驗(yàn)統(tǒng)計(jì)量還應(yīng)該在“H0成立”的前提下有已知的分布，從而便于計(jì)算出現(xiàn)某種特定的觀測結(jié)果的概率。6-9三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量，就是根據(jù)所抽取的樣本計(jì)算6-106-106-116-116-12四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生，可以不予考慮。在假設(shè)檢驗(yàn)中，我們做出判斷時(shí)所依據(jù)的邏輯是：如果在原假設(shè)正確的前提下，檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值的出現(xiàn)屬于小概率事件，那么可以認(rèn)為原假設(shè)不可信，從而否定它，轉(zhuǎn)而接受備擇假設(shè)。6-12四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的6-13至于小概率的標(biāo)準(zhǔn)是多大？這要根據(jù)實(shí)際問題而定。假設(shè)檢驗(yàn)中，稱這一標(biāo)準(zhǔn)為顯著性水平，用來表示α，在應(yīng)用中，通常取α=0.01，α=0.05。一般來說，犯第一類錯(cuò)誤可能造成的損失越大，α的取值應(yīng)當(dāng)越小。對假設(shè)檢驗(yàn)問題做出判斷可依據(jù)兩種規(guī)則：一是P-值規(guī)則；二是臨界值規(guī)則。6-13至于小概率的標(biāo)準(zhǔn)是多大？這要根據(jù)實(shí)際問題而定。假設(shè)檢6-14（一）P-值規(guī)則所謂P-值，實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(大于或小于)具體樣本觀測值的概率。如果P-值小于所給定的顯著性水平，則認(rèn)為原假設(shè)不太可能成立；如果P-值大于所給定的標(biāo)準(zhǔn)，則認(rèn)為沒有充分的證據(jù)否定原假設(shè)。6-14（一）P-值規(guī)則6-15【例6-3】假定，根據(jù)例6-2的結(jié)果，計(jì)算該問題的P-值，并做出判斷。解：查標(biāo)準(zhǔn)正態(tài)概率表，當(dāng)z=2.29時(shí)，陰影面積為0.9890，尾部面積為1–0.9890=0.011，由對稱性可知，當(dāng)z=–2.29時(shí)，左側(cè)面積為0.011。

0.011≤α/2=0.0250.011這個(gè)數(shù)字意味著，假若我們反復(fù)抽取n=100的樣本，在100個(gè)樣本中僅有可能出現(xiàn)一個(gè)使檢驗(yàn)統(tǒng)計(jì)量等于或小于–2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平，所以，可以判斷μ=150的假定是錯(cuò)誤的，也就是說，根據(jù)觀測的樣本，有理由表明總體的與150克的差異是顯著存在的。6-15【例6-3】假定，根據(jù)例6-2的結(jié)果，計(jì)算該問題的P6-16（二）臨界值規(guī)則假設(shè)檢驗(yàn)中，還有另外一種做出結(jié)論的方法：根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)（它是概率密度曲線的尾部面積）查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值，稱作臨界值，直接用檢驗(yàn)統(tǒng)計(jì)量的觀測值與臨界值作比較，觀測值落在臨界值所劃定的尾部（稱之為拒絕域）內(nèi)，便拒絕原假設(shè)；觀測值落在臨界值所劃定的尾部之外（稱之為不能拒絕域）的范圍內(nèi)，則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗(yàn)結(jié)論的方法，我們稱之為臨界值規(guī)則。6-16（二）臨界值規(guī)則6-17顯然，P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候，只用其中一個(gè)規(guī)則即可。P-值規(guī)則較之臨界值規(guī)則具有更明顯的優(yōu)點(diǎn)。這主要是：第一，它更加簡捷；第二，在值規(guī)則的檢驗(yàn)結(jié)論中，對于犯第一類錯(cuò)誤的概率的表述更加精確。推薦使用P-值規(guī)則。6-17顯然，P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候6-18【例6-4】假定，根據(jù)例6-2的結(jié)果，用臨界值規(guī)則做出判斷。解：查表得到，臨界值z0.025=–1.96。由于

z=–2.29<–1.96，即，檢驗(yàn)統(tǒng)計(jì)量的觀測值落在臨界值所劃定的左側(cè)（即落在拒絕域），因而拒絕μ＝150克的原假設(shè)。上面的檢驗(yàn)結(jié)果意味著，由樣本數(shù)據(jù)得到的觀測值的差異提醒我們：裝袋生產(chǎn)線的生產(chǎn)過程已經(jīng)偏離了控制狀態(tài)，正在向裝袋重量低于技術(shù)標(biāo)準(zhǔn)的狀態(tài)傾斜。6-18【例6-4】假定，根據(jù)例6-2的結(jié)果，用臨界值規(guī)則做6-19五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)的拒絕域分配α/21–α

α/2–Zα/2

Zα/2

α–Zα0

α0Zα(a)雙側(cè)檢驗(yàn)(b)左側(cè)檢驗(yàn)(c)右側(cè)檢驗(yàn)6-19五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)6-20

表6-1拒絕域的單、雙側(cè)與備擇假設(shè)之間的對應(yīng)關(guān)系拒絕域位置P-值檢驗(yàn)的顯著性水平判斷標(biāo)準(zhǔn)原假設(shè)備擇假設(shè)雙側(cè)α/2H0:θ＝θ0H1:θ≠θ0左單側(cè)αH0:θ≥θ0H1:θ<θ0右單側(cè)αH0:θ≤θ0H1:θ>θ06-20表6-1拒絕域的單、雙側(cè)與備擇6-21六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-21六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-226-226-236-236-24七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解

這就是說，在假設(shè)檢驗(yàn)中，相對而言，當(dāng)原假設(shè)被拒絕時(shí)，我們能夠以較大的把握肯定備擇假設(shè)的成立。而當(dāng)原假設(shè)未被拒絕時(shí)，我們并不能認(rèn)為原假設(shè)確實(shí)成立。6-24七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-25第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)二、雙總體均值是否相等的檢驗(yàn)6-25第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)6-26一、單個(gè)總體均值的檢驗(yàn)6-26一、單個(gè)總體均值的檢驗(yàn)6-276-276-286-286-296-296-306-306-316-316-326-326-33二、雙總體均值是否相等的檢驗(yàn)6-33二、雙總體均值是否相等的檢驗(yàn)6-346-346-356-356-366-366-376-376-38【例6-6】某工廠為了比較兩種裝配方法的效率，分別組織了兩組員工，每組9人，一組采用新的裝配方法，另外一組采用舊的裝配方法。假設(shè)兩組員工設(shè)備的裝配時(shí)間均服從正態(tài)分布，兩總體的方差相等但未知?，F(xiàn)有18個(gè)員工的設(shè)備裝配時(shí)間見表6-2，根據(jù)這些數(shù)據(jù)，是否有理由認(rèn)為新的裝配方法更節(jié)約時(shí)間？（顯著性水平0.05）表6-2兩組員工設(shè)備的裝配時(shí)間單位：小時(shí)新方法（x2）353129253440273231舊方法（x1）3237353841443531346-38【例6-6】某工廠為了比較兩種裝配方法的效率，分別組6-396-396-406-406-416-416-42第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢驗(yàn)二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-42第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢6-43一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-43一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-446-446-45

【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱，某市小學(xué)生每月零花錢達(dá)到200元的比例為40%，某科研機(jī)構(gòu)為了檢驗(yàn)這個(gè)調(diào)查是否可靠，隨機(jī)抽選了100名小學(xué)生，發(fā)現(xiàn)有47人每月零花錢達(dá)到200元，調(diào)查結(jié)果能否證實(shí)早先調(diào)查40%的看法？（）6-45【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱，某市小學(xué)生每月零花錢6-466-466-47二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-47二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-486-486-49第四節(jié)單因子方差分析一、問題的提出二、方差分析的檢驗(yàn)統(tǒng)計(jì)量三、關(guān)于方差分析的兩點(diǎn)說明6-49第四節(jié)單因子方差分析一、問題的提出6-50一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同（假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等）。為此，他們對四組初始條件完全相同的小雞，在完全相同的其他飼養(yǎng)條件下，分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。表6-3四種不同飼料配方下小雞的增重情況飼料配方i小雞序號j38周后小雞個(gè)體增重yij(克)123456配方13704204504901730配方24903804003905004102570配方33303404003804701920配方441048040042038041025001600162016501680135082087206-50一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-51一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同（假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等）。為此，他們對四組初始條件完全相同的小雞，在完全相同的其他飼養(yǎng)條件下，分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。6-51一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-52對于類似本例的問題，一般地，把隨機(jī)變量分組的數(shù)目記作m，我們可建立下列假設(shè)：6-52對于類似本例的問題，一般地，把隨機(jī)變量分組的數(shù)目記作6-53二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-53二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-546-546-556-556-566-566-57【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析（顯著水平為α=0.05）。6-57【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析（6-586-586-596-596-606-606-61

表6-4方差分析表變異來源離差平方和自由度均方差值P-值臨界值組間7112.1432370.7141.012320.4115733.196774組內(nèi)39811.67172341.863總計(jì)46923.81206-61表6-4方差分析表變異離差自由6-62（一）方差分析中變量的類型方差分析中的因變量是數(shù)量型變量。自變量可以是品質(zhì)型變量，也可以是數(shù)量型變量。當(dāng)自變量是數(shù)量型變量的時(shí)候，也要對其作統(tǒng)計(jì)分組設(shè)計(jì)，也就是將它按品質(zhì)型變量來處理。（二）總體的正態(tài)性和同方差方差分析適用于多個(gè)正態(tài)總體Yi（i=1，2，…，m）均值的比較，且要求它們具有相同的方差。不過在實(shí)際應(yīng)用中，即使對于正態(tài)性和同方差性都存在很大背離的數(shù)據(jù)，方差分析仍不失為一種提供有用的近似信息的技術(shù)。三、關(guān)于方差分析的兩點(diǎn)說明6-62（一）方差分析中變量的類型三、關(guān)于方差分析的兩點(diǎn)說明6-63第五節(jié)雙因子方差分析一、問題的提出二、有交互作用的雙因子方差分析6-63第五節(jié)雙因子方差分析一、問題的提出6-64一、問題的提出

方差分析中的“因子”，也稱因素。它是一個(gè)獨(dú)立的變量（自變量）。在上一節(jié)的例子中，我們要分析飼料是否為影響增重產(chǎn)生差異的原因，所以飼料是因子。該例中所考察的因子只有“飼料”一個(gè)，而其他因子如雞的品種，飼養(yǎng)條件等保持不變，我們稱這種方差分析為單因子方差分析。如果要同時(shí)考察飼料和雞的品種兩個(gè)因子對小雞的增重是否有影響，則稱之為雙因子方差分析。6-64一、問題的提出方差分析中的“因子”，6-656-656-666-666-67

在這里要注意，不能把A的r個(gè)處理和B的c個(gè)處理看成“隨機(jī)樣本”。現(xiàn)在的rc個(gè)處理是rc個(gè)總體，即Ai和Bj的每一種搭配形成的組格都是一個(gè)總體（隨機(jī)變量Yij）。對一個(gè)組格總體的nij個(gè)觀測yij1,yij2,…,yij才是隨機(jī)樣本。我們把Ai與Bj的搭配所形成的組格總體即隨機(jī)變量Yij的期望值記作，于是可以寫出與表6-5（樣本）相應(yīng)的總體期望值表如表6-6。6-67在這里要注意，不能把A的r個(gè)處理和B6-686-686-696-696-706-706-716-716-726-726-73二、有交互作用的雙因子方差分析

樣本數(shù)據(jù)的方差分析恒等式。SST=SSA+SSB+SSAB+SSE（6.24）

式中,SST是總離差平方和，

SSA是A因子處理間的離差平方和，

SSB是B因子處理間的離差平方和，

SSAB是AB交互作用處理間的離差平方和，

SSE是組格內(nèi)離差平方和。

6-73二、有交互作用的雙因子方差分析樣本數(shù)據(jù)的方差6-746-746-756-756-766-766-776-776-786-786-796-796-806-806-816-816-826-826-83第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用一、假設(shè)檢驗(yàn)二、方差分析6-83第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用一、6-84一、假設(shè)檢驗(yàn)【例6-11】使用例6-1的數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)（顯著性水平0.05，雙側(cè)檢驗(yàn)）。解：操作步驟如下。1.構(gòu)造工作表，見圖6-2。圖中方框內(nèi)為計(jì)算所得數(shù)據(jù)，方框外為原始輸入數(shù)據(jù)。注意，如果給出了具體的樣本中每袋咖啡的重量，則樣本均值、標(biāo)準(zhǔn)差、樣本容量分別可以用AVERAGE函數(shù)、STDEV函數(shù)和COUNT函數(shù)進(jìn)行計(jì)算。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量Z（由于樣本容量較大，所以使用Z統(tǒng)計(jì)量）。在B6單元格輸入公式“=(B1-B2)/(B3/SQRT(B4))”。3.計(jì)算臨界值。在B7中輸入公式“=ABS(NORMSINV(B5/2))”，由于是雙側(cè)檢驗(yàn)，因此NORMSINV函數(shù)的參數(shù)必須是。6-84一、假設(shè)檢驗(yàn)【例6-11】使用例6-1的數(shù)據(jù)進(jìn)行6-854.計(jì)算p-值。在B8中輸入公式“=NORMSDIST(B6)”。5.根據(jù)以上的計(jì)算結(jié)果，使用臨界值規(guī)則或p-值規(guī)則進(jìn)行判斷，檢驗(yàn)統(tǒng)計(jì)量的觀測值落在拒絕域，因而拒絕μ=150克的原假設(shè)。圖6-26-854.計(jì)算p-值。在B8中輸入公式“=NORMSDIS6-86【例6-12】利用Excel求解例6-6的問題。6-86【例6-12】利用Excel求解例6-6的問題。6-876-876-88圖6-36-88圖6-36-89圖6-46-89圖6-46-906-906-91二、方差分析【例6-13】用Excel實(shí)現(xiàn)例6-8的計(jì)算過程。6-91二、方差分析【例6-13】用Excel實(shí)現(xiàn)例6-8的6-922.調(diào)出[方差分析：單因素方差分析]對話框，按圖6-6所示填寫。圖6-66-922.調(diào)出[方差分析：單因素方差分析]對話框，按圖6-6-936-936-946-946-95【例6-15】用Excel實(shí)現(xiàn)例6-10的計(jì)算過程1.輸入數(shù)據(jù)，如圖6-7所示。其中，B2:B4單元格存放的是在“A1”與“B1”因素水平共同作用下，進(jìn)行3次試驗(yàn)所得的結(jié)果；D5:D7單元格存放的是在“A3”與“B2”因素水平共同作用下，進(jìn)行3次試驗(yàn)所得的結(jié)果，其余類推。圖6-76-95【例6-15】用Excel實(shí)現(xiàn)例6-10的計(jì)算過程16-962.調(diào)出[方差分析：可重復(fù)雙因素分析]對話框，其填寫如圖6-8所示。該分析工具對話框與單因素方差分析對話框基本相同，只是多了一個(gè)[每一樣本的行數(shù)]編輯框，其中輸入包含在每個(gè)樣本中的行數(shù)。本例中，在每種不同因素水平組合下，分別進(jìn)行了3次試驗(yàn)，因此[每一樣本的行數(shù)]為“3”。每個(gè)樣本必須包含同樣的行數(shù)。另外，在該分析工具對話框中去掉了[標(biāo)志位于第一行]復(fù)選框，但要注意輸入?yún)^(qū)域必須包括因素水平標(biāo)志（“A1”、“B2”等）所在的單元格區(qū)域，也即，輸入?yún)^(qū)域?yàn)椤?A$1:$E$10”，而不是只包括數(shù)據(jù)的單元格區(qū)域“$B$2:$E$10”。6-962.調(diào)出[方差分析：可重復(fù)雙因素分析]對話框，其填寫6-973.單擊[確定]按鈕，得到方差分析表。圖6-86-973.單擊[確定]按鈕，得到方差分析表。圖6-86-98

本章小結(jié)6-98本章小結(jié)6-99本資料來源6-1本資料來源6-100統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-2統(tǒng)計(jì)學(xué)導(dǎo)論曾五一肖紅葉主編6-101第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原理第二節(jié)總體均值的假設(shè)檢驗(yàn)第三節(jié)總體比例的假設(shè)檢驗(yàn)第四節(jié)單因子方差分析第五節(jié)雙因子方差分析第六節(jié)Excel在假設(shè)檢驗(yàn)與方差分析中的應(yīng)用6-3第六章假設(shè)檢驗(yàn)與方差分析第一節(jié)假設(shè)檢驗(yàn)的基本原6-102第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)二、原假設(shè)與備擇假設(shè)三、檢驗(yàn)統(tǒng)計(jì)量四、顯著性水平、P-值與臨界值五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-4第一節(jié)假設(shè)檢驗(yàn)的基本原理一、什么是假設(shè)檢驗(yàn)6-103一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N（μ,σ2）。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?，F(xiàn)從生產(chǎn)線抽取簡單隨機(jī)樣本n=100袋，測得其平均重量為=149.8克，樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線的裝袋凈重的期望值是否為150克（即問生產(chǎn)線是否處于控制狀態(tài)）?6-5一、什么是假設(shè)檢驗(yàn)【例6-1】假定咖啡的分袋包裝生產(chǎn)線6-104

一個(gè)完整的假設(shè)檢驗(yàn)過程，包括以下幾個(gè)步驟：（1）提出假設(shè)；（2）構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量，并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值；（3）規(guī)定顯著性水平，建立檢驗(yàn)規(guī)則；（4）做出判斷。6-7一個(gè)完整的假設(shè)檢驗(yàn)過程，包括以下幾個(gè)步驟：6-106二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示，通常是設(shè)定總體參數(shù)等于某值，或服從某個(gè)分布函數(shù)等；備擇假設(shè)是與原假設(shè)互相排斥的假設(shè)，原假設(shè)與備擇假設(shè)不可能同時(shí)成立。所謂假設(shè)檢驗(yàn)問題實(shí)質(zhì)上就是要判斷H0是否正確，若拒絕原假設(shè)H0

，則意味著接受備擇假設(shè)H1

。如在例6-1中，我們可以提出兩個(gè)假設(shè)：假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒有顯著差異，記為；假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異，記為。6-8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示，通常是設(shè)定總6-107三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量，就是根據(jù)所抽取的樣本計(jì)算的用于檢驗(yàn)原假設(shè)是否成立的隨機(jī)變量。檢驗(yàn)統(tǒng)計(jì)量中應(yīng)當(dāng)含有所要檢驗(yàn)的總體參數(shù)，以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計(jì)量的觀測結(jié)果。檢驗(yàn)統(tǒng)計(jì)量還應(yīng)該在“H0成立”的前提下有已知的分布，從而便于計(jì)算出現(xiàn)某種特定的觀測結(jié)果的概率。6-9三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量，就是根據(jù)所抽取的樣本計(jì)算6-1086-106-1096-116-110四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生，可以不予考慮。在假設(shè)檢驗(yàn)中，我們做出判斷時(shí)所依據(jù)的邏輯是：如果在原假設(shè)正確的前提下，檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值的出現(xiàn)屬于小概率事件，那么可以認(rèn)為原假設(shè)不可信，從而否定它，轉(zhuǎn)而接受備擇假設(shè)。6-12四、顯著性水平、P-值與臨界值小概率事件在單獨(dú)一次的6-111至于小概率的標(biāo)準(zhǔn)是多大？這要根據(jù)實(shí)際問題而定。假設(shè)檢驗(yàn)中，稱這一標(biāo)準(zhǔn)為顯著性水平，用來表示α，在應(yīng)用中，通常取α=0.01，α=0.05。一般來說，犯第一類錯(cuò)誤可能造成的損失越大，α的取值應(yīng)當(dāng)越小。對假設(shè)檢驗(yàn)問題做出判斷可依據(jù)兩種規(guī)則：一是P-值規(guī)則；二是臨界值規(guī)則。6-13至于小概率的標(biāo)準(zhǔn)是多大？這要根據(jù)實(shí)際問題而定。假設(shè)檢6-112（一）P-值規(guī)則所謂P-值，實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(大于或小于)具體樣本觀測值的概率。如果P-值小于所給定的顯著性水平，則認(rèn)為原假設(shè)不太可能成立；如果P-值大于所給定的標(biāo)準(zhǔn)，則認(rèn)為沒有充分的證據(jù)否定原假設(shè)。6-14（一）P-值規(guī)則6-113【例6-3】假定，根據(jù)例6-2的結(jié)果，計(jì)算該問題的P-值，并做出判斷。解：查標(biāo)準(zhǔn)正態(tài)概率表，當(dāng)z=2.29時(shí)，陰影面積為0.9890，尾部面積為1–0.9890=0.011，由對稱性可知，當(dāng)z=–2.29時(shí)，左側(cè)面積為0.011。

0.011≤α/2=0.0250.011這個(gè)數(shù)字意味著，假若我們反復(fù)抽取n=100的樣本，在100個(gè)樣本中僅有可能出現(xiàn)一個(gè)使檢驗(yàn)統(tǒng)計(jì)量等于或小于–2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平，所以，可以判斷μ=150的假定是錯(cuò)誤的，也就是說，根據(jù)觀測的樣本，有理由表明總體的與150克的差異是顯著存在的。6-15【例6-3】假定，根據(jù)例6-2的結(jié)果，計(jì)算該問題的P6-114（二）臨界值規(guī)則假設(shè)檢驗(yàn)中，還有另外一種做出結(jié)論的方法：根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)（它是概率密度曲線的尾部面積）查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值，稱作臨界值，直接用檢驗(yàn)統(tǒng)計(jì)量的觀測值與臨界值作比較，觀測值落在臨界值所劃定的尾部（稱之為拒絕域）內(nèi)，便拒絕原假設(shè)；觀測值落在臨界值所劃定的尾部之外（稱之為不能拒絕域）的范圍內(nèi)，則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗(yàn)結(jié)論的方法，我們稱之為臨界值規(guī)則。6-16（二）臨界值規(guī)則6-115顯然，P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候，只用其中一個(gè)規(guī)則即可。P-值規(guī)則較之臨界值規(guī)則具有更明顯的優(yōu)點(diǎn)。這主要是：第一，它更加簡捷；第二，在值規(guī)則的檢驗(yàn)結(jié)論中，對于犯第一類錯(cuò)誤的概率的表述更加精確。推薦使用P-值規(guī)則。6-17顯然，P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候6-116【例6-4】假定，根據(jù)例6-2的結(jié)果，用臨界值規(guī)則做出判斷。解：查表得到，臨界值z0.025=–1.96。由于

z=–2.29<–1.96，即，檢驗(yàn)統(tǒng)計(jì)量的觀測值落在臨界值所劃定的左側(cè)（即落在拒絕域），因而拒絕μ＝150克的原假設(shè)。上面的檢驗(yàn)結(jié)果意味著，由樣本數(shù)據(jù)得到的觀測值的差異提醒我們：裝袋生產(chǎn)線的生產(chǎn)過程已經(jīng)偏離了控制狀態(tài)，正在向裝袋重量低于技術(shù)標(biāo)準(zhǔn)的狀態(tài)傾斜。6-18【例6-4】假定，根據(jù)例6-2的結(jié)果，用臨界值規(guī)則做6-117五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)的拒絕域分配α/21–α

α/2–Zα/2

Zα/2

α–Zα0

α0Zα(a)雙側(cè)檢驗(yàn)(b)左側(cè)檢驗(yàn)(c)右側(cè)檢驗(yàn)6-19五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)圖6-1雙側(cè)、單側(cè)檢驗(yàn)6-118

表6-1拒絕域的單、雙側(cè)與備擇假設(shè)之間的對應(yīng)關(guān)系拒絕域位置P-值檢驗(yàn)的顯著性水平判斷標(biāo)準(zhǔn)原假設(shè)備擇假設(shè)雙側(cè)α/2H0:θ＝θ0H1:θ≠θ0左單側(cè)αH0:θ≥θ0H1:θ<θ0右單側(cè)αH0:θ≤θ0H1:θ>θ06-20表6-1拒絕域的單、雙側(cè)與備擇6-119六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-21六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤6-1206-226-1216-236-122七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解

這就是說，在假設(shè)檢驗(yàn)中，相對而言，當(dāng)原假設(shè)被拒絕時(shí)，我們能夠以較大的把握肯定備擇假設(shè)的成立。而當(dāng)原假設(shè)未被拒絕時(shí)，我們并不能認(rèn)為原假設(shè)確實(shí)成立。6-24七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解6-123第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)二、雙總體均值是否相等的檢驗(yàn)6-25第二節(jié)總體均值的假設(shè)檢驗(yàn)一、單個(gè)總體均值的檢驗(yàn)6-124一、單個(gè)總體均值的檢驗(yàn)6-26一、單個(gè)總體均值的檢驗(yàn)6-1256-276-1266-286-1276-296-1286-306-1296-316-1306-326-131二、雙總體均值是否相等的檢驗(yàn)6-33二、雙總體均值是否相等的檢驗(yàn)6-1326-346-1336-356-1346-366-1356-376-136【例6-6】某工廠為了比較兩種裝配方法的效率，分別組織了兩組員工，每組9人，一組采用新的裝配方法，另外一組采用舊的裝配方法。假設(shè)兩組員工設(shè)備的裝配時(shí)間均服從正態(tài)分布，兩總體的方差相等但未知?，F(xiàn)有18個(gè)員工的設(shè)備裝配時(shí)間見表6-2，根據(jù)這些數(shù)據(jù)，是否有理由認(rèn)為新的裝配方法更節(jié)約時(shí)間？（顯著性水平0.05）表6-2兩組員工設(shè)備的裝配時(shí)間單位：小時(shí)新方法（x2）353129253440273231舊方法（x1）3237353841443531346-38【例6-6】某工廠為了比較兩種裝配方法的效率，分別組6-1376-396-1386-406-1396-416-140第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢驗(yàn)二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-42第三節(jié)總體比例的假設(shè)檢驗(yàn)一、單個(gè)總體比例的假設(shè)檢6-141一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-43一、單個(gè)總體比例的假設(shè)檢驗(yàn)6-1426-446-143

【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱，某市小學(xué)生每月零花錢達(dá)到200元的比例為40%，某科研機(jī)構(gòu)為了檢驗(yàn)這個(gè)調(diào)查是否可靠，隨機(jī)抽選了100名小學(xué)生，發(fā)現(xiàn)有47人每月零花錢達(dá)到200元，調(diào)查結(jié)果能否證實(shí)早先調(diào)查40%的看法？（）6-45【例6-7】一項(xiàng)調(diào)查結(jié)果聲稱，某市小學(xué)生每月零花錢6-1446-466-145二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-47二、兩個(gè)總體的比例是否相等的檢驗(yàn)6-1466-486-147第四節(jié)單因子方差分析一、問題的提出二、方差分析的檢驗(yàn)統(tǒng)計(jì)量三、關(guān)于方差分析的兩點(diǎn)說明6-49第四節(jié)單因子方差分析一、問題的提出6-148一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同（假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等）。為此，他們對四組初始條件完全相同的小雞，在完全相同的其他飼養(yǎng)條件下，分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。表6-3四種不同飼料配方下小雞的增重情況飼料配方i小雞序號j38周后小雞個(gè)體增重yij(克)123456配方13704204504901730配方24903804003905004102570配方33303404003804701920配方441048040042038041025001600162016501680135082087206-50一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-149一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)小雞所增加的體重服從正態(tài)分布。某養(yǎng)雞場欲檢驗(yàn)四種飼料配方對小雞增重的影響是否不相同（假定已經(jīng)經(jīng)過檢驗(yàn)表明不同飼料配方下的小雞增重方差相等）。為此，他們對四組初始條件完全相同的小雞，在完全相同的其他飼養(yǎng)條件下，分別使用四種不同的飼料配方進(jìn)行喂養(yǎng)。所得到的增重?cái)?shù)據(jù)如表6-3。6-51一、問題的提出【例6-8】已知在一組給定的條件下飼養(yǎng)6-150對于類似本例的問題，一般地，把隨機(jī)變量分組的數(shù)目記作m，我們可建立下列假設(shè)：6-52對于類似本例的問題，一般地，把隨機(jī)變量分組的數(shù)目記作6-151二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-53二、方差分析的檢驗(yàn)統(tǒng)計(jì)量6-1526-546-1536-556-1546-566-155【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析（顯著水平為α=0.05）。6-57【例6-9】利用表6-3中的數(shù)據(jù)進(jìn)行單因子方差分析（6-1566-586-1576-596-1586-606-159

表6-4方差分析表變異來源離差平方和自由度均方差值P-值臨界值組間7112.1432370.7141.012320.4115733.196774組內(nèi)39811.67172341.863總計(jì)46923.81206-61表6-4方差分析表變異離差自由6-160（一）方差分析中變量的類型方差分析中的因變量是數(shù)量型變量。自變量可以是品質(zhì)型變量，也可以是數(shù)量型變量。當(dāng)自變量是數(shù)量型變量的時(shí)候，也要對其作統(tǒng)計(jì)分組設(shè)計(jì)，也就是將它按品質(zhì)型變量來處理。（二）總體的正態(tài)性和同方差方差分析適用于多個(gè)正態(tài)總體Yi（i=1，2，…，m）均值的比較，且要求它們具有相同的方差。不過在實(shí)際應(yīng)用中，即使對于正態(tài)性和同方差性都存在很大背離的數(shù)據(jù)，方差分析仍不失為一種提供有用的近似信息的技術(shù)。三、關(guān)于方差分析的兩點(diǎn)說明6-62（一）方差分析中變量的類型三、關(guān)于方差分析的兩點(diǎn)說明6-161第五節(jié)雙因子方差分析一、問題的提出二、有交互作用的雙因子方差分析6-63第五節(jié)雙因子方差分析一、問題的提出6-162一、問題的提出

在這里要注意，不能把A的r個(gè)處理和B的c個(gè)處理看成“隨機(jī)樣本”?，F(xiàn)在的rc個(gè)處理是rc個(gè)總體，即Ai和Bj的每一種搭配形成的組格都是一個(gè)總體（隨機(jī)變量Yij）。對一個(gè)組格總體的nij個(gè)觀測yij1,yij2,…,yij才是隨機(jī)樣本。我們把Ai與Bj的搭配所形成的組格總體即隨機(jī)變量Yij的期望值記作，于是可以寫出與表6-5（樣本）相應(yīng)的總體期望值表如表6-6。6-67在這里要注意，不能把A的r個(gè)處理和B6-1666-686-1676-696-1686-706-1696-716-1706-726-171二、有交互作用的雙因子方差分析

樣本數(shù)據(jù)的方差分析恒等式。SST=SSA+SSB+SSAB+SSE（6.24）

式中,SST是總離差平方和，

SSA是A因子處理間的離差平方和，

SSB是B因子處理間的離差平方和，

SSAB是AB交互作用處理間的離差平方和，

SSE是組格內(nèi)離差平方和。

6-73

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計(jì)學(xué)之假設(shè)檢驗(yàn)與方差分析課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔