假設(shè)檢驗課件_第1頁
假設(shè)檢驗課件_第2頁
假設(shè)檢驗課件_第3頁
假設(shè)檢驗課件_第4頁
假設(shè)檢驗課件_第5頁
已閱讀5頁,還剩70頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

假設(shè)檢驗假設(shè)檢驗參數(shù)估計統(tǒng)計推斷在總體理論分布和小概率原理的基礎(chǔ)上,通過提出假設(shè)、確定顯著水平、計算統(tǒng)計數(shù)、做出推斷等步驟來完成在一定概率意義上的推斷。會出現(xiàn)兩類錯誤。參數(shù)估計又分為區(qū)間估計和點估計,與假設(shè)檢驗比較,二者主要是表示結(jié)果的形式不同,其本質(zhì)是一樣的。常見的假設(shè)檢驗有:一樣個本平均數(shù)的檢驗兩個樣本平均數(shù)的檢驗頻率檢驗U檢驗或Z檢驗t檢驗卡方檢驗F檢驗§1假設(shè)檢驗概述Hypothesistest

假設(shè)檢驗參數(shù)假設(shè)檢驗非參數(shù)假設(shè)檢驗總體分布已知,檢驗關(guān)于未知參數(shù)的某個假設(shè)總體分布未知時的假設(shè)檢驗問題

一、解決的基本問題利用兩組樣本信息,根據(jù)一定概率對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷.。

生產(chǎn)流水線上罐裝可樂不斷地封裝,然后裝箱外運(yùn).怎么知道這批罐裝可樂的容量是否合格呢?把每一罐都打開倒入量杯,看看容量是否合于標(biāo)準(zhǔn).這樣做顯然不行!罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)在350毫升和360毫升之間.每隔一定時間,抽查若干罐.如每隔1小時,抽查5罐,得5個容量的值X1,…,X5,根據(jù)這些值來判斷生產(chǎn)是否正常.

通常的辦法是進(jìn)行抽樣檢查.方法:事先對生產(chǎn)狀況提出一個假設(shè),然后利用樣本統(tǒng)計量的值檢驗提出的假設(shè)是否正確。

(二)備擇假設(shè)(alternativehypothesis),與原假設(shè)相對立(相反)的假設(shè)。一般為研究者想收集數(shù)據(jù)予以證實自己觀點的假設(shè)。用H1表示。表示形式:H1:總體參數(shù)≠某值(<)(>)

H0:(=355)例:H1:二、兩類假設(shè)(一)原假設(shè)(nullhypothesis),又稱零假設(shè),指檢驗前對總體參數(shù)值所做的假設(shè)。一般為研究者想收集證據(jù)予以反對的假設(shè)。用H0表示。表示形式:H0:總體參數(shù)=某值(≥)(≤)

例:三、假設(shè)檢驗的原理,如何判斷原假設(shè)H0是否成立呢?在實踐中普遍采用小概率原則:小概率事件在一次試驗中基本上不會發(fā)生.如果在H0條件下發(fā)生了小概率事件,則認(rèn)為H0不正確

四、雙側(cè)檢驗和單側(cè)檢驗(一)雙側(cè)檢驗與單側(cè)檢驗

(三類假設(shè)的形式,以均值為例)2、雙側(cè)檢驗的顯著性水平與拒絕域

如果統(tǒng)計量的值界于左、右臨界值間,則H0成立;

如果大于右臨界值或小于左臨界值,H0不成立。

抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕域拒絕域接受域1-置信水平(三)單側(cè)檢驗

1、定義:強(qiáng)調(diào)方向性的檢驗叫單側(cè)檢驗。目的在于檢驗研究對象是高于(右尾檢驗)或低于某一水平(左尾檢驗)。2、左尾檢驗(左側(cè)檢驗)例如:改進(jìn)生產(chǎn)工藝后,會使產(chǎn)品的生產(chǎn)時間降低到2小時以下建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:12H1:1

<

2

單下尾檢驗(左側(cè)檢驗)顯著性水平與拒絕域:

如果統(tǒng)計量的值大于左臨界值,則H0成立;如果小于左臨界值,H0不成立。

H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-置信水平右側(cè)檢驗顯著性水平與拒絕:

如果統(tǒng)計量值小于右臨界值,則H0成立;如果大于右臨界值,H0不成立。

H0值臨界值a樣本統(tǒng)計量拒絕域接受域抽樣分布1-置信水平觀察到的樣本統(tǒng)計量五、假設(shè)檢驗中的兩類錯誤(決策風(fēng)險)

如果H0實際上為真,但統(tǒng)計量的實測值落入了否定域,從而作出否定H0的結(jié)論,那就犯了“以真為假”的錯誤.

如果H0不成立,但統(tǒng)計量的實測值未落入否定域,從而沒有作出否定H0的結(jié)論,即接受了錯誤的H0,那就犯了“以假為真”的錯誤.請看下表/2/2H0

真H0

不真6062.56567.57072.57567.57072.57577.58082.5兩類錯誤的關(guān)系兩類錯誤是互相關(guān)聯(lián)的,當(dāng)樣本容量固定時,一類錯誤概率的減少導(dǎo)致另一類錯誤概率的增加.要同時降低兩類錯誤的概率,或者要在不變的條件下降低,需要增加樣本容量.baab六、假設(shè)檢驗的過程與步驟2、假設(shè)檢驗的步驟

提出原假設(shè)和備擇假設(shè)確定適當(dāng)?shù)挠嬎銠z驗統(tǒng)計量的公式規(guī)定顯著性水平由樣本信息,計算檢驗統(tǒng)計量的值作出統(tǒng)計決策提出原假設(shè)和備擇假設(shè)1、

提出原假設(shè)與備擇假設(shè)。H0、H1是對立的,“先將研究者收集證據(jù)要證明的觀點定為H1,再提出H0”。2、三種假設(shè)形式

H0:參數(shù)=某值

H1:參數(shù)某值雙側(cè)檢驗H0:參數(shù)某值

H1:參數(shù)

某值右尾檢驗H0:參數(shù)某值

H1:參數(shù)

某值左尾檢驗作出統(tǒng)計決策

(1)臨界值比較法

用計算出的統(tǒng)計量的值與雙側(cè)臨界值,或單側(cè)(左臨界值、右臨界值)比較。

(2)利用P值法

P值是指統(tǒng)計量值在分布曲線上所截取的剩余面積值,可由計算機(jī)自動給出。

無論是雙側(cè)還是單側(cè)檢驗問題:當(dāng)P≤α?xí)r,H0不成立;P>α?xí)r,H0成立

多重檢驗及校正

在同一研究中,有時我們會用到二次或多次顯著性檢驗,從上表可以看出,如果我們將顯著性水平確定為α=0.05水平,做一次顯著性檢驗后我們只能保證有95%的研究結(jié)果與真值是一致的;如果做兩次顯著性檢驗后,研究結(jié)果與真值的符合程度就會降至95%*95%=90.25,當(dāng)我們進(jìn)行5次顯著性檢驗后,就會降至77.4%,即在5次顯著性檢驗后,由α水平所得到的顯著性檢驗結(jié)果的可靠性只有3/4的可靠性。校正方法1:Bonferroni校正法----如果研究中進(jìn)行了n次顯著性檢驗,則將每次顯著性檢驗的水平降至0.05的n分之一倍。****或?qū)嶒灲Y(jié)果的P值的n倍,與0.05比較校正方法2:Newman-Keuls檢驗法(SNK,檢驗)校正方法3:最小顯著差法(LSD法)校正方法4:Q-value檢驗在同一個研究中,所有顯著性檢驗的p值的分布也是隨機(jī)的,符合一定的分布規(guī)律,因此可以通過這個特點對所得到的所有p值進(jìn)行校正,使之與總體相一致。§2樣本平均數(shù)的假設(shè)檢驗檢驗問題:用從總體中抽取的一個樣本的均值,檢驗該總體均值是否等于某個值。一、單樣本均值顯著性檢驗(One-samplettest)

例:食品安全要求防腐劑添加量必須低于0.1g/kg,如何檢驗市場中投放的康氏方便面是否達(dá)標(biāo)?方案:隨機(jī)抽檢20盒得到樣本“防腐劑添加量均值”與0.1g/kg比較得出結(jié)論**********SPSS分析********

方法1:總體方差已知時的檢驗1、假定條件總體服從正態(tài)分布若不服從正態(tài)分布,可用正態(tài)分布來近似(n30)2、原假設(shè):H0:=0備擇假設(shè):H1:0

使用z-統(tǒng)計量:方法2:總體方差未知時的均值檢驗

*(2未知,小樣本)1. 假定條件總體為正態(tài)分布2. 使用t統(tǒng)計量)1(~0--=ntn-1sxtm

方法3:近似正態(tài)分布的檢驗1t檢驗時,樣本大于302總體非正態(tài)分布,樣本大于300-=nsxZ'

m方法總結(jié)1、需要依據(jù)不同的數(shù)據(jù)特點選擇不同的分析方法2、特點分析1:檢驗數(shù)據(jù)分布是否為正態(tài)分布?3、特點分析2:抽樣數(shù)據(jù)樣本是大樣本還是小樣本?單樣本檢驗的SPSS分析操作1、檢驗數(shù)據(jù)分布是否為正態(tài)分布(非參數(shù)統(tǒng)計分析)2、無論是大樣本還是小樣本SPSS菜單:Analyze—》comparemean—》one-samplettest輸入μ0值(testvalue)與顯著性水平(confidenceinterval)值3、讀取結(jié)果:用sig.值與0.05比較進(jìn)行決策。

*單樣本檢驗結(jié)果讀取實例

檢驗問題:用兩個樣本平均數(shù)之間的差異值X1-X2檢驗所代表的兩個總體之間u1-u2是否有差異?

二、平均數(shù)差值的顯著性檢驗例:如何檢驗?zāi)撤N新型降壓藥的治療效果?方案:病例----對照研究隨機(jī)將高血壓病人分為兩組或用同一組病人服藥前、后得到兩個樣本均值差異值檢驗其是否等于“0”得出結(jié)論**********SPSS分析********

數(shù)據(jù)獲取與分析方案方案1:隨機(jī)分組服藥組服藥后平均血壓值統(tǒng)計分析方法:獨立樣本檢驗(Independent-samplesttest)方案2:配對分組服藥組服藥前平均血壓值統(tǒng)計分析方法:配對樣本檢驗(Paired-samplesttest)未服藥組平均血壓值服藥組服藥后平均血壓值(一)獨立樣本檢驗

(Independent-samplesttest)

用于處理生物學(xué)研究中比較不同處理效應(yīng)的差異顯著性。數(shù)據(jù)資料中,兩個樣本的各個變量從各自總體中抽取,兩個樣本之間變量沒有任何關(guān)聯(lián),即兩個抽樣樣本彼此獨立,不論兩個樣本容量是否相同。假定條件兩個樣本是獨立的隨機(jī)樣本兩個總體都是正態(tài)分布若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)原假設(shè)

H0:1-

2

=0

備擇假設(shè):H1:1-

2

0檢驗統(tǒng)計量或方法1:兩個總體方差都已知(或方差未知大樣本)有兩種方法可用于制造某種以抗拉強(qiáng)度為重要特征的產(chǎn)品。根據(jù)以往的資料得知,第一種方法生產(chǎn)出的產(chǎn)品其抗拉強(qiáng)度的標(biāo)準(zhǔn)差為8公斤,第二種方法的標(biāo)準(zhǔn)差為10公斤。從兩種方法生產(chǎn)的產(chǎn)品中各抽取一個隨機(jī)樣本,樣本容量分別為n1=32,n2=40,測得x2=50公斤,x1=44公斤。問這兩種方法生產(chǎn)的產(chǎn)品平均抗拉強(qiáng)度是否有顯著差別?(=0.05)例題

計算結(jié)果H0:

1-2=0H1:

1-2

0=

0.05n1=

32,n2

=

40臨界值(s):檢驗統(tǒng)計量:決策:結(jié)論:

拒絕H0有證據(jù)表明兩種方法生產(chǎn)的產(chǎn)品其抗拉強(qiáng)度有顯著差異Z01.96-1.96.025拒絕H0拒絕H0.025兩個總體方差未知,但相等。(1)假定條件兩個樣本是獨立隨機(jī)樣本兩個總體都是正態(tài)分布兩個總體方差未知但相等12=22(樣本方差差異不顯著)(2)假設(shè):原假設(shè)?備擇假設(shè)?(3)檢驗統(tǒng)計量其中:方法2:兩個總體方差未知,小樣本df=n1+n2-2例:用高蛋白和低蛋白兩種飼料飼養(yǎng)一月齡大白鼠,在三個月時,測定兩組大鼠的增重量(g)高蛋白組:134、146、106、119、124、161、107、83、113、129、97、123;低蛋白組:70、118、101、85、107、132、94;試問兩種飼料飼養(yǎng)是否有差別?假設(shè)方差相等

假設(shè)H0:μ1=

μ2

H1:μ1≠μ2

檢驗計算:

結(jié)論:在t分布中,當(dāng)df=17時,t0.05=2.112.

一個車間研究用兩種不同的工藝組裝某種產(chǎn)品所用的時間是否相同。讓一個組的10名工人用第一種工藝組裝該產(chǎn)品,平均所需時間為26.1分鐘,樣本標(biāo)準(zhǔn)差為12分鐘;另一組8名工人用第二種工藝組裝,平均所需時間為17.6分鐘,樣本標(biāo)準(zhǔn)差為10.5分鐘。已知用兩種工藝組裝產(chǎn)品所用時間服從正態(tài)分布,且s12=s22

。試問能否認(rèn)為用第二種方法組裝比用第一中方法組裝更好?(=0.05)例題(計算結(jié)果)H0:

1-2

0H1:

1-2>0=

0.05n1=10,n2

=

8臨界值(s):檢驗統(tǒng)計量:決策:結(jié)論:

接受H0沒有證據(jù)表明用第二種方法組裝更好t0拒絕域0.051.7459

兩個總體方差未知,但不相等(齊性)(1)

假定條件兩個樣本是獨立的隨機(jī)樣本兩個總體都是正態(tài)分布兩個總體方差未知但不相等1222(樣本方差差異顯著)(2)假設(shè):原假設(shè)?備擇假設(shè)?(3)檢驗統(tǒng)計量自由度為df’獨立樣本差異性檢驗SPSS操作SPSS菜單命令:AnalyzecomparemeanIndependent-samplesttest輸入檢驗變量、分組編號讀取結(jié)果:用sig.值與0.05比較進(jìn)行決策。*獨立樣本差異性檢驗結(jié)果分析(二)配對樣本檢驗

(Paired-samplesttest)

要求兩個樣本間配偶成對,每一對除隨機(jī)地給予不同處理外,其他試驗條件盡量一致。檢驗兩個相關(guān)總體的均值配對或匹配重復(fù)測量(前/后)假定條件兩個總體都服從正態(tài)分布如果不服從正態(tài)分布,可用正態(tài)分布來近似(n1

30,n230)配對樣本的t檢驗

(數(shù)據(jù)形式)例:在研究飲食中缺乏維生素E與肝中維生素A的關(guān)系時,將試驗動物按性別、體重等配成8對,并將每對中的兩差試驗動物用隨機(jī)分配法在正常飼料組和維生素E缺乏組,然后將試驗動物殺死,測定其肝中的維生素A的含量,其結(jié)果如下表,試檢驗兩組飼料對試驗動物肝中維生素A含量的作用是否有顯著差異。配對樣本的t檢驗

(檢驗統(tǒng)計量)樣本均值樣本標(biāo)準(zhǔn)差自由度df=nD-1統(tǒng)計量【例】一個以減肥為主要目標(biāo)的健美俱樂部聲稱,參加其訓(xùn)練班至少可以使減肥者平均體重減重8.5公斤以上。為了驗證該宣稱是否可信,調(diào)查人員隨機(jī)抽取了10名參加者,得到他們的體重記錄如下表:配對樣本的t檢驗

(例子)在

=0.05的顯著性水平下,調(diào)查結(jié)果是否支持該俱樂部的聲稱?屬于檢驗?zāi)稠椔暶鞯募僭O(shè)!配對樣本的t檢驗

(計算表)配對樣本的t檢驗

(計算結(jié)果)樣本均值樣本標(biāo)準(zhǔn)差H0:

m1–m2

8.5H1:m1–m2

<8.5a=0.05df=

10-1=9臨界值(s):檢驗統(tǒng)計量:決策:結(jié)論:

接受H0有證據(jù)表明該俱樂部的宣稱是可信的配對樣本的t檢驗

(計算結(jié)果)-1.833t0拒絕域.05配對樣本差異性檢驗SPSS操作SPSS菜單:AnalyzecomparemeanPaired-samplesttest輸入配對的檢驗變量讀取結(jié)果:用sig.值與0.05比較進(jìn)行決策。*配對樣本差異性檢驗結(jié)果分析§3樣本率的假設(shè)檢驗一、單樣本率的檢驗

研究問題用1個總體中抽樣樣本計算出的率,檢驗該總體率是否等于某個值。必須有一個總體報告率值或標(biāo)準(zhǔn)率值。方法:

假定條件樣本為大樣本總體近似服從正態(tài)分布假設(shè):H0:p=p0;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論