常用顯著性檢驗

上傳人：奔*** IP屬地：河北上傳時間：2024-06-24 格式：PDF 頁數(shù)：39 大小：15.29MB 積分：12 舉報 版權申訴

已閱讀5頁，還剩34頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

常用顯著性檢驗

l.t檢驗

適用于計量資料、正態(tài)分布、方差具有齊性的兩組間小樣本比較。包

括配對資料間、樣本與均數(shù)間、兩樣本均數(shù)間比較三種，三者的計算公式

不能混淆。

2.t'檢驗

應用條件與t檢驗大致相同，但檢驗用于兩組間方差不齊時，tz

檢驗的計算公式實際上是方差不齊時t檢驗的校正公式。

3.U檢驗

應用條件與t檢驗基本一致，只是當大樣本時用U檢驗，而小樣本時

則用t檢驗，t檢驗可以代替U檢驗。

4.方差分析

用于正態(tài)分布、方差齊性的多組間計量比較。常見的有單因素分組的

多樣本均數(shù)比較及雙因素分組的多個樣本均數(shù)的比較，方差分析首先是比

較各組間總的差異，如總差異有顯著性，再進行組間的兩兩比較，組間比

較用q檢驗或LST檢驗等。

5.X2檢驗

是計數(shù)資料主要的顯著性檢驗方法。用于兩個或多個百分比（率）的比

較。常見以下幾種情況：四格表資料、配對資料、多于2行*2列資料及組

內(nèi)分組X2檢驗。

6.零反應檢驗

用于計數(shù)資料。是當實驗組或對照組中出現(xiàn)概率為0或100%

時，X2檢驗的一種特殊形式。屬于直接概率計算法。

7.符號檢驗、秩和檢驗和Ridit檢驗

三者均屬非參數(shù)統(tǒng)計方法，共同特點是簡便、快捷、實用?？捎糜诟?/p>

種非正態(tài)分布的資料、未知分布資料及半定量資料的分析。其主要缺點是

容易丟失數(shù)據(jù)中包含的信息。所以凡是正態(tài)分布或可通過數(shù)據(jù)轉換成正態(tài)

分布者盡量不用這些方法。

8.Hotelling檢驗

用于計量資料、正態(tài)分布、兩組間多項指標的綜合差異顯著性檢驗。

計量經(jīng)濟學檢驗方法討論

計量經(jīng)濟學中的檢驗方法多種多樣，而且在不同的假設前提之下，使

用的檢驗統(tǒng)計量不同，在這里我論述幾種比較常見的方法。

在討論不同的檢驗之前，我們必須知道為什么要檢驗，到底檢驗什么？

如果這個問題都不知道，那么我覺得我們很荒謬或者說是很模式化。檢驗

的含義是要確實因果關系，計量經(jīng)濟學的核心是要說因果關系是怎么樣的。

那么如果兩個東西之間沒有什么因果聯(lián)系，那么我們尋找的原因就不對。

那么這樣的結果是沒有什么意義的，或者說是意義不大的。那么檢驗對于

我們確認結果非常的重要，也是評價我們的結果是否擁有價值的關鍵因素。

所以要做統(tǒng)計檢驗。

t檢驗，t檢驗主要是檢驗單個。歸估計值或者說是參數(shù)估計值的顯著

性，什么是顯著性？也就是給定一個容忍程度，一個我們可以犯

錯誤的限度，錯誤分為兩類：1、本來是錯的但是我們認為是對的。2、

本來是對的我們認為是錯的。統(tǒng)計的檢驗主要是針對第一種錯誤而言的。

一般的計量經(jīng)濟學中的這個容忍程度是5%,也就是說可以容忍我們范第

一類錯誤的概率是5%。這樣說不準確，但是比較好理解。t-stastic是類似

標準正態(tài)化的正態(tài)分布兩一樣，也就是估計值減去假設值除以估計值得標

準差，一般假設值是0,這一點不難理解，如果是0,那么也就意味著沒

有因果關系。這個t-static在經(jīng)典假設之下服從t分布。t分布一般是和正

態(tài)分布差不多，尤其是當樣本的量足夠大的時候，一般的經(jīng)驗認為在樣本

數(shù)量大于120的時候，就可以看成是正態(tài)分布的。

F-statistc：F檢驗是屬于聯(lián)合檢驗比較重要的一種，主要的目的是用于

對于一系列的原因的是否會產(chǎn)生結果這樣一個命題做出的檢驗。F統(tǒng)計量

主要的產(chǎn)生來源是SSR\SST\SSE三個量。但是這個檢驗有一個缺點是必須

在經(jīng)典假設之下才能有效。

LM檢驗：這個檢驗的性質和F檢驗的性質是一樣的，都是檢驗聯(lián)合

顯著性的，不同的是F統(tǒng)計量符合F分布，但是LM統(tǒng)計量服從卡方分布。

卡方分布是正態(tài)分布的變量的平方和，而F分布是卡方分布的商，并且分

子和分布必須獨立，這就是為什么F檢驗適用范圍受限的原因。LM=n*SSR、

或者是

LM=n-SSRo

至于其他的White檢驗、Brusch-pagan檢驗（異方差的檢驗方法）、還

有序列相關的t檢驗、DW檢驗基本原來是相同的。

關于異方差檢驗、序列相關的檢驗其中存在不同的地方，但是思

想基本是相同的。

關于異方差檢驗的討論:

1>Brusch-pagan檢驗：這個檢驗的思路比較簡單，主要是要研究殘查

和X之間的關系，給定這樣的一個方程：u=b0+bl*xl+??+bn*xn+u'的

回歸，其中進行F檢驗和LM檢驗。如果檢驗通過那么不存在異方差，如

果不通過那么存在異方差。

2、White檢驗：這個檢驗也是對異方差的檢驗，但是這個檢驗不同的

是不僅對于X的一次方進行回歸，而且考慮到殘查和x的平方還有Xi*Xj

之間的關系。給定如下方程：u=bO+bl*y+b2*yA2+u'；o也是用F和LM

聯(lián)合檢驗來檢驗顯著性。如果通過那么不存在異方差，否則存在。

序列相關的檢驗方法的討論：

對于時間序列的問需要知道一個東西，也就是一介自回歸過程，也就

是一般在教科書中說到的：AR(1)過程，其中的道理主要是說在當期的變量

主要是取決于過去一個時期的變量和一個隨機誤差項。表示如下：

Ut=p*U(t-l)+eto在這里我要說到幾個概念問題,I⑴(一階積整)、1(0)(零

階積整)。其中的一介自回歸過程AR(1)就屬于零階積整過程，而一階積整

過程實際上是隨機游動和飄移的隨機游動過程。隨機游動過程：

Ut=U(t-l)+eto也就是在AR(1)的過程之下，其中的P是等于1的。飄移的

隨機游動過程：Ut=a+U(t-l)+eto其中隨機游動過程和AR⑴過程中的不同

點在于一個弱相依性的強弱問題，實際上我們在時間序列問題中，我們可

以認為任何一個過程是弱相依

的，但是問題的關鍵是我們不知道到底有多弱？或者更加直觀地說，

我們想知道P到底是多大，如果P是0.9或者是一個比較接近于1得數(shù)，

那么可能我們可以認為這個時間序列有高度持久性，這個概念表示當期的

變量卻絕于一個很早的時期的變量，比如一階積整過程，實際上et是一個

獨立統(tǒng)分布的變量，而且條件數(shù)學期望等于0,沒有異方差性。那么實際

上這個序列的數(shù)學期望是和期數(shù)沒有什么關系的。那么也就意味著從第0

期開始，U的數(shù)學期望值就是和很久以后的U的數(shù)學期望值一樣的。但是

方差就不同了，方差隨著時間的增加不斷擴大。我們知道了，這種不同的

概念就可以討論在一階自回歸的條件之下的檢驗問題，但是我們說一介自

回歸的過程是參差序列的特征而已，其他的變量的特征問題我們不談。

在討論檢驗的問題以前，我有必要交待一下時間序列在ols估計的時

候我們應該注意什么。實際上解決序列自相關問題最主要的問題就是一個

差分的方法。因為如果是長期持久的序列或者是不是長期持久的序列，那

么一定的差分就可以解除這種問題。

1、t檢驗。如果我們知道這個變量是一個一介自回歸的過程，如果我

們知道自回歸過程是AR(1)的。那么我們就可以這樣作，首先我們做OLS

估計，得到的參差序列我們認為是一階自相關的。那么為了驗證這種情況,

那么我們可以做Ut和U(t-l)的回歸，當然這里可以包含一個截距項。那么

我們驗證其中的參數(shù)的估計是不是顯著的，就用t檢驗。

t檢驗與F檢驗有什么區(qū)別

1.檢驗有單樣本t檢驗，配對t檢驗和兩樣本t檢驗。

單樣本t檢驗：是用樣本均數(shù)代表的未知總體均數(shù)和已知總體均數(shù)進

行比較，來觀察此組樣本與總體的差異性。

配對t檢驗：是采用配對設計方法觀察以下幾種情形，

1,兩個同質受試對象分別接受兩種不同的處理;

2,同一受試對象接受兩種不同的處理;

3,同一受試對象處理前后。

F檢驗又叫方差齊性檢驗。在兩樣本t檢驗中要用到F檢驗。從兩研

究總體中隨機抽取樣本，要對這兩個樣本進行比較的時候，首先要判斷兩

總體方差是否相同，即方差齊性。若兩總體方差相等，則直接用t檢驗，

若不等，可采用t'檢驗或變量變換或秩和檢驗等方法。其中要判斷兩

總體方差是否相等，就可以用F檢驗。

2.t檢驗和方差分析的前提條件及應用誤區(qū)用于比較均值的t檢驗可以

分成三類，

第一類是針對單組設計定量資料的；

第二類是針對配對設計定量資料的；

第三類則是針對成組設計定量資料的。

后兩種設計類型的區(qū)別在于事先是否將兩組研究對象按照某一個或

幾個方面的特征相似配成對子。無論哪種類型的t檢驗，都必須在

滿足特定的前提條件下應用才是合理的。

若是單組設計，必須給出一個標準值或總體均值，同時，提供一組定

量的觀測結果，應用t檢驗的前提條件就是該組資料必須服從正態(tài)分布；

若是配對設計，每對數(shù)據(jù)的差值必須服從正態(tài)分布；

若是成組設計，個體之間相互獨立，兩組資料均取自正態(tài)分布的總體,

并滿足方差齊性。

之所以需要這些前提條件，是因為必須在這樣的前提下所計算出的t

統(tǒng)計量才服從t分布，而t檢驗正是以t分布作為其理論依據(jù)的檢驗方法。

值得注意的是，方差分析與成組設計t檢驗的前提條件是相同的，即正態(tài)

性和方差齊性。

t檢驗是目前醫(yī)學研究中使用頻率最高，醫(yī)學論文中最常見到的處理

定量資料的假設檢驗方法。t檢驗得到如此廣泛的應用，究其原因，不外

乎以下幾點：現(xiàn)有的醫(yī)學期刊多在統(tǒng)計學方面作出了要求，研究結論需要

統(tǒng)計學支持；傳統(tǒng)的醫(yī)學統(tǒng)計教學都把t檢驗作為假設檢驗的入門方法進

行介紹，使之成為廣大醫(yī)學研究人員最熟悉的方法；t檢驗方法簡單，其

結果便于解釋。簡單、熟悉加上外界的要求，促成了t檢驗的流行。但是，

由于某些人對該方法理解得不全面，導致在應用過程中出現(xiàn)不少問題，有

些甚至是非常嚴重的錯誤，直接影響到結論的可靠性。將這些問題歸類,

可大致概括為以下兩種情況：不考慮t檢驗的應用前提，對兩組的比較一

律用t檢驗；

將各種實驗設計類型一律視為多個單因素兩水平設計，多次用t檢驗

進行均值之間的兩兩比較。

以上兩種情況，均不同程度地增加了得出錯誤結論的風險。而且，在

實驗因素的個數(shù)大于等于2時,無法研究實驗因素之間的交互作用的大小。

u檢驗和t檢驗區(qū)別與聯(lián)系

U檢驗和t檢驗可用于樣本均數(shù)與總體均數(shù)的比較以及兩樣本均數(shù)的

比較。理論上要求樣本來自正態(tài)分布總體。但在實用時，只要樣本例數(shù)n

較大，或n小但總體標準差。已知時，就可應用u檢驗；n小且總體標準

差。未知時，可應用t檢驗，但要求樣本來自正態(tài)分布總體。兩樣本均數(shù)

比較時還要求兩總體方差相等。

一、樣本均數(shù)與總體均數(shù)比較

比較的目的是推斷樣本所代表的未知總體均數(shù)u與已知總體均數(shù)u0

有無差別。通常把理論值、標準值或經(jīng)大量調(diào)查所得的穩(wěn)定值作為R0.根

據(jù)樣本例數(shù)n大小和總體標準差。是否已知選用u檢驗或t檢驗。

（-）u檢驗用于。已知或。未知但n足夠大［用樣本標準差s作為。

的估計值，代入式（19.6）］時。

以算得的統(tǒng)計量u,按表19-3所示關系作判斷。

表19-3U值、P值與統(tǒng)計結論

例19.3根據(jù)大量調(diào)查，已知健康成年男子脈搏均數(shù)為72次/分，標準

差為6.0次/分。某醫(yī)生在山區(qū)隨機抽查25名健康成年男子，求得其脈搏

均數(shù)為74.2次/分，能否據(jù)此認為山區(qū)成年男子的脈搏高于一般？據(jù)題意,

可把大量調(diào)查所得的均數(shù)72次/分與標準差6.0次/分看作為總體均數(shù)U0

和總體標準差。，樣本均數(shù)x為74.2次/分，樣本例數(shù)n為25.

HO：U=U0

Hl：Li>HO

a=0.05（單側檢驗）

算得的統(tǒng)計量u=1.833>1.645,PV0.05,按a=0.05檢驗水準拒絕H0,

可認為該山區(qū)健康成年男子的脈搏高于一般。

（二）t檢驗用于。未知且n較小時。

以算得的統(tǒng)計量t,按表19-4所示關系作判斷。

表19-4ItI值、P值與統(tǒng)計結論

例19.4若例19.3中總體標準差。未知，但樣本標準差已求出，s=6.5

次/分，余數(shù)據(jù)同例19.3.

據(jù)題意，與例19.3不同之處在于。未知，可用t檢驗。

HO：U=U0

Hl：UU0

a=0.05（單側檢驗）

本例自由度v=25-l=24,查t界值表（單側）（附表19-1）得005

（24）=1.711.算得的統(tǒng)計量t=1.692VL711,P>0.05,按a=0.05檢

驗水準不拒絕H0,尚不能認為該山區(qū)成年男子的脈搏高于一般。

二、配對資料的比較

在醫(yī)學研究中，常用配對設計。配對設計主要有四種情況：①同一受

試對象處理前后的數(shù)據(jù)；②同一受試對象兩個部位的數(shù)據(jù)；③同一樣品用

兩種方法（儀器等）檢驗的結果；④配對的兩個受試對象分別接受兩種處

理后的數(shù)據(jù)。情況①的目的是推斷其處理有無作用；情況②、③、④的目

的是推斷兩種處理（方法等）的結果有無差別。公式（19.8）

式中，0為差數(shù)年總體均數(shù)，因為假設處理前后或兩法無差別，則其

差數(shù)的均數(shù)應為0,d為一組成對數(shù)據(jù)之差d（簡稱差數(shù)）的均數(shù)，其計算

公式同式（18.1）；Sd為差數(shù)均數(shù)的標準誤，sd為差數(shù)年的標準差，計算

公式同式（18.3）；n為對子數(shù)。

因計算的統(tǒng)計量是3按表19-4所示關系作判斷。

例19.5應用某藥治療9例高血壓病人，治療前后舒張壓如表19-5,

試問用藥前后舒張壓有無變化？

表19-5高血壓病人用某藥治療前后的舒張壓（kPa）

HO：該藥治療前后的舒張壓無變化，即Hd=O

Hl：該藥治療前后的舒張壓有變化，即RdWO

a=0.05

自由度v=n-l=8,查t界值表得t0.05(8)=2.306,tO.Ol(8)=3.355,

本例t=3.714>t0.01(8),P<0.01,按a=0.05檢驗水準拒絕H0,接受Hl,

可認為治療前后舒張壓有變化，即該藥有降壓作用。

三、完全隨機設計的兩樣本均數(shù)的比較

亦稱成組比較。目的是推斷兩樣本各自代表的總體均數(shù)U1與U2是

否相等。根據(jù)樣本含量n的大小，分u檢驗與t檢驗。

(一)u檢驗可用于兩樣本含量nl、n2、均足夠大時，如均大于50

或100.

公式(19.9)

算得的統(tǒng)計量為u值，按表19-3所示關系作出判斷。

例19.6某地抽樣調(diào)查了部分健康成人紅細胞數(shù)，其中男性360人，均

數(shù)為4.660X1012/L,標準差為0.575X1012/L；女性255人,均數(shù)為4.178

X1012/L,標準差為0.291X1012/L,試問該地男、女紅細胞數(shù)的均數(shù)有無

差別？

HO：U=U0

Hl：LiU0

a=0.05

今xl=4.660X1012/L,sl=0.575X1012/L,nl=360；

x2=4.1781012/L,s2=0.2911012/L,n2=255.

算得的u=13.63>2.58,P<0.01,按Q=0.05檢驗水準拒絕HO,接受

Hl,可認為該地男女紅細胞數(shù)的均數(shù)不同，男性高于女性。

(二)t檢驗可用于兩樣本含量nl、n2較小時，且要求兩總體方差相

等，即方差齊(homoscedasticity)。若被檢驗的兩樣本方差相差較大且差

別有統(tǒng)計學意義則需用t檢驗。

公式(19.10)

公式(19.11)

公式(19.12)

式中sxl—x2,為兩樣本均數(shù)之差的標準誤，s2c為合并估計方差

(combinedestimatevariance)o算得的統(tǒng)計量為t,按表19-4所示關系作

出判斷。

例19.7某醫(yī)生統(tǒng)廣西瑤族和侗族正常婦女骨盆X線測量資料各50例。

骨盆入口前后徑：瑤族的均數(shù)為12.002(cm),標準差0.948(cm),侗族

相應的為11.456(cm)和1.215(cm)。問兩族婦女的骨盆入口前后徑是

否有差別？

HO：U1=U2

Hl：U1WU2

a=0.05

已知nl=n2=50,xl=12.002(cm),sl=0.948(cm)；

x2=11.456(cm),s2=1.215(cm)。

本例自由度v=nl+n2-2=98,查t界值表［表內(nèi)自由度一欄無98,可用

內(nèi)插法(從略)或用v=100估計］.T0.05(100)=1948,tO.Ol(100)=2.626,

今t=2.505>t0.05（1000,P<0.05,按a=0.05檢驗水準拒絕H0,接受Hl,

可認為廣西瑤族和侗族婦女骨盆入口前后徑不同，前者大于后者。

四、完全隨機設計的兩樣本幾何均數(shù)比較

醫(yī)學上有些資料為等比資料或正態(tài)分布資料，宜用幾何均數(shù)表示其平

均水平。比較兩樣本幾何均數(shù)的目的是推斷它們分別代表的總體幾何均數(shù)

是否相等。此種情況下，應先把原始數(shù)據(jù)X進行對數(shù)變換，用變換后的數(shù)

據(jù)代入式（19.10）、（19.11）、（19.12）計算t值。

例19.8將20名鉤端螺旋體病人的血清隨機分為兩組，分別用標準株

或水生株作凝溶試驗，測得稀釋倍數(shù)如下，問兩組的平均效價有無差別？

XI：標準株（11人）100,200,400,400,400,400,800,1600,

1600,1600,3200

X2：水生珠（9人）100,100,100,200,200,200,200,400,400

HO：Ul=li2

Hl：U1WP2

a=0.05

將兩組數(shù)據(jù)分別取對數(shù)，以對數(shù)作為新變量XI和X2.

XI：2.000,2.301,2.602,2.602,2.602,2.602,2.903,3.204,

3.204,3.204,3.505

X2：2.000,2.000,2.000,2.301,2.301,2.301,2.301,2.602,

2.602

用變換后的數(shù)據(jù)計算xl,S12；x2,s22再代入式（19.10）、（19.11）、

（19.12）計算t值。

xl=2.794,sl2=0.2043；x2=2.268,$22=0.0554

自由度v=ll+9-2=18,查t界值表得tO.Ol(18)=2.878,今t=3.150>

2.878,P<0.01,按a=0.05檢驗水準拒絕HO,接受Hl,可認為兩組平均

效價不同，標準株高于水生株。

???/blog/item/54edcd02c2f4ea23bl35ldda.html

方差分析與兩樣本T檢驗區(qū)別

方差分析與兩樣本T檢驗。

lo首先可以看到方差分析(ANOVA)包含兩樣本T檢驗，把兩樣本T

檢？

驗作為自己的特例。

因為ANOVA可以比較多個總體的均值,當然包含兩個總體作為特例。

實際上，T的平方就是F統(tǒng)計量(m個自由度的T分布之平方恰為自由度

為(Lm)的F分布。因此，這時候二者檢驗效果完全相同。T檢驗和ANOVA

檢驗對于所要求的條件也相同：

1)各個組的樣本數(shù)據(jù)內(nèi)部要相互獨立，

2)各組皆要正態(tài)分布

3)各總體的方差相等。

上述這3個條件完全相同。

2。如果說要指出差別，則區(qū)別僅在下列一點上：

用ANOVA檢驗兩總體均值相等性時，只限于這樣的雙側檢驗問題，

BP：HO：mul=MU2<->Ha:mulnot=mu2

而兩樣本的T檢驗則可以比上述情況更廣泛，對立假設可以是下面3

種中的任何一種.

Ha:mul>mu2

Ha:mul<mu2

Ha:mulnot=mu2

這樣說來，兩樣本均值相等性檢驗雖然可以用ANOVA做，但這沒有任

何好處，反而使得對立假設受到限制，因而還是T檢驗更好。

其他表述：

t檢驗與方差分析，主要差異在于,t檢驗一般使用在單樣本或雙樣本的

檢驗,方差分析用于2個樣本以上的總體均值的檢驗.同樣，雙樣本也可以使

用方差分析，多樣本也可以使用t檢驗,不過,t檢驗只能是所有總體兩兩檢

驗而已.

兩種方法與樣本量沒有直接關系，而是與數(shù)據(jù)的分布有關系，如果數(shù)據(jù)

是正態(tài)分布的，那不管是小樣本或大樣本，利用萊維-林德伯格中心極限定理

的原理渚B是可以用的,如果數(shù)據(jù)非正態(tài)分布，那只能使用大樣本利用李雅普

諾夫中心極限定理的原理進行2t檢驗，此時不能利用方差分析，因為方差分

析三個條件之一就是正態(tài)分布.

T檢驗及其與方差分析的區(qū)別

假設檢驗是通過兩組或多組的樣本統(tǒng)計量的差別或樣本統(tǒng)計量與總

體參數(shù)的差異來推斷他們相應的總體參數(shù)是否相同。

t檢驗：

1.單因素設計的小樣本（n<50）計量資料

2.樣本來自正態(tài)分布總體

3.總體標準差未知

4.兩樣本均數(shù)比較時，要求兩樣本相應的總體方差相等？根據(jù)研究設

計t檢驗可由三種形式：

-單個樣本的t檢驗

-配對樣本均數(shù)t檢驗(非獨立兩樣本均數(shù)t檢驗)

-兩個獨立樣本均數(shù)t檢驗

(1)單個樣本t檢驗

?又稱單樣本均數(shù)t檢驗(onesamplettest),適用于樣本均數(shù)與已知總

體均數(shù)u0的比較，其比較目的是檢驗樣本均數(shù)所代表的總

體均數(shù)u是否與已知總體均數(shù)u0有差別。

?已知總體均數(shù)R0一般為標準值、理論值或經(jīng)大量觀察得到的較

穩(wěn)定的指標值。

?單樣t檢驗的應用條件是總體標準s未知的小樣本資料(如n<5O),

且服從正態(tài)分布。

(2)配對樣本均數(shù)t檢驗

?配對樣本均數(shù)t檢驗簡稱配對t檢驗(pairedttest),又稱非獨立兩樣本

均數(shù)t檢驗，適用于配對設計計量資料均數(shù)的比較，其比較目的是檢驗兩相

關樣本均數(shù)所代表的未知總體均數(shù)是否有差別。？配對設計(paireddesign)

是將受試對象按某些重要特征相近的原則配成對子，每對中的兩個個體隨

機地給予兩種處理。

?應用配對設計可以減少實驗的誤差和控制非處理因素，提高統(tǒng)計處

理的效率。

?配對設計處理分配方式主要有三種情況:

①兩個同質受試對象分別接受兩種處理，如把同窩、同性別和體重相

近的動物配成一對，或把同性別和年齡相近的相同病情病人配成一對；

②同一受試對象或同一標本的兩個部分，隨機分配接受兩種不同處理,

如例5.2資料；

③自身對比(self-contrast)。即將同一受試對象處理(實驗或治療)前

后的結果進行比較，如對高血壓患者治療前后、運動員體育運動前后的某

一生理指標進行比較。

(3)兩獨立樣本t檢驗

兩獨立樣本t檢驗(twoindependentsamplest-test),又稱成組t檢驗。

?適用于完全隨機設計的兩樣本均數(shù)的比較，其目的是檢驗兩樣本所

來自總體的均數(shù)是否相等。

?完全隨機設計是將受試對象隨機地分配到兩組中，每組對象分別接

受不同的處理，分析比較處理的效應?；蚍謩e從不同總體中隨機抽樣進行

研究。

?兩獨立樣本t檢驗要求兩樣本所代表的總體服從正態(tài)分布N(U1,

。12)和1\1(112,o22),且兩總體方差。12、。22相等，即方差齊性

(homogeneityofvariance,homoscedasticity)0

?若兩總體方差不等,即方差不齊，可采用檢驗，或進行變量變換，

或用秩和檢驗方法處理。

t檢驗中的注意事項

1.假設檢驗結論正確的前提作假設檢驗用的樣本資料，必須能代表

相應的總體，同時各對比組具有良好的組間均衡性，才能得出有意義的統(tǒng)計

結論和有價值的專業(yè)結論。這要求有嚴密的實驗設計和抽樣設計，如樣本是

從同質總體中抽取的一個隨機樣本，試驗單位在干預前隨機分組，有足夠的

樣本量等。

2.檢驗方法的選用及其適用條件，應根據(jù)分析目的、研究設計、資料

類型、樣本量大小等選用適當?shù)臋z驗方法。t檢驗是以正態(tài)分布為基礎的，

資料的正態(tài)性可用正態(tài)性檢驗方法檢驗予以判斷。若資料為非正態(tài)分布，

可采用數(shù)據(jù)變換的方法，嘗試將資料變換成正態(tài)分布資料后進行分析。

3.雙側檢驗與單側檢驗的選擇需根據(jù)研究目的和專業(yè)知識予以選擇。

單側檢驗和雙側檢驗中的t值計算過程相同，只是t界值不同，對同一資

料作單側檢驗更容易獲得顯著的結果。單雙側檢驗的選擇，應在統(tǒng)計分析

工作開始之前就決定，若缺乏這方面的依據(jù)，一般應選用雙側檢驗。

4.假設檢驗的結論不能絕對化假設檢驗統(tǒng)計結論的正確性是以概率

作保證的，作統(tǒng)計結論時不能絕對化。在報告結論時，最好列出概率P的

確切數(shù)值或給出P值的范圍，如寫成0.02<P<0.05,同時應注明采用的

是單側檢驗還是雙側檢驗，以便讀者與同類研究進行比較。當P接近臨界

值時，下結論應慎重。

5.正確理解P值的統(tǒng)計意義P是指在無效假設H0的總體中進行隨

機抽樣，所觀察到的等于或大于現(xiàn)有統(tǒng)計量值的概率。其推斷的

基礎是小概率事件的原理,即概率很小的事件在一次抽樣研究中幾乎

是不可能發(fā)生的,如發(fā)生則拒絕H0。因此，只能說明統(tǒng)計學意義的“顯著”。

6.假設檢驗和可信區(qū)間的關系假設檢驗用以推斷總體均數(shù)間是否相

同，而可信區(qū)間則用于估計總體均數(shù)所在的范圍，兩者既有聯(lián)系又有區(qū)別。

T檢驗屬于均值分析，它是用來檢驗兩類母體均值是否相等。均值分

析是來考察不同樣本之間是否存在差異，而方差分析則是評估不同樣本之

間的差異是否由某個因素起主要作用。

T檢驗及其與方差分析的區(qū)別

假設檢驗是通過兩組或多組的樣本統(tǒng)計量的差別或樣本統(tǒng)計量與總

體參數(shù)的差異來推斷他們相應的總體參數(shù)是否相同。

t檢驗：

1.單因素設計的小樣本(n<50)計量資料

2.樣本來自正態(tài)分布總體

3.總體標準差未知

4.兩樣本均數(shù)比較時，要求兩樣本相應的總體方差相等

?根據(jù)研究設計t檢驗可由三種形式：

-單個樣本的t檢驗

-配對樣本均數(shù)t檢驗(非獨立兩樣本均數(shù)t檢驗)

-兩個獨立樣本均數(shù)t檢驗

(1)單個樣本t檢驗

?又稱單樣本均數(shù)t檢驗(onesamplettest),適用于樣本均數(shù)與已知總

體均數(shù)U0的比較，其比較目的是檢驗樣本均數(shù)所代表的總

體均數(shù)u是否與已知總體均數(shù)u0有差別。

?已知總體均數(shù)R0一般為標準值、理論值或經(jīng)大量觀察得到的較

穩(wěn)定的指標值。

?單樣t檢驗的應用條件是總體標準s未知的小樣本資料(如n<50),

且服從正態(tài)分布。

(2)配對樣本均數(shù)t檢驗

?配對樣本均數(shù)t檢驗簡稱配對t檢驗(pairedttest),又稱非獨立兩樣本

均數(shù)t檢驗，適用于配對設計計量資料均數(shù)的比較，其比較目的是檢驗兩相

關樣本均數(shù)所代表的未知總體均數(shù)是否有差別。？配對設計(paireddesign)

是將受試對象按某些重要特征相近的原則配成對子，每對中的兩個個體隨

機地給予兩種處理。

?應用配對設計可以減少實驗的誤差和控制非處理因素，提高統(tǒng)計處

理的效率。

?配對設計處理分配方式主要有三種情況：

①兩個同質受試對象分別接受兩種處理，如把同窩、同性別和體重相

近的動物配成一對，或把同性別和年齡相近的相同病情病人配成

一對；

②同一受試對象或同一標本的兩個部分，隨機分配接受兩種不同處理,

如例5.2資料；

③自身對比(self-contrast)。即將同一受試對象處理(實驗或治療)前

后的結果進行比較，如對高血壓患者治療前后、運動員體育運動前后的某

一生理指標進行比較。

(3)兩獨立樣本t檢驗

兩獨立樣本t檢驗(twoindependentsamplest-test),又稱成組t檢驗。

?適用于完全隨機設計的兩樣本均數(shù)的比較，其目的是檢驗兩樣本所

來自總體的均數(shù)是否相等。

?完全隨機設計是將受試對象隨機地分配到兩組中，每組對象分別接

受不同的處理，分析比較處理的效應?；蚍謩e從不同總體中隨機抽樣進行

研究。

?兩獨立樣本t檢驗要求兩樣本所代表的總體服從正態(tài)分布N(U1,

。12)和1\1(112,o22),且兩總體方差。12、。22相等，即方差齊性

(homogeneityofvariance,homoscedasticity)0

?若兩總體方差不等,即方差不齊，可采用檢驗，或進行變量變換，

或用秩和檢驗方法處理。

t檢驗中的注意事項

1.假設檢驗結論正確的前提作假設檢驗用的樣本資料，必須能代表

相應的總體，同時各對比組具有良好的組間均衡性，才能得出有

意義的統(tǒng)計結論和有價值的專業(yè)結論。這要求有嚴密的實驗設計和抽

樣設計，如樣本是從同質總體中抽取的一個隨機樣本,試驗單位在干預前隨

機分組，有足夠的樣本量等。

2.檢驗方法的選用及其適用條件，應根據(jù)分析目的、研究設計、資料

類型、樣本量大小等選用適當?shù)臋z驗方法。t檢驗是以正態(tài)分布為基礎的，

資料的正態(tài)性可用正態(tài)性檢驗方法檢驗予以判斷。若資料為非正態(tài)分布，

可采用數(shù)據(jù)變換的方法，嘗試將資料變換成正態(tài)分布資料后進行分析。

3.雙側檢驗與單側檢驗的選擇需根據(jù)研究目的和專業(yè)知識予以選擇。

單側檢驗和雙側檢驗中的t值計算過程相同，只是t界值不同，對同一資

料作單側檢驗更容易獲得顯著的結果。單雙側檢驗的選擇，應在統(tǒng)計分析

工作開始之前就決定，若缺乏這方面的依據(jù)，一般應選用雙側檢驗。

4.假設檢驗的結論不能絕對化假設檢驗統(tǒng)計結論的正確性是以概率

作保證的，作統(tǒng)計結論時不能絕對化。在報告結論時，最好列出概率P的

確切數(shù)值或給出P值的范圍，如寫成0.02<P<0.05,同時應注明采用的

是單側檢驗還是雙側檢驗，以便讀者與同類研究進行比較。當P接近臨界

值時，下結論應慎重。

5.正確理解P值的統(tǒng)計意義P是指在無效假設H0的總體中進行隨

機抽樣，所觀察到的等于或大于現(xiàn)有統(tǒng)計量值的概率。其推斷的基礎是小概

率事件的原理，即概率很小的事件在一次抽樣研究中幾乎是不可能發(fā)生的，

如發(fā)生則拒絕H0。因此，只能說明統(tǒng)計學意義的

“顯著”。

6.假設檢驗和可信區(qū)間的關系假設檢驗用以推斷總體均數(shù)間是否相

同，而可信區(qū)間則用于估計總體均數(shù)所在的范圍，兩者既有聯(lián)系又有區(qū)別。

T檢驗屬于均值分析，它是用來檢驗兩類母體均值是否相等。均值分

析是來考察不同樣本之間是否存在差異，而方差分析則是評估不同樣本之

間的差異是否由某個因素起主要作用。

t檢驗：是假設檢驗的一種常用方法，當方差未知時，可以用來檢驗

一個正態(tài)總體或兩個正態(tài)總體的均值檢驗假設問題，也可以用來檢驗成對

數(shù)據(jù)的均值假設問題。具體內(nèi)容可以參考《概率論與數(shù)理統(tǒng)計》?？梢杂?/p>

來判斷兩組數(shù)倨差異是否有顯著意義，也就是結果有沒有統(tǒng)計學意義。

方差分析：它是處理實驗研究資料時重要的分析方法之一，代表數(shù)據(jù)

是否具有統(tǒng)計意義,

一般一組數(shù)據(jù)代表某個條件或因素，方差分析可以判斷你選取的這個

因素是否有意義，是不是影響因素

如果你做統(tǒng)計為了找到事物相關性，而方差結果顯示數(shù)據(jù)無統(tǒng)計學差

異,很可能代表實驗失敗或設計有問題

在對均值進行假設檢驗時，一般有兩種參數(shù)檢驗方法，即t檢驗與方

差分析。t檢驗僅用在單因素兩水平設計（包括配對設計和成組設計）和

單組設計（給出一組數(shù)據(jù)和一個標準值的資料）的定量資料的均值檢驗場

合；而方差分析用在單因素k水平設計（k三3）和多因素設計的定量資料

的均值檢驗場合。應當進一步說明的是，方差分析有十幾種，不同的方差

分析取決于不同的設計類型。很多人習慣于用t檢驗取代一切方差分析。

不能用t檢驗取代方差分析的情況

①單因素k（k>3）水平設計時的情形。為了便于理解，舉例說明。

［實例］研究單味中藥對小鼠細胞免疫機能的影響，把40只小鼠隨機均

分為4組，每組10只，雌雄各半，用藥15d后測定E-玫瑰結成率（％）,

結果如下，試比較各組總體均值之間的差別有無顯著性意義？對照組：

1410121613141210139

黨參組：21241817221918232018

黃黃組：24202218172118221923

淫羊蕾組：35272329314035302836

處理本例資料，通常人們錯誤的做法是，重復運用成組設計資料的t

檢驗對4個組的均值進行6次兩兩比較；而正確的做法是，先進行單因素

4水平設計資料的方差分析，若4個總體均值之間的差別有顯著性意義,

再用q檢驗等方法進行多個均值之間的兩兩比較。下面將從多個方面來說

明上述兩種分析方法之間的差異（表1）。

表1用t檢驗與方差分析處理［實例］資料的區(qū)別

比較的內(nèi)容資料的利用率對原實驗設計的影響犯假陽性錯誤的概

率結論的可靠性

t檢驗低：每次僅用兩組殘：割裂了整體設計大：1-（1-0.05）6=

0.265低：統(tǒng)計量的自由度?。╲=18）

方差分析加q檢驗高：每次要用全部數(shù)據(jù)全：與原實驗設計相呼應

小：0.05（假定a=0Q5）高：統(tǒng)計量的自由度大（u=36）

注：自由度大，所對應的統(tǒng)計量的可靠性就高，它相當于“權重”，

也類似于產(chǎn)生“代表”的基數(shù)，基數(shù)越大，所選出的“代表”就越具

有權威性。

②多因素設計時的情形。為了便于理解，仍舉例說明（表2）。

表2注射氯化鋰或煙堿后不同時間大鼠體溫的下降值

使用氯化鋰與否使用煙堿與否第二次注射后不同時間體溫下降值

（攝氏度）

0.71.535

--------0.0±0.40.2±0.50.1+0.40.3±0.5

+--0.7±0.50.1±0.50.1±0.60.2±0.5

--+1.2±0.80.1±0.60.4±0.50.4±0.3

++1.7±0.60.7±0.60.3±0.60.1±0.5

顯然，表2中涉及到的3個實驗因素（即”使用氯化鋰與否”、“使用煙

堿

與否”、“藥物在體內(nèi)作用時間”）。這些因素之間一般都存在不同程度

的交互作用，應當選用與設計類型（本例為具有一個重復測量的三因素設

計）相對應的方差分析方法。然而，對于處置復雜的實驗設計問題，人們

常犯的錯誤是在；其一，將多因素各水平的不同組合（本例中共有16種

不同的組合，相當于16種不同的實驗條件）、簡單地看作單因素的多個水

平（即視為單因素16水平），混淆了因素與水平之間的區(qū)別，從而錯誤地

確定了實驗設計類型；其二，分析資料時，常錯誤用單因素多水平設計或

仍采用多次t檢驗進行兩兩比較。誤用這兩種方法的后果是，不僅無法分

析因素之間的交互作用的大小，而且，由于所選用的數(shù)學模型與設計不匹

配，易得出錯誤的結論。

答：t檢驗適用于兩個變量均數(shù)間的差異檢驗，多于兩個變量間的均

數(shù)比較要用方差分析。用于比較均值的t檢驗可以分成三類，第一類是針

對單組設計定量資料的；第二類是針對配對設計定量資料的；第三類則是

針對成組設計定量資料的。后兩種設計類型的區(qū)別在于事先是否將兩組研

究對象按照某一個或幾個方面的特征相似配成對子。無論哪種類型的t檢

驗，都必須在滿足特定的前提條件下應用才是合理的。若是單組設計，

必須給出一個標準值或總體均值，同時，提供一組定量的觀測結果，應用

t檢驗的前提條件就是該組資料必須服從正態(tài)分布；若是配對設計，每對

數(shù)據(jù)的差值必須服從正態(tài)分布；若是成組設計，個體之間相互獨立，兩組

資料均取自正態(tài)分布

的總體，并滿足方差齊性。之所以需要這些前提條件，是因為必須在

這樣的前提下所計算出的t統(tǒng)計量才服從t分布，而t檢驗正是以t分布作

為其理論依據(jù)的檢驗方法。值得注意的是，方差分析與成組設計t檢驗

的前提條件是相同的，即正態(tài)性和方差齊性。t檢驗是目前醫(yī)學研究中

使用頻率最高，醫(yī)學論文中最常見到的處理定量資料的假設檢驗方法。t

檢驗得到如此廣泛的應用，究其原因，不外乎以下幾點：現(xiàn)有的醫(yī)學期刊

多在統(tǒng)計學方面作出了要求，研究結論需要統(tǒng)計學支持；傳統(tǒng)的醫(yī)學統(tǒng)計

教學都把t檢驗作為假設檢驗的入門方法進行介紹，使之成為廣大醫(yī)學研

究人員最熟悉的方法；t檢驗方法簡單，其結果便于解釋。簡單、熟悉加

上外界的要求，促成了t檢驗的流行。但是，由于某些人對該方法理解得

不全面，導致在應用過程中出現(xiàn)不少問題，有些甚至是非常嚴重的錯誤，

直接影響到結論的可靠性。將這些問題歸類，可大致概括為以下兩種情況:

不考慮t檢驗的應用前提，對兩組的比較一律用t檢驗；將各種實驗設計

類型一律視為多個單因素兩水平設計，多次用t檢驗進行均值之間的兩兩

比較。以上兩種情況，均不同程度地增加了得出錯誤結論的風險。而且，

在實驗因素的個數(shù)大于等于2時，無法研究實驗因素之間的交互作用的大

小。

u檢驗

(utest)以服從u分布的統(tǒng)計量檢驗統(tǒng)計假設的方法。①均值u的檢

驗。一個正態(tài)總體：當O0:U=U02—O2已知時，用檢驗統(tǒng)計量：其

中，U0、。02為已知正態(tài)總體的均值與方差，X為樣本平均數(shù)，n為樣本

含量。當總體分布未知但樣本含量較大時，用檢驗統(tǒng)計量：兩個正態(tài)總

體：HO：H1=H2當兩個總體方差。12、。22已知時，用檢驗統(tǒng)計量:

當總體分布未知但樣本含量較大時，用檢驗統(tǒng)計量：②總體率口的檢驗

（適用于大樣本）。一個總體：HO:Ji="0用檢驗統(tǒng)計量：兩個總體：

H0："1=冗2用檢驗統(tǒng)計量：其中，為兩樣本率的加權平均數(shù)，ml、m2

分別為兩樣本中某事件出現(xiàn)的頻數(shù)。u檢驗的判斷結論：對給定的顯著性

水平a,查正態(tài)分布表，當a=0.05、0.01時,臨界值分別為1.96、2.58。

當IuI<1.96時，P>0.05,不拒絕H0,差異不具顯著性；當1.96<IuI

W2.58時，PW0.05,拒絕H0,差異具顯著性；當|uI22.58時，P

<0.01,拒絕H0,差異具高度顯著性。只要u檢驗的條件滿足，如正態(tài)總

體。02已知或是大樣本，都可使用該方法，如某一運動隊通過一段時間的

訓練后成績是否有所提高，可以進行u檢驗。

皮爾遜x2檢驗和卡方檢驗一樣嗎？

皮爾遜x2檢驗是檢驗實際頻數(shù)和理論頻數(shù)是否較為接近,統(tǒng)計學家卡

爾?皮爾遜1900年提出了如下檢驗統(tǒng)計量：XA2=E｛【（實際頻數(shù)-理論頻數(shù)

的）人2】/理論頻數(shù)｝

它近似服從自由度為V/且格數(shù)一估計參數(shù)個數(shù)一1的分布。式中，

n是樣本量，理論頻數(shù)是由樣本量乘以由理論分布確定的組格概率計算的。

求和項數(shù)為組格數(shù)目。

皮爾遜統(tǒng)計量的直觀意義十分顯然：是各組格的實際觀測頻數(shù)與理

論期望頻數(shù)

的相對平方偏差的總和，若值充分大，則應認為樣本提供了理論分

布與統(tǒng)計分布不同的

顯著證據(jù)，即假設的總體分布與總體的實際分布不符，從而應否定所

假定的理論分布。所以，

應當在分布密度曲線圖的右尾部建立拒絕域。

卡方檢驗有很多種，跟他們叫卡方檢驗是因為構造的統(tǒng)計量服從或近

似服從卡方分布，然后再根據(jù)卡方分布建立檢驗規(guī)則，比如檢驗正態(tài)總體

方差的是否為某定值的卡方檢驗構造的統(tǒng)計量是那樣的~~這個統(tǒng)計量服

從n-1的卡方分布，，所以這個檢驗也叫卡方檢驗。T檢驗

（TTest）

什么是T檢驗

T檢驗是用于小樣本（樣本容量小于30）的兩個平均值差異程度的檢

驗方法。它是用T分布理論來推斷差異發(fā)生的概率，從而判定兩個平均數(shù)

的差異是否顯著。

T檢驗是戈斯特為了觀測釀酒質量而發(fā)明的。戈斯特在位于都柏林的

健力士釀酒廠擔任統(tǒng)計學家，基于ClaudeGuinness聘用從牛津大學和劍橋

大學出來的最好的畢業(yè)生以將生物化學及統(tǒng)計學應用到健力士工業(yè)程序

的創(chuàng)新政策。戈特特于1908年在Biometrika上公布T檢驗，但因其老板認

為其為商業(yè)機密而被迫使用筆名（學生）。實際上，戈斯特的真實身份不

只是其它統(tǒng)計學家不知道，連其老板也不知道。

T檢驗的步驟

1、建立虛無假設HO：U1=U2,即先假定兩個總體平均數(shù)之

間沒有顯著差異；

2、計算統(tǒng)計量T值，對于不同類型的問題選用不同的統(tǒng)計量計算方

法;

1)如果要評斷一個總體中的小樣本平均數(shù)與總體平均值之間的差異

程度，其統(tǒng)計量T值的計算公式為：

2)如果要評斷兩組樣本平均數(shù)之間的差異程度，其統(tǒng)計量T值的計

算公式為：

3、根據(jù)自由度df=n-l,查T值表，找出規(guī)定的T理論值并進行比較。

理論值差異的顯著水平為0.01級或0.05級。不同自由度的

顯著水平理論值記為T(df)0.01和T(df)0.05

4、比較計算得到的t值和理論T值，推斷發(fā)生的概率，依據(jù)下表給出

的T值與差異顯著性關系表作出判斷。

T值與差異顯著性關

系表

值顯著程度

差異差異

非常顯著

T<差異顯著P>；

T(df)0.差異不顯0.05

05著

5、根據(jù)是以上分析，結合具體情況，作出結論。

T檢驗舉例說明

例如，T檢驗可用于比較藥物治療組與安慰劑治療組病人的測量差別。

理論上，即使樣本量很小時，也可以進行T檢驗。（如樣本量為10,一些

學者聲稱甚至更小的樣本也行），只要每組中變量呈正態(tài)分布，兩組方差

不會明顯不同。如上所述，可以通過觀察數(shù)據(jù)的分布或進行正態(tài)性檢驗估

計數(shù)據(jù)的正態(tài)假設。方差齊性的假設可進行F檢驗，或進行更有效的

Levene's檢驗。如果不滿足這些條件，只好使用非參數(shù)檢驗代替T檢

驗進行兩組間均值的比較。

T檢驗中的P值是接受兩均值存在差異這個假設可能犯錯的

概率。在統(tǒng)計學上，當兩組觀察對象總體中的確不存在差別時，這個

概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性,

我們只要考慮單側概率分布，將所得到t-檢驗的P值分為兩半。另一些學

者則認為無論何種情況下都要報告標準的雙側T檢驗概率。

1、數(shù)據(jù)的排列

為了進行獨立樣本T檢驗，需要一個自（分組）變量（如性別：男女）

與一個因變量（如測量值）。根據(jù)自變量的特定值，比較各組中因變量的

均值。用T檢驗比較下列男、女兒童身高的均值。

性

別

對男

象1性

對象男

111

2性

110

對象男

109

3性

102

對象女

104

4性

對象女

5性

男性身高身高

均數(shù)=110

女性身高均數(shù)

=103

T統(tǒng)計量(『statistic)和T檢驗(T-test)是一回事嗎？如何不是，它們之

間有什么關系？

相關，但不是一件事。T-test是指用T-statistic來做假設檢驗(hypothesis

testing),而T-statistic是根據(jù)model計算的,用來做檢驗的統(tǒng)計量。正常

T-statistic應該在0假設(nullhypothesis)為真時,服從T分布(T-distribution)。

T-test時根據(jù)T-statistic值的大小計算p-value,決定是接受還是拒絕假

設。

參數(shù)估計和假設估計的區(qū)別和聯(lián)系

參數(shù)估計：指的是用樣本中的數(shù)據(jù)估計總體分布的某個或某幾個參數(shù),

比如給定一定樣本容量的樣本，要求估計總體的均值、方差等。假設檢

驗：通過樣本分布，檢驗某個參數(shù)的屬于某個區(qū)間范圍的概率。

參數(shù)估計分兩種：一種是點估計，另一種是區(qū)間估計。其中，區(qū)間估

計與假設檢驗可以看作同一個問題的不同表述方式。

統(tǒng)計學方法包括描述統(tǒng)計和推斷統(tǒng)計兩種方法，其中，推斷統(tǒng)計又包

括參數(shù)估計和假設檢驗。

1.?參數(shù)估計就是用樣本統(tǒng)計量去估計總體的參數(shù)，它的方法有點估計

和區(qū)間估計兩種。

點估計是用估計量的某個取值直接作為總體參數(shù)的估計值。點估計的

缺陷是沒法給出估計的可靠性，也沒法說出點估計值與總體參數(shù)真實值接

近的程度。

區(qū)間估計是在點估計的基礎上給出總體參數(shù)估計的一個估計區(qū)間，該

區(qū)間通常是由樣本統(tǒng)計量加減估計誤差得到的。在區(qū)間估計中，由樣本估

計量構造出的總體參數(shù)在一定置信水平下的估計區(qū)間稱為置信區(qū)間。統(tǒng)計

學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù)。

在區(qū)間統(tǒng)計中置信度越高，置信區(qū)間越大。置信水平為1-a,a為小概

率事件或者不可能事件，常用的置信水平值為99%,95%,90%,對應的a

為0.01,0.05,0.1

置信區(qū)間是一個隨機區(qū)間，它會因樣本的不同而變化，而且不是所有

的區(qū)間都包含總體參數(shù)。

一個總體參數(shù)的區(qū)間估計需要考慮總體是否為正態(tài)分布，總體方差是

否已知，用于估計的樣本是大樣本還是小樣本等

(1)來自正態(tài)分布的樣本均值，不論抽取的是大樣本還是小樣

本，均服從正態(tài)分布

(2)總體不是正態(tài)分布，大樣本的樣本均值服從正態(tài)分布，小樣本

的服從t分布

(3)不論已判斷是正態(tài)分布還是t分布，如果總體方差未知時，都

按t分布來處理

(4)t分布要比標準正態(tài)分布平坦，那么要比標準正態(tài)分布離散，

隨著自由度的增大越接近

(5)樣本均數(shù)服從的正態(tài)分布為N(uaA2/n)遠遠小于原變量離散

程度N(uaA2)

2.假設檢驗是推斷統(tǒng)計的另一項重要內(nèi)容，它與參數(shù)估計類似，但角

度不同，參數(shù)估計是利用樣本信息推斷未知的總體參數(shù)，而假設檢驗則是

先對總體參數(shù)提出一個假設值，然后利用樣本信息判斷這一假設是否成立。

檢驗的基本思想：先提出假設，然后根據(jù)資料的特點，計算

相應的統(tǒng)計量，來判斷假設是否成立，如果成立的可能性是一個小概率的

話，就拒絕該假設，因此稱小概率的反證法。最重要的是看能否通過得到

的概率去推翻原定的假設，而不是去證實它

<2>統(tǒng)計學中假設檢驗的基本步驟：

(1)建立假設，確定檢驗水準a

假設有零假設(H0)和備擇假設(H1)兩個，零假設又叫作無效假

設或檢驗假設。H0和H1的關系是互相對立的，如果拒絕H0,就要接

受Hl,根據(jù)備擇假設不同，假設檢驗有單、雙側檢驗兩種。檢驗水準用

a表示，通常取0.05或0.10,檢驗水準說明了該檢驗犯第一類錯誤的

概率。

（2）根據(jù)研究目的和設計類型選擇適合的檢驗方法

這里的檢驗方法，是指參數(shù)檢驗方法，有u檢驗、t檢驗和方差分析

三種，對應于不同的檢驗公式。

（3）確定P值并作出統(tǒng)計結論

U檢驗得到的是U統(tǒng)計量或稱U值,t檢驗得到的是t統(tǒng)計量或稱t值。

方差分析得到的是F統(tǒng)計量或稱F值。將求得的統(tǒng)計量絕對值與界值相比，

可以確定P值。當a=0.05時，u值要和u界值1.96相比較，確定P值。

如果uVl.96,則P>0.05反之,如u>1.96,則P<0.05.t值要和某自由度

的t界值相比較，確定P值。如果t值<t界值，故P>0.05.反之，如t>t

界值，貝IP<0Q5。相同自由度的情況下，單側檢驗的t界值要小于雙側檢

驗的t界值，因此有可能出現(xiàn)算得的t值大于單側t界值，而小于雙側t

界值的情況，即單側檢驗顯著，雙側檢驗未必就顯著，反之，雙側檢驗顯

著，單側檢驗必然會顯著。即單側檢驗更容易出現(xiàn)陽性結論。當P>0.05

時，接受零假設，認為差異無統(tǒng)計學意義，或者說二者不存在質的區(qū)別。

當P<0.05時，拒絕零假設，接受備擇假設，認為差異有統(tǒng)計學意義，也

可以理解為二者存在質的區(qū)別。但即使檢驗結果是P<0.01甚至P<0.001,

都不說明差異相差很大，只表示更有把握認為二者存在差異。

3參數(shù)估計與假設檢驗之間的聯(lián)系與區(qū)別：

（1）主要聯(lián)系:

a、都是根據(jù)樣本信息推斷總體參數(shù);

b、都以抽樣分布為理論依據(jù)，建立在概率論基礎之上的推斷；c、

二者可相互轉換，形成對偶性。

（2）主要區(qū)別：

a、參數(shù)估計是以樣本資料估計總體參數(shù)的真值，假設檢驗是以樣本

資料檢驗對總體參數(shù)的先驗假設是否成立；

b、區(qū)間估計求得的是求以樣本估計值為中心的雙側置信區(qū)間，假設

檢驗既有雙側檢驗，也有單側檢驗；

c、區(qū)間估計立足于大概率，假設檢驗立足于小概率。

區(qū)間估計：

1、單個正態(tài)總體均值的區(qū)間估計：

法1：打開數(shù)據(jù)文件：DescriotiveStatisticsfExplore:Dsplay中選

Statistics,在DependentList中輸入所求的變量名

Statistics對話框中選擇Descriptives,并在ConfidenceIntervalforMeans

中輸入數(shù)值，作為置信度.得統(tǒng)計量描述表中LowerBound為置信區(qū)間的下

限，UpperBound為置信區(qū)間的上限

法2：利用單個樣本t檢驗過程求均值的置信區(qū)間CompareMeans一

One_SampleTTest,在TestVariables中輸入所求的變量名，在TestValue

中輸入所假設的均值，打開Option對話框中Confidencein

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

常用顯著性檢驗

文檔簡介

溫馨提示

最新文檔

評論

常用顯著性檢驗

文檔簡介

溫馨提示

最新文檔

評論

相關文檔