參數(shù)估計與假設(shè)檢驗2016-7-3_第1頁
參數(shù)估計與假設(shè)檢驗2016-7-3_第2頁
參數(shù)估計與假設(shè)檢驗2016-7-3_第3頁
參數(shù)估計與假設(shè)檢驗2016-7-3_第4頁
參數(shù)估計與假設(shè)檢驗2016-7-3_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

參數(shù)估計與假設(shè)檢驗實例結(jié)果

(1)現(xiàn)患狀況:瀏陽市18歲以上成年人糖尿病患病率為5.4%(95%CI:4.8%-5.9%),其中男性為5.0%(95%CI:4.3%-5.8%),女性為5.7%(95%CI:4.9%-6.7%);高血壓患病率為27.2%(95%CI:26.0%-28.4%),其中男性為26.5%(95%CI:24.9%-28.1%),女性為27.9%(95%CI:26.3%-29.7%);糖尿病患者合并高血壓的患病率為2.6%(95%CI:2.2%,3.1%),其中男性為2.4%(95%CI:1.9%,2.9%),女性為2.9%(95%CI:2.3%,3.6%),糖尿病患者中合并高血壓的比例為48.7%(148/304)。非條件多因素logistic回歸分析結(jié)果顯示與糖尿病有關(guān)的因素是:既往吸煙1.890(95%CI:1.175,3.040)、飲酒0.684(95%CI:0.482,0.970)、膽固醇1.411(95%CI:1.003,1.986)、甘油三酯2.190(95%CI:1.671,2.871)、腹型肥胖1.750(95%CI:1.358,2.253)、高血壓1.760(95%CI:1.362,2.274),

非條件多因素logistic回歸分析結(jié)果顯示有既往吸煙1.936(95%CI:1.059,3.540)、甘油三酯異常3.236(95%CI:2.267,4.619)、肥胖5.343(95%CI:1.174,24.325)、腹型肥胖1.737(95%CI:1.119,2.699),表3-1瀏陽市18歲以上不同性別、年齡糖尿病患病率年齡(歲)男

性女

性合

計調(diào)查數(shù)患病數(shù)率(%)調(diào)查數(shù)患病數(shù)率(%)調(diào)查數(shù)患病數(shù)率(%)18-2923710.423310.447020.430-39400

9

2.341281.98121721880374.21743643.750-59630447.0530427.91160867.760-69501336.63584011.2859738.570-792622911.1216209.34784910.280以上7268.37479.5146138.9合計29651495.027031555.756683045.4表3-5糖尿病合并高血壓單因素分析結(jié)果因素糖尿病組非糖尿病組檢驗統(tǒng)計量P值性別:男70(3.2)21021.8010.180

女78(4.0)1871年齡(歲):18-291(0.2)456131.9760.00030-395(0.7)72640-4926(1.9)137350-5944(5.9)72360-6946(9.4)44270-7918(8.4)19780以上8(12.5)56婚姻:

未婚5(2.2)22027.0160.000已婚120(3.3)3504喪偶22(9.7)204離異1(2.4)40本章開始學(xué)習(xí)統(tǒng)計推斷(statisticalinference)方法,內(nèi)容涉及參數(shù)估計和假設(shè)檢驗的基本概念和原理。

統(tǒng)計推斷參數(shù)估計假設(shè)檢驗總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

統(tǒng)計推斷統(tǒng)計推斷

statisticalinference如:樣本均數(shù)樣本標準差S

樣本率P如:總體均數(shù)總體標準差總體率參數(shù)估計(estimationofparameters)

包括:點估計與區(qū)間估計假設(shè)檢驗(testofhypothesis)

統(tǒng)計學(xué)中的統(tǒng)計推斷包括兩個重要的方面:一是利用樣本統(tǒng)計量的信息對相應(yīng)總體參數(shù)值做出推斷,如用樣本均數(shù)估計總體均數(shù),用樣本標準差S估計總體標準差等,稱之為點估計。另一個是利用樣本統(tǒng)計量來推斷我們是否接受一個事先的假設(shè),稱之為假設(shè)檢驗。本章只討論參數(shù)估計,假設(shè)檢驗將在下一章中討論。而參數(shù)估計又分為點估計與區(qū)間估計。

一、抽樣誤差在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息推斷總體特征。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數(shù)往往不等于總體均數(shù),這種由抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異稱為抽樣誤差(samplingerror)。第一節(jié)參數(shù)估計抽樣試驗

從正態(tài)分布總體N(5.00,0.502)中,每次隨機抽取樣本含量n=5,并計算其均數(shù)與標準差;重復(fù)抽取1000次,獲得1000份樣本;計算1000份樣本的均數(shù)與標準差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實驗;比較計算結(jié)果。抽樣試驗(n=5)抽樣試驗(n=10)抽樣試驗(n=30)1000份樣本抽樣計算結(jié)果總體的均數(shù)總體標準差s均數(shù)的均數(shù)均數(shù)標準差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個抽樣實驗結(jié)果圖示(一)均數(shù)的標準誤統(tǒng)計學(xué)中為了區(qū)別個體觀察值之間變異的標準差與反映樣本均數(shù)之間變異的標準差,將后者稱為均數(shù)的標準誤(standarderrorofthemean)。顯然,均數(shù)的標準誤小于原始測量值的標準差,均數(shù)的標準誤越小說明估計越精確,因此可以用均數(shù)的標準誤表示均數(shù)抽樣誤差的大小。均數(shù)的標準誤用符號表示,計算公式為:

在樣本含量一定的情況下,均數(shù)的標準誤與標準差成正比,均數(shù)的標準誤與樣本含量的平方根成反比,說明在同一總體中隨機抽樣,樣本含量越大,均數(shù)的標準誤越小。均數(shù)的標準誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。

統(tǒng)計上通常將統(tǒng)計量(如樣本均數(shù)、樣本率p等)的標準差稱為標準誤(standarderror,SE)。所以,樣本均數(shù)的標準差又稱為樣本均數(shù)的標準誤,是反映樣本均數(shù)抽樣誤差大小的指標。

特點:

1.總體標準誤的大小與總體標準差成正比,與樣本含量的平方根成反比。即當樣本含量n一定時,標準差越大,即樣本的個體差異越大,標準誤就越大,樣本均數(shù)的抽樣誤差就越大;標準差越小,標準誤就越小,即樣本均數(shù)抽樣誤差就越小。

2.當標準差一定時,n越大,標準誤就越??;n越小,標準誤就越大。故影響抽樣誤差大小的主要因素是樣本含量。作為總體參數(shù)(常數(shù))通常是未知的,因而,在實際工作中常用樣本標準差S來估計。

實際中,總體標準差往往未知,因而通常用樣本標準差代替,求得樣本均數(shù)標準誤的估計值,計算公式為:例3-1

在某地隨機抽查成年男子140人,得紅細胞均數(shù),標準差,試計算其標準誤。 按公式計算得:(二)率的標準誤樣本率的標準差也稱為率的標準誤(standarderrorofrate),可用來描述樣本率抽樣誤差的大小。率的標準誤越小,則率的抽樣誤差越小,率的標準誤越大,則率的抽樣誤差越大。公式為:在一般情況下,總體率往往是未知的,此時可用樣本率來代替總體率,其估計值為:二、可信區(qū)間的概念點估計:是使用單一的數(shù)值直接作為總體參數(shù)的估計值,如用估計相應(yīng)的,用估計相應(yīng)的。該法表達簡單,但未考慮抽樣誤差的影響,無法評價參數(shù)估計的準確程度。區(qū)間估計(intervalestimation)是指按預(yù)先給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數(shù)。事先給定的概率稱為可信度,計算得到的區(qū)間稱為可信區(qū)間(confidenceinterval,CI)??傮w均數(shù)的估計

總體均數(shù)的點估計(pointestimation)與區(qū)間估計參數(shù)的估計點估計:由樣本統(tǒng)計量直接估計總體參數(shù)區(qū)間估計:在一定可信度(Confidencelevel)下,同時考慮抽樣誤差區(qū)間估計總體均數(shù)的區(qū)間估計(intervalestimation)是利用樣本信息給出一個區(qū)間,并同時給出重復(fù)試驗時該區(qū)間包含總體均數(shù)的概率。

1)可信區(qū)間的涵義

從總體中作隨機抽樣,對于含量為n的每個樣本而言,都可以算得一個區(qū)間。以95%的可信區(qū)間為例,意味著在同一總體中作100次重復(fù)抽樣,可得100個可信區(qū)間,平均有95個可信區(qū)間包含總體均數(shù)(估計正確),只有5個可信區(qū)間不包含總體均數(shù)(估計不正確),或?qū)τ谀骋粋€區(qū)間而言,它包含總體均數(shù)的可能性為95%,而不包含總體均數(shù)的可能性僅為5%。因此在實際應(yīng)用中,以這種方法估計總體均數(shù)犯錯誤的概率僅為5%。

2)可信區(qū)間具有兩個要素

(1)準確度(accuracy),即可信區(qū)間包含的概率的大小,一般而言概率越大越好。

(2)精密度(precision),反映區(qū)間的長度,區(qū)間的長度越窄,估計的精密度越好,反之越差。

(一)已知一般情況其中為標準正態(tài)分布的雙側(cè)界值。

95%可信區(qū)間:三、總體均數(shù)的區(qū)間估計(二)未知通常未知,這時可以用其估計量S代替,但已不再服從標準正態(tài)分布,而是服從著名的t分布。

圖6-1

不同自由度的t

分布圖

ConfidenceintervalWilliamGosset可信區(qū)間的計算:原理與前完全相同,僅僅是兩側(cè)概率的界值有些差別。即需要注意:在小樣本情況下,應(yīng)用這一公式的條件是原始變量服從正態(tài)分布。在大樣本下可以用替換??尚艆^(qū)間:Confidenceinterval例3-2

某醫(yī)生測得25名動脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為3.32g/L,標準差為0.57g/L,試計算該種病人血漿纖維蛋白原含量總體均數(shù)的95%可信區(qū)間。下限:上限:Confidenceinterval例3-3

試計算例6-1中該地成年男子紅細胞總體均數(shù)的95%可信區(qū)間。本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因為,則95%可信區(qū)間為:

下限:上限:Confidenceinterval單側(cè)可信區(qū)間:前面涉及的都是雙側(cè)可信區(qū)間。但有些情況下,我們所關(guān)心的僅僅是單側(cè)的可信限。單側(cè)可信區(qū)間與雙側(cè)可信區(qū)間的計算公式基本相同,只需將公式中的抽樣分布的雙側(cè)界值換成單側(cè)界值,同時只取下限或上限。Confidenceinterval實際中,有時需要計算兩個總體均數(shù)差值的可信區(qū)間,例如通過計算兩種降壓藥物平均降壓的差值比較兩種藥物的差別,其雙側(cè)可信區(qū)間的計算公式為 其中,為自由度,為兩樣本均數(shù)之差的標準誤。

四、兩總體均數(shù)差的區(qū)間估計當兩總體方差相同時,其中為兩樣本的合并方差。當兩樣本的樣本含量均較大時,上述計算可信區(qū)間中的可用相應(yīng)的代替,而且無論兩總體的方差是否相同,有Confidenceinterval例3-4

評價復(fù)方纈沙坦膠囊與纈沙坦膠囊對照治療輕中度高血壓的有效性,將123名患者隨機分為兩組,其中試驗組和對照組分別為54例和48例。經(jīng)六周治療后測量收縮壓,試驗組平均下降15.77mmHg,標準差為13.17mmHg;對照組平均下降9.53mmHg,標準差為13.55mmHg。試估計兩組收縮壓平均下降差值的95%可信區(qū)間。Confidenceinterval由公式計算:下限:上限:五、總體率的區(qū)間估計

1.

樣本率的區(qū)間估計:利用二項分布可估計其總體率可信區(qū)間,一般取。對于,且接近于0或1時,可直接查附表6百分率的可信區(qū)間表得到其總體率的可信區(qū)間。例3-52003年4~6月某醫(yī)院重癥監(jiān)護病房收治重癥SARS患者38人,其中死亡14人,求SARS病死率的95%可信區(qū)間。(查附表6,95%的可信區(qū)間為22%~54%)。

2.當較大,和均不太小,如和均大于5時,可利用樣本率近似服從正態(tài)分布的原理來估計總體率的可信區(qū)間,計算公式為

,例6-6

某區(qū)疾病預(yù)防控制中心2002年對該鄉(xiāng)鎮(zhèn)250名小學(xué)生進行貧血的檢測,結(jié)果發(fā)現(xiàn)有86名貧血者,檢出率為34.40%,求貧血檢出率95%的可信區(qū)間。

六、兩總體率差值的區(qū)間估計在大樣本情況下,可采用正態(tài)近似法對兩總體率差值進行可信區(qū)間估計,其計算公式為:X1和X2分別表示兩組中某事件發(fā)生的例數(shù)。例3-7

某醫(yī)院口腔科醫(yī)生用極固寧治療牙本質(zhì)過敏癥,以雙氟涂料作對照,進行了1年的追蹤觀察,結(jié)果見表6-1所示,試估計兩組有效率差別95%的可信區(qū)間。

表6-1治療牙本質(zhì)過敏癥兩組有效率的比較組別總牙數(shù)有效數(shù)有效率(%)試驗組776179.22對照組693855.07合計1469967.81Confidenceinterval本例:

兩組總體率差別95%的可信區(qū)間為

Confidenceinterval第二節(jié)假設(shè)檢驗一、基本原理假設(shè)檢驗(hypothesistest):統(tǒng)計推斷另一重要內(nèi)容,其目的是比較總體參數(shù)之間有無差別。

例3-8

使用黑加侖油軟膠囊治療高脂血癥,30名患者治療前后的血清甘油三酯檢測結(jié)果的差值為1.38±0.76(mmol/L),問治療后血清甘油三酯是否有所改善?假設(shè)檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。

假設(shè)檢驗基本思想

樣本治療前后甘油三酯的變化(差值)問題歸納:樣本療效藥物作用+機遇

對上面問題可以作如下考慮:

問題:究竟多大能夠下“有效”的結(jié)論?Hypothesistest假設(shè)的基本思想是,首先對所需要比較的總體提出一個無差別的假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)。如服從t分布圖3-2

利用t分布進行假設(shè)檢驗原理示意圖Hypothesistest假設(shè)檢驗步驟

Procedureofhypothesistesting

Step1:setuptesthypothesis(H0vs.H1)andsignificantlevel,Nullhypothesis:Theobserveddifferenceisduetochance(I.e.,thereisnorealdifference),Alternativehypothesis:Thereisarealdifference;Step2:selectandcalculatethestatistic;Step3:findthePvalueandmakeaconclusion.除t分布外,針對不同的資料還有其他各種檢驗統(tǒng)計量及分布,如F分布、分布等,應(yīng)用這些分布對不同類型的數(shù)據(jù)進行假設(shè)檢驗的步驟相同,其差別僅僅是需要計算的檢驗統(tǒng)計量不同。

二、基本步驟(一)建立假設(shè)和確定檢驗水準假設(shè)檢驗中,包括原假設(shè)(nullhypothesis)和備擇假設(shè)(alternativehypothesis)兩種假設(shè)。Hypothesistest原假設(shè)符號為,指需要檢驗的假設(shè),如治療前后血清甘油三酯沒有差別,即這一假設(shè)通常與我們要驗證的結(jié)論相反,是計算檢驗統(tǒng)計量和P值的依據(jù)。備擇假設(shè)符號為,是在成立證據(jù)不足的情況下而被接受的假設(shè),如拒絕治療前后血清甘油三酯相同的假設(shè),可表示為

Hypothesistest備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè)檢驗指無論是正方向還是負方向的誤差,若顯著地超出檢驗水準則拒絕,即為雙側(cè)檢驗。單側(cè)檢驗指僅在正方向或負方向誤差超出規(guī)定的水準時則拒絕,如治療后血清甘油三酯下降的假設(shè)可表示為:或雙側(cè)檢驗和單側(cè)檢驗應(yīng)如何選擇,需根據(jù)研究目的和專業(yè)知識而定。 Hypothesistest建立檢驗假設(shè)的同時,還必須給出檢驗水準。檢驗水準亦稱顯著性水準(significantlevel),用

表示,是預(yù)先規(guī)定的拒絕域的概率值,實際中一般取或。顯然,值越大越容易得出有差別的結(jié)論。Hypothesistest(二)選擇檢驗方法和計算檢驗統(tǒng)計量根據(jù)資料類型、研究設(shè)計方案和統(tǒng)計推斷的目的,選擇適當?shù)臋z驗方法和計算公式。許多假設(shè)檢驗方法是以檢驗統(tǒng)計量來命名的,如t檢驗、z檢驗、F檢驗和檢驗等。Hypothesistest(三)根據(jù)P值做出統(tǒng)計推斷查表得到檢驗用的臨界值,然后將算得的統(tǒng)計量與拒絕域的臨界值作比較,確定值。如對雙側(cè)檢驗,則,按檢驗水準拒絕,接受;若,則不能拒絕

。HypothesistestJerzyNeyman若,不拒絕H0,但不能下“無差別”或“相等”的結(jié)論,只能下“根據(jù)目前試驗結(jié)果,尚不能認為有差別”的結(jié)論。

t檢驗概述

BASICCONCEPTIONOFtTESTStudent'st-testAmethodoftestinghypothesesaboutthe

mean

ofasmallsampledrawnfromanormallydistributedpopulationwhenthepopulationstandarddeviationisunknown.In1908WilliamSealyGosset,publishingunderthepseudonymStudent,developedthet-testandtdistribution.Thetdistributionisafamilyofcurvesinwhichthenumberofdegreesoffreedomspecifiesaparticularcurve.Asthesamplesizeincreases,thetdistributionapproachesthebellshapeofthestandardnormaldistribution.Inpractice,fortestsinvolvingthemeanofasampleofsizegreaterthan30,thenormaldistributionisusuallyapplied.Preferablewhenthen<60Certainlyifn<30t檢驗的應(yīng)用條件

AssumptionsNormaldistribution(正態(tài)分布)Equalvariance(兩總體方差相等(方差齊性)Randomsampling(隨機樣本)t檢驗依據(jù)的檢驗統(tǒng)計量是服從t分布的t值兩獨立樣本均數(shù)的t檢驗

ttestforIndependentsamples

兩樣本的完全隨機分組設(shè)計,即將受試對象(試驗單位)完全隨機地分為兩組,分別接受兩種不同的處理。由于當兩組樣本含量相等,兩個樣本均數(shù)之差的抽樣誤差最小,檢驗效能最高,故應(yīng)采用適當?shù)碾S機分組方法,如隨機排列的分段隨機化,使兩組樣本含量相等。The2SampleIndependentt-TestUsedtocomparemeansbetweentwogroups.Assumesthedataarecontinuousandhaveasymmetric,uni-modal(onepeak)distribution.Assumesthetwogroupsareindependent.Thetteststatisticinvolvesthedifferencebetweenthesampleaveragesofthe2groups.Usingourknowledgeofthedistribution,wecancomputeap-valuetohelpdecidewhetherornottorejectthenullhypothesis.完全隨機設(shè)計資料的一般形式設(shè)有兩個平均數(shù)的差值-=d,統(tǒng)計學(xué)認為,從樣本直接得出的結(jié)論是不可靠的。因為抽樣誤差的隨機性,每次抽樣兩樣本平均數(shù)的差并不均等于d。造成這種差異可能有兩種原因

品種造成的差異,即是兩總體本質(zhì)不同所致

試驗誤差(或抽樣誤差)The2SampleIndependentt-Test正常成年男性血紅蛋白

140g/L

130.83g/L男性鉛作業(yè)工人血紅蛋白

140g/L一種假設(shè)H0另一種假設(shè)H1抽樣誤差總體不同

本質(zhì)差異抽樣研究:通過樣本研究其所代表的總體。設(shè)兩個總體平均數(shù)分別為,試驗研究的目的,就是要給、是否相同做出推斷。由于總體平均數(shù)、未知,在進行顯著性檢驗時只能以樣本平均數(shù)、作為檢驗對象,更確切地說,是以(-)作為檢驗對象。為什么以樣本平均數(shù)作為檢驗對象呢?這是因為樣本平均數(shù)具有下述特征:

1、離均差的平方和∑(-)2最小。說明樣本平均數(shù)與樣本各個觀測值最接近,平均數(shù)是資料的代表數(shù)。

2、樣本平均數(shù)是總體平均數(shù)的無偏估計值,即E()=μ。

3、根據(jù)統(tǒng)計學(xué)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布。

由上所述,一方面我們有依據(jù)由樣本平均數(shù)和的差異來推斷總體平均數(shù)、相同與否,另一方面又不能僅據(jù)樣本平均數(shù)表面上的差異直接作出結(jié)論,其根本原因在于試驗誤差(或抽樣誤差)的不可避免性

通過試驗測定得到的每個觀測值,既由被測個體所屬總體的特征決定,又受個體差異和諸多無法控制的隨機因素的影響。所以觀測值由兩部分組成,即

=+

總體平均數(shù)反映了總體特征,表示誤差。若樣本含量為n,則可得到n

個觀測值:,,,。于是樣本平均數(shù)

說明樣本平均數(shù)并非總體平均數(shù),它還包含試驗誤差的成分,對于接受不同處理的兩個樣本來說,則有:

=+,=+

這說明兩個樣本平均數(shù)之差(-)也包括了兩部分:一部分是兩個總體平均數(shù)的差(-),叫做試驗的處理效應(yīng)(treatmenteffect);另一部分是試驗誤差(-)。

樣本平均數(shù)的差(-)包含有試驗誤差,它只是試驗的表面效應(yīng)。因此,僅憑(-)就對總體平均數(shù)、是否相同下結(jié)論是不可靠的。只有通過顯著性檢驗才能從(-)中提取結(jié)論。對(-)進行顯著性檢驗就是要分析:試驗的表面效應(yīng)(-)主要由處理效應(yīng)(-)引起的,還是主要由試驗誤差所造成。雖然處理效應(yīng)(-)未知,但試驗的表面效應(yīng)是可以計算的,借助數(shù)理統(tǒng)計方法可以對試驗誤差作出估計。所以,可從試驗的表面效應(yīng)與試驗誤差的權(quán)衡比較中間接地推斷處理效應(yīng)是否存在,這就是顯著性檢驗的基本思想。例如:兩樣本比較的u檢驗(two-sampleu-test)

適用于兩樣本含量較大(如n1>30且n2>30)時。檢驗統(tǒng)計量為

兩均數(shù)之差的標準誤的估計值兩均數(shù)之差的標準誤的估計值由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2,得P<0.01,按α=0.05水準,拒絕H0,接受H1,兩組間差別有統(tǒng)計學(xué)意義??梢哉J為試驗組和對照組退熱天數(shù)的總體均數(shù)不相等,兩組的療效不同。試驗組的平均退熱天數(shù)比對照組短。例7-7已計算了的95%的可信區(qū)間:天,給出了兩總體均數(shù)差別的數(shù)量大小。

兩均數(shù)之差的標準誤的估計值I型錯誤和II型錯誤

假設(shè)檢驗是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立,然后在假定H0成立的條件下計算檢驗統(tǒng)計量,最后根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。檢驗水準與兩類錯誤

I型錯誤:“實際無差別,但下了有差別的結(jié)論”,假陽性錯誤。犯這種錯誤的概率是(其值等于檢驗水準)

II型錯誤:“實際有差別,但下了不拒絕H0的結(jié)論”,假陰性錯誤。犯這種錯誤的概率是(其值未知)

。

但n

一定時,

增大,則減少。

可能發(fā)生的兩類錯誤圖3-2I型錯誤與II型錯誤示意圖(以單側(cè)u檢驗為例)

1-

:檢驗效能(power):當兩總體確有差別,按檢驗水準所能發(fā)現(xiàn)這種差別的能力。ab減少(增加)I型錯誤,將會增加(減少)II型錯誤增大n

同時降低a與ba與b間的關(guān)系減少I型錯誤的主要方法:假設(shè)檢驗時設(shè)定

值。減少II型錯誤的主要方法:提高檢驗效能。提高檢驗效能的最有效方法:增加樣本量。如何選擇合適的樣本量:實驗設(shè)計。假設(shè)檢驗注意事項(1)可比性(2)正確選用假設(shè)檢驗方法(3)差別的實際意義(4)判斷結(jié)論時不能絕對化(5)單側(cè)檢驗與雙側(cè)檢驗(6)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值(1)可比性(2)正確選用假設(shè)檢驗方法(3)差別的實際意義(4)判斷結(jié)論時不能絕對化(5)單側(cè)檢驗與雙側(cè)檢驗(6)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值為了保證試驗結(jié)果的可靠及正確,要有嚴密合理的試驗或抽樣設(shè)計,保證各樣本是從相應(yīng)同質(zhì)總體中隨機抽取的。并且處理間要有可比性,即除比較的處理外,其它影響因素應(yīng)盡可能控制相同或基本相近。否則,任何顯著性檢驗的方法都不能保證結(jié)果的正確(1)可比性(2)正確選用假設(shè)檢驗方法(3)差別的實際意義(4)判斷結(jié)論時不能絕對化(5)單側(cè)檢驗與雙側(cè)檢驗(6)報告結(jié)果應(yīng)寫出統(tǒng)計量值、具體P值選用的顯著性檢驗方法應(yīng)符合其應(yīng)用條件由于研究變量的類型、問題的性質(zhì)、條件、試驗設(shè)計方法、樣本大小等的不同,所用的顯著性檢驗方法也不同,因而在選用檢驗方法時,應(yīng)認真考慮其適用條件,不能濫用。要正確理解差異顯著或極顯著的統(tǒng)計意義。顯著性檢驗結(jié)論中的“差異顯著”或“差異極顯著”不應(yīng)該誤解為相差很大或非常大,也不能認為在專業(yè)上一定就有重要或很重要的價值。“顯著”或“極顯著”是指表面上如此差別的不同樣本來自同一總體的可能性小于0.05或0.01,已達到了可以認為它們有實質(zhì)性差異的顯著水平。有些試驗結(jié)果雖然差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論