




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計分析的原那么
PrinciplesofstatisticalanalysisAdistinctivefunctionofstatisticsisthis:itenablesthescientisttomakeanumericalevaluationoftheuncertaintyofhisconclusion.--Snedecor(1950)統(tǒng)計分析的原那么
Principlesofstatist1引言統(tǒng)計分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中去。SamplePopulation利用均數(shù)、標(biāo)準(zhǔn)差;百分構(gòu)成/率;圖表等進(jìn)展描述。不同處理組間的比較。樣本結(jié)論〔統(tǒng)計量〕能否代表總體〔參數(shù)〕?統(tǒng)計分析的兩個根本工具—估計Estimation和假設(shè)檢驗HypothesisTest引言統(tǒng)計分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中2統(tǒng)計學(xué)的一個重要思想如何說明從樣本中得出的結(jié)果是對總體的最好的估計〔Estimate〕?例1:服用A藥的病人63%得到緩解,而服用B藥的病人只有53%。A藥的療效比B藥好10%?!睵=0.15〕例2:服用A藥的病人56%得到完全緩解,而服用B藥的病人只有36%。A藥的療效比B藥好18%?!睵<0.01〕統(tǒng)計學(xué)的一個重要思想如何說明從樣本中得出的結(jié)果是對總體的最好3抽樣變異SamplingVariation抽樣變異SamplingVariation4樣本均數(shù)的變異Variabilityofsamplemeans性質(zhì)
1.較大樣本的均數(shù)的變異小于較小樣本的均數(shù)的變異
2.樣本均數(shù)的變異小于觀測值的變異
3.樣本均數(shù)的變異隨觀測值變異的增大而增大樣本均數(shù)的變異Variabilityofsamplem5隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistribution從一個總體中隨機(jī)地、不斷地抽出樣本大小一樣的樣本,這些樣本具有如下性質(zhì):1.樣本均數(shù)/方差的期望=總體均數(shù)/方差2.樣本均數(shù)的均數(shù)=總體均數(shù)
樣本均數(shù)的方差=總體方差/樣本量
樣本均數(shù)的標(biāo)準(zhǔn)差-標(biāo)準(zhǔn)誤
標(biāo)準(zhǔn)誤的估計3.如果總體為正態(tài)分布,那么樣本均數(shù)的分布也是正態(tài)分布。如果樣本量足夠大,那么即使總體不是正態(tài)分布,樣本均數(shù)的分布也近似正態(tài)分布—中心極限定理〔CentralLimitedTheorem〕。隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistr6對抽樣分布的補(bǔ)充說明在實際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對稱的分布,就可以認(rèn)為其均數(shù)的分布服從正態(tài)或接近于正態(tài)。在實際應(yīng)用中,只要樣本量足夠大,那么不管數(shù)據(jù)呈何種分布,都可以將其均數(shù)的分布當(dāng)作正態(tài)分布來處理。隨機(jī)樣本的均數(shù)的分布的第1條性質(zhì)和第3條性質(zhì)同樣適用于樣本的百分構(gòu)成〔如二項分布〕。但是由于這類數(shù)據(jù)所代表的顯然不是正態(tài)總體,所以只有在樣本量相當(dāng)大時才可以應(yīng)用性質(zhì)1和3。對抽樣分布的補(bǔ)充說明在實際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對7記號Notations記號Notations8理解抽樣分布理解抽樣分布9計算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清白蛋白服從均數(shù)35g/l標(biāo)準(zhǔn)差6g/l的正態(tài)分布?,F(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個考察它們的均數(shù)的分布。
理論上,均數(shù)的均數(shù)均應(yīng)該等于35,均數(shù)的標(biāo)準(zhǔn)差應(yīng)該分別等于計算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原10Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清膽紅素服從均數(shù)3.6mol/l標(biāo)準(zhǔn)差1.1mol/l的對數(shù)正態(tài)分布?,F(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個考察它們的均數(shù)的分布。二項分布的抽樣分布
例:假設(shè)哮喘在人群中的患病率為20%,現(xiàn)隨機(jī)抽取樣本量為10、25、100的樣本各100個考察哮喘患者數(shù)的分布。Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原11一個樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofasamplemean例:216名原發(fā)性膽石癥患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l。假設(shè)服從正態(tài)分布并且此樣本為一隨機(jī)樣本,試問如何用此樣本的均數(shù)來對總體的均數(shù)進(jìn)展估計呢?一個樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofa12兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorofthedifferencebetweentwosamplemeans因為兩樣本均數(shù)之差的方差等于兩樣本各自均數(shù)的方差之和,所以:兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorof13一個樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorofasampleproportion理論上,當(dāng)np>5時,二項分布的百分構(gòu)成p近似地服從均數(shù)為p,標(biāo)準(zhǔn)差為的正態(tài)分布。即樣本百分構(gòu)成p的標(biāo)準(zhǔn)誤為:例:觀察到80名婦女中有13名患有哮喘,那么哮喘的百分構(gòu)成p為13/80=0.16,其標(biāo)準(zhǔn)誤為:一個樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorof14兩個樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,因為兩個樣本的百分構(gòu)成之差的方差等于兩個樣本各自的百分構(gòu)成的方差的和,所以兩個樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤的計算為:兩個樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,15可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕16可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕17理解可信區(qū)間理解可信區(qū)間18假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思想
兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis〔H0〕
意在推翻的假設(shè)〔說法A〕。備擇假設(shè)Alternativehypothesis〔H1〕
意在承受的假設(shè)〔說法B〕。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思19小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗〔抽樣〕時,我們往往認(rèn)為它〔事件A〕不會發(fā)生。統(tǒng)計學(xué)中,小概率事件一般是指發(fā)生概率<0.05〔檢驗水準(zhǔn)〕的事件。在假設(shè)檢驗中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們那么疑心無效假設(shè)的真實性。小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗〔抽樣20例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處理結(jié)果B
效果Effect:=結(jié)果A-結(jié)果B對于總體
如果=0,那么A處理和B處理之間沒有差異。
如果0,那么A處理和B處理之間有差異。對于樣本
即使=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處21對本例進(jìn)展假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計算出得到樣本差異或者更大差異的概率〔P值〕。如果P值小于檢驗水準(zhǔn),那么我們認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,承受備擇假設(shè)〔差異顯著性〕。反之對本例進(jìn)展假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅22方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。由此假設(shè),。那么有包含95%的,同樣地,包含總體均數(shù)0的可能性是95%。換句話說,不包含總體均數(shù)0的可能性是5%。利用可信區(qū)間推翻無效假設(shè)
一旦發(fā)現(xiàn)沒有包含總體均數(shù)0,我們那么認(rèn)為無效假設(shè)是不對的。即樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的。樣本結(jié)果A和B之間的差異有顯著性。方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽23方法二:利用檢驗統(tǒng)計量檢驗統(tǒng)計量的構(gòu)建〔在無效假設(shè)的前提下〕
檢驗統(tǒng)計量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗統(tǒng)計量一般服從某種分布。這樣我們就可以利用這種分布計算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。方法二:利用檢驗統(tǒng)計量檢驗統(tǒng)計量的構(gòu)建〔在無效假設(shè)的前提下〕24在繼續(xù)進(jìn)展之前在繼續(xù)進(jìn)展之前25界值對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.051.645或-1.645雙側(cè)0.051.96和-1.96一樣檢驗水準(zhǔn),單側(cè)檢驗界值外的概率是雙側(cè)檢驗的2倍界值對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些26堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用。未服藥時成年男性的堿性磷酸酶的均值為60U/l,標(biāo)準(zhǔn)差為15U/l。現(xiàn)觀察到100名服藥后的成年男性的堿性磷酸酶的均值為62U/l,問該藥物是否有提高成年男性堿性磷酸酶的作用?無效假設(shè):備擇假設(shè):檢驗統(tǒng)計量:拒絕無效假設(shè)的區(qū)間:單側(cè)=0.05,如果Z>1.645那么拒絕。結(jié)論:由于1.33<1.645,不拒絕無效假設(shè)。尚無足夠證據(jù)證明該藥有提高成年男性堿性磷酸酶的作用。堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用27血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.5g/l?,F(xiàn)有216名患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l,問此樣本是否來自于上面的總體?
無效假設(shè)H0:此樣本來自于上面的總體或者說此樣本代表的總體與上面的總體一樣。10備擇假設(shè)H1:此樣本不來自于上面的總體或者說此樣本代表的總體與上面的總體不同。10檢驗水準(zhǔn):雙側(cè)0.05血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.28理解檢驗統(tǒng)計量觀察到的量可以是
一個樣本的均數(shù)、兩個樣本均數(shù)的差、
一個樣本的百分構(gòu)成、兩個樣本百分構(gòu)成的差檢驗統(tǒng)計量所服從的分布不一定是正態(tài)分布。但只要是的理論分布,都可以通過該分布求得P值。理解檢驗統(tǒng)計量觀察到的量可以是
一個樣本的均數(shù)、兩個樣本均數(shù)29理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的概率。P值越小說明無效假設(shè)越不可靠。或者說,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小〞,一般的,我們是根據(jù)事先確定的檢驗水準(zhǔn)來判斷的。當(dāng)P<時,我們就可以下諸如“差異有顯著性〞的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端30當(dāng)P>時非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)缺乏。具體問題,專業(yè)判斷
P=0.70與P=0.07當(dāng)P>時非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔31“差異有顯著性〞與“差異顯著〞類似地,還有“差異有高度顯著性〞與“差異極為顯著〞二者之間不存在必然的聯(lián)系?!安町愶@著〞不一定導(dǎo)致“差異有顯著性〞,“差異不顯著〞倒是有很大可能導(dǎo)致“差異有顯著性〞。即使“差異有顯著性〞,臨床上也不一定有意義?!安町愑酗@著性〞與“差異顯著〞類似地,還有“差異有高度顯著性32I型錯誤與II型錯誤
TypeIandTypeIIerrors盡管是小概率事件,它還是有可能發(fā)生的。I型錯誤:雖然無效假設(shè)為真,但由于抽到了較大〔檢驗統(tǒng)計量〕的樣本,使得P值小于檢驗水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗水準(zhǔn)而定,所以犯錯誤的概率也由檢驗水準(zhǔn)而定。II型錯誤:雖然無效假設(shè)為假,但由于抽到了較小〔檢驗統(tǒng)計量〕的樣本,使得P值大于檢驗水準(zhǔn)而導(dǎo)致不被拒絕。犯II型錯誤的概率由另一水準(zhǔn)而定。I型錯誤與II型錯誤
TypeIandTypeII33單側(cè)檢驗還是雙側(cè)檢驗?
One-sidedortwo-sidedtest?雙側(cè)檢驗永遠(yuǎn)是正確的單側(cè)檢驗只有在少數(shù)情況下才是適宜的即使要做單側(cè)檢驗,也必須事先確定單側(cè)檢驗還是雙側(cè)檢驗?
One-sidedortwo-s34非參數(shù)方法Non-parametricmethods估計和假設(shè)檢驗都是基于某種分布來進(jìn)展的,它們之間有著很密切的聯(lián)系。由于分布都可以用某些參數(shù)來描述〔特別是均數(shù)和標(biāo)準(zhǔn)差〕,所以基于分布的統(tǒng)計分析方法又被稱為參數(shù)方法。與此不同的是,統(tǒng)計學(xué)中還存在著另外一類不基于分布的分析方法,這類方法稱為非參數(shù)方法。廣義的,非參數(shù)方法是用來分析那些不適合用參數(shù)方法分析的數(shù)據(jù)〔常見的是嚴(yán)重偏態(tài)的數(shù)據(jù)、等級數(shù)據(jù)〕。最常見的非參數(shù)方法是利用數(shù)據(jù)的順位〔而非數(shù)據(jù)本身〕來進(jìn)展。非參數(shù)方法Non-parametricmethods估計和35統(tǒng)計建模StatisticalModelling在估計和假設(shè)檢驗的思想背后有一個統(tǒng)計分析的一般策略稱為建模。一個統(tǒng)計模型是一個可以近似描述兩個或多個變量之間關(guān)系的數(shù)學(xué)式。這種方法可以簡化數(shù)據(jù)的分析。大多數(shù)參數(shù)方法都可以歸為一個被稱為“線性模型〞的統(tǒng)一框架,其中線性的意思為“可加的〞。其根本思想在于所關(guān)心指標(biāo)的變異可以由許多影響因子的相加的效果來進(jìn)展解釋。例如:血壓值的大小是由年齡、性別、是否吸煙的效果相加而來。統(tǒng)計建模StatisticalModelling在估計和假36關(guān)于統(tǒng)計建模的兩個根本思想統(tǒng)計建模一般基于某些假設(shè),所以在建模之前對這些假設(shè)的驗證是非常重要的。在建好模型之后,我們也要從兩個方面對模型的好壞進(jìn)展評價。
第一是對模型的擬合度進(jìn)展評價??纯从赡P蛿M合的數(shù)據(jù)是否接近樣本數(shù)據(jù),擬合數(shù)據(jù)與樣本數(shù)據(jù)之間的差是否呈隨機(jī)分布。
第二是評價模型在用于預(yù)測更廣范圍的數(shù)據(jù)時,其可靠性如何。關(guān)于統(tǒng)計建模的兩個根本思想統(tǒng)計建模一般基于某些假設(shè),所以在建37區(qū)間估計還是假設(shè)檢驗?假設(shè)檢驗盡管有用,但只能反映數(shù)據(jù)信息的一局部。區(qū)間估計反映〔對總體特征〕估計的不確定程度,能更全面地把握數(shù)據(jù)??尚艆^(qū)間與假設(shè)檢驗的互通性
如果95%可信區(qū)間不包含總體均數(shù),那么假設(shè)檢驗中P值一定小于0.05反之,如果95%可信區(qū)間包含總體均數(shù),那么P值一定大于0.05。99%可信區(qū)間同理。區(qū)間估計還是假設(shè)檢驗?假設(shè)檢驗盡管有用,但只能反映數(shù)據(jù)信息的38小結(jié)理解統(tǒng)計分析的根本思想至關(guān)重要。樣本均數(shù)/樣本百分構(gòu)成的抽樣分布理論。中心極限定理。估計〔主要是區(qū)間估計〕和假設(shè)檢驗是統(tǒng)計分析的兩個重要工具。P值的理解與解釋?!安町愑酗@著性〞與“有顯著差異〞不能混為一談。“差異有顯著性〞也不代表臨床上有意義。小結(jié)理解統(tǒng)計分析的根本思想至關(guān)重要。39統(tǒng)計分析的原那么
PrinciplesofstatisticalanalysisAdistinctivefunctionofstatisticsisthis:itenablesthescientisttomakeanumericalevaluationoftheuncertaintyofhisconclusion.--Snedecor(1950)統(tǒng)計分析的原那么
Principlesofstatist40引言統(tǒng)計分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中去。SamplePopulation利用均數(shù)、標(biāo)準(zhǔn)差;百分構(gòu)成/率;圖表等進(jìn)展描述。不同處理組間的比較。樣本結(jié)論〔統(tǒng)計量〕能否代表總體〔參數(shù)〕?統(tǒng)計分析的兩個根本工具—估計Estimation和假設(shè)檢驗HypothesisTest引言統(tǒng)計分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中41統(tǒng)計學(xué)的一個重要思想如何說明從樣本中得出的結(jié)果是對總體的最好的估計〔Estimate〕?例1:服用A藥的病人63%得到緩解,而服用B藥的病人只有53%。A藥的療效比B藥好10%。〔P=0.15〕例2:服用A藥的病人56%得到完全緩解,而服用B藥的病人只有36%。A藥的療效比B藥好18%?!睵<0.01〕統(tǒng)計學(xué)的一個重要思想如何說明從樣本中得出的結(jié)果是對總體的最好42抽樣變異SamplingVariation抽樣變異SamplingVariation43樣本均數(shù)的變異Variabilityofsamplemeans性質(zhì)
1.較大樣本的均數(shù)的變異小于較小樣本的均數(shù)的變異
2.樣本均數(shù)的變異小于觀測值的變異
3.樣本均數(shù)的變異隨觀測值變異的增大而增大樣本均數(shù)的變異Variabilityofsamplem44隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistribution從一個總體中隨機(jī)地、不斷地抽出樣本大小一樣的樣本,這些樣本具有如下性質(zhì):1.樣本均數(shù)/方差的期望=總體均數(shù)/方差2.樣本均數(shù)的均數(shù)=總體均數(shù)
樣本均數(shù)的方差=總體方差/樣本量
樣本均數(shù)的標(biāo)準(zhǔn)差-標(biāo)準(zhǔn)誤
標(biāo)準(zhǔn)誤的估計3.如果總體為正態(tài)分布,那么樣本均數(shù)的分布也是正態(tài)分布。如果樣本量足夠大,那么即使總體不是正態(tài)分布,樣本均數(shù)的分布也近似正態(tài)分布—中心極限定理〔CentralLimitedTheorem〕。隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistr45對抽樣分布的補(bǔ)充說明在實際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對稱的分布,就可以認(rèn)為其均數(shù)的分布服從正態(tài)或接近于正態(tài)。在實際應(yīng)用中,只要樣本量足夠大,那么不管數(shù)據(jù)呈何種分布,都可以將其均數(shù)的分布當(dāng)作正態(tài)分布來處理。隨機(jī)樣本的均數(shù)的分布的第1條性質(zhì)和第3條性質(zhì)同樣適用于樣本的百分構(gòu)成〔如二項分布〕。但是由于這類數(shù)據(jù)所代表的顯然不是正態(tài)總體,所以只有在樣本量相當(dāng)大時才可以應(yīng)用性質(zhì)1和3。對抽樣分布的補(bǔ)充說明在實際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對46記號Notations記號Notations47理解抽樣分布理解抽樣分布48計算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清白蛋白服從均數(shù)35g/l標(biāo)準(zhǔn)差6g/l的正態(tài)分布?,F(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個考察它們的均數(shù)的分布。
理論上,均數(shù)的均數(shù)均應(yīng)該等于35,均數(shù)的標(biāo)準(zhǔn)差應(yīng)該分別等于計算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原49Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清膽紅素服從均數(shù)3.6mol/l標(biāo)準(zhǔn)差1.1mol/l的對數(shù)正態(tài)分布?,F(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個考察它們的均數(shù)的分布。二項分布的抽樣分布
例:假設(shè)哮喘在人群中的患病率為20%,現(xiàn)隨機(jī)抽取樣本量為10、25、100的樣本各100個考察哮喘患者數(shù)的分布。Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原50一個樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofasamplemean例:216名原發(fā)性膽石癥患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l。假設(shè)服從正態(tài)分布并且此樣本為一隨機(jī)樣本,試問如何用此樣本的均數(shù)來對總體的均數(shù)進(jìn)展估計呢?一個樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofa51兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorofthedifferencebetweentwosamplemeans因為兩樣本均數(shù)之差的方差等于兩樣本各自均數(shù)的方差之和,所以:兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorof52一個樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorofasampleproportion理論上,當(dāng)np>5時,二項分布的百分構(gòu)成p近似地服從均數(shù)為p,標(biāo)準(zhǔn)差為的正態(tài)分布。即樣本百分構(gòu)成p的標(biāo)準(zhǔn)誤為:例:觀察到80名婦女中有13名患有哮喘,那么哮喘的百分構(gòu)成p為13/80=0.16,其標(biāo)準(zhǔn)誤為:一個樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorof53兩個樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,因為兩個樣本的百分構(gòu)成之差的方差等于兩個樣本各自的百分構(gòu)成的方差的和,所以兩個樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤的計算為:兩個樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,54可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕55可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕56理解可信區(qū)間理解可信區(qū)間57假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思想
兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis〔H0〕
意在推翻的假設(shè)〔說法A〕。備擇假設(shè)Alternativehypothesis〔H1〕
意在承受的假設(shè)〔說法B〕。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗HypothesisTesting假設(shè)檢驗的反證思58小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗〔抽樣〕時,我們往往認(rèn)為它〔事件A〕不會發(fā)生。統(tǒng)計學(xué)中,小概率事件一般是指發(fā)生概率<0.05〔檢驗水準(zhǔn)〕的事件。在假設(shè)檢驗中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們那么疑心無效假設(shè)的真實性。小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗〔抽樣59例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處理結(jié)果B
效果Effect:=結(jié)果A-結(jié)果B對于總體
如果=0,那么A處理和B處理之間沒有差異。
如果0,那么A處理和B處理之間有差異。對于樣本
即使=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處60對本例進(jìn)展假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計算出得到樣本差異或者更大差異的概率〔P值〕。如果P值小于檢驗水準(zhǔn),那么我們認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,承受備擇假設(shè)〔差異顯著性〕。反之對本例進(jìn)展假設(shè)檢驗的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅61方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。由此假設(shè),。那么有包含95%的,同樣地,包含總體均數(shù)0的可能性是95%。換句話說,不包含總體均數(shù)0的可能性是5%。利用可信區(qū)間推翻無效假設(shè)
一旦發(fā)現(xiàn)沒有包含總體均數(shù)0,我們那么認(rèn)為無效假設(shè)是不對的。即樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的。樣本結(jié)果A和B之間的差異有顯著性。方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽62方法二:利用檢驗統(tǒng)計量檢驗統(tǒng)計量的構(gòu)建〔在無效假設(shè)的前提下〕
檢驗統(tǒng)計量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗統(tǒng)計量一般服從某種分布。這樣我們就可以利用這種分布計算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。方法二:利用檢驗統(tǒng)計量檢驗統(tǒng)計量的構(gòu)建〔在無效假設(shè)的前提下〕63在繼續(xù)進(jìn)展之前在繼續(xù)進(jìn)展之前64界值對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.051.645或-1.645雙側(cè)0.051.96和-1.96一樣檢驗水準(zhǔn),單側(cè)檢驗界值外的概率是雙側(cè)檢驗的2倍界值對應(yīng)于檢驗水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些65堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用。未服藥時成年男性的堿性磷酸酶的均值為60U/l,標(biāo)準(zhǔn)差為15U/l?,F(xiàn)觀察到100名服藥后的成年男性的堿性磷酸酶的均值為62U/l,問該藥物是否有提高成年男性堿性磷酸酶的作用?無效假設(shè):備擇假設(shè):檢驗統(tǒng)計量:拒絕無效假設(shè)的區(qū)間:單側(cè)=0.05,如果Z>1.645那么拒絕。結(jié)論:由于1.33<1.645,不拒絕無效假設(shè)。尚無足夠證據(jù)證明該藥有提高成年男性堿性磷酸酶的作用。堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用66血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.5g/l。現(xiàn)有216名患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l,問此樣本是否來自于上面的總體?
無效假設(shè)H0:此樣本來自于上面的總體或者說此樣本代表的總體與上面的總體一樣。10備擇假設(shè)H1:此樣本不來自于上面的總體或者說此樣本代表的總體與上面的總體不同。10檢驗水準(zhǔn):雙側(cè)0.05血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.67理解檢驗統(tǒng)計量觀察到的量可以是
一個樣本的均數(shù)、兩個樣本均數(shù)的差、
一個樣本的百分構(gòu)成、兩個樣本百分構(gòu)成的差檢驗統(tǒng)計量所服從的分布不一定是正態(tài)分布。但只要是的理論分布,都可以通過該分布求得P值。理解檢驗統(tǒng)計量觀察到的量可以是
一個樣本的均數(shù)、兩個樣本均數(shù)68理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小〞,一般的,我們是根據(jù)事先確定的檢驗水準(zhǔn)來判斷的。當(dāng)P<時,我們就可以下諸如“差異有顯著性〞的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端69當(dāng)P>時非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)缺乏。具體問題,專業(yè)判斷
P=0.70與P=0.07當(dāng)P>時非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔70“差異有顯著性〞與“差異顯著〞類似地,還有“差異有高度顯著性〞與“差異極為顯著〞二者之間不存在必然的聯(lián)系?!安町愶@著〞不一定導(dǎo)致“差異有顯著性〞,“差異不顯著〞倒是有很大可能導(dǎo)致“差異有顯著性〞。即使“差異有顯著性〞,臨床上也不一定有意義。“差異有顯著性〞與“差異顯著〞類似地,還有“差異有高度顯著性71I型錯誤與II型錯誤
TypeIandTypeIIerrors盡管是小概率事件,它還是有可能發(fā)生的。I型錯誤:雖然無效假設(shè)為真,但由于抽到了較大〔檢驗統(tǒng)計量〕的樣本,使得P值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 超市員工2025年度環(huán)境與職業(yè)健康合同
- 二零二五拼多多商家入駐合同范本:電商合作細(xì)節(jié)解析
- 二零二五年度城市廣場綠化維護(hù)個人服務(wù)合同
- 2025年度通信工程施工現(xiàn)場環(huán)境保護(hù)合同
- 2025年度茶葉文化研究及出版合作協(xié)議
- 二零二五年度民辦學(xué)校教職工校企合作與產(chǎn)學(xué)研用合同
- 冷庫租賃與冷鏈物流信息化管理服務(wù)協(xié)議2025
- 二零二五年度個人委托代付款安全無憂服務(wù)合同
- Unit 8 How are you?Period 3 詞匯與語法過關(guān) 同步練習(xí)(含答案)
- 2025年西安貨運(yùn)從業(yè)資格考試題目大全及答案
- 大學(xué)生心理健康(上海交通大學(xué))知到智慧樹章節(jié)答案
- 《呼吸囊的使用》課件
- 高三百天沖刺家長會
- 《文化遺產(chǎn)概論》課程教學(xué)大綱
- TD-T 1048-2016耕作層土壤剝離利用技術(shù)規(guī)范
- 公共體育場館物業(yè)管理服務(wù)方案
- 乳腺外科診療指南技術(shù)操作規(guī)范
- 北京市西城區(qū)2022-2023學(xué)年高三上學(xué)期期末試卷政治試卷 附答案
- 建筑施工起重吊裝工程安全技術(shù)規(guī)范
- 蘇教一年級《心理健康》教案(完整版)
- 部編人教版五年級下冊小學(xué)道德與法治全冊課時作業(yè)(一課一練)
評論
0/150
提交評論