醫(yī)學(xué)統(tǒng)計(jì)學(xué)符號-公式-重點(diǎn)(完整版)_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)符號-公式-重點(diǎn)(完整版)_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)符號-公式-重點(diǎn)(完整版)_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)符號-公式-重點(diǎn)(完整版)_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)符號-公式-重點(diǎn)(完整版)_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章醫(yī)學(xué)統(tǒng)計(jì)中的基本概念1、 醫(yī)學(xué)統(tǒng)計(jì)學(xué)是研究醫(yī)學(xué)數(shù)據(jù)的收集、整理、分析、解釋和呈現(xiàn)其結(jié)果的一門學(xué)科。2、 個(gè)體:研究的基本觀察單位。3、 變量:用于觀察研究對象的指標(biāo)。4、 觀察值:個(gè)體變量的數(shù)值。5、 資料:又稱為數(shù)據(jù),由變量的觀察值構(gòu)成。 變異:個(gè)體觀察值之間具有的差異。 變異和同質(zhì)是對統(tǒng)計(jì)學(xué)數(shù)據(jù)的要求! 變異是統(tǒng)計(jì)學(xué)研究的真正對象! 統(tǒng)計(jì)學(xué)是研究變異規(guī)律的科學(xué)! 同質(zhì):個(gè)體觀察值之間的變異在允許范圍內(nèi)。 異質(zhì):個(gè)體觀察值之間的變異超出允許范圍。一、總體、抽樣、樣本、參數(shù)、統(tǒng)計(jì)量總體:同質(zhì)的個(gè)體所構(gòu)成的全體研究對象??傮w同時(shí)具有同質(zhì)和變異兩個(gè)特點(diǎn)。 有限總體:總體中的個(gè)體數(shù)量是有限的。

2、 無限總體:總體中的個(gè)體數(shù)量是無限的。 樣本:從總體中隨機(jī)抽取的部分個(gè)體。 樣本量:樣本所包含的個(gè)體數(shù)目。 參數(shù):刻畫總體特征的指標(biāo)。 統(tǒng)計(jì)量:刻畫樣本特征的指標(biāo)。抽樣:從總體中隨機(jī)抽取部分個(gè)體的過程。抽樣具有代表性、隨機(jī)性、可靠性、可比性;原則:代表性:樣本能充分反映總體特征。隨機(jī)性:保證總體中每個(gè)個(gè)體都有相同的幾率被抽樣。 隨機(jī)性是代表性的保證; 生活中隨機(jī)性的例子(思考題); 計(jì)量資料:由連續(xù)變量的觀察值構(gòu)成的資料。對每個(gè)觀察對象的觀察指標(biāo)用定量方法測定其數(shù)值大小所得的資料,一般有度量衡單位,例如年齡、身高、血糖。 計(jì)數(shù)資料:由離散變量的觀察值構(gòu)成的資料。先將觀察對象的觀測指標(biāo)按性質(zhì)或類

3、別進(jìn)行分組,然后計(jì)數(shù)各組的數(shù)目所得的資料,例如性別、患病、血型。 等級分組資料:由等級變量的觀測值構(gòu)成的資料。具有計(jì)數(shù)資料的特征,同時(shí)又具有半定量性質(zhì)的資料,例如細(xì)菌培養(yǎng)陽性結(jié)果。二、3種設(shè)計(jì)類型:完全隨機(jī)設(shè)計(jì);配對設(shè)計(jì);配伍組設(shè)計(jì)。三、 抽樣誤差、概率和小概率事件 抽樣誤差:由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異。抽樣誤差的原因;抽樣誤差是不可避免的。 概率P:表示某事件發(fā)生的可能性大小的度量。v 小概率事件:統(tǒng)計(jì)學(xué)上習(xí)慣將P0.05或P0.01的事件稱為小概率事件,表示該事件發(fā)生的可能性很小?!靶「怕适录苯y(tǒng)計(jì)意義(兩面性) 小概率事件幾乎不會發(fā)生,或者說可以認(rèn)為在一次試驗(yàn)中不會發(fā)生統(tǒng)

4、計(jì)推斷基礎(chǔ)(正面:應(yīng)用); 小概率事件偶然會發(fā)生,如果發(fā)生了統(tǒng)計(jì)推斷發(fā)生錯(cuò)誤(反面:警惕);第二章集中趨勢的統(tǒng)計(jì)描述一、統(tǒng)計(jì)描述總體和樣本具有同質(zhì)和變異兩個(gè)特征。集中趨勢同質(zhì)的統(tǒng)計(jì)描述;變異程度變異的統(tǒng)計(jì)描述;統(tǒng)計(jì)描述主要通過統(tǒng)計(jì)量和統(tǒng)計(jì)圖表來刻畫的頻數(shù)表和直方圖頻數(shù)表:同時(shí)列出觀察指標(biāo)的可能取值區(qū)間及其在各區(qū)間內(nèi)出現(xiàn)頻數(shù)的統(tǒng)計(jì)表。直方圖:以垂直條段代表頻數(shù)分布的一種圖形,條段的高度代表各組的頻數(shù),由縱軸標(biāo)度;各組的組限由橫軸標(biāo)度,條段的寬度表示組距。頻數(shù)表和直方圖的用途1. 作為陳述資料的形式; 2. 便于觀察數(shù)據(jù)的分布類型; 3. 便于發(fā)現(xiàn)資料中含有的異常值;4. 可用各組段的頻率作為概率

5、的估計(jì)值; 二、平均數(shù)平均數(shù):描述一組觀察值集中趨勢或平均水平的統(tǒng)計(jì)指標(biāo)。平均數(shù)類型 算數(shù)均數(shù)(均數(shù)):線性尺度上的平均水平; 幾何均數(shù):對數(shù)尺度上的平均水平; 中位數(shù):順序尺度上的平均水平; 百分位數(shù):順序尺度上的平均水平。均數(shù)的意義和應(yīng)用均數(shù)代表每組觀察值的平衡點(diǎn),也就是重心。常用在對稱分布,尤其是正態(tài)分布;在偏態(tài)分布時(shí),易受極值影響;算術(shù)均數(shù)算數(shù)均數(shù)(均數(shù)):線性尺度上的平均水平幾何均數(shù)及應(yīng)用幾何均數(shù):對數(shù)尺度上的平均水平;1. 幾何均數(shù)的對數(shù)等于各觀察值對數(shù)的算術(shù)均數(shù);2.幾何均數(shù)主要應(yīng)用在免疫學(xué)(抗體滴度、血清凝聚效價(jià))、微生物學(xué)(細(xì)菌計(jì)數(shù))等領(lǐng)域。觀察值一般呈等比或?qū)?shù)正態(tài)分布。中

6、位數(shù)中位數(shù):將一組觀察值從小到大按順序排列,居中心位置的數(shù)值,記為M。中位數(shù)的精確計(jì)算1. 當(dāng)觀察例數(shù)n為奇數(shù)時(shí),中位數(shù)是按順序排列在第(n+1)/2項(xiàng)的觀察值;2. 當(dāng)觀察例數(shù)n為偶數(shù)時(shí),中位數(shù)是按順序排列在第n/2和(n/2)+1項(xiàng)觀察值的平均值;百分位數(shù)百分位數(shù)Px:指在一組數(shù)據(jù)中找到這樣一個(gè)數(shù)值,全部觀察值的x%小于Px ,其余(100-x)%大于Px。l 定量:頻數(shù)表/圖 集中趨勢+離散程度 是否對稱變異系數(shù):兩均數(shù)相差很大,或者不同變量間變異程度的比較l 定性:發(fā)病率、構(gòu)成比l 相對數(shù)使用注意事項(xiàng)l 率的標(biāo)化第三章 變異程度的統(tǒng)計(jì)描述自由度的理解樣本方差S2是總體方差2的無偏估計(jì)。

7、 E(S2)=2n-1 是自由度df自由度:已知 ,固定X1,X2,.,Xn-1后,Xn必然確定;所以只有n-1個(gè)獨(dú)立(自由變化)個(gè)體。不同類型變異程度指標(biāo)的比較正態(tài)分布及應(yīng)用正態(tài)分布有兩個(gè)參數(shù) 和 , 分別表示均數(shù)和標(biāo)準(zhǔn)差主要特征: 1.以為中心的對稱分布 2.鐘型曲線 3.曲線下面積分布有規(guī)律 4.兩個(gè)參數(shù)決定位置和變異當(dāng)=0,=1時(shí),稱為標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布曲線下面積單側(cè)95%=雙側(cè)90%=1.645 :68% 1.96:95% 2.58:99%二、醫(yī)學(xué)參考值范圍的制定方法 (一)選擇一定數(shù)量的參照樣本;(二)對選定的參照樣本進(jìn)行準(zhǔn)確的測定;(三)決定取單側(cè)范圍還是雙側(cè)范圍值;(四)選擇

8、適當(dāng)?shù)陌俜址秶唬ㄎ澹┕烙?jì)參考值范圍的界限;(三)決定取單側(cè)范圍還是雙側(cè)范圍值 有些指標(biāo)過高或過低均屬異常(A) ,故其參考值范圍需要分別確定下限和上限,稱作雙側(cè)參考值范圍。有些指標(biāo)僅在過高(B)或過低時(shí)為異常(C),只需確定其上限或下限,稱作單側(cè)參考值范圍。(四)選擇適當(dāng)?shù)陌俜址秶?參考值的百分范圍應(yīng)根據(jù)資料的性質(zhì)和研究目的選擇,它與診斷閾值有確定的關(guān)系。百分范圍的不同將導(dǎo)致不同的假陽性率和假陰性率。(五)估計(jì)參考值范圍的界限參考值范圍估計(jì)主要有百分位數(shù)法和正態(tài)分布法。 總結(jié)衡量變異程度的指標(biāo) 極差、四分位數(shù)間距、方差和標(biāo)準(zhǔn)差、變異系數(shù)正態(tài)分布的特征和曲線下面積分布規(guī)律醫(yī)學(xué)參考值范圍的制定方

9、法第四章 抽樣誤差與假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(基本步驟)1、 建立假設(shè)和確定檢驗(yàn)水準(zhǔn);建立假設(shè)(反證法的假設(shè)命題)無效假設(shè)H0: d=0備擇假設(shè)H1: d0確定檢驗(yàn)水準(zhǔn)(小概率事件定義)=0.05或=0.012. 選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量;3. 確定P值和作出統(tǒng)計(jì)推斷結(jié)論1)計(jì)算獲得t值的概率P值,并與檢驗(yàn)水準(zhǔn)比較。2)若P,小概率事件發(fā)生,矛盾,拒絕H0 ,接受H1;認(rèn)為d0,即治療前后血清甘油三酯差異有顯著統(tǒng)計(jì)學(xué)意義。3)若P ,不能拒絕拒絕H0 ;認(rèn)為d=0,即治療前后血清甘油三酯差異無顯著統(tǒng)計(jì)學(xué)意義。假設(shè)檢驗(yàn)(三個(gè)基本步驟)1. 建立假設(shè)和確定檢驗(yàn)水準(zhǔn);3. 選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量;

10、4. 確定P值和作出統(tǒng)計(jì)推斷結(jié)論。假設(shè)檢驗(yàn)的思路1. 為了判斷兩組樣本代表的總體之間的差異是由抽樣誤差還是總體之間本質(zhì)差別引起的?2. 作假設(shè)。H0:抽樣誤差引起的; H1 :總體本質(zhì)差別引起的。3. 利用反證法在H0條件下計(jì)算樣本的統(tǒng)計(jì)量。4. 利用抽樣分布原理,根據(jù)樣本統(tǒng)計(jì)量大小判斷抽樣結(jié)果是否為小概率事件,決定是否拒絕H0 。假設(shè)檢驗(yàn)的基本思想 反證法思想 小概率事件原理關(guān)于的說明1. 檢驗(yàn)水準(zhǔn),顯著性水平,即定義小概率事件;2. 界值是人為確定的,常用0.05,0.01;某些情況下可取0.1,0.001; P0.05,“差異沒有顯著統(tǒng)計(jì)學(xué)意義”; P0.05,“差異有顯著統(tǒng)計(jì)學(xué)意義”;

11、 P0.01,“差異有極其顯著統(tǒng)計(jì)學(xué)意義”; 錯(cuò)誤的說法:“有顯著差異”;“差異是否顯著”由專業(yè)來決定,統(tǒng)計(jì)學(xué)只能給出“差異是否有統(tǒng)計(jì)學(xué)意義”,即是否有證據(jù)表明存在差異。3. 界值代表容許犯錯(cuò)的最大概率,是事先確定的,不能隨便移動 。假設(shè)檢驗(yàn)的兩類錯(cuò)誤1. 一般反證法能得到絕對矛盾;2. 假設(shè)檢驗(yàn)的矛盾基于“小概率事件原理”“小概率事件(P)在一次試驗(yàn)中是不會發(fā)生的”;l 若小概率事件發(fā)生了,則我們犯了經(jīng)驗(yàn)主義錯(cuò)誤;l 因?yàn)樾「怕适录l(fā)生可能性為,則我們犯經(jīng)驗(yàn)主義錯(cuò)誤的概率為,這種錯(cuò)誤稱為型錯(cuò)誤。l 若小概率事件沒有發(fā)生,接受零假設(shè)時(shí),還是有可能犯錯(cuò)誤,這時(shí)候錯(cuò)誤是教條主義,稱為型錯(cuò)誤。單側(cè)還

12、是雙側(cè)檢驗(yàn)研究目的決定第五章 t 檢驗(yàn)t分布特征 自由度不同,曲線形態(tài)不同,t分布是一簇曲線; 自由度越大,t分布越接近于正態(tài)分布;當(dāng)自由度逼近時(shí),t分布趨向于標(biāo)準(zhǔn)正態(tài)分布; 自由度較小時(shí),曲線峰的高度低于標(biāo)準(zhǔn)正態(tài)曲線,且曲線峰的寬度也較標(biāo)準(zhǔn)正態(tài)分布曲線峰狹,尾部面積大于標(biāo)準(zhǔn)正態(tài)曲線尾部面積,而且自由度越小,t分布的這種特征越明顯(翹尾低狹峰)。標(biāo)準(zhǔn)正態(tài)分布概率a、與u值關(guān)系標(biāo)準(zhǔn)正態(tài)分布中u值大小與尾部面積(概率a)有關(guān),以ua (單側(cè))和ua/2(雙側(cè))表示; P、自由度n與t值關(guān)系1. 在t分布中,t值與P、n的大小有關(guān);2. 在t分布中,當(dāng)自由度一定時(shí)P越小,|t|越大;3. 在P一定時(shí)

13、,自由度越小,|t|越大,大于u值;4.在單側(cè)時(shí)(尾部面積取單側(cè))t界值表示為ta,n ,雙側(cè)時(shí)表示為ta/2,n ,其意義為單樣本 t檢驗(yàn)原理在 H0 :m =m0的假定下,可以認(rèn)為樣本是從已知總體中抽取的,根據(jù)t分布的原理,單樣本t檢驗(yàn)的公式為:自由度nn-1樣本來自總體的可能性越大: 樣本均數(shù)與總體均數(shù)差別越大; 樣本標(biāo)準(zhǔn)差越??; 樣本量越大;單樣t檢驗(yàn)的應(yīng)用條件:小樣本資料(如n0.05,表明差異無統(tǒng)計(jì)學(xué)意義,按 a=0.05水準(zhǔn)不拒絕H0,根據(jù)現(xiàn)有樣本信息,尚不能認(rèn)為該地難產(chǎn)兒與一般新生兒平均出生體重不同。配對樣本均數(shù)t檢驗(yàn)配對樣本均數(shù)t檢驗(yàn):簡稱配對t檢驗(yàn),又稱非獨(dú)立兩樣本均數(shù)t檢

14、驗(yàn),適用于配對設(shè)計(jì)計(jì)量資料均數(shù)的比較,其比較目的是檢驗(yàn)兩相關(guān)樣本均數(shù)所代表的未知總體均數(shù)是否有差別。 配對設(shè)計(jì):是將受試對象按某些重要特征相近的原則配對,每對中的兩個(gè)個(gè)體隨機(jī)地給予(兩種處理中的)一種處理。 配對設(shè)計(jì)概述1. 應(yīng)用配對設(shè)計(jì)可以減少實(shí)驗(yàn)的誤差和控制非處理因素,提高統(tǒng)計(jì)處理的效率。 2. 配對設(shè)計(jì)處理分配方式主要有三種情況:兩個(gè)同質(zhì)受試對象分別接受兩種處理,如把同窩、同性別和體重相近的動物配成一對,或把同性別和年齡相近的相同病情病人配成一對;同一受試對象或同一標(biāo)本的兩個(gè)部分,隨機(jī)分配接受兩種不同處理,如例5.2資料;自身對比(self-contrast)。即將同一受試對象處理(實(shí)驗(yàn)

15、或治療)前后的結(jié)果進(jìn)行比較,如對高血壓患者治療前后、運(yùn)動員體育運(yùn)動前后的某一生理指標(biāo)進(jìn)行比較。 配對樣本均數(shù)t檢驗(yàn)檢驗(yàn)步驟1. 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) H0:md=0,兩種結(jié)核菌素的皮膚浸潤反應(yīng)總體平均直徑差異為0; H1:md0,兩種結(jié)核菌素的皮膚浸潤反應(yīng)總體平均直徑差異不為0; a=0.05或0.01。2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量3. 確定 P 值,作出推斷結(jié)論 自由度計(jì)算為 =n-1=12-1=11, P=0.0010.01,差別有統(tǒng)計(jì)學(xué)意義,拒絕H0,接受H1, 可認(rèn)為兩種方法皮膚浸潤反應(yīng)結(jié)果的差別有統(tǒng)計(jì)學(xué)意義。兩獨(dú)立樣本均數(shù)t檢驗(yàn)1. 兩獨(dú)立樣本均數(shù)t 檢驗(yàn)又稱成組t檢驗(yàn)。 2. 適用于

16、完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)的比較,其目的是檢驗(yàn)兩樣本所來自總體的均數(shù)是否相等。 3. 完全隨機(jī)設(shè)計(jì)是將受試對象隨機(jī)地分配到兩組中,每組患者分別接受不同的處理,分析比較處理的效應(yīng)。 兩獨(dú)立樣本t檢驗(yàn)原理兩獨(dú)立樣本t檢驗(yàn)的檢驗(yàn)假設(shè)是兩總體均數(shù)相等,即H0:1=2,也可表述為12=0, t統(tǒng)計(jì)量計(jì)算公式為 兩獨(dú)立樣本t檢驗(yàn)檢驗(yàn)步驟1. 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) H0:m1=m2,兩種療法治療后患者血糖值的總體均數(shù)相同; H1:m1m2,兩種療法治療后患者血糖值的總體均數(shù)不同; =a0.05或0.01。2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量3. 確定P值,作出推斷結(jié)論兩獨(dú)立樣本t檢驗(yàn)自由度為 n =n1+n2-2=12

17、+13-2=23; P=0.0010.01,按a=0.01的水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義。t檢驗(yàn)的應(yīng)用條件 計(jì)量資料; 小樣本(n0.05,“差異沒有(顯著)統(tǒng)計(jì)學(xué)意義”; P0.05,“差異有(顯著)統(tǒng)計(jì)學(xué)意義”; P0.01,“差異有極其(顯著)統(tǒng)計(jì)學(xué)意義”; 錯(cuò)誤的說法:“有顯著差異”;“差異是否顯著”由專業(yè)來決定,統(tǒng)計(jì)學(xué)只能給出“差異是否有統(tǒng)計(jì)學(xué)意義”,即是否有證據(jù)表明存在差異。3. 界值代表容許犯錯(cuò)的最大概率,是事先確定的,不能隨便移動 。t 檢驗(yàn)中的注意事項(xiàng) 1. 假設(shè)檢驗(yàn)結(jié)論正確的前提 作假設(shè)檢驗(yàn)用的樣本資料,必須能代表相應(yīng)的總體,同時(shí)各對比組具有良好的組間均衡性,才

18、能得出有意義的統(tǒng)計(jì)結(jié)論和有價(jià)值的專業(yè)結(jié)論。2. 檢驗(yàn)方法的選用及其適用條件 應(yīng)根據(jù)分析目的、研究設(shè)計(jì)、資料類型、樣本量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。3. 雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)的選擇 需根據(jù)研究目的和專業(yè)知識予以選擇。單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)中的t值計(jì)算過程相同,只是t界值不同,對同一資料作單側(cè)檢驗(yàn)更容易獲得顯著的結(jié)果。單雙側(cè)檢驗(yàn)的選擇,應(yīng)在統(tǒng)計(jì)分析工作開始之前就決定,若缺乏這方面的依據(jù),一般應(yīng)選用雙側(cè)檢驗(yàn)。4.假設(shè)檢驗(yàn)的結(jié)論不能絕對化 假設(shè)檢驗(yàn)統(tǒng)計(jì)結(jié)論的正確性是以概率作保證的,作統(tǒng)計(jì)結(jié)論時(shí)不能絕對化。在報(bào)告結(jié)論時(shí),最好列出概率P的確切數(shù)值。當(dāng)P 接近臨界值時(shí),下結(jié)論應(yīng)慎重。5. 正確理解P值的統(tǒng)計(jì)意義 P

19、是指在無效假設(shè) H0 的總體中進(jìn)行隨機(jī)抽樣,所觀察到的等于或大于現(xiàn)有統(tǒng)計(jì)量值的概率。其推斷的基礎(chǔ)是小概率事件的原理,即概率很小的事件在一次抽樣研究中幾乎是不可能發(fā)生的,如發(fā)生則拒絕H0。因此,只能說明統(tǒng)計(jì)學(xué)意義的“顯著”。假設(shè)檢驗(yàn)中兩類錯(cuò)誤第六章 方差分析F分布的三個(gè)抽樣分布的事實(shí)上,它們都是基于正態(tài)分布。分布函數(shù)F:F分布在的統(tǒng)計(jì)學(xué)家RAFisher姓的第一個(gè)字母的名稱F分布的目的:方差分析,協(xié)方差分析和回歸分析的分析。 (A)F分布的定義為:設(shè)X,Y兩個(gè)獨(dú)立的隨機(jī)變量X的自由度的卡方分布M,Y服從卡方分布的N 2 獨(dú)立自由的程度的各自的自由度,在另外的購買比例的量的統(tǒng)計(jì)分布的卡方分布F =

20、(/米)/(Y / N)(米,n)的F分布服從自由度在F服從程度的自由米,第二自由度的F-n的密度函數(shù)的分布這樣的條目, (II)F的性質(zhì)為1的分布,這是一種非對稱的分布; 2,具有兩個(gè)自由度,即相應(yīng)的分布是由F(n-1個(gè),百萬-1 m-1的1)中,n表示? - 1通常被稱為作為分子的自由度,m-1的通常被稱為作為分母的自由度; 3 F分布是一個(gè)自由度n -1個(gè),和m-1是一個(gè)分布族的不同程度的參數(shù),自由決定的F-分布的形狀。 F分布的天然的互補(bǔ)性:F,DF1,DF2 =1/F1-,DF2,DF1多個(gè)樣本均數(shù)的兩兩比較兩獨(dú)立樣本均數(shù)t檢驗(yàn)如采用多次t檢驗(yàn),累積型錯(cuò)誤概率將大大增加。方差分析思想

21、要說明甲組比乙組和丙組好,首先其次: 方差分析步驟 提出檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)。 H0: 三個(gè)組GSH值的總體均數(shù)相同; H1: 三個(gè)組GSH值的總體均數(shù)不全相同; 根據(jù)公式計(jì)算SS、MS及F值,列于方差分析表內(nèi)。 確定P值,作出判斷 分子自由度=k-1=2,分母自由度=n-k=33,F(xiàn)=23.85,P分母);第七章 相對數(shù)及其應(yīng)用相對數(shù)的種類率(rate) 構(gòu)成比(constituent ratio) 相對比(relative ratio) 率(通常針對二分類計(jì)數(shù)資料)概念:率是表示某種現(xiàn)象發(fā)生的頻率和強(qiáng)度,常以百分率(%)、千分率()、萬分率(/萬)、十萬分率(10萬)等表示 。計(jì)算公式:

22、注意:比例基數(shù)”通常依據(jù)習(xí)慣而定,治愈率、感染率用百分率,出生率、死亡率用千分率,某些疾病的死亡率用十萬分率。保持率的整數(shù)位12位。構(gòu)成比(通常針對多分類計(jì)數(shù)資料或等級資料)概念:又稱構(gòu)成指標(biāo),表示事物內(nèi)部各個(gè)組成部分所占整體的比重,通常以100為比例基數(shù),以百分比表示。 計(jì)算公式:注意:各組成部分的構(gòu)成比之和為100%,某一部分比重增大,則其它部分相應(yīng)減少。相對比概念:相對比是兩個(gè)有關(guān)聯(lián)指標(biāo)之比,用以描述兩者的對比水平,常用R表示。 計(jì)算公式: 注意:A大于B用倍數(shù)表示,A小于B時(shí)用百分?jǐn)?shù)表示。相對比的種類1. 兩類個(gè)體例數(shù)之比 兩類同指標(biāo)之比(男:女) 兩類不同指標(biāo)之比(人均收入)2. 兩

23、個(gè)率之比(相對危險(xiǎn)度RR)3. 兩個(gè)相對比之比(比值比OR)相對數(shù)使用應(yīng)注意的問題1. 不要把構(gòu)成比與率相混淆(例7.1);2. 使用相對數(shù)時(shí)分母不宜過?。ㄍ痘@比較);3. 注意資料的可比性(醫(yī)院治愈率比較);4. 要考慮抽樣誤差。率的標(biāo)準(zhǔn)化率的標(biāo)準(zhǔn)化,是為了在比較兩個(gè)不同人群的患病率、發(fā)病率、死亡率等資料時(shí),消除其內(nèi)部構(gòu)成(如年齡、性別、工齡、病程長短等)的影響。如年齡會影響死亡率,年齡越大,死亡率可能越大;病情越重,越難治愈,治愈率就越低。 標(biāo)準(zhǔn)化直接法的計(jì)算步驟1. 選取標(biāo)準(zhǔn)構(gòu)成。標(biāo)準(zhǔn)構(gòu)成選取方法有三種: (1)另外選取一個(gè)包含比較各組(如各地區(qū))的有代表性的、較穩(wěn)定的、數(shù)量較大的構(gòu)成為

24、標(biāo)準(zhǔn)。如世界的、全國的、全省的數(shù)據(jù)為標(biāo)準(zhǔn)構(gòu)成。 (2)取比較各組的各層例數(shù)的合計(jì)為標(biāo)準(zhǔn)構(gòu)成。 (3)從比較的各組(如各地區(qū))中任選其一的構(gòu)成作為標(biāo)準(zhǔn)構(gòu)成。2. 在標(biāo)準(zhǔn)構(gòu)成下,以原分層率計(jì)算各組的預(yù)期發(fā)生數(shù)。3. 計(jì)算標(biāo)準(zhǔn)化率。醫(yī)學(xué)中常用的相對數(shù)指標(biāo)1. 死亡統(tǒng)計(jì)指標(biāo) 死亡率:表示某地某年每1000人中的死亡人數(shù); 年齡別死亡率 死因別死亡率(十大死亡率) 死因構(gòu)成2. 疾病統(tǒng)計(jì)指標(biāo)發(fā)病率:“新發(fā)病率”,表示在某一時(shí)期內(nèi)特定人群中患某病新病例的頻率?;疾÷剩骸艾F(xiàn)患病率”,也稱現(xiàn)患率,表示某一時(shí)點(diǎn)某人群中患某病的頻率。第八章 卡方檢驗(yàn)A:觀察值;T:理論值;四格表的自由度為1是連續(xù)型分布的檢驗(yàn)統(tǒng)計(jì)

25、量2 值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度1. 若檢驗(yàn)假設(shè)H0:1=2成立,四個(gè)格子的實(shí)際頻數(shù)A 與理論頻數(shù)T 相差不應(yīng)該很大,即統(tǒng)計(jì)量2 不應(yīng)該很大。2. 如果2 值很大,即相對應(yīng)的P 值很小,若 P,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對立假設(shè)H1,即12 卡方檢驗(yàn)步驟(1) 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。H0:1=2 即甲藥與乙藥的總體有效率相等 H1:12 即甲藥與乙藥的總體有效率不等 =0.05。(2)求檢驗(yàn)統(tǒng)計(jì)量值(3) 確定P 值,作出推斷結(jié)論 因?yàn)镻=0.2510.05,按=0.05水準(zhǔn),接受H0,差異有統(tǒng)計(jì)學(xué)意義,可以

26、認(rèn)為甲乙兩種藥物治療冠心病的總體有效率相等。四格表資料檢驗(yàn)的應(yīng)用條件:n40且所有T5,用基本公式所有情況,都可以用Fisher確切概率法配對四格表資料,用配對專用公式;關(guān)聯(lián)性檢驗(yàn) Vs Kappa統(tǒng)計(jì)量Kappa0.75,一致性好;Kappa0.4,一致性差;n200,考慮用Kappa。行列表資料的2檢驗(yàn) 行數(shù)或者列數(shù)大于2列聯(lián)表資料稱為行表資料或稱RC表資料卡方檢驗(yàn)統(tǒng)計(jì)量基本公式列聯(lián)表資料檢驗(yàn)的應(yīng)用條件:1. T1,且5T1的格子數(shù)不能超過1/5,用基本公式;2. 所有情況,都可以用Fisher確切概率法;3. 兩組或多組比較的等級分組資料 非參數(shù)檢驗(yàn)實(shí)際應(yīng)用中:對于行列表資料要根據(jù)其分類

27、類型和研究目的選用恰當(dāng)?shù)臋z驗(yàn)方法。對于兩組或多組比較的等級分組資料不宜用卡方檢驗(yàn)。多個(gè)樣本率間的多重比較1. 用四格表資料的卡方檢驗(yàn)進(jìn)行兩兩比較;2. 檢驗(yàn)水準(zhǔn)=/n,n為檢驗(yàn)次數(shù);這種多重檢驗(yàn)校正方法稱為Bonferroni方法。四格表專用公式:1) 這種校正稱為連續(xù)性校正。 2) 如檢驗(yàn)所得P值近于檢驗(yàn)水準(zhǔn)a時(shí), 好改用四格表確切概率法。 第十章 線性相關(guān)與回歸線性相關(guān)的基本概念把這種Y隨著X變化而變化的關(guān)系稱之為相關(guān)關(guān)系,如果這種變化呈現(xiàn)直線關(guān)系,又稱之為直線相關(guān)(線性相關(guān))或簡單相關(guān)。線性相關(guān)系數(shù)相關(guān)系數(shù)就是說明具有直線關(guān)系的兩個(gè)變量間相關(guān)密切程度和相關(guān)方向的統(tǒng)計(jì)量。相關(guān)系數(shù)r沒有測量

28、單位,其數(shù)值為-1r1 相關(guān)系數(shù)的顯著性檢驗(yàn)原因:由于根據(jù)樣本資料計(jì)算出來的相關(guān)系數(shù)存在抽樣誤差。舉例:假設(shè)在一個(gè)X與Y無關(guān)總體中作隨機(jī)抽樣,由于抽樣誤差的影響,所得的樣本相關(guān)系數(shù)也常常不等于零。結(jié)論:要判斷兩個(gè)變量X與Y在總體是否真的存在相關(guān)關(guān)系,需要作總體相關(guān)系數(shù)是否為零的假設(shè)檢驗(yàn)。 進(jìn)行線性相關(guān)分析的注意事項(xiàng)1. 線性相關(guān)表示兩個(gè)變量之間的相互關(guān)系是雙向的,分析兩個(gè)變量之間到底有無相關(guān)關(guān)系可首先繪制散點(diǎn)圖,散點(diǎn)圖呈現(xiàn)出直線趨勢時(shí),再作分析。2. 依據(jù)公式計(jì)算出的相關(guān)系數(shù)僅是樣本相關(guān)系數(shù),它是總體相關(guān)系數(shù)的一個(gè)估計(jì)值,與總體相關(guān)系數(shù)之間存在著抽樣誤差,要判斷兩個(gè)事物之間有無相關(guān)及相關(guān)的密切

29、程度,必須作假設(shè)檢驗(yàn)。3. 相關(guān)分析是用相關(guān)系數(shù)來描述兩個(gè)變量間相互關(guān)系的密切程度和方向。而兩個(gè)事物之間的關(guān)系既可能是依存因果關(guān)系,也可能僅是相互伴隨的數(shù)量關(guān)系。要證明兩事物間確實(shí)存在因果關(guān)系,必須憑借專業(yè)知識加以闡明。等級相關(guān)系數(shù)1 如果觀測值是等級資料,則可以用等級相關(guān)來表達(dá)兩事物之間的關(guān)系。2 常用的等級相關(guān)計(jì)算方法是Spearman等級相關(guān)系數(shù)。線性回歸方程的顯著性檢驗(yàn)1 對線性回歸方程要進(jìn)行假設(shè)檢驗(yàn),就是要檢驗(yàn)b是否為=0的總體中的一個(gè)隨機(jī)樣本。該假設(shè)檢驗(yàn)通常用采用方差分析或者t檢驗(yàn),兩者的檢驗(yàn)效果等價(jià)。 2 t檢驗(yàn):3 方差分析:進(jìn)行線性回歸分析的注意事項(xiàng) 只有對兩個(gè)有內(nèi)在聯(lián)系的變

30、量進(jìn)行回歸分析才是有意義的。 作回歸分析時(shí),如果兩個(gè)有內(nèi)在聯(lián)系的變量之間存在的是一種依存因果的關(guān)系,那么應(yīng)該以“因”的變量為X ,以“果”的變量為Y 。 在回歸分析中,要求自變量與因變量都服從正態(tài)分布。 回歸方程建立后必須作假設(shè)檢驗(yàn),只有經(jīng)假設(shè)檢驗(yàn)拒絕了無效假設(shè),回歸方程才有意義。 使用回歸方程計(jì)算估計(jì)值時(shí),不可把估計(jì)的范圍擴(kuò)大到建立方程時(shí)的自變量的取值范圍之外。線性相關(guān)與回歸的區(qū)別與聯(lián)系1. 線性相關(guān)表示兩個(gè)變量之間的相互關(guān)系是雙向的;回歸則反映兩個(gè)變量之間的依存關(guān)系,是單向的。 2. 如果對同一資料進(jìn)行相關(guān)與回歸分析,則得到的相關(guān)系數(shù)r與回歸方程中的b正負(fù)號是相同的。3. 在相關(guān)分析中,求

31、出r后要進(jìn)行假設(shè)檢驗(yàn),同樣,在回歸分析中,對b也要進(jìn)行假設(shè)檢驗(yàn)。同一樣本的這兩種假設(shè)檢驗(yàn)也是等價(jià)的。4.相關(guān)和回歸可以互相解釋。直線回歸:研究兩個(gè)變量之間的數(shù)量依存關(guān)系直線相關(guān):研究兩變量之間相互聯(lián)系的方向和密切程度。 r是表示兩個(gè)隨機(jī)變量之間呈直線相關(guān)的強(qiáng)度和方向的統(tǒng)計(jì)量。直線回歸:要求Y服從正態(tài)分布,X為人為控制或精確測量直線相關(guān):要求X和Y都服從正態(tài)分布。 r=0.85,關(guān)系密切?,只能說程正相關(guān)。 總復(fù)習(xí)計(jì)量資料:由連續(xù)變量的觀察值構(gòu)成的資料。對每個(gè)觀察對象的觀察指標(biāo)用定量方法測定其數(shù)值大小所得的資料,一般有度量衡單位,例如年齡、身高、血糖。計(jì)數(shù)資料:由離散變量的觀察值構(gòu)成的資料。先將

32、觀察對象的觀測指標(biāo)按性質(zhì)或類別進(jìn)行分組,然后計(jì)數(shù)各組的數(shù)目所得的資料,例如性別、患病、血型。等級分組資料:由等級變量的觀測值構(gòu)成的資料。具有計(jì)數(shù)資料的特征,同時(shí)又具有半定量性質(zhì)的資料,例如細(xì)菌培養(yǎng)陽性結(jié)果。統(tǒng)計(jì)推斷參數(shù)估計(jì)s未知,且n小 s未知,但n足夠大 s已知 2用兩種方法檢驗(yàn)已確診的肝癌患者120名, 得到如下資料甲法 乙法 合計(jì) 42 30 72 18 30 48 合計(jì) 60 60 120 (1)請解釋表中42、18兩個(gè)數(shù)字的意義。2c (2)請通過 檢驗(yàn)說明兩種方法檢查的陽性檢出率有無差別。解:(1).請解釋表中42、18兩個(gè)數(shù)字的意義?!?2”表示兩種方法檢驗(yàn)結(jié)果一致的例數(shù),“18

33、”是指兩者不一致的例數(shù)(4分)2c(2).請通過 檢驗(yàn)說明兩種方法檢查的陽性檢出率有無差別。1).檢驗(yàn)假設(shè):H0:兩法檢驗(yàn)結(jié)果無差別或一致, 的扣1分)a=0.05(2分,未給H0或aH1:兩法檢驗(yàn)結(jié)果有差別或不一致,2).計(jì)算統(tǒng)計(jì)量:因配對四格表b+c=4840,故可不用校正法(3分,用校正公式扣1分) 3).確定P值并作結(jié)論:自由度=1,界值 ,故PChapter 基本概念顯著性檢驗(yàn)(test of significance):計(jì)算P值醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容:1、實(shí)驗(yàn)設(shè)計(jì):最關(guān)鍵最重要2、收集資料:最基礎(chǔ)原始資料:實(shí)驗(yàn)數(shù)據(jù)現(xiàn)場調(diào)查資料醫(yī)療衛(wèi)生工作記錄報(bào)表 報(bào)告卡質(zhì)量控制精度和偏倚3、整理資料(

34、1) 資料的邏輯檢查(壞數(shù))(2) 一致性檢查(3) 原始數(shù)據(jù)加工:頻數(shù)分布表4、分析資料:統(tǒng)計(jì)描述(表、圖、離散趨勢、集中趨勢)和統(tǒng)計(jì)推斷統(tǒng)計(jì)描述類型的選擇: 集中趨勢 離散趨勢對稱、正態(tài) , 對數(shù)正態(tài) G S lgX偏態(tài)及其他 M Q,R單位不同或均數(shù)差別大 CV醫(yī)學(xué)統(tǒng)計(jì)的資料類型:計(jì)量資料、計(jì)數(shù)資料、等級分組資料醫(yī)學(xué)統(tǒng)計(jì)學(xué)的對象:有變異的事物總體和樣本:總體(population)的特性:同質(zhì)性、大量性、差異性。抽樣總體樣本參數(shù)統(tǒng)計(jì)量推斷抽樣的要求:代表性、隨機(jī)性、可靠性、可比性。樣本的三性:代表性、隨機(jī)性、可靠性。可靠性(reliability):實(shí)驗(yàn)的結(jié)果要具有可重復(fù)性。即由科研課題

35、的樣本得出的結(jié)論所推測總體的結(jié)論有較大的可信度。兩樣本間具有:可比性。誤差的類別:1、系統(tǒng)誤差(system error):在資料的收集過程中,由于儀器初始狀態(tài)沒有調(diào)零、標(biāo)準(zhǔn)試劑未經(jīng)矯正、標(biāo)準(zhǔn)指定偏高或偏低等原因,造成的觀察結(jié)果的傾向性的偏大或偏小。必須克服。2、隨機(jī)測量誤差(random measurement error):在避免系統(tǒng)誤差的情況下,由于各種偶然因素的影響造成對同一對象多次測量值的不一致。3、抽樣誤差(sampling error):由于抽樣造成的的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別。不可避免。樣本含量越大,抽樣誤差越小。如均數(shù)的抽樣誤差:。概率(probability):P(A

36、)小概率事件:P0.05(有統(tǒng)計(jì)學(xué)意義)或P0.01(有高度統(tǒng)計(jì)學(xué)意義)。Chapter 集中趨勢的統(tǒng)計(jì)描述手工整理資料頻數(shù)表(frequency table)的步驟:1、求極差(全距)2、確定組數(shù)、組距參考組距=全距 / 組數(shù)3、確定組段4、手工編制劃記表直方圖(histogram):高度:各組的頻數(shù) 縱軸寬度:組距 橫軸表示組限均數(shù)(average):適用:對稱分布或偏度不大的資料,尤其適合正態(tài)分布。1、算術(shù)均數(shù)(mean):2、加權(quán)均數(shù):3、幾何均數(shù):,中位數(shù)(median):觀察值按照從小到大排列時(shí),居中心位置的數(shù)值。適用于1、分布明顯成偏態(tài)時(shí),2、頻數(shù)分布的一端或兩端無確切數(shù)值時(shí)。不

37、便于統(tǒng)計(jì)計(jì)算。M:中位數(shù);LM:M所在組的上限;f L:M所在組之前積累的頻數(shù);fM:M所在組的頻數(shù);i:組距。百分位數(shù)(percentile):Px。在一組中找到這樣一個(gè)數(shù)值P,全部觀察值的x%小于P。P75、P25描述資料離散程度。眾數(shù):一組觀察值中,出現(xiàn)頻率最高的那個(gè)觀察值。若為分組資料,則為頻率最高組的組中值。適用于大樣本,但粗糙。Chapter 離散程度的統(tǒng)計(jì)描述離散的表述指標(biāo):1、按間距計(jì)算:極差、四分位數(shù)間距2、按平均差距:離均差平方和、方差、標(biāo)準(zhǔn)差、變異系數(shù)極差(range,R):即全距。粗略。適用于任何分布。四分位數(shù)間距(quartile,Q):一組觀察值按大小排序后,分成四

38、個(gè)數(shù)目相等的段落,每個(gè)段落觀察值的數(shù)目占總例數(shù)的25%。去掉兩端含有極端數(shù)值的25%,取中間的50%的觀察值的數(shù)據(jù)范圍即為。越大則數(shù)據(jù)變異越大。適用于偏態(tài)分布。Q=P75 - P25離均差平方和(sum of square of deviation):方差(variance):樣本方差 總體方差 標(biāo)準(zhǔn)差(standard deviations):適用于近似正態(tài)分布。p.s.1、可用于合并資料的直接計(jì)算2、與均數(shù)結(jié)合可以完整概括一個(gè)正態(tài)分布。變異系數(shù)(CV):用于均屬相差交大或單位不同的幾組數(shù)據(jù)觀察值的比較。CV=正態(tài)分布(normal distribution):1、正偏態(tài)分布:高峰向左,長尾

39、向右負(fù)偏態(tài)分布:高峰向右,長尾向左。2、和是正態(tài)分布總體的兩個(gè)參數(shù),對應(yīng)樣本統(tǒng)計(jì)量中的S和X。實(shí)際應(yīng)用中和通常未知,可以將S和X作為總體參數(shù)的估計(jì)量使用。注意對比:2、是位置參數(shù),是變異參數(shù)。描述方法:N(,2)3、曲線下面積的意義:X1X2出現(xiàn)的概率。 68.3%1.96 (單側(cè)1.645) 95%2.58(單側(cè)2.33) 99%標(biāo)準(zhǔn)正態(tài)分布(standard):是=0,=1的正態(tài)分布。對于任何參數(shù)為、的正態(tài)分布,都可以通過變量變換轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布:。醫(yī)學(xué)參考值范圍(reference value range)的制定方法:1、選擇足夠數(shù)量的正常人作為參照樣本2、對選定的參照樣本進(jìn)行準(zhǔn)確的測

40、定3、決定取單側(cè)范圍還是雙側(cè)范圍值4、選擇適當(dāng)?shù)陌俜址秶?、估計(jì)參考值范圍的界限Chapter 抽樣誤差與可信區(qū)間中心極限定理:在樣本含量很大的情況下(n50),無論樣本測量量(X)服從什么分布,樣本均數(shù)的抽樣分布都近似服從以為均數(shù)的正態(tài)分布N(,2/n)標(biāo)準(zhǔn)誤(standard error):樣本均數(shù)之間變異的標(biāo)準(zhǔn)差。實(shí)際工作中總體標(biāo)準(zhǔn)差 未知,用樣本的標(biāo)準(zhǔn)差S代替:標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別:標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤含義描述觀察值的變異程度的大小的指標(biāo)描述樣本均數(shù)的抽樣誤差大小的指標(biāo)公式()意義標(biāo)準(zhǔn)差較小,表示觀察值圍繞均數(shù)波動較小,說明樣本均數(shù)代表性好小,表明樣本均數(shù)圍繞總體均數(shù)的波動較小,說明樣本均數(shù)可

41、靠性好應(yīng)用1、表示觀察值變異程度2、結(jié)合樣本均數(shù)描述正態(tài)分布資料特征,確定醫(yī)學(xué)參考值范圍3、計(jì)算標(biāo)準(zhǔn)誤4、計(jì)算CV1、估計(jì)樣本均數(shù)抽樣可靠程度2、估計(jì)總體均數(shù)的可信區(qū)間3、進(jìn)行假設(shè)檢驗(yàn)n趨于穩(wěn)定()逐漸減小標(biāo)準(zhǔn)誤(公式)的意義:1、與標(biāo)準(zhǔn)差的聯(lián)系:在樣本含量一定的情況下,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。(1) 當(dāng)觀察值的變異(標(biāo)準(zhǔn)差)較小時(shí),樣本均數(shù)之間的抽樣誤差較小,抽到的樣本均數(shù)與總體均屬可能相差較小,用估計(jì)的可靠性較好(2) 當(dāng)觀察值的變異較大時(shí),樣本均數(shù)之間的抽樣誤差較大,抽到的樣本均數(shù)與總體均屬可能相差較大,用估計(jì)的可靠性較差。2、與樣本含量的關(guān)系:與其平方根成反比,說明在同一總體中隨機(jī)抽樣,

42、樣本含量越大,標(biāo)準(zhǔn)誤越小。3、標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。參數(shù)估計(jì)(parameter estimation):指偶那個(gè)過樣本參數(shù)估計(jì)總體參數(shù),是統(tǒng)計(jì)推斷的重要內(nèi)容之一。常用方法有點(diǎn)估計(jì)、區(qū)間估計(jì)。點(diǎn)估計(jì)(point ):使用單一數(shù)值直接作為總體參數(shù)的估計(jì)值。適用于各種資料。區(qū)間估計(jì)(interval ):按照預(yù)先給定的概率計(jì)算出一個(gè)區(qū)間,使它能夠包含總體參數(shù)。給定的概率(1-)稱為可信度。計(jì)算得到的區(qū)間稱為可信區(qū)間(confidence interval,CI)可信區(qū)間通常包括兩個(gè)數(shù)值界定的可信限(confidence limit),分別為上限、下限。

43、總體均數(shù)估計(jì)的95%可信區(qū)間表示:該區(qū)間有95%的概率包含總體均數(shù)。注意不可以說“總體均數(shù)有95%的概率落在這個(gè)區(qū)間里”??尚艆^(qū)間估計(jì)效果的比較:1、(1-)越接近1越好,概率2、區(qū)間寬度越窄越好,精確度但兩者是矛盾的。一般選擇(1-)=95%。t分布(t distribution):是以0為中心的對稱分布;當(dāng)時(shí),t分布的極限分布就是標(biāo)準(zhǔn)正態(tài)分布。在正態(tài)分布的總體中進(jìn)行抽樣,服從自由度的t分布。t的大小與、自由度有關(guān)??尚艆^(qū)間的計(jì)算: ,若n50,則t分布接近標(biāo)準(zhǔn)正態(tài)分布,則簡化 ,若已知,則可簡化為 ,Chapter 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(hypothesis test):目的:比較總體參數(shù)有無差別基本思想:首先對所需比較的總體提出一個(gè)無差別的假設(shè),然后通過樣本數(shù)據(jù)推斷是否拒絕這一假設(shè)?;痉椒ǎ悍醋C法和小概率事件?;静襟E:1、建立假設(shè)和確定檢驗(yàn)水準(zhǔn)無效假設(shè)(null hypothesis):H0:=0(或d=0),總體均數(shù)無差別。備擇假設(shè)(alternative ):H0:0(或d0),總體均數(shù)有差別假設(shè)有單側(cè)和雙側(cè)兩種。應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論