醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)匯總_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)匯總_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)匯總_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)匯總_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)匯總_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)緒論1、隨機(jī)現(xiàn)象:在同一條件下進(jìn)行試驗(yàn),一次試驗(yàn)結(jié)果不能確定,而在一定數(shù)量的重復(fù)試驗(yàn)之 后呈現(xiàn)統(tǒng)計(jì)規(guī)律的現(xiàn)象。2、同質(zhì):統(tǒng)計(jì)學(xué)中對(duì)研究指標(biāo)影響較大的,可以控制的主要因素。3、變異:同質(zhì)基礎(chǔ)上各觀察單位某變量值的差異。廠數(shù)值變量:變量值是定量的,由此而構(gòu)成的資料稱(chēng)為數(shù)值變量資料或計(jì)量資料,其數(shù)值是連續(xù)性的,稱(chēng)之為連續(xù)型變量。變量彳r無(wú)序分類(lèi)變量:所分類(lèi)別或?qū)傩灾g無(wú)順序和程度上的差異分類(lèi)變量:定性變量-V有序分類(lèi)變量:有順序和程度上的差異4、總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象中所有觀察單位某變量值的集合。可以分為有限 總體和無(wú)限總體。5、樣本:是按隨機(jī)化原則從同質(zhì)總體中隨機(jī)抽取的

2、部分觀察單位某變量值的集合。樣本代表 性的前提:同質(zhì)總體,足夠的觀察單位數(shù),隨機(jī)抽樣。統(tǒng)計(jì)學(xué)中,描述樣本特征的指標(biāo)稱(chēng)為統(tǒng)計(jì)量,描述總體特征的指標(biāo)稱(chēng)為參數(shù)。6概率:描述隨機(jī)事件發(fā)生的可能性大小的一個(gè)度量。若P( A) =1,則稱(chēng)A為必然事件;若P (A) =0,則稱(chēng)A為不可能事件;隨機(jī)事件 A的概率為Ov PV 1.小概率事件:若隨機(jī)事件 A的概率Pa,則稱(chēng)隨機(jī)事件A為小概率事件,其統(tǒng)計(jì)學(xué)意義為: 小概率事件在一次隨機(jī)試驗(yàn)中認(rèn)為是不可能發(fā)生的。統(tǒng)計(jì)描述1、頻數(shù)分布有兩個(gè)重要的特征:集中趨勢(shì)和離散程度。頻數(shù)分布有對(duì)稱(chēng)分布和偏態(tài)分布之分。 后者是指頻數(shù)分布不對(duì)稱(chēng),集中趨勢(shì)偏向一側(cè),如偏向數(shù)值小的一側(cè)

3、為正偏態(tài)分布, 如偏向數(shù) 值大的一側(cè)為負(fù)偏態(tài)分布。2、常用的集中趨勢(shì)的描述指標(biāo)有:均數(shù),幾何均數(shù),中位數(shù)等。均數(shù):適用于正態(tài)或近似正態(tài)的分布的數(shù)值變量資料。樣本均數(shù)用x表示,總體均數(shù)用卩表示。幾何均數(shù):適用于等比級(jí)數(shù)資料和對(duì)數(shù)呈正態(tài)分布的資料。注意觀察值中不能有零,一組 觀察值中不能同時(shí)有正值和負(fù)值。中位數(shù):適用于偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無(wú)確切數(shù)據(jù)的資料。3、常用的離散程度的描述指標(biāo)有:全距,四分位數(shù)間距,方差,標(biāo)準(zhǔn)差,變異系數(shù)。全距:任何資料,一組中最大值與最小值的差。四分位數(shù)間距:適用于偏態(tài)分布以及分布的一端或兩端無(wú)確切數(shù)據(jù)資料。方差和標(biāo)準(zhǔn)差:正態(tài)分布資料。標(biāo)準(zhǔn)差表示觀察值的變

4、異度的大小。 變異系數(shù):比較度量單位不同或均數(shù)相差懸殊的兩組資料的變異度。4、標(biāo)準(zhǔn)正態(tài)分布:對(duì)正態(tài)分布的(X-卩)/ c進(jìn)行u的變換,u= (X-卩)/(T ,則正態(tài)分布變 換為卩=0,c =1的標(biāo)準(zhǔn)正態(tài)分布,亦稱(chēng)u分布。u被稱(chēng)為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差。 兩個(gè)參數(shù):卩是位置參數(shù),c是形狀參數(shù)。 用N (0,1 )表示標(biāo)準(zhǔn)正態(tài)分布。常用估計(jì)醫(yī)學(xué)參考值范圍的方法有:(1)正態(tài)分布方法:適用于正態(tài)或近似正態(tài)分布的資料。雙側(cè)界值:X uS單側(cè)上界:X+Ur S,或單側(cè)下界:X-u S(2)對(duì)數(shù)正態(tài)分布方法:適用于對(duì)數(shù)正態(tài)分布資料。雙側(cè)界值:Lg-1 (X lgx Ur I2S lgx ) 單側(cè)上界

5、:Lg-1 (X lgx +U r S Igx ), 或單側(cè)下界:Lg-1 ( X lgx -u rS lgx )(3) 百分位數(shù)法:用于偏態(tài)分布資料以及資料中一端或兩端無(wú)確切數(shù)值的資料。 雙側(cè)上界:P2.5和P97.5 ;單側(cè)上界:P95,或單側(cè)下界:F5常用的U值表參考值范圍(%單側(cè)雙側(cè)800.8421.282901.2821.645951.6451.96992.3262.5765、分類(lèi)變量資料的統(tǒng)計(jì)描述:常用相對(duì)數(shù)指標(biāo)描述,包括:率,構(gòu)成比,相對(duì)比。 率:說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。(病死率不等于死亡率) 構(gòu)成比:說(shuō)明某現(xiàn)象內(nèi)部組成部分所占的比重或分布,常以百分?jǐn)?shù)表示。相對(duì)比:亦稱(chēng)比,是

6、A、B 2個(gè)有關(guān)指標(biāo)之比,說(shuō)明A為B的若干倍或百分之幾。兩個(gè)指 標(biāo)可以性質(zhì)相同,也可以性質(zhì)不同。應(yīng)用相對(duì)數(shù)時(shí)的注意事項(xiàng):1 、計(jì)算相對(duì)數(shù)的分母不宜過(guò)??;2、分析時(shí)不能以構(gòu)成比代替率;3、對(duì)觀察單位數(shù)不等 的幾個(gè)率,不能直接相加求其平均率;4、比較相對(duì)數(shù)時(shí)應(yīng)注意其可比性;5、對(duì)樣本率(或構(gòu) 成比)的比較應(yīng)遵循隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。6標(biāo)準(zhǔn)化法:標(biāo)準(zhǔn)化的目的在于消除混雜因素對(duì)結(jié)果的影響,使資料更具有可比性。其基本 思想是:將所比較的兩組或多組資料的構(gòu)成按統(tǒng)一的“標(biāo)準(zhǔn)”調(diào)整后,計(jì)算標(biāo)化率,使其更具 有可比性。標(biāo)準(zhǔn)化率的計(jì)算方法:亦稱(chēng)標(biāo)化率,直接法用于已知被標(biāo)化組的年齡別率, 以及已知標(biāo)準(zhǔn)組的 年齡別

7、人口數(shù)或年齡別人口構(gòu)成比時(shí);間接法用于已知被標(biāo)化組的年齡別人口數(shù)與發(fā)病 (死亡) 總數(shù),但年齡別率未知,以及已知標(biāo)準(zhǔn)組年齡別發(fā)病(死亡)率與總發(fā)病(死亡)率時(shí)。通??蓮南铝?種方法選用標(biāo)準(zhǔn)組:以兩組資料中任一組的年齡別人口數(shù)或構(gòu)成比作為標(biāo)準(zhǔn) 組;以兩組資料合并的各年齡組的人口數(shù)或構(gòu)成比作為標(biāo)準(zhǔn)組;以公認(rèn)的或便于與他人資料比較的標(biāo)準(zhǔn)作為標(biāo)準(zhǔn)組。7、統(tǒng)計(jì)表:結(jié)構(gòu):由標(biāo)題、標(biāo)目、線條和數(shù)字構(gòu)成。編制統(tǒng)計(jì)表的要求: 標(biāo)題:概括表的內(nèi)容,列于表的上方居中,應(yīng)注明時(shí)間和地點(diǎn); 標(biāo)目:主語(yǔ)和謂語(yǔ)分別列于橫、縱標(biāo)目,文字簡(jiǎn)明,層次清楚。橫標(biāo)目列于表的左側(cè),通常 為被研究的事物,縱標(biāo)目列于表的上端,為說(shuō)明橫標(biāo)目

8、的統(tǒng)計(jì)指標(biāo)。 線條:通常,除表的頂線、底線、縱標(biāo)目下以及合計(jì)上的橫線外,其余線條均省去,頂線和 底線應(yīng)略粗些,表的左上角不宜用斜線。 數(shù)字:用阿拉伯?dāng)?shù)字表示,同一指標(biāo)的小數(shù)位數(shù)要一致并對(duì)齊, 數(shù)字暫缺或無(wú)數(shù)字者分別用 “”或“-”表示,數(shù)字為0者要記作“ 0”,不應(yīng)空項(xiàng),為方便核實(shí)和分析,應(yīng)有合計(jì)。備注:一般不列入表內(nèi),必要時(shí)可用“ *”標(biāo)出,列于表下。8、統(tǒng)計(jì)圖: 條圖:用于相互對(duì)比關(guān)系的資料; 圓圖與百分條圖:適用于百分構(gòu)成比資料,表示事物各組成部分所占的比重或構(gòu)成; 線圖:用于連續(xù)性資料,用于說(shuō)明事物在時(shí)間上的發(fā)展變化, 或某現(xiàn)象隨另一現(xiàn)象而變動(dòng)的 情況; 直方圖:表示連續(xù)性資料的頻數(shù)分

9、布; 散點(diǎn)圖:適用于直線相關(guān)分析,說(shuō)明兩個(gè)變量間的數(shù)量關(guān)系和變化趨勢(shì)。抽樣分布與參數(shù)估計(jì)抽樣研究的目的是用樣本信息來(lái)推斷總體特征,即統(tǒng)計(jì)推斷,包括兩個(gè)內(nèi)容:一是總體參數(shù)的估計(jì),二是假設(shè)檢驗(yàn)。1、抽樣誤差:由于變異的存在,抽樣研究所造成的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異或各樣本統(tǒng)計(jì)量之間的差異稱(chēng)為抽樣誤差。常用標(biāo)準(zhǔn)誤x反映均數(shù)抽樣誤差的大?。挥寐实臉?biāo)準(zhǔn)誤c P反映率的抽樣誤差的大??;用Possion計(jì)數(shù)的標(biāo)準(zhǔn)誤口反映其抽樣誤差的大小。2、中心極限定理和正態(tài)分布推理:從正態(tài)分布 N(y,c2)總體中以固定n隨機(jī)抽取樣本,樣本均數(shù)X的分布仍服從正態(tài)分布,即使是從偏態(tài)分布總體中隨機(jī)抽樣,只要n足夠大,X

10、的分布也近似正態(tài)分布。樣本均數(shù)的均數(shù)仍為卩,樣本均數(shù)的標(biāo)準(zhǔn)差為-。樣本均數(shù)的抽樣誤差 x (簡(jiǎn)稱(chēng)標(biāo)準(zhǔn)誤)是反映均數(shù)抽樣誤差大小的指標(biāo)。c用樣本均數(shù)S作為的估計(jì)值則 七3、t分布:將X看成變量值,那么可將正態(tài)變量進(jìn)行 u變換(u=x-卩/ c)后,也可將N(u,2-)變換成標(biāo)準(zhǔn)正態(tài)分布N( 0,1)。常用s作為c的估計(jì)值,統(tǒng)計(jì)量為t,此分布為t分布統(tǒng)計(jì)量t= t曲線的形態(tài)變化與自由度V的大小有關(guān)。V越小,t值越分散,曲線越低 Sx平,V逐漸增大時(shí),則t分布逐漸逼近正態(tài)分布,當(dāng)v=無(wú)窮大時(shí),t分布即為u分布。4、總體均數(shù)的估計(jì)有兩種方法:一種是點(diǎn)估計(jì),即用統(tǒng)計(jì)量X估計(jì)總體均數(shù);二是區(qū)間估計(jì),亦稱(chēng)可

11、信區(qū)間。(1)c 未知且 n 小: X-t a /2,V S X X+t a/2,V S X(2) c未知,但n足夠大,t分布逼近u分布:X-Ua/2SXU X+Ua/2SX(3) c 已知:X -U a /2 c XU X +Ua/2 c X標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的比較標(biāo)準(zhǔn)誤 一 2:V n 1表示觀察值的變異程度大小計(jì)算變異系數(shù)CV=S 100%x確定醫(yī)學(xué)參考值的范圍 計(jì)算標(biāo)準(zhǔn)誤sF n估計(jì)均數(shù)的抽樣誤差大小估計(jì)總體均數(shù)可信區(qū)間x-t a /2 , V S xVyV X +t a/2 , V S x進(jìn)行假設(shè)檢驗(yàn)數(shù)值變量資料的假設(shè)檢驗(yàn)1、 假設(shè)檢驗(yàn)的原理:假設(shè)在一次抽樣研究中得出了 u1.96

12、,則pw 0.05,此為小概率事件, 依據(jù)“小概率事件在一次隨機(jī)試驗(yàn)中認(rèn)為是不可能發(fā)生的” 的定理,可認(rèn)為此樣本不是來(lái)自該 總體。2、 步驟:建立假設(shè)和確定檢驗(yàn)水準(zhǔn);假設(shè)有兩種,一種是檢驗(yàn)假設(shè),常稱(chēng) 無(wú)效假設(shè)或零假 設(shè),記為H0,假設(shè)樣本所代表的總體參數(shù)與已知總體參數(shù)相等;另一種是 備擇假設(shè),記為H, 是與H0相聯(lián)系且對(duì)立的假設(shè);檢驗(yàn)水準(zhǔn),亦稱(chēng)顯著性水準(zhǔn),是判斷拒絕或不拒絕H0,也是允 許犯I型錯(cuò)誤的概率,通常用0.05。選定檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量確定 P值,做出推斷結(jié)論。P值是指從H)所規(guī)定的總體中隨機(jī) 抽樣時(shí),獲得等于及大于現(xiàn)有樣本統(tǒng)計(jì)量的概率。3、 t檢驗(yàn):適用于:樣本均數(shù)與總體均數(shù)比較(

13、c未知且nv50或nv30);成組設(shè)計(jì)的 兩小樣本均數(shù)的比較(n1,n2均小于30或50);配對(duì)設(shè)計(jì)的兩樣本均數(shù)比較。應(yīng)用條件:當(dāng)樣本含量較?。╪v 50或nv30)時(shí),要求樣本來(lái)自正態(tài)分布總體;用于成 組設(shè)計(jì)的兩樣本均數(shù)比較時(shí),要求兩樣本來(lái)自總體方差相等的總體。4、單樣本t檢驗(yàn):用于樣本均數(shù)與已知總體均數(shù)的比較,研究目的是推斷樣本所代表的總體 均數(shù)卩與已知總體均數(shù)卩0有無(wú)差別。統(tǒng)計(jì)量t=-一畀v=n-1s/Jn5、配對(duì)t檢驗(yàn):用于配對(duì)設(shè)計(jì)資料的 兩均數(shù)的比較。其研究目的是推斷某種處理有無(wú)作用, 或兩種處理的效果有無(wú)差別。配對(duì)設(shè)計(jì)類(lèi)型有3種:先將受試對(duì)象按配比條件配對(duì),然后用隨機(jī)分組方法將各對(duì)

14、中的2個(gè)受試對(duì)象分別分配到不同的處理組;同一對(duì)象分別接受2種不同處理;同一對(duì)象處理前后。t= -產(chǎn)(d是差值的樣本均數(shù))v=n-1sd / J n&兩樣本t檢驗(yàn):用于完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)的 比較,兩個(gè)樣本來(lái)自兩個(gè)總體,其研究 目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。t=Sx1x2x1x1x2v=n i+n 2-2D(1* 1)1 n 2檢驗(yàn)。研究目的是推u=8、兩樣本的u檢驗(yàn)7、單樣本u檢驗(yàn):用于樣本均數(shù)與已知總體均數(shù)比較,其研究目的同斷樣本所代表的總體均數(shù)卩與已知總體均數(shù)卩0有無(wú)差別。其統(tǒng)計(jì)量:用于完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)的比較,兩個(gè)樣本來(lái)自兩個(gè)總體,其研 究目的是推斷兩樣本所分別

15、代表的總體均數(shù)是否相等。其統(tǒng)計(jì)量為:x1 x2x1 x2u=-=-sxjs2 / m s; /n29、 正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn):資料在做假設(shè)檢驗(yàn)之前首先應(yīng)該檢驗(yàn)資料是否來(lái)自正態(tài)總體, 并且它們的方差是否齊。10、兩類(lèi)錯(cuò)誤:2總離均差平方和SS和自由度vkm_ 2SS總=(Xjj x) = x2 ( x)2 / nX1 X222s1 (nj 1)s2 (n2處理組b-Xj)2j 1k-1SS處理/v處理 MS處理/MS誤差配伍組kb -Xj)2i 1b-1SS 配伍/v配伍MS 配伍 /MS 誤差誤差SS總-SS處理-SS配伍(k-1)(b-1)SS誤差/v誤差v總=門(mén)-13、組間離均差平方和

16、SS 組間,自由度v組間 和均方MS且間nik (. X) ( x)2SS、SS組間=U- v 組間=k-1 MS 組間=一組間i 1ninV組間4、組內(nèi)離均差平方和 SS組內(nèi),自由度v組內(nèi)和均方MS且內(nèi)SS組內(nèi)=SS總-SS 組間 v 組內(nèi) =n-k MS 組內(nèi)=SS組內(nèi)/v組內(nèi)多樣本均數(shù)比較的方差分析的應(yīng)用條件:各樣本是相互獨(dú)立的隨機(jī)樣本;各樣本來(lái)自正態(tài) 分布總體;各總體方差相等,即方差齊。5、完全隨機(jī)設(shè)計(jì)資料的方差分析:亦稱(chēng)單因素的方差分析,可用于完全隨機(jī)設(shè)計(jì)的多個(gè)樣本 均數(shù)比較的資料,研究目的是推斷各個(gè)樣本所代表的總體均數(shù)是否相等。單因素方差分析的計(jì)算公式變異來(lái)源SSv MS F總變異

17、x2 Cn-1SSa間MS組間組間變異k - Xj)2j1Ci 1mk-1v組間MS組內(nèi)組內(nèi)變異SS 總-SS組間n-kSS組內(nèi)/v組內(nèi)C為校正系數(shù)C= - x)2/n6配伍組設(shè)計(jì)資料的方差分析:亦稱(chēng)兩因素的方差分析,用于配伍組設(shè)計(jì)的多個(gè)樣本均數(shù)比 較的資料,其研究目的是推斷各樣本所代表的總體均數(shù)是否相等, 但考慮了個(gè)體差異對(duì)試驗(yàn) 效 應(yīng)的影響。兩因素方差分析的計(jì)算公式變異來(lái)源SSv MSF總變異x2 C n-1若均數(shù)和標(biāo)準(zhǔn)差用率表示,則卩 p=n(T p= . n( 1 n) / nC為校正系數(shù)C= ( x)3 4 5 6/n b為配伍組數(shù)分類(lèi)資料的假設(shè)檢驗(yàn)1、二項(xiàng)分布:應(yīng)用條件:各觀察單位

18、只能具有兩種相互對(duì)立的結(jié)果已知發(fā)生某結(jié)果的概率為n,其對(duì)立結(jié)果的概率為1- nn次試驗(yàn)是在相同的條件下進(jìn)行的。性質(zhì):卩=nn(T = ,nn( 1 n)3、Poisson分布的方差 扌與均數(shù)相等。4、Poisson分布可以看成是二項(xiàng)分布的極限形式。5、Poisson分布的極限形式也是二項(xiàng)分布,一般當(dāng)0.01時(shí),二項(xiàng)分布可以當(dāng)作 Poisson分布來(lái)處理。6、Poisson分布具有 可加性。總體均數(shù)的估計(jì):(正態(tài)近似法)x Ua/2jx, x Ua/2仮3、服從二項(xiàng)分布資料的假設(shè)檢驗(yàn):(1)樣本率和總體率的估計(jì):k直接計(jì)算法:最多有k例陽(yáng)性的概率:P(x20時(shí),可按正態(tài)分布處理,當(dāng)nW最少有k例

19、陽(yáng)性的概率:P (x k)nk 1P(x)=1- P(x)k0n未知時(shí),用樣本率P作為n的估計(jì)值,則 Sp= . p(1 p)/n總體率的估計(jì):正態(tài)近似法:當(dāng)樣本含量n足夠大,且樣本率p或1-p均不太小,如np與n(1-p )均大于5時(shí)樣本率p的抽樣誤差分布近似正態(tài)分布,可信區(qū)間為:(P-U a/2Sp, p + Ua /2Sp)2、Poisson分布:對(duì)于二項(xiàng)分類(lèi)變量,若某結(jié)果發(fā)生的概率很小,如nV 0.05時(shí),單位時(shí)間、 人群、空間內(nèi)“陽(yáng)性”發(fā)生次數(shù)x (x=0,1, 2,)的概率可用Poisson分布概率函數(shù)來(lái)描述:1! xp(x)=e(!/x!)遞推公式:P (0) =e!P (x)

20、= P (x 1 ! x應(yīng)用條件:nV 0.05夕卜,其余同二項(xiàng)分布。分布的性質(zhì):(1)、Poisson分布式一種單參數(shù)的離散型分布,其參數(shù)為!,表示單位時(shí)間、人群、空間內(nèi) 某事件平均發(fā)生的次數(shù)。正態(tài)近似法:當(dāng)no不太靠近0或1,且樣本含量n足夠大;或nn 5且n (1-冗0) 5時(shí),二項(xiàng)分布接近正態(tài)分布其公式為:u=PlsP1P2=PiP2.Pc(1嘰 Apc為合并陽(yáng)性率,Pc=(xi+x2)/(ni+n2)X1,X2為兩個(gè)樣本的陽(yáng)性例數(shù)。當(dāng)兩樣本P n 0 x n n ou=- =-no( n0) n n n0(1 no)(2)兩樣本率的比較:目的是推斷兩個(gè)樣本各自代表的兩總體率是否相等,

21、當(dāng)兩個(gè)樣本率均 滿足正態(tài)近似條件時(shí),可用u檢驗(yàn)。4、服從Poisson分布的假設(shè)檢驗(yàn):對(duì)于Poisson分布的假設(shè)檢驗(yàn),對(duì)于總體均數(shù)可以用乘法將 小單位化大,也可以用除法將大單位化小,對(duì)于樣本均數(shù),只能用除法將大單位化小,而不能 用乘法將小單位化大。(1)樣本均數(shù)與總體均數(shù)的比較:適用于卩ov20,且樣本陽(yáng)性數(shù)X較小作單側(cè)檢驗(yàn)時(shí)。k直接計(jì)算法:最多有k例陽(yáng)性的概率:P(xk) = P(x)=1- P(x)k0正態(tài)近似法:當(dāng)卩20時(shí),Poisson分布逼近正態(tài)分布。u=(x卩0).卩0(2)兩樣本陽(yáng)性數(shù)的比較:目的是推斷兩樣本各自代表的兩總體平均數(shù)是否相等。 陽(yáng)性數(shù)X1, X2均大于20時(shí),可用

22、u檢驗(yàn)。其計(jì)算用兩種情況:兩樣本觀察單位(時(shí)間、面積、容積等)相同時(shí):X1X2x1x2X2x1x2兩樣本觀察單位(時(shí)間、面積、容積等)不同時(shí):x1x2u= .x-i n1 x2 n22檢驗(yàn):是2檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量為,其基本公式為:22(AJ ,自由度 v=(行數(shù)-1)(列數(shù)-1)式中A為實(shí)際頻數(shù),T為理論頻數(shù)。理論頻數(shù)T的計(jì)算公式為:TRC此匹n為第R| RC自由度v= (R-1)2值才能正確行第C列的理論頻數(shù),nR為相應(yīng)行的合計(jì),nc為相應(yīng)列的合計(jì),n為總例數(shù)。(C-1).2反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。只有考慮了自由度v的影響,地反應(yīng)實(shí)際頻數(shù)A和理論頻數(shù)T的吻合程度26四格表資料的檢驗(yàn)

23、:最小理論頻數(shù)T的判斷,R行與C列中,行合計(jì)數(shù)中的最小值與T RC列合計(jì)數(shù)中的最小值所對(duì)應(yīng)的理論頻數(shù)最小。(1) 四個(gè)表資料檢驗(yàn)的專(zhuān)用公式:2(2) 四個(gè)表資料檢驗(yàn)的校正公式:2(|A T| 0.5)2T(ad be)2n(a b)(e d )(a e)(b d)2(ad be n 2)2 ne (a b)(e d)(a e)(b d)在實(shí)際工作中,對(duì)于四個(gè)表資料,通常規(guī)定為:2(1)當(dāng)n40且所有的T 5時(shí),用檢驗(yàn)的基本公式或四個(gè)表資料2檢驗(yàn)的專(zhuān)用公式;當(dāng)Pa時(shí),改用四個(gè)表資料的 Fisher確切概率法2(2)當(dāng)n40,但 KT5時(shí),用四格表資料的檢驗(yàn)的校正公式;或改用四個(gè)表資料的Fishe

24、r確切概率計(jì)算法。(3) 當(dāng)nv40,或Tv 1時(shí),用四個(gè)表資料的Fisher確切概率法。2(4)連續(xù)性校正僅用于v=1的四格表資料,尤其是n小時(shí)。當(dāng)v2時(shí)一般不做校正7、配對(duì)四個(gè)表資料的$檢驗(yàn):由于在抽樣研究中,抽樣誤差是不可避免的,樣本中的b和e往往不相等(即bM e),為此,需進(jìn)行假設(shè)檢驗(yàn),其檢驗(yàn)統(tǒng)計(jì)量為:2 (b c)2b ev=1 (條R行C列,稱(chēng)為R*C表?;竟剑夯竟綖?(A T)2件為:b+c40)2(lb e 1)2v=1 (條件為:b+ev 40)b e本方法只適用于樣本含量不太大的資料,它僅考慮了兩種方法結(jié)果不一致的情況,而未考 慮樣本含量n和兩種方法一致的兩種情況

25、,所以當(dāng) n很大且a與d的數(shù)值也很大,而b與e 的數(shù)值相對(duì)較小時(shí),即使檢驗(yàn)統(tǒng)計(jì)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義也不大。8、行*列表資料的 2檢驗(yàn):只適用于多個(gè)樣本率的比較,兩個(gè)或多個(gè)構(gòu)成比的比較以及雙向無(wú)序分類(lèi)資料的關(guān)聯(lián)性檢驗(yàn)。其基本數(shù)據(jù)由三種情況: 多個(gè)樣本率的比較時(shí),有 R行2列,稱(chēng)為R*2表 兩個(gè)樣本的構(gòu)成比比較時(shí),有 2列C列,稱(chēng)為2*C表 多個(gè)樣本的構(gòu)成比比較以及雙向無(wú)序分類(lèi)資料關(guān)聯(lián)性檢驗(yàn)時(shí),有 以上三種可統(tǒng)稱(chēng)為行*列表資料2專(zhuān)用公式:n(AnRnC1)自由度 v=(行數(shù)-1)(列數(shù)-1)注意事項(xiàng):一般人行*列表資料中各格的理論頻數(shù)不能小于 1,且1T5格子數(shù)不能超過(guò)總數(shù)的1/5。如果

26、出現(xiàn)以上情況,可通過(guò)以下方法解決:最好是增加樣本含量,使得理論頻數(shù)增大;根據(jù)專(zhuān) 業(yè)知識(shí),考慮能否刪去理論頻數(shù)太小的行和列, 能否將理論頻數(shù)太小的行和列于性質(zhì)相近的鄰 行或鄰列合并;改用雙向無(wú)序 R*C的Fisher確切概率計(jì)算法。當(dāng)多個(gè)樣本率比較時(shí),所得統(tǒng)計(jì)推斷為拒絕 Ho,接受H1時(shí),只能認(rèn)為各樣本率間總的來(lái)說(shuō) 有差別,但不能說(shuō)明任兩個(gè)樣本率間均有差別,需要做多個(gè)樣本率的多重比較。2對(duì)于有序的R*C表資料不宜用 檢驗(yàn)。對(duì)于R*C表的資料要根據(jù)分類(lèi)類(lèi)型和研究目的選 用恰當(dāng)?shù)臋z驗(yàn)方法。9、雙向無(wú)序分類(lèi)資料的關(guān)聯(lián)性檢驗(yàn): 對(duì)于此資料,常常需要分析兩個(gè)分類(lèi)變量之間有無(wú)關(guān)系,大時(shí),Z近似服從均數(shù)為Z,

27、方差為的正態(tài)分布符合參數(shù)檢驗(yàn)應(yīng)用條件的資料應(yīng)首選參數(shù)檢驗(yàn); 而不能滿足參數(shù)檢驗(yàn)應(yīng)用條件的資料, 應(yīng)選用 非參數(shù)檢驗(yàn)。主要選擇編秩的方法,比較統(tǒng)計(jì)變量T,而做出統(tǒng)計(jì)推斷。直線回歸與相關(guān)分析1、直線相關(guān):如果兩個(gè)隨機(jī)變量中,當(dāng)其中的一個(gè)變量由大到小的變化時(shí),另一個(gè)變量也相 應(yīng)的由大到?。ê笥尚〉酱螅┑淖兓?,并且相應(yīng)變化的散點(diǎn)圖在直角坐標(biāo)系呈現(xiàn)直線趨 勢(shì),則稱(chēng)這兩個(gè)隨機(jī)變量存在直線相關(guān)。相關(guān)分析是研究變量和變量集合之間數(shù)量協(xié)同變化關(guān)系的密切程度和方向的統(tǒng)計(jì)方法。要求:兩個(gè)變量X和丫都服從正態(tài)分布,嚴(yán)格說(shuō)應(yīng)服從雙變量正態(tài)分布。直線相關(guān)系數(shù):用于說(shuō)明具有直線相關(guān)關(guān)系的兩個(gè)變量間的相關(guān)關(guān)系的密切程度和相關(guān)

28、方向; 亦稱(chēng)積差相關(guān)系數(shù),總體的為p,樣本的為Y。x和y的協(xié)方差(x x)(y y)口2z,“戶則Z的可信區(qū)間為(U;(n 3) , u .(n 3),對(duì)其進(jìn)行回歸方程為:? a bxn_(Xi x)(yi y)i 1n_(Xix)2i 1xya y bx(x)2n(x)( y) xyn的變換,可以得出的可信區(qū)間直線相關(guān)分析的注意事項(xiàng): 算相關(guān)系數(shù)時(shí)首先繪制散點(diǎn)圖,判斷兩變量是否存在線性趨勢(shì);相關(guān)分析時(shí)要求X、丫均為隨機(jī)變量,而不能用于事先界定 X、丫的資料;相關(guān)分析時(shí)必須剔除異常點(diǎn);相關(guān)分析要有實(shí)際意義,兩變量相關(guān),并不一定存在聯(lián)系,可能是另外一種因素引起的;分層資料不宜盲目的合并,進(jìn)行相關(guān)

29、分析;同時(shí)進(jìn)行相關(guān)分析時(shí),如果不能確定各層研究對(duì) 象具有同質(zhì)基礎(chǔ),不宜盲目合并。不能將假設(shè)檢驗(yàn)中 顯著性大小理解為兩變量相關(guān)程度的大小,后者是由相關(guān)系數(shù)的大小決定 的。2、等級(jí)相關(guān):適用于不服從雙變量正態(tài)分布或總體分布未知的資料,還可用于等級(jí)資料的相關(guān)分析。等級(jí)相關(guān)系數(shù)表示兩個(gè)變量間相關(guān)系數(shù)的密切程度與相關(guān)方向s基本思想:對(duì)于不符合正態(tài)分布的資料或等級(jí)資料, 將兩個(gè)變量的原始觀察值分別由小到大編 秩,然后利用量變量的秩次計(jì)算相關(guān)系數(shù)。3、直線回歸: 處理兩個(gè)變量間線性數(shù)量依存關(guān)系的一種統(tǒng)計(jì)分析方法。?為應(yīng)變量,給定x的y的條件均數(shù)的估計(jì)值;b為回歸斜率,表示當(dāng)自變量x每變化1個(gè)單位時(shí),應(yīng)變量y

30、平均變化b個(gè)單位;a為截距,表示沒(méi)有自變量x時(shí) 其他因素對(duì)y的平均影響。線性回歸模型的前提條件:線性:應(yīng)變量y的總體均數(shù)與自變量x呈線性關(guān)系;因此進(jìn)行回歸分析前應(yīng)先繪制散點(diǎn)圖;獨(dú)立:任意兩個(gè)觀察單位之間相互獨(dú)立;正態(tài)性:對(duì)任意給定x的值,y均服從正態(tài)分布;該分布的均數(shù)是回歸直線上與 x值相對(duì)應(yīng) 的那點(diǎn)的縱坐標(biāo);等方差:自變量x的取值范圍內(nèi),不論x取什么值,y都具有相同的方差。直線回歸分析的步驟:繪制散點(diǎn)圖,通過(guò)觀察散點(diǎn)的形態(tài)來(lái)判斷線性假設(shè)是否成立;建立直線回歸方程,即求出回歸參數(shù) a和b;通常用最小二乘法估計(jì)參數(shù),即要求殘差平方 和達(dá)到最小;繪制回歸線;注意:不應(yīng)超過(guò) x的實(shí)測(cè)值范圍;所繪制的

31、直線必然通過(guò)xx(x, y );直線的左端延長(zhǎng)與縱軸的焦點(diǎn)必然是截距a。回歸方程的假設(shè)檢驗(yàn):檢驗(yàn)方法有方差分析和 t檢驗(yàn)方差分析:基本思想:將應(yīng)變量 y的總變異SS總分解成SS回歸和SS剩余兩部分,然后利用F 檢驗(yàn)來(lái)判斷回歸方程是否成立。任意一點(diǎn)P( x,y)的縱坐標(biāo)被回歸直線與均數(shù)y截成3段:三部分的變異可以表示為:(y y)6 =(? y)2 + (y y)2即SS總=SS回歸+SS剩余各部分的意義:1、處理因素:研究者根據(jù)研究目的確定的,通過(guò)合理安排實(shí)驗(yàn),從而科學(xué)的考察其作用大小 的因素;3、 交叉設(shè)計(jì):是在自身配對(duì)設(shè)計(jì)基礎(chǔ)上發(fā)展起來(lái)的雙因素設(shè)計(jì), 該設(shè)計(jì)考慮了 1個(gè)處理因素, 此因素有

32、兩個(gè)水平(A,B),并且還考慮了 2個(gè)與處理因素?zé)o交互作用的非處理因素對(duì)實(shí)驗(yàn)效 應(yīng)的影響。適用條件及應(yīng)注意的問(wèn)題:處理因素只有2個(gè)水平(A,B ),且2個(gè)非處理因素(實(shí)驗(yàn)階段、受試對(duì)象)與處理因素之 間無(wú)交互作用;兩個(gè)實(shí)驗(yàn)階段之間要安排一定的間隔時(shí)間, 以便消除前一階段治療措施的殘留效應(yīng), 保證兩1、多元線性回歸分析中偏回歸系數(shù)的意義:在其他自變量保持不變的條件下,自變量 X改變 一個(gè)單位是因變量Y的平均該變量。流行病學(xué)意義:在其他因素不變的條件下,某因素改變1個(gè)單位時(shí),疾病或死亡危險(xiǎn)性的增加 量。2、 Logistic回歸分析中偏回歸系數(shù)的意義:在其他自變量固定的條件下,第j個(gè)自變量每改變

33、一個(gè)單位時(shí)Logit(p)的改變量。流行病學(xué)意義:在其他因素不變的條件下,暴露因素使疾病或死亡發(fā)生的改變量。3、 Cox回歸模型中偏回歸系數(shù)的意義:當(dāng)其他協(xié)變量都不變時(shí),Xi每變化一個(gè)單位,相對(duì)危險(xiǎn)度的自然對(duì)數(shù)(LnRR)變化匚個(gè)單位。流行病學(xué)意義:在其他因素不變的條件下,暴露組發(fā)病或死亡是非暴露組的倍數(shù)。生存分析生存時(shí)間:廣義的生存時(shí)間是指從某個(gè)起始事件開(kāi)始到某個(gè)終點(diǎn)事件的發(fā)生(出現(xiàn)反應(yīng))所 經(jīng)歷的時(shí)間。也稱(chēng)為失效時(shí)間。選擇合適的生存分析方法:非參數(shù)法:不論資料是什么樣的分布形式,只根據(jù)樣本提供的順序統(tǒng)計(jì)量對(duì)生存率進(jìn)行估計(jì), 常用的方法有乘積極限法和壽命表法;參數(shù)法:假定生存時(shí)間服從特定的參

34、數(shù)分布,然后根據(jù)已知分布的特點(diǎn)對(duì)影響生存的時(shí)間進(jìn)行分析,常用的方法有指數(shù)分布法、Weibull分布法、對(duì)數(shù)正態(tài)回歸分析法和對(duì)數(shù) Logistic回歸分析法等。半?yún)?shù)法:主要用于分析影響生存時(shí)間和生存率的因素,屬多因素分析方法,為Cox模型(x, y );直線的左端延長(zhǎng)與縱軸的焦點(diǎn)必然是截距a。SS總:即lyy = (y y)2,為y的總離均差平方和,反映未考慮 x和y的回歸關(guān)系時(shí)的y的變 異;SS回歸:即 (* y)2,稱(chēng)回歸平方和,反映在y的總變異中,由于x和y的直線關(guān)系而使y 變異減小的部分,即在總變異中可以用 x解釋的部分;SS回歸越大,說(shuō)明回歸效果越好,即SS 總中可用X與丫線性關(guān)系解

35、釋的變異越多。SS剩余:即 (y ,殘差平方和或剩余平方和, 反映x和y的線性影響之外的一切因素對(duì) ySXY為剩余標(biāo)準(zhǔn)差,是指扣除了 x因變量線性影響后離散程度。擬合效果評(píng)價(jià):回歸模型的擬合優(yōu)度假設(shè)檢驗(yàn),檢驗(yàn)回歸方程對(duì)樣本數(shù)據(jù)的擬合程度。 決定的變異的作用,即在總變異中無(wú)法用x解釋的部分 ??;各部分的自由度為:總=該部分越小說(shuō)明直線回歸的估計(jì)值誤差越各部分變異的計(jì)算公式為:回歸+剩余總=n-1,回歸=1,剩余=n-2SS總=(y y)2(y)2統(tǒng)計(jì)量F的計(jì)算公式:Fb與總體均數(shù)回歸系數(shù)B進(jìn)行比較來(lái)判斷tbbSbSbSXYJ-xxSXYMS剩余系數(shù)R表示,R2總體回歸系數(shù)的區(qū)間估計(jì):(b tb,

36、 b2Kb)(y ?) 2 S 尙歸 2 2 Fl? R 亦 R r回歸方程的應(yīng)用:利用回歸方程進(jìn)行預(yù)報(bào);統(tǒng)計(jì)控制。直線回歸分析的注意事項(xiàng):I回歸分析要有實(shí)際意義,注意變量之間的內(nèi)在聯(lián)系和規(guī)律,兩變量之間還必須是因果關(guān)系; n對(duì)資料的要求:一般y來(lái)自正態(tài)總體的隨機(jī)變量,x可以是正態(tài)總體的隨機(jī)變量,也可以 是精確測(cè)量和嚴(yán)密控制的值;川進(jìn)行分析前應(yīng)先繪制散點(diǎn)圖;IV必須剔除一些異常點(diǎn);V回歸方程的適用范圍不能隨意外延。其適用范圍一般以自變量取值范圍為界。 直線相關(guān)和回歸的區(qū)別與聯(lián)系:區(qū)別: 資料的要求不同:相關(guān)要求兩個(gè)變量呈雙變量正態(tài)分布;回歸要求y服從正態(tài)分布,而x可以是精確測(cè)量和嚴(yán)格控制的變量

37、; 統(tǒng)計(jì)意義不同:相關(guān)反映的是兩變量間的伴隨關(guān)系, 二者的關(guān)聯(lián)程度如何,而回歸反映的是 兩變量間的依存關(guān)系,即因果關(guān)系,或從屬關(guān)系; 分析的目的不同:相關(guān)分析的目的是描述兩個(gè)變量間的相互關(guān)系, 用r來(lái)反映這種關(guān)系的方 向以及密切程度,而回歸分析的目的是描述兩個(gè)變量間的數(shù)量依存關(guān)系, 從而進(jìn)行統(tǒng)計(jì)預(yù)測(cè)和 統(tǒng)計(jì)控制;聯(lián)系:對(duì)于同一資料,r和b的符號(hào)一致,說(shuō)明兩變量間關(guān)系的方向; 相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗(yàn)是等價(jià)的,對(duì)于同一樣本,tr仏,實(shí)際應(yīng)用中只檢驗(yàn)其中之一即可; 二者可以相互解釋?zhuān)嚓P(guān)系數(shù)的平方和等于回歸平方和占總平方和的比例,即反映應(yīng)變量y的總變異中歸因于x的部分;實(shí)驗(yàn)設(shè)計(jì)的概述廠實(shí)驗(yàn)室研

38、究:以動(dòng)物或標(biāo)本為研究對(duì)象實(shí)驗(yàn)研究的分類(lèi) t)表示。生存率隨時(shí)間記為S(t):t個(gè)時(shí)段后仍存活的概率,及生存時(shí)間大于等于t的概率,用P (Tt的變化而變化,即生存率是相對(duì)于時(shí)間 t的函數(shù),稱(chēng)為生存函數(shù),若前t個(gè)時(shí)段沒(méi)有刪失:St時(shí)段結(jié)束時(shí)仍存活的人數(shù)S(t) P(T t)研究期初觀察人數(shù)若觀察期內(nèi)有刪失,假定觀察對(duì)象在各個(gè)單位時(shí)段內(nèi)是否生存的時(shí)間是相互獨(dú)立的,其生 存概率分別用 p1, p2.pt,貝U S(t) p1 p2.ptPjtj t生存函數(shù)又稱(chēng)累積生存概率,即將時(shí)刻 t尚存活看成是前t個(gè)時(shí)段一直存活的累計(jì)結(jié)果。2、生存分析的基本思路:對(duì)資料的要求:樣本要有代表性,由隨機(jī)抽樣的方法獲得

39、,要有一定的數(shù)量;完全數(shù)據(jù)所占的比例不能太 少,即截尾值不宜太多;截尾值出現(xiàn)的原因無(wú)偏性;生存時(shí)間盡可能精確;缺項(xiàng)要盡量 補(bǔ)齊。I型錯(cuò)誤:拒絕了實(shí)際上成立的H0,即樣本來(lái)自卩=U o的總體,由于抽樣的偶然性,按a =0.05 檢驗(yàn)水準(zhǔn)拒絕了 H0,接受H。這類(lèi)在假設(shè)檢驗(yàn)中拒絕了原本正確的H0的錯(cuò)誤稱(chēng)為I型錯(cuò)誤。,理論上犯I型錯(cuò)誤的概率為a,a值得大小視研究目的而定。通常設(shè)a=0.05。U型錯(cuò)誤:不拒絕了實(shí)際上不成立的 H0,即樣本來(lái)自卩工卩0的總體,由于抽樣的偶然性,按 a =0.05檢驗(yàn)水準(zhǔn)不拒絕H),這類(lèi)在假設(shè)檢驗(yàn)中不拒絕原本不正確的 H)的錯(cuò)誤稱(chēng)為U型錯(cuò)誤。 犯U型錯(cuò)誤的概率為B,它只有

40、與特定的 Hi結(jié)合起來(lái)才有意義。同時(shí)減少a和B的方法是 增加樣本含量。1- B稱(chēng)為檢驗(yàn)效能或把握度,即兩總體確有差別時(shí), 按a水準(zhǔn)能識(shí)別該差別的能力。 如1- B =0.95表示:若兩總體確有差別,理論上平均100次抽 樣中,有95次能得出兩總體有差別的結(jié)論。11、假設(shè)檢驗(yàn)時(shí)應(yīng)注意的事項(xiàng):要有嚴(yán)密的抽樣研究設(shè)計(jì)-假設(shè)檢驗(yàn)的前提正確選用檢驗(yàn)方法:完全隨機(jī)的設(shè)計(jì)的兩數(shù)值變量資料比較時(shí), 若n小且方差齊,則選用兩 樣本t檢驗(yàn);若方差不齊,則選用t檢驗(yàn)或成組設(shè)計(jì)的兩樣本比較的秩和檢驗(yàn);若 n1,n2均大 于50,則選用兩樣本u檢驗(yàn)。正確理解“顯著性”的含義對(duì)差別有無(wú)統(tǒng)計(jì)學(xué)意義的判斷不能絕對(duì)化。方差分析1、 基本思想:按研究目的和設(shè)計(jì)類(lèi)型,將總變異的離均差平方和SS和自由度v分別分解成 若干部分,并求得各相應(yīng)部分的變異。其中的組內(nèi)變異或誤差主要反映個(gè)體差異或抽樣誤差,其它部分的變異與之比較得出統(tǒng)計(jì)量 F值,由F值的大小確定P值,并作出推斷,從而了解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論