




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、醫(yī)學統(tǒng)計學總結(jié)緒論1、隨機現(xiàn)象:在同一條件下進行試驗,一次試驗結(jié)果不能確定,而在一定數(shù)量的重復試驗之后呈現(xiàn)統(tǒng)計規(guī)律的現(xiàn)象。2、同質(zhì):統(tǒng)計學中對研究指標影響較大的,可以控制的主要因素。3、變異:同質(zhì)基礎(chǔ)上各觀察單位某變量值的差異。數(shù)值變量:變量值是定量的,由此而構(gòu)成的資料稱為數(shù)值變量資料或計量資料,其數(shù)值是連續(xù)性的,稱之為連續(xù)型變量。變量1無序分類變量:所分類別或?qū)傩灾g無順序和程度上的差異分類變量:定性變量有序分類變量:有順序和程度上的差異4、總體:根據(jù)研究目的確定的同人研究對象中所有觀察單位某變量值的集合??梢苑譃橛邢蘅傮w和無限總體。5、樣本:是按隨機化原則從同質(zhì)總體中隨機抽取的部分觀察單位
2、某變量值的集合。樣本代表性的前提:同質(zhì)總體,足夠的觀察單位數(shù),隨機抽樣。統(tǒng)計學中,描述樣本特征的指標稱為統(tǒng)計量,描述總體特征的指標稱為參數(shù)。6、概率:描述隨機事件發(fā)生的可能性大小的一個度量。若P(A)=1,則稱A為必然事件;若P(A)=0,則稱A為不可能事件;隨機事件A的概率為0<P<1.小概率事件:若隨機事件A的概率P<a,則稱隨機事件A為小概率事件,其統(tǒng)計學意義為:小概率事件在一次隨機試驗中認為是不可能發(fā)生的。統(tǒng)計描述1、頻數(shù)分布有兩個重要的特征:集中趨勢和離散程度。頻數(shù)分布有對稱分布和偏態(tài)分布之分。后者是指頻數(shù)分布不對稱,集中趨勢偏向一側(cè),如偏向數(shù)值小的一側(cè)為正偏態(tài)分布
3、,如偏向數(shù)值大的一側(cè)為負偏態(tài)分布。2、常用的集中趨勢的描述指標有:均數(shù),幾何均數(shù),中位數(shù)等。均數(shù):適用于正態(tài)或近似正態(tài)的分布的數(shù)值變量資料。樣本均數(shù)用表示,總體均數(shù)用以表小0幾何均數(shù):適用于等比級數(shù)資料和對數(shù)呈正態(tài)分布的資料。注意觀察值中不能有零,一組觀察值中不能同時有正值和負值。中位數(shù):適用于偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)的資料。3、常用的離散程度的描述指標有:全距,四分位數(shù)間距,方差,標準差,變異系數(shù)。全距:任何資料,一組中最大值與最小值的差。四分位數(shù)間距:適用于偏態(tài)分布以及分布的一端或兩端無確切數(shù)據(jù)資料。方差和標準差:正態(tài)分布資料。標準差表示觀察值的變異度的大小。變異系數(shù)
4、:比較度量單位不同或均數(shù)相差懸殊的兩組資料的變異度。4、標準正態(tài)分布:對正態(tài)分布的(X-仙)/進行u的變換,u=(X-仙)/(T,則正態(tài)分布變換為仙=0,(7=1的標準正態(tài)分布,亦稱u分布。u被稱為標準正態(tài)變量或標準正態(tài)離差。兩個參數(shù):N是位置參數(shù),是形狀參數(shù)。用N(0,1)表示標準正態(tài)分布。常用估計醫(yī)學參考值范圍的方法有:(1)正態(tài)分布方法:適用于正態(tài)或近似正態(tài)分布的資料。雙側(cè)界值:X±u“2S單側(cè)上界:X+u,S,或單側(cè)下界:X-u.S(2)對數(shù)正態(tài)分布方法:適用于對數(shù)正態(tài)分布資料。雙側(cè)界值:Lg5、分類變量資料的統(tǒng)計描述:常用相對數(shù)指標描述,包括:率,構(gòu)成比,相對比。率:說明某
5、現(xiàn)象發(fā)生的頻率或強度。(病死率不等于死亡率)構(gòu)成比:說明某現(xiàn)象內(nèi)部組成部分所占的比重或分布,常以百分數(shù)表示。相對比:亦稱比,是A、B 2個有關(guān)指標之比,說明A為B的若干倍或百分之幾。兩個指 標可以性質(zhì)相同,也可以性質(zhì)不同。應(yīng)用相對數(shù)時的注意事項: 、計算相對數(shù)的分母不宜過??;2、分析時不能以構(gòu)成比代替率;3、對觀察單位數(shù)不等 的幾個率,不能直接相加求其平均率;4、比較相對數(shù)時應(yīng)注意其可比性;5、對樣本率(或構(gòu) 成比)的比較應(yīng)遵循隨機抽樣,并做假設(shè)檢驗。6、標準化法:標準化的目的在于消除混雜因素對結(jié)果的影響,使資料更具有可比性。其基本 思想是:將所比較的兩組或多組資料的構(gòu)成按統(tǒng)一的“標準”調(diào)整后
6、,計算標化率,使其更具 有可比性。標準化率的計算方法:亦稱標化率,直接法用于已知被標化組的年齡別率, 以及已知標準組的 年齡別人口數(shù)或年齡別人口構(gòu)成比時;間接法用于已知被標化組的年齡別人口數(shù)與發(fā)病 (死亡) 總數(shù),但年齡別率未知,以及已知標準組年齡別發(fā)病(死亡)率與總發(fā)病(死亡)率時。通??蓮南铝?種方法選用標準組:以兩組資料中任一組的年齡別人口數(shù)或構(gòu)成比作為標準 組;以兩組資料合并的各年齡組的人口數(shù)或構(gòu)成比作為標準組;以公認的或便于與他人資料比較的標準作為標準組。7、統(tǒng)計表:結(jié)構(gòu):由標題、標目、線條和數(shù)字構(gòu)成。編制統(tǒng)計表的要求:標題:概括表的內(nèi)容,列于表的上方居中,應(yīng)注明時間和地點;標目:主
7、語和謂語分別列于橫、縱標目,文字簡明,層次清楚。橫標目列于表的左側(cè),通常 為被研究的事物,縱標目列于表的上端,為說明橫標目的統(tǒng)計指標。線條:通常,除表的頂線、底線、縱標目下以及合計上的橫線外,其余線條均省去,頂線和底線應(yīng)略粗些,表的左上角不宜用斜線。數(shù)字:用阿拉伯數(shù)字表示,同一指標的小數(shù)位數(shù)要一致并對齊, 數(shù)字暫缺或無數(shù)字者分別用 “”或"-”表示,數(shù)字為0者要記作“ 0”,不應(yīng)空項,為方便核實和分析,應(yīng)有合計。(Xlgx±U"2slgx)單側(cè)上界:Lg1(XIgx+ubSlgx),或單側(cè)下界:Lg-1(Xlgx-u6lgx)(3)百分位數(shù)法:用于偏態(tài)分布資料以及
8、資料中一端或兩端無確切數(shù)值的資料。雙側(cè)上界:P2.5和P97.5;單側(cè)上界:P95,或單側(cè)下界:P5常用的U值表參考值范圍(%單側(cè)800.8421.282901.2821.645951.6451.96992.3262.576備注:一般不列入表內(nèi),必要時可用* ”標出,列于表下8、統(tǒng)計圖:條圖:用于相互對比關(guān)系的資料;圓圖與百分條圖:適用于百分構(gòu)成比資料,表示事物各組成部分所占的比重或構(gòu)成;線圖:用于連續(xù)性資料,用于說明事物在時間上的發(fā)展變化,或某現(xiàn)象隨另一現(xiàn)象而變動的情況;直方圖:表示連續(xù)性資料的頻數(shù)分布;散點圖:適用于直線相關(guān)分析,說明兩個變量間的數(shù)量關(guān)系和變化趨勢。抽樣分布與參數(shù)估計抽樣研
9、究的目的是用樣本信息來推斷總體特征,即統(tǒng)計推斷,包括兩個內(nèi)容:一是總體參數(shù)的估計,二是假設(shè)檢驗。1、抽樣誤差:由于變異的存在,抽樣研究所造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異稱為抽樣誤差。常用標準誤氣反映均數(shù)抽樣誤差的大??;用率的標準誤”反映率的抽樣誤差的大??;用Possion計數(shù)的標準誤V7反映其抽樣誤差的大小。2、中心極限定理和正態(tài)分布推理:從正態(tài)分布N(p,d)總體中以固定n隨機抽取樣本,樣本均數(shù)X的分布仍服從正態(tài)分布,即使是從偏態(tài)分布總體中隨機抽樣,只要n足夠大,X的分布也近似正態(tài)分布。樣本均數(shù)的均數(shù)仍為1,樣本均數(shù)的標準差為CT-0樣本均數(shù)的抽樣誤差;七(簡稱標
10、準誤)是反映均數(shù)抽樣誤差大小的指標。用樣本均數(shù)S作為6的估計值,則sx =S n3、t分布:將x看成變量值,那么可將正態(tài)變量進行u變換(u=x- N /(T )后,也可將N ( N ,2)變換成標準正態(tài)分布N(0,1)。常用s作為6的估計值,統(tǒng)計量為t,此分布為t分布統(tǒng)計量t=工二上t曲線的形態(tài)變化與自由度v的大小有關(guān)。v越小,t值越分散,曲線越低Sx平,v逐漸增大時,則t分布逐漸逼近正態(tài)分布,當丫=無窮大時,t分布即為u分布。4、總體均數(shù)的估計有兩種方法:一種是點估計,即用統(tǒng)計量X估計總體均數(shù)口;二是區(qū)間估計,亦稱可信區(qū)間。(1)CT未知且n/、:X-ta/2,VSX<(1<X+
11、ta/2,vSX(2) (T未知,但n足夠大,t分布逼近U分布:X-Ua/2sx<N<X+Ua/2sx(3) (T已知:X-ua/2CTx<1<X+Ua/2CTx標準差,-2S= (x-x) n -1表示觀察值的變異程度大小計算變異系數(shù)CV=s 100% x標準差和標準誤的比較標準誤s%1 n估計均數(shù)的抽樣誤差大小估計總體均數(shù)可信區(qū)問確定醫(yī)學參考值的范圍 計算標準誤X-ta/2,VSX<(1<X+ta/2,VSx進行假設(shè)檢驗數(shù)值變量資料的假設(shè)檢驗1、假設(shè)檢驗的原理:假設(shè)在一次抽樣研究中得出了u>1.96,則P00.05,此為小概率事件,依據(jù)“小概率事件
12、在一次隨機試驗中認為是不可能發(fā)生的”的定理,可認為此樣本不是來自該總體。2、步驟:建立假設(shè)和確定檢驗水準;假設(shè)有兩種,一種是檢驗假設(shè),常稱無效假設(shè)或零假設(shè),記為H0,假設(shè)樣本所代表的總體參數(shù)與已知總體參數(shù)相等;另一種是備擇假設(shè),記為H,是與H0相聯(lián)系且對立的假設(shè);檢驗水準,亦稱顯著性水準,是判斷拒絕或不拒絕代,也是允許犯I型錯誤的概率,通常用0.05。選定檢驗方法和計算統(tǒng)計量確定P值,做出推斷結(jié)論。P值是指從H0所規(guī)定的總體中隨機抽樣時,獲得等于及大于現(xiàn)有樣本統(tǒng)計量的概率。3、t檢驗:適用于:樣本均數(shù)與總體均數(shù)比較(6未知且n<50或n<30);成組設(shè)計的兩小樣本均數(shù)的比較(m,n
13、2均小于30或50);配對設(shè)計的兩樣本均數(shù)比較。應(yīng)用條件:當樣本含量較?。╪<50或n<30)時,要求樣本來自正態(tài)分布總體;用于成組設(shè)計的兩樣本均數(shù)比較時,要求兩樣本來自總體方差相等的總體。4、單樣本t檢驗:用于樣本均數(shù)與已知總體均數(shù)的比較,研究目的是推斷樣本所代表的總體均數(shù)以與已知總體均數(shù)口有無差別。統(tǒng)計量t=0%v=n-1s/n5、配對t檢驗:用于配對設(shè)計資料的兩均數(shù)的比較。其研究目的是推斷某種處理有無作用,或兩種處理的效果有無差別。配對設(shè)計類型有3種:先將受試對象按配比條件配對,然后用隨機分組方法將各對中的2個受試對象分別分配到不同的處理組;同一對象分別接受2種不同處理;同一
14、對象處理前后。t=一d-=(d是差值的樣本均數(shù))v=n-1sd/.n6、兩樣本t檢驗:用于完全隨機設(shè)計的兩樣本均數(shù)的比較,兩個樣本來自兩個總體,具研究目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。t=v=n 1+n2-2x1-'I型錯誤:拒絕了實際上成立的H0,即樣本來自 尸-的總體,由于抽樣的偶然性,按a =0.05 檢驗水準拒絕了 H0,接受H。這類在假設(shè)檢驗中拒絕了原本正確的H0的錯誤稱為I型錯誤。,理論上犯I型錯誤的概率為a , a值得大小視研究目的而定。通常設(shè) a =0.05。R型錯誤:不拒絕了實際上不成立的 H0,即樣本來自以手以0的總體,由于抽樣的偶然性,按 a =0.0
15、5檢驗水準不拒絕這類在假設(shè)檢驗中不拒絕原本不正確的 H的錯誤稱為II型錯誤。 犯R型錯誤的概率為B ,它只有與特定的H1結(jié)合起來才有意義。同時減少a和B的方法是增加樣本含量。1- B稱為檢驗效能或把握度,即兩總體確有差別時, 按a水準能識別該差別的能力。如1- B =0.95表示:若兩總體確有差別,理論上平均100次抽 樣中,有95次能得出兩總體有差別的結(jié)論。11、假設(shè)檢驗時應(yīng)注意的事項:要有嚴密的抽樣研究設(shè)計一假設(shè)檢驗的前提正確選用檢驗方法:完全隨機的設(shè)計的兩數(shù)值變量資料比較時, 若n小且方差齊,則選用兩 樣本t檢驗;若方差不齊,則選用t檢驗或成組設(shè)計的兩樣本比較的秩和檢驗;若n2均大于50
16、,則選用兩樣本u檢驗。正確理解“顯著性”的含義對差別有無統(tǒng)計學意義的判斷不能絕對化。方差分析1、基本思想:按研究目的和設(shè)計類型,將總變異的離均差平方和SS和自由度v分別分解成若干部分,并求得各相應(yīng)部分的變異。其中的組內(nèi)變異或誤差主要反映個體差異或抽樣誤差, 其它部分的變異與之比較得出統(tǒng)計量 F值,由F值的大小確定P值,并作出推斷,從而了解 該因素對觀測指標有無影響。組內(nèi)變異主要由個體差異所致,組間變異可能由兩種原因所致:一是抽樣誤差,二是由于接 受的處理不同。2、總離均差平方和SS和自由度vk niSS= Z X (xij -x) =E x2 -(> x)2 / n i £ j
17、 £2_X1-'X2_xi'x2S2s2(11)s2(ni-1)sM-1)(1.1)n1n2n1n2-2n1n2x 仙07、單樣本u檢驗:用于樣本均數(shù)與已知總體均數(shù)比較,其研究目的同t檢驗。研究目的是推8、兩樣本的u檢驗斷樣本所代表的總體均數(shù)以與已知總體均數(shù)尸有無差別。其統(tǒng)計量u=:用于完全隨機設(shè)計的兩樣本均數(shù)的比較,兩個樣本來自兩個總體,具研究目的是推斷兩樣本所分別代表的總體均數(shù)是否相等。其統(tǒng)計量為:X1-X2X1-x2U=_sx1衛(wèi)s2/ns2/n29、正態(tài)性檢驗和方差齊性檢驗:資料在做假設(shè)檢驗之前首先應(yīng)該檢驗資料是否來自正態(tài)總體,并且它們的方差是否齊。10、兩類
18、錯誤:v總"n-l3、組間離均差平方和SS組間,自由度v組間和均方MS且間nicc(jj)(Zx)2、,SS且間SS間=V間一k-lMS=nnv組間4、組內(nèi)離均差平方和SS組內(nèi),自由度v組內(nèi)和均方MS且內(nèi)SS組內(nèi)-SS總-SS組間v組內(nèi)=n-kMS組內(nèi)=SS組內(nèi)/v組內(nèi)多樣本均數(shù)比較的方差分析的應(yīng)用條件:各樣本是相互獨立的隨機樣本;各樣本來自正態(tài)分布總體;各總體方差相等,即方差齊。5、完全隨機設(shè)計資料的方差分析:亦稱單因素的方差分析,可用于完全隨機設(shè)計的多個樣本均數(shù)比較的資料,研究目的是推斷各個樣本所代表的總體均數(shù)是否相等。單因素方差分析的計算公式變異來源SSvMSF總變異'
19、、x2-Cn-1組間變異nikXij)2'、jimni-Ck-1SS且間MS組間v組間MS組內(nèi)組內(nèi)變異SS總-SS組間n-kSS組內(nèi)/v組內(nèi)*C為校正系數(shù)C=(Zx)2/n6、配伍組設(shè)計資料的方差分析:亦稱兩因素的方差分析,用于配伍組設(shè)計的多個樣本均數(shù)比較的資料,其研究目的是推斷各樣本所代表的總體均數(shù)是否相等,但考慮了個體差異對試驗效應(yīng)的影響。兩因素方差分析的計算公式變異來源SSvMSF總變異"x2-Cn-1bkrxj)處理組j土CCk-1SS處理/v處理MS處理/MS誤差i1bkbxij)配伍組i1C-Cb-1SS配伍/v配伍MS配伍/MS誤差j1kSS總-SS處壬i-SS
20、配伍(k-1)(b-1)SS誤差/v誤差*C為校正系數(shù)C=(£x)2/nb為配伍組數(shù)分類資料的假設(shè)檢驗1、二項分布:應(yīng)用條件:各觀察單位只能具有兩種相互對立的結(jié)果已知發(fā)生某結(jié)果的概率為冗,其對立結(jié)果的概率為1-九n次試驗是在相同的條件下進行的。性質(zhì):N=nTt0-=Vn(1一冗)若均數(shù)和標準差用率表示,則pp=兀p p= 5t (1 一冗)/ n冗未知時,用樣本率P作為冗的估計值,則Sp=Jp(1-p)/n總體率的估計:正態(tài)近似法:當樣本含量n足夠大,且樣本率p或1-p均不太小,如np與n(1-p)均大于5時樣本率p的抽樣誤差分布近似正態(tài)分布,可信區(qū)間為:(p-u/2Sp,p+u/2
21、Sp)2、Poisson分布:對于二項分類變量,若某結(jié)果發(fā)生的概率很小,如冗0.05時,單位時間、人群、空間內(nèi)“陽性”發(fā)生次數(shù)x(x=0,1,2,)的概率可用Poisson分布概率函數(shù)來描述:P(X)=e飛J/x!)遞推公式:P (0) =ec/、 P(x1)LIP (x)=x應(yīng)用條件:兀0.05外,其余同二項分布分布的性質(zhì):小,表示單位時間、人群、空間內(nèi)(1)、Poisson分布式一種單參數(shù)的離散型分布,其參數(shù)為某事件平均發(fā)生的次數(shù)。(2)、Poisson分布的方差;與均數(shù)相等。(3)、Poisson分布可以看成是二項分布的極限形式。(4)、Poisson分布的極限形式也是二項分布,一般當n
22、20時,可按正態(tài)分布處理,當冗&0.01時,二項分布可以當作Poisson分布來處理。(5)、Poisson分布具有可加性。總體均數(shù)的估計:(正態(tài)近似法)(xIVx,x+(Ix4x)Ua/27Ua/23、服從二項分布資料的假設(shè)檢驗:(1)樣本率和總體率的估計:k直接計算法:最多有k例陽性的概率:P(xk)=ZP(x)0nk最少有k例陽性的概率:P(x>k)=ZP(x)=1-YP(x)k0正態(tài)近似法:當兀0不太靠近0或1,且樣本含量n足夠大;或n兀05且n(1-兀0)5時,二項分布接近正態(tài)分布u=P -九0x-n 九0n n 九 o(1九 o)其公式為:u=_pL二p2 =SP1
23、“2(2)兩樣本率的比較:目的是推斷兩個樣本各自代表的兩總體率是否相等,當兩個樣本率均滿足正態(tài)近似條件時,可用u檢驗。Pl-P2、,11、Pc(1-Pc)()n1n2Pc為合并陽性率,Pc=(X1+X2)/(ni+n2)X1,X2為兩個樣本的陽性例數(shù)。4、服從Poisson分布的假設(shè)檢驗:對于Poisson分布的假設(shè)檢驗,對于總體均數(shù)可以用乘法將小單位化大,也可以用除法將大單位化小,對于樣本均數(shù),只能用除法將大單位化小,而不能用乘法將小單位化大。(1)樣本均數(shù)與總體均數(shù)的比較:適用于0<20,且樣本陽性數(shù)X較小作單側(cè)檢驗時。k直接計算法:最多有k例陽性的概率:P(x<k)=ZP(x
24、)onk最少有k例陽性的概率:P(x>k)=ZP(x)=1-EP(x)k0正態(tài)近似法:當p20時,Poisson分布逼近正態(tài)分布。u=(x-p0)/值'(2)兩樣本陽性數(shù)的比較:目的是推斷兩樣本各自代表的兩總體平均數(shù)是否相等。當兩樣本陽性數(shù)X1,X2均大于20時,可用u檢驗。其計算用兩種情況:兩樣本觀察單位(時間、面積、容積等)相同時:X1-X2X1X2X1X2X1一二x2兩樣本觀察單位(時間、面積、容積等)不同時:X1 -X2一 .X1 n1X2 n22.2.-25、1檢驗:是一種連續(xù)型分布,u分布的平方即為工分布。對于同一份資料,u2=/2。72檢驗的檢驗統(tǒng)計量為/,其基本公
25、式為:72=2(A二,自由度v=(行數(shù)-1)(列數(shù)-1).n-*ric.式中A為實際頻數(shù),T為理論頻數(shù)。理論頻數(shù)T的計算公式為:Trc=比上丁為第Rn1RC行第C列的理論頻數(shù),nR為相應(yīng)行的合計,nC為相應(yīng)列的合計,n為總例數(shù)。自由度v=(R-1)(C-1).72反映了實際頻數(shù)與理論頻數(shù)的吻合程度。只有考慮了自由度v的影響,72值才能正確地反應(yīng)實際頻數(shù)A和理論頻數(shù)T的吻合程度2*6、四格表資料的7檢驗:最小理論頻數(shù)丁的判斷,R行與C列中,行合計數(shù)中的最小值與TRC列合計數(shù)中的最小值所對應(yīng)的理論頻數(shù)最小。(1)四個表資料?2檢驗的專用公式:2(2)四個表資料7.檢驗的校正公式:(ad -bc)2
26、n(a b)(c d )(a c)(b d)(|A -T| -0.5)2T2(ad-bc|n2)2nc(ab)(cd)(ac)(bd)在實際工作中,對于四個表資料,通常規(guī)定為:2(1)當n40且所有的T5時,用7-檢驗的基本公式或四個表資料7檢驗的專用公式;當P=a時,改用四個表資料的Fisher確切概率法。,2,1,,(2)當240,但1WT&5時,用四格表資料的7檢驗的校正公式;或改用四個表資料的Fisher確切概率計算法。(3)當n<40,或T<1時,用四個表資料的Fisher確切概率法。2(4)7連續(xù)性校正僅用于v=1的四格表資料,尤其是n小時。當v2時一般不做校正
27、。7、配對四個表資料的叉2檢驗:由于在抽樣研究中,抽樣誤差是不可避免的,樣本中的b和c往往不相等(即bwc),為此,需進行假設(shè)檢驗,具檢驗統(tǒng)計量為:72=也二支v=1(條bc件為:b+c>40)72=(cv=1(條件為:b+c<40)bc本方法只適用于樣本含量不太大的資料,它僅考慮了兩種方法結(jié)果不一致的情況,而未考慮樣本含量n和兩種方法一致的兩種情況,所以當n很大且a與d的數(shù)值也很大,而b與c的數(shù)值相對較小時,即使檢驗統(tǒng)計結(jié)果有統(tǒng)計學意義,其實際意義也不大。8、行*列表資料的?2檢驗:只適用于多個樣本率的比較,兩個或多個構(gòu)成比的比較以及雙向無序分類資料的關(guān)聯(lián)性檢驗。其基本數(shù)據(jù)由三種
28、情況:多個樣本率的比較時,有R行2歹I,稱為R*2表兩個樣本的構(gòu)成比比較時,有2列C歹1,稱為2*C表多個樣本的構(gòu)成比比較以及雙向無序分類資料關(guān)聯(lián)性檢驗時,有R行C歹I,稱為R*C表。以上三種可統(tǒng)稱為行*列表資料2基本公式:基本公式為:2=,.(AT)2A2關(guān)系的密切程度如何,進一步分析密切程度時,可以用Pearson列聯(lián)系數(shù), r = I_rp rp n 2rp取值在01之間,0表示完全不相關(guān),1表示完全相關(guān),愈接近于 0,關(guān)系愈不密切,愈接近1,關(guān)系愈密切。11、R*C表的分類及檢驗方法的選擇:分類:雙向無序、單向有序、雙向有序?qū)傩韵嗤碗p向有序但屬性不同四種。雙向無序R*C表:兩個分類變
29、量皆為無序分類變量,對于該資料:如果研究目的為兩個 樣本率(或構(gòu)成比)的比較,可用行*列資料的7 2檢驗;如果研究目的是分析兩個分類變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時,可用行*列表資料的7檢驗以及Pearson列聯(lián)系數(shù)進行分析。單向有序R*C表:有兩種形式:一種是R*C表的分組變量是有序的,而指標變量是無序的; 研究的目的通常是多個構(gòu)成比的比較,可用行 *列表資料的7 2檢驗進行分析。另一種是 R*C 表中的分組變量是無序的,而指標變量是有序的,研究目的通常是多個 等級資料的比較,可用 秩和檢驗或Ridit分析。雙向有序?qū)傩孕瓮腞*C表:兩個分類變量皆為有序且屬性相同,研究目的通常是分析
30、兩 種檢測方法的一致性,此時宜用 一致性檢驗(或稱Kappa檢驗);也可用特殊模型分析方法。 雙向有序?qū)傩圆煌腞*C表:兩分類變量皆為有序的,但屬性不同,對于該資料:如果 研究目的是分析不同年齡組患者療效見有無差別,可把它視為單向有序的R*C表資料,選用秩和檢驗;如果研究目的是分析兩個有序分類變量間是否存在相關(guān)關(guān)系,可以用等級相關(guān)分析或Pearso制矩相關(guān)分析;如果研究目的是分析兩個有序分類變量是否存在線性變化趨勢, 可以用有序分組資料的線性趨勢檢驗。非參數(shù)檢驗非參數(shù)檢驗的統(tǒng)計推斷基礎(chǔ)是比較分布而不是比較參數(shù),所以不必考慮被研究對象的為何種分布以及分布是否已知。在實際工作中,對符合參數(shù)檢驗應(yīng)
31、用條件的資料,或經(jīng)變量變換后,.、專用公式:n=n(£1)自由度V=(行數(shù)-1)(列數(shù)-1)HrHc注意事項:一般人行*列表資料中各格的理論頻數(shù)不能小于1,且仃5格子數(shù)不能超過總數(shù)的1/5。如果出現(xiàn)以上情況,可通過以下方法解決:最好是增加樣本含量,使得理論頻數(shù)增大;根據(jù)專業(yè)知識,考慮能否刪去理論頻數(shù)太小的行和列,能否將理論頻數(shù)太小的行和列于性質(zhì)相近的鄰行或鄰列合并;改用雙向無序R*C的Fisher確切概率計算法。當多個樣本率比較時,所得統(tǒng)計推斷為拒絕H。,接受H1時,只能認為各樣本率問總的來說有差別,但不能說明任兩個樣本率間均有差別,需要做多個樣本率的多重比較。對于有序的R*C表資料
32、不宜用?2檢驗。對于R*C表的資料要根據(jù)分類類型和研究目的選用恰當?shù)臋z驗方法。9、雙向無序分類資料的關(guān)聯(lián)性檢驗:對于此資料,常常需要分析兩個分類變量之間有無關(guān)系,符合參數(shù)檢驗應(yīng)用條件的資料應(yīng)首選參數(shù)檢驗;而不能滿足參數(shù)檢驗應(yīng)用條件的資料,應(yīng)選用非參數(shù)檢驗。主要選擇編秩的方法,比較統(tǒng)計變量T,而做出統(tǒng)計推斷。直線回歸與相關(guān)分析1、直線相關(guān):如果兩個隨機變量中,當其中的一個變量由大到小的變化時,另一個變量也相應(yīng)的由大到小(后由小到大)的變化,并且相應(yīng)變化的散點圖在直角坐標系呈現(xiàn)直線趨勢,則稱這兩個隨機變量存在直線相關(guān)。相關(guān)分析是研究變量和變量集合之間數(shù)量協(xié)同變化關(guān)系的密切程度和方向的統(tǒng)計方法。要求
33、:兩個變量X和Y都服從正態(tài)分布,嚴格說應(yīng)服從雙變量正態(tài)分布。直線相關(guān)系數(shù):用于說明具有直線相關(guān)關(guān)系的兩個變量間的相關(guān)關(guān)系的密切程度和相關(guān)方向;亦稱積差相關(guān)系數(shù),總體的為P,樣本的為Y。p_x和y的協(xié)方差(_工(x-x)(yy)_nx的方差)一(y的方差)(xi(x-x)2Z(y-y)2lyyP的取值在-1,1之間。其意義如下:若P#0則X與Y存在直線相關(guān)關(guān)系;P>0為正相關(guān);PY0為負相關(guān);|P越大,說明兩變量間的相關(guān)關(guān)系越密切;|P越小,說明兩變量間的相關(guān)關(guān)系越不密切;若|p|=1為完全相關(guān);若P=0,則X和Y不存在相關(guān)關(guān)系。0<|?|<1表示存在不同程度的線性相關(guān)關(guān)系:0
34、Ml3Y0.4為低度線性相關(guān);0.4Y0.7為顯著線性相關(guān);0.7斗y1為高度顯著線性相關(guān)。相關(guān)分析的步驟:(在X與Y均服從雙變量正態(tài)分布的情況下)繪制散點圖:呈線性趨勢,計算相關(guān)性;呈曲線趨勢,進行曲線擬合;無任何趨勢,不必分析。根據(jù)上述公式計算T的值;相關(guān)系數(shù)的假設(shè)檢驗,由于抽樣誤差的存在,判斷了是否來自P=0的總體,常用t檢驗,-0公式:ty=-J7V=V=n-2(或直接查t界值表)s?J1n2-2總體相關(guān)系數(shù)的區(qū)間估計:當P#0時,從這樣的總體中抽樣,計算出的丫不服從正態(tài)分布,而進行反正切變換后,n較大時,z近似服從均數(shù)為Z,方差為仃2=的正態(tài)分布。n3xyxx2zz=1ln(H_2則
35、Z的可信區(qū)間為(Z-uJjF3),Z+Uo/jK3J),對其進行¥=ez二線性回歸模型的前提條件:線性:應(yīng)變量y的總體均數(shù)與自變量x呈線性關(guān)系;因此進行回歸分析前應(yīng)先繪制散點圖;獨立:任意兩個觀察單位之間相互獨立;正態(tài)性:對任意給定x的值,y均服從正態(tài)分布;該分布的均數(shù)是回歸直線上與 x值相對應(yīng) 的那點的縱坐標;等方差:自變量x的取值范圍內(nèi),不論x取什么值,y都具有相同的方差。直線回歸分析的步驟:繪制散點圖,通過觀察散點的形態(tài)來判斷線性假設(shè)是否成立;建立直線回歸方程,即求出回歸參數(shù) a和b;通常用最小二乘法估計參數(shù),即要求殘差平方 和達到最?。籲_% (xi -x)(yi -y) 1
36、b 二nz,1-e1的變換,可以得出p的可信區(qū)問。直線相關(guān)分析的注意事項:算相關(guān)系數(shù)時首先繪制散點圖,判斷兩變量是否存在線性趨勢;相關(guān)分析時要求X、Y均為隨機變量,而不能用于事先界定X、Y的資料;相關(guān)分析時必須剔除異常點;相關(guān)分析要有實際意義,兩變量相關(guān),并不一定存在聯(lián)系,可能是另外一種因素引起的;分層資料不宜盲目的合并,進行相關(guān)分析;同時進行相關(guān)分析時,如果不能確定各層研究對象具有同質(zhì)基礎(chǔ),不宜盲目合并。不能將假設(shè)檢驗中顯著性大小理解為兩變量相關(guān)程度的大小,后者是由相關(guān)系數(shù)的大小決定的。2、等級相關(guān):適用于不服從雙變量正態(tài)分布或總體分布未知的資料,還可用于等級資料的相關(guān)分析。等級相關(guān)系數(shù)學表
37、示兩個變量間相關(guān)系數(shù)的密切程度與相關(guān)方向。s基本思想:對于不符合正態(tài)分布的資料或等級資料,將兩個變量的原始觀察值分別由小到大編秩,然后利用量變量的秩次計算相關(guān)系數(shù)。3、直線回歸:處理兩個變量間線性數(shù)量依存關(guān)系的一種統(tǒng)計分析方法。回歸方程為:?=a+bx?為應(yīng)變量,給定x的y的條件均數(shù)的估計值;b為回歸斜率,表示a = y -bxl xy =xy0 x) y)n繪制回歸線;注意:不應(yīng)超過x的實測值范圍;所繪制的直線必然通過當自變量x每變化1個單位時,應(yīng)變量y平均變化b個單位;a為截距,表示沒有自變量x時其他因素對y的平均影響。a。(X,y);直線的左端延長與縱軸的焦點必然是截距回歸方程的假設(shè)檢驗
38、:檢驗方法有方差分析和t檢驗方差分析:基本思想:將應(yīng)變量y的總變異SS總分解成SS回歸和SS剩余兩部分,然后利用F檢驗來判斷回歸方程是否成立。任意一點P(x,y)的縱坐標被回歸直線與均數(shù)y截成3段:三部分的變異可以表示為:'、(y-y)2=x(?-y)2+x(y-y)2即SS總"SS回歸+SS剩余各部分的意義:SS總:gPlyy=Z(y-y)2,為y的總離均差平方和,反映未考慮x和y的回歸關(guān)系時的y的變異;SS回歸:即£(y?-y)2,稱回歸平方和,反映在y的總變異中,由于x和y的直線關(guān)系而使y變異減小的部分,即在總變異中可以用x解釋的部分;SS回歸越大,說明回歸效
39、果越好,即SS總中可用X與Y線性關(guān)系解釋的變異越多。SS剩余:即工(y-y)2,殘差平方和或剩余平方和,反映x和y的線性影響之外的一切因素對y的變異的作用,即在總變異中無法用x解釋的部分。該部分越小說明直線回歸的估計值誤差越??;各部分的自由度為:"總=V回歸+V剩余¥總=口-1,V回歸=1,Y剩余=n-2各部分變異的計算公式為:SS總=£ (y-y)2 =Z2S%歸=blxy=4lxxMS回歸MS剩余SS剩余=SS總一SS回歸統(tǒng)計量F的計算公式:F=S*歸”回歸SS剩余/Y剩余回歸系數(shù)的t檢驗:基本思想:通過樣本回歸系數(shù)b與總體均數(shù)回歸系數(shù)B進行比較來判斷回歸方程
40、是否成立。有關(guān)公式如下:tbb一;Sbv = n -2 ;Sb = -Y=;Sxy = vMS剩余Sxy為剩余標準差,是指扣除了x因變量線性影響后離散程度。擬合效果評價:回歸模型的擬合優(yōu)度假設(shè)檢驗,檢驗回歸方程對樣本數(shù)據(jù)的擬合程度。決定系數(shù)R2表示,R2J"2RSSMR2=2RRc(y-y)2RSSRr總體回歸系數(shù)的區(qū)間估計:(b-1門.sb,b+U.sb)二,nN二,nN22回歸方程的應(yīng)用:利用回歸方程進行預(yù)報;統(tǒng)計控制。直線回歸分析的注意事項:I回歸分析要有實際意義,注意變量之間的內(nèi)在聯(lián)系和規(guī)律,兩變量之間還必須是因果關(guān)系;n對資料的要求:一般y來自正態(tài)總體的隨機變量,x可以是正
41、態(tài)總體的隨機變量,也可以是精確測量和嚴密控制的值;田進行分析前應(yīng)先繪制散點圖;IV必須剔除一些異常點;V回歸方程的適用范圍不能隨意外延。其適用范圍一般以自變量取值范圍為界。直線相關(guān)和回歸的區(qū)別與聯(lián)系:區(qū)別:資料的要求不同:相關(guān)要求兩個變量呈雙變量正態(tài)分布;回歸要求y服從正態(tài)分布,而x可以是精確測量和嚴格控制的變量;統(tǒng)計意義不同:相關(guān)反映的是兩變量間的伴隨關(guān)系,二者的關(guān)聯(lián)程度如何,而回歸反映的是兩變量間的依存關(guān)系,即因果關(guān)系,或從屬關(guān)系;分析的目的不同:相關(guān)分析的目的是描述兩個變量間的相互關(guān)系,用r來反映這種關(guān)系的方向以及密切程度,而回歸分析的目的是描述兩個變量間的數(shù)量依存關(guān)系,從而進行統(tǒng)計預(yù)測
42、和統(tǒng)計控制;聯(lián)系:對于同一資料,r和b的符號一致,說明兩變量間關(guān)系的方向;相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗是等價的,對于同一樣本,tr=tb,實際應(yīng)用中只檢驗其中之一即可;二者可以相互解釋,相關(guān)系數(shù)的平方和等于回歸平方和占總平方和的比例,即反映應(yīng)變量y的總變異中歸因于x的部分;實驗設(shè)計的概述C實驗室研究:以動物或標本為研究對象實驗研究的分類臨床試驗:以人為研究對象仁社區(qū)干預(yù)試驗:以社區(qū)人群為研究對象,又稱半試驗性研究處理因素試驗設(shè)計的基本因素J受試對象Q實驗效應(yīng)1、處理因素:研究者根據(jù)研究目的確定的,通過合理安排實驗,從而科學的考察其作用大小的因素;非處理因素:對正確的評價處理因素的作用有一定的干
43、擾,但研究者并不想通過本次實驗考察其作用大小的因素;注意事項:要區(qū)分處理因素和非處理因素;主要依據(jù)研究目的來確定;抓住實驗中的主要因素,且因素的水平數(shù)不宜過多;處理因素必須標準化,即保證處理因素在整個實驗過程中始終如一,保持不變;2、實驗效應(yīng):通過觀察指標來反映觀察指標的基本原則:客觀性;精確性(包括準確度和精確度,準確度是指測值與真實值的接近程度,屬系統(tǒng)誤差;而精確度是指對同一變量重復觀測時,觀測值與平均值的接近程度);靈敏性;特異性3、實驗設(shè)計的基本原則:對照,隨機,重復,均衡對照組設(shè)計的三個條件 對照的形式:空白對照 實驗對照 標準對照 自身對照 相互對照 歷史對照配對對照;安慰劑對照對
44、照:使實驗組和對照組內(nèi)的非處理因素基本一致,從而使處理因素的效應(yīng)得以顯示;專設(shè),同步,對等;不給對照組施加任何處理因素,臨床試驗中不宜用空白對照;不給對照組施加處理因素,但施加某種實驗因素;與現(xiàn)有的標準法或常規(guī)方法、公認的有效藥物作對照;對照與實驗在同一受試對象上進行;不單獨設(shè)立對照組,而是2個或幾個實驗組相互對照;除了非處理因素影響較小的少數(shù)疾病外,一般不宜用此種對照隨機:包括隨機抽樣與隨機分配;重復:樣本含量與四個因素有關(guān):a,B,6,且均呈反變的關(guān)系。均衡:各組的受試對象除接受的處理因素不同外,其他影響實驗的非處理因素要基本相同常用的實驗設(shè)計方法1、完全隨機設(shè)計:亦稱單因素實驗設(shè)計,不考
45、慮個體差異的影響,僅涉及1個處理因素,但可以有2個或2個以上的水平。將受試對象隨機分配到處理組合對照組中,各組的例數(shù)可以相等或不等。分析方法同前。2、配對設(shè)計和配伍組設(shè)計:先將受試對象按配比條件配成對子,再按隨機化的原則把每對中的受試對象分配到實驗組和對照組中。通常以影響實驗效應(yīng)的主要處理因素為配對條件。醫(yī)學實驗中的自身對照也是配對設(shè)計,但容易產(chǎn)生混雜影響,最好設(shè)立平衡對照。配伍組設(shè)計,亦稱隨機區(qū)組設(shè)計,是配對設(shè)計的擴大。分析方法:配對設(shè)計:如果各對的觀察值的差值服從均數(shù)為0的正態(tài)分布,用配對設(shè)計的t檢驗,否則用配對設(shè)計的秩和檢驗。配伍組設(shè)計:滿足方差分析條件的用方差分析,不滿足的經(jīng)變量變換后
46、也可以用,仍達不到要求的用配伍組設(shè)計的秩和檢驗。3、交叉設(shè)計:是在自身配對設(shè)計基礎(chǔ)上發(fā)展起來的雙因素設(shè)計,該設(shè)計考慮了1個處理因素,此因素有兩個水平(A,B),并且還考慮了2個與處理因素無交互作用的非處理因素對實驗效應(yīng)的影響。適用條件及應(yīng)注意的問題:處理因素只有2個水平(A,B),且2個非處理因素(實驗階段、受試對象)與處理因素之間無交互作用;兩個實驗階段之間要安排一定的間隔時間,以便消除前一階段治療措施的殘留效應(yīng),保證兩個階段的起始條件一樣;兩次觀察的時間不能過長,處理效應(yīng)不能持續(xù)過久;適用于病情較穩(wěn)定,病程可以分階段,短期治療可見療效的疾??;為消除患者的心理作用或防止研究者的暗示,一般多采
47、用盲法。分析方法:符合方差分析條件的應(yīng)用方差分析,不符合的經(jīng)變量變換后也可以用,仍達不到要求的用秩和檢驗。方差分析將總變異分為4部分:受試者問,階段問,處理間和誤差。4、拉丁方設(shè)計:是按拉丁方陣的字母、行和列安排實驗的三因素等水平的設(shè)計??紤]了3個因素對實驗效應(yīng)的影響?;疽螅罕仨毷?個因素的實驗,且3個因素的水平數(shù)相等(若不等,以主要的處理因素的水平數(shù)為主,其他2個進行調(diào)整);3個因素是相互獨立的,均無交互作用;各行、列和字母所得實驗數(shù)據(jù)的方差齊;設(shè)計步驟:根據(jù)主要處理因素的水平數(shù)確定基本型拉丁方;先將基本型拉丁方隨機化,然后按隨機化后拉丁方陣安排實驗,隨機化是通過拉丁方的任兩行或任兩列交換位置實現(xiàn);規(guī)定行、歹h字母所代表的因素或水平,通常用字母表示主要的處理因素;分析方法:可用方差分析,將總變異分為列間、行間、字母間和誤差4部分。5、析因?qū)嶒炘O(shè)計:是一種將2個或多個因素的各水平交叉分組安排實驗的設(shè)計,不僅可以檢驗各因素內(nèi)部不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 股份制企業(yè)合同文書編寫規(guī)范
- 初中古詩詞山水畫的教學計劃
- 三農(nóng)產(chǎn)品產(chǎn)地保護與安全管理指南
- 交通運輸智能交通系統(tǒng)介紹
- 存單質(zhì)押借款合同
- 常州消防工程合同
- 2025年吉林貨運從業(yè)資格證模擬考試題及答案解析
- 2025年黃石貨運從業(yè)資格模擬考試題
- 《Poems》作業(yè)設(shè)計方案
- 2023年高考真題全國乙卷物理試卷解析版
- 2025年度模特代言合同隱私條款規(guī)范樣本4篇
- 【歷史】元朝的建立與統(tǒng)一課件 2024-2025學年統(tǒng)編版七年級歷史下冊
- 2025年度游戲工作室游戲客服中心用工合同
- 2024年高州市人民醫(yī)院廣東醫(yī)學院附屬高州醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 橋梁拆除施工方案及安全措施
- 2024年吉林長春市總工會公招?聘工會社會工作者筆試真題
- 中國骨關(guān)節(jié)炎診療指南(2024版)解讀
- 【歷史】2025年春季七下歷史新教材課本答案大全(想一想、材料研讀、讀地圖、課后活動)
- 高端寫字樓物業(yè)管理思路
- 江蘇省中小學生金鑰匙科技競賽(高中組)考試題及答案
- 2024-2030年中國ORC低溫余熱發(fā)電系統(tǒng)行業(yè)商業(yè)模式創(chuàng)新規(guī)劃分析報告
評論
0/150
提交評論