醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié) 一.緒論1,醫(yī)學(xué)統(tǒng)計(jì)學(xué):運(yùn)用概率論和數(shù)理統(tǒng)計(jì)學(xué)的原理和方法,研究醫(yī)學(xué)領(lǐng)域中隨機(jī)現(xiàn)象有關(guān)數(shù)據(jù)的搜集、整理、分析和推斷,進(jìn)而闡明其客觀規(guī)律性的一門應(yīng)用科學(xué)。2,醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容:1) 統(tǒng)計(jì)研究設(shè)計(jì) 調(diào)查研究設(shè)計(jì)和實(shí)驗(yàn)研究設(shè)計(jì)2) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本原理和方法 研究設(shè)計(jì)和數(shù)據(jù)處理中的基本統(tǒng)計(jì)理論和方法。A:資料的搜集與整理 B:常用統(tǒng)計(jì)描述,集中趨勢(shì)和離散趨勢(shì),相對(duì)數(shù),相關(guān)系數(shù),回歸系數(shù),統(tǒng)計(jì)表,統(tǒng)計(jì)圖 C:統(tǒng)計(jì)推斷,如參數(shù)估計(jì)和假設(shè)檢驗(yàn)。 3)醫(yī)學(xué)多元統(tǒng)計(jì)方法 多元線性回歸和逐步回歸分析、判別分析、聚類分析、主成分分析、因子分析、logistic回歸與Cox回歸分析。3,統(tǒng)計(jì)工

2、作步驟:1) 設(shè)計(jì) 明確研究目的和研究假說(shuō),確定觀察對(duì)象與觀察單位,樣本含量和抽樣方法,擬定研究方案,預(yù)期分析指標(biāo),誤差控制措施,進(jìn)度與費(fèi)用。2) 搜集材料A, 搜集材料的原則 及時(shí)、準(zhǔn)確、完整B, 統(tǒng)計(jì)資料的來(lái)源 醫(yī)學(xué)領(lǐng)域的統(tǒng)計(jì)資料的來(lái)源主要有三個(gè)方面。一是統(tǒng)計(jì)報(bào)表,二是經(jīng)常性工作記錄,三是專題調(diào)查或?qū)n}實(shí)驗(yàn)。C, 資料貯存3) 整理資料 a檢查核對(duì)b設(shè)計(jì)分組c擬定整理表d歸表4) 分析資料 統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷4,同質(zhì)(homogeneity):指被研究指標(biāo)的影響因素相同。 變異(variation):同質(zhì)基礎(chǔ)上的各觀察單位間的差異。 變量(variable):收集資料過(guò)程中,根

3、據(jù)研究目的確定同質(zhì)觀察單位,再對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量或觀察,這種特征稱為變量 變量值:變量的觀察結(jié)果或測(cè)量值。變量類型變量值表現(xiàn)實(shí)例資料類型數(shù)值變量離散型定量測(cè)量值,有計(jì)量單位產(chǎn)前檢查次數(shù) 計(jì)量資料連續(xù)型身高分類變量無(wú)序二分類對(duì)立的兩類屬性性別(男女)計(jì)數(shù)資料多分類不相容的多類屬性血型(A,B,O,AB)有序多分類類間有程度差異的屬性受教育程度(小學(xué),中學(xué),高中,大學(xué))等級(jí)資料5,總體(population) 根據(jù)研究目的所確定的同質(zhì)研究對(duì)象中所有觀察單位某變量值的集合??傮w具有的基本特征是:同質(zhì)性 樣本(sample) 從總體中隨機(jī)抽取部分觀察單位,其變量值的集合構(gòu)成樣本。樣本必須

4、具有代表性。代表性是指樣本來(lái)自同質(zhì)總體,足夠的樣本含量和隨機(jī)抽樣的前提。 統(tǒng)計(jì)量(statistics)描述樣本變量值特征的指標(biāo)(樣本率,樣本均數(shù),樣本標(biāo)準(zhǔn)差)。 參數(shù)(parameter)描述總體變量值特征的指標(biāo)(總體率,標(biāo)準(zhǔn)差,總體均數(shù))。 抽樣誤差(sampling error):由于個(gè)體差異的存在,即使在同一整體中隨機(jī)抽取若干樣本,各樣本的統(tǒng)計(jì)量往往不等,統(tǒng)計(jì)量與參數(shù)也會(huì)有所不同。這種因抽樣研究引起的差異稱抽樣誤差。 隨機(jī)事件(random event)對(duì)隨機(jī)試驗(yàn)的各種可能結(jié)果的集合。 概率(probability) 描述隨機(jī)事件發(fā)生的可能性大些哦的一個(gè)度量。 小概率事件 若隨機(jī)事件A

5、的概率P(A),習(xí)慣上,=0.05時(shí),就稱A為小概率事件。其統(tǒng)計(jì)學(xué)意義是小概率事件在一次隨機(jī)試驗(yàn)中認(rèn)為不會(huì)發(fā)生。抽樣誤差1,抽樣誤差(sampling error) 由抽樣而造成的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異或各樣本統(tǒng)計(jì)量之間的差異。在醫(yī)學(xué)統(tǒng)計(jì)學(xué)中,常把由抽樣造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差;由抽樣造成的樣本率與總體率之間的差異稱為率的抽樣誤差。2,樣本均數(shù)的標(biāo)準(zhǔn)差(簡(jiǎn)稱標(biāo)準(zhǔn)誤,standard error) 反映均數(shù)的抽樣誤差大小的指標(biāo)。大,抽樣誤差大;反之,小,抽樣誤差小。 (3.1)實(shí)際工作中往往未知的,可用樣本標(biāo)準(zhǔn)差s作的估計(jì)值,計(jì)算標(biāo)準(zhǔn)誤的估計(jì)值。 (3.2)3,

6、標(biāo)準(zhǔn)誤的用途:a,衡量樣本均數(shù)的可靠性;b,估計(jì)總體均數(shù)的置信區(qū)間;3,用于均數(shù)的假設(shè)檢驗(yàn)。4,標(biāo)準(zhǔn)誤的估計(jì)值的用途: a,描述抽樣誤差的大??; b,總體參數(shù)的估計(jì); c,用來(lái)進(jìn)行假設(shè)檢驗(yàn)。5,率的抽樣誤差:由抽樣造成的樣本率與總體率的差異稱為率的抽樣誤差。衡量率的抽樣誤差大小的指標(biāo)是率的標(biāo)準(zhǔn)誤。越小,率的抽樣誤差越??;越大,率的抽樣誤差越大。 (3.3)其中為總體率。實(shí)際工作中,由于往往是未知的,可用樣本率p作的估計(jì)值,計(jì)算率的標(biāo)準(zhǔn)誤的估計(jì)值。 (3.4)。標(biāo)準(zhǔn)差(s)標(biāo)準(zhǔn)誤計(jì)算公式s=(1)表示觀察值的變異程度(1)估計(jì)均數(shù)的抽樣誤差的大小(2)計(jì)算變異系數(shù)CV=100%(2)估計(jì)總體均數(shù)

7、的可信區(qū)間(,)(3)確定醫(yī)學(xué)參考值范圍(3)進(jìn)行假設(shè)檢驗(yàn)(4)計(jì)算標(biāo)準(zhǔn)誤簡(jiǎn)述標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系?區(qū)別:(1)含義不同:標(biāo)準(zhǔn)差S表示觀察值的變異程度,描述個(gè)體變量值(x)之間的變異度大小,S越大,變量值(x)越分散;反之變量值越集中,均數(shù)的代表性越強(qiáng)。標(biāo)準(zhǔn)誤估計(jì)均數(shù)的抽樣誤差的大小,是描述樣本均數(shù)之間的變異度大小,標(biāo)準(zhǔn)誤越大,樣本均數(shù)與總體均數(shù)間差異越大,抽樣誤差越大;反之,樣本均數(shù)越接近總體均數(shù),抽樣誤差越小。(2)與n的關(guān)系不同: n增大時(shí),S趨于(恒定),標(biāo)準(zhǔn)誤減少并趨于0(不存在抽樣誤差)。(3)用途不同:標(biāo)準(zhǔn)差表示x的變異度大小、計(jì)算變異系數(shù)、確定醫(yī)學(xué)參考值范圍、計(jì)算標(biāo)準(zhǔn)誤等

8、,標(biāo)準(zhǔn)誤用于估計(jì)總體均數(shù)可信區(qū)間和假設(shè)檢驗(yàn)。聯(lián)系:二者均為變異度指標(biāo),樣本均數(shù)的標(biāo)準(zhǔn)差即為標(biāo)準(zhǔn)誤,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤成正比。標(biāo)準(zhǔn)差: 標(biāo)準(zhǔn)誤:二.分布 正態(tài)分布 1,正態(tài)分布的函數(shù) 其中為總體均數(shù),為總體標(biāo)準(zhǔn)差,為圓周率,為自然對(duì)數(shù)的底,且僅為變量。以為橫軸,以為縱軸,當(dāng)均數(shù)和標(biāo)準(zhǔn)差已知時(shí)即可繪出正態(tài)分布曲線。為應(yīng)用方便,將式中進(jìn)行變量變換,使原來(lái)的正態(tài)分布變?yōu)榈臉?biāo)準(zhǔn)正態(tài)分布,亦稱分布。被稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,將代入上述公式即得標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)。 (2.17) (2.18) 2,正態(tài)分布的特征 (1)正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高。(2)正態(tài)分布以均數(shù)為中

9、心,左右對(duì)稱。(3)正態(tài)分布有2個(gè)參數(shù)(parameter),即均數(shù)(位置)和標(biāo)準(zhǔn)差(形狀)。當(dāng)固定不變時(shí),越大,曲線沿橫軸越向右移動(dòng);反之,越小,則曲線沿橫軸越向左移動(dòng)。當(dāng)固定不變時(shí),越大,曲線越平闊;越小,曲線越尖峭。通常用N(,)表示均數(shù)為、方差為的正態(tài)分布。用(0,1)表示標(biāo)準(zhǔn)正態(tài)分布。(4)正態(tài)分布在1處各有一個(gè)拐點(diǎn)。(5)正態(tài)曲線下面積的分布有一定規(guī)律。3,常用的兩個(gè)區(qū)間:1.96及2.58的區(qū)間面積分別占總面積的95%及99%。4,正態(tài)分布的應(yīng)用 1),制定醫(yī)學(xué)參考值范圍 a,正態(tài)分布法 適用于正態(tài)或近似正態(tài)分布的資料 雙側(cè)界值:;單側(cè)上界:,或單側(cè)下界:。 b,對(duì)數(shù)正態(tài)分布法

10、適用于對(duì)數(shù)正態(tài)分布資料 雙側(cè)界值: ;單側(cè)上界:,或單側(cè)下界 c,百分位數(shù)法 常用于偏態(tài)分布資料及資料中一端或兩端無(wú)確切數(shù)值的資料。雙側(cè)界值:和;單側(cè)上界:,或單側(cè)下界:。 2)正態(tài)分布是多種統(tǒng)計(jì)方法的理論基礎(chǔ) 如t分布,F(xiàn)分布,分布都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來(lái)的,分布也是以正態(tài)分布為基礎(chǔ)的。另外t分布,二項(xiàng)分布,poisson分布的極限為正態(tài)分布,一定條件下可按正態(tài)分布原理處理。t分布1,t分布: (3.5)t分布的特征為:1 以0為中心,左右對(duì)稱的單峰分布。2 t分布曲線形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,曲線越低平;自由度逐漸增大時(shí),則t分布逐漸逼近正態(tài)分布(標(biāo)準(zhǔn)正態(tài)

11、分布)。當(dāng)=時(shí),t分布為u分布。t界值表附圖中非陰影部分面積的概率為: 2,總體均數(shù)的估計(jì):用樣本指標(biāo)估計(jì)總體參數(shù)稱為參數(shù)估計(jì),是統(tǒng)計(jì)推斷的一個(gè)重要方面??傮w均數(shù)的估計(jì)有2種方法。一是直接用統(tǒng)計(jì)量估計(jì)總體參數(shù),稱為點(diǎn)值估計(jì)。由于抽樣誤差的存在,此法很難估計(jì)準(zhǔn)確。二是區(qū)間估計(jì)(interval estimation)法。區(qū)間估計(jì)是按一定的概率100(1-)%估計(jì)總體均數(shù)所在的范圍,亦稱可信區(qū)間(confidence interval,CI)。常取的可信度為95%和99%,即95%可信區(qū)間和99%可信區(qū)間。計(jì)算方法有3種:(1)未知且n小 按t分布原理用式(3.6)計(jì)算可信區(qū)間。 由于 將代入,得

12、 則總體均數(shù)的100(1-)%可信區(qū)間的通式為: (3.6)或?qū)懗?(,)。(2)未知,但n足夠大時(shí)(n100) t分布逼近u分布,按正態(tài)分布原理,用式(3.7)估計(jì)可信區(qū)間。 () (3.7)(3)已知 按正態(tài)分布原理,用式(3.8)估計(jì)可信區(qū)間。 ()(3.8)標(biāo)準(zhǔn)正態(tài)分布(u分布)與t分布有何異同?答:相同點(diǎn):t分布和標(biāo)準(zhǔn)正態(tài)分布(u分布)都是以0為中心的正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布是t分布的特例(自由度是無(wú)限大時(shí))。 不同點(diǎn):t分布為抽樣分布,u分布為理論分布;t分布比標(biāo)準(zhǔn)正態(tài)分布的峰值低,且尾部翹得更高;t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標(biāo)準(zhǔn)正態(tài)分布;t分布有無(wú)數(shù)條曲線

13、,而u分布只有唯一一條曲線。二項(xiàng)分布1,二項(xiàng)分布(binomial distribution)是對(duì)只具有2種互斥結(jié)果的離散型隨機(jī)事件的規(guī)律性進(jìn)行描述的一種概率分布。二項(xiàng)分布概率公式: (3.9)式中n為獨(dú)立的貝努力試驗(yàn)次數(shù),為成功的概率,(1-)為失敗的概率,X為在n次貝努力試驗(yàn)中出現(xiàn)“成功”的次數(shù),表示在n次試驗(yàn)中出現(xiàn)X的各種組合數(shù),在此稱為二項(xiàng)系數(shù)(binomial coefficient)。2,二項(xiàng)分布的應(yīng)用條件:(1)各觀察單位只能具有相互對(duì)立的一種結(jié)果,如陽(yáng)性或陰性,生存或死亡。(2)已知發(fā)生某一結(jié)果(陽(yáng)性)的概率為,其對(duì)立結(jié)果的概率為1-,實(shí)際工作中要求 是從大量觀察中獲得比較穩(wěn)定

14、的數(shù)值。(3)n次試驗(yàn)在相同條件下進(jìn)行,且各個(gè)觀察單位的觀察結(jié)果相互獨(dú)立。3,二項(xiàng)分布的性質(zhì):A,二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差 在二項(xiàng)分布的資料中,當(dāng)和n已知時(shí),它的均數(shù)及其標(biāo)準(zhǔn)差如下:=n (3.11) (3.12)若均數(shù)和標(biāo)準(zhǔn)差不用絕對(duì)數(shù)表示,而是用率表示時(shí),即對(duì)式(3.11)(3.12)分別除以n,得: (3.13) (3.14)是樣本率的標(biāo)準(zhǔn)誤的理論值,當(dāng)未知時(shí),常用樣本率p作為的估計(jì)值,則: (3.15)B,二項(xiàng)分布的累計(jì)概率 二項(xiàng)分布的累計(jì)概率(cumulative probability)常用的有左側(cè)累計(jì)和右側(cè)累計(jì)2種方法。從陽(yáng)性率為的總體中隨機(jī)抽取n個(gè)個(gè)體,則(1)最多有k例陽(yáng)性的概

15、率 (3.16) (2)最少有k例陽(yáng)性的概率 (3.17)D,二項(xiàng)分布的形狀取決于和n的大小:(1)當(dāng)=0.5時(shí),分布對(duì)稱;當(dāng)0.5時(shí),分布呈負(fù)偏態(tài),且固定n時(shí),越大,分布越偏。(2)對(duì)固定的,分布隨n的增大趨于對(duì)稱。4,總體率的估計(jì) 總體率的估計(jì)也有點(diǎn)估計(jì)和區(qū)間估計(jì),點(diǎn)估計(jì)是簡(jiǎn)單地用樣本率來(lái)估計(jì)總體率;區(qū)間估計(jì)是求出總體率的可能范圍。樣本率的理論分布和樣本含量n、陽(yáng)性率p的大小有關(guān),所以需要根據(jù)n和p的大小不同,分別選用下列2種方法。(一)查表法 當(dāng)樣本含量n較小,如n50,特別是p很接近于0或1時(shí),按二項(xiàng)分布的原理估計(jì)總體率的可信區(qū)間。(二)正態(tài)近似法 當(dāng)樣本含量n足夠大,且樣本率p或1-

16、p均不太小,如np與n(1-p)均大于5時(shí),樣本率的p的抽樣分布近似正態(tài)分布,總體率的可信區(qū)間可按下列式(3.17)進(jìn)行估計(jì)。 (3.17)Poisson分布1,Poisson分布 泊松分布是在很小,樣本含量n趨向于無(wú)窮大時(shí),二項(xiàng)分布的極限形式。更多地用于研究單位時(shí)間、單位人群、單位空間內(nèi),某罕見事件發(fā)生的次數(shù)的分布。 X=0,1,2(3.19)式中=n為Poisson分布的總體均數(shù),X為單位時(shí)間或單位空間內(nèi)某事件的發(fā)生數(shù),e為自然對(duì)數(shù)的底,約等于2.71828。在實(shí)際運(yùn)算中,P(X)亦可按式(3.20)作遞推計(jì)算。 (3.20)2,Poisson分布應(yīng)用條件:A, 要求事件的發(fā)生是相互獨(dú)立B

17、, 發(fā)生的概率相等C, 結(jié)果是二分類3,Poisson分布的性質(zhì):A, 該分布是一種單參數(shù)的離散型分布,其參數(shù)為,它表示單位時(shí)間或空間內(nèi)某件事平均發(fā)生的次數(shù),又稱強(qiáng)度參數(shù)。B, Poisson分布的方差和均數(shù)相等,即=C, Poisson分布的累計(jì)概率 (1) 最多為k次的概率 (2) 最少為k次的概率 4,Poisson分布的圖形 已知,就可按公式計(jì)算得出X=0,1,2,時(shí)的P(X)值,以X為橫坐標(biāo),以P(X)為縱坐標(biāo)作圖,即可會(huì)出Poisson分布的圖形。值越小,分布越偏,隨著的增大,分布越趨于對(duì)稱,當(dāng)=20時(shí),分布接近正態(tài)分布,當(dāng)=50時(shí),可以認(rèn)為Poisson分布呈正態(tài)分布N(,)按正

18、態(tài)分布處理。5,Poisson分布具有可加性6,總體參數(shù)的估計(jì) 由樣本均數(shù)(樣本計(jì)數(shù))X估計(jì)總體均數(shù)也有點(diǎn)(值)估計(jì)和區(qū)間估計(jì),區(qū)間估計(jì)的方法,需視樣本計(jì)數(shù)(樣本均數(shù))X的大小而定,X小時(shí)用查表法,X大時(shí)用正態(tài)近似法。 (一)查表法當(dāng)樣本計(jì)數(shù)X時(shí),用X值查附表poisson分布的可信區(qū)間,可得總體均數(shù)的95%或99%可信區(qū)間。 (二)正態(tài)近似法當(dāng)樣本計(jì)數(shù)X50時(shí),可用正態(tài)近似原理下面公式求總體均數(shù)的95%或99%可信區(qū)間 正態(tài)分布、二項(xiàng)式和泊松分布的關(guān)系:二項(xiàng)分布(binomial distribution):對(duì)只具有兩種互斥結(jié)果的離散型隨機(jī)事件的規(guī)律性進(jìn)行描述的一種概率分布。Poisson分

19、布是在很小,樣本含量n趨于無(wú)窮大時(shí),二項(xiàng)分布的極限形式。當(dāng)v=時(shí),t分布即為u分布,趨向正態(tài)分布。可信區(qū)間與參考值范圍的區(qū)別:意義、計(jì)算公式和用途均不同。(1)參考值范圍是指同質(zhì)總體內(nèi)包括百分之幾十個(gè)體值的估計(jì)范圍。而可信區(qū)間是指在百分之幾十的可信度估計(jì)的總體參數(shù)的所在范圍。(2)同樣的百分之幾十,參考值范圍是樣本范圍,可信區(qū)間是指可信度范圍,二者有著本質(zhì)的不同。(3)從意義來(lái)看,95參考值范圍是指同質(zhì)總體內(nèi)包括95個(gè)體值的估計(jì)范圍,而總體均數(shù)95可信區(qū)間是指按95可信度估計(jì)的總體均數(shù)的所在范圍。(4)從計(jì)算公式看,若指標(biāo)服從正態(tài)分布,95參考值范圍的公式是:1.96s??傮w均數(shù)95可信區(qū)間的

20、公式是:。前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用為0.05,自由度為v的t界值。(5)從用途上看,可信區(qū)間用來(lái)估計(jì)總體均數(shù),參考值范圍用來(lái)判斷觀察對(duì)象的某項(xiàng)指標(biāo)是否正常。簡(jiǎn)述檢驗(yàn)假設(shè)與可信區(qū)間的聯(lián)系與區(qū)別。答:(1)可信區(qū)間用于推斷總體參數(shù)所在的范圍,假設(shè)檢驗(yàn)用于推斷總體參數(shù)是否不同。前者估計(jì)總體參數(shù)的大小,后者推斷總體參數(shù)有無(wú)質(zhì)的不同。(2)可信區(qū)間也可回答假設(shè)檢驗(yàn)的問題。但可信區(qū)間不能提供確切的P值范圍,只能給出在水準(zhǔn)上有無(wú)統(tǒng)計(jì)意義。(3)可信區(qū)間還可提示差別有無(wú)實(shí)際意義。統(tǒng)計(jì)圖表1,繪制統(tǒng)計(jì)圖的基本要求:A, 根據(jù)資料性質(zhì)和分析目的據(jù)頂適當(dāng)圖形。B, 標(biāo)題應(yīng)說(shuō)明資料的內(nèi)容、時(shí)

21、間和地點(diǎn),一般位于圖的下方。C, 圖的縱、橫軸應(yīng)注明標(biāo)目及對(duì)應(yīng)單位,尺度應(yīng)等距或具有規(guī)律性,一般自左而右、自下而上、由小到大。D, 為使圖形美觀并便于比較,統(tǒng)計(jì)圖的長(zhǎng)寬比例一般為7:5,有時(shí)為了說(shuō)明問題也可以變動(dòng)。E, 比較、說(shuō)明不同的事物時(shí),可用不同顏色或線條表示,并常附圖例說(shuō)明,但不宜過(guò)多。2,常用統(tǒng)計(jì)圖的適用條件與繪制1 條圖(bar graph) 用等寬長(zhǎng)條的高度表示按性質(zhì)分類資料各類別的數(shù)值大小,用于表示它們之間的對(duì)比關(guān)系。2 圓圖(pie graph) 圓形圖適用于百分構(gòu)成比資料,表示事物各組成部分所占的比重或構(gòu)成。3 百分條圖(percent bar) 意義及適用資料同圓圖,也稱

22、構(gòu)成條圖。4 線圖(line graph) 線圖適用于連續(xù)性資料,以不同的線段升降來(lái)表示資料的變化,并可表明一事物隨另一食物(時(shí)間)而變動(dòng)的情況。5 直方圖(histogram) 直方圖用于表達(dá)連續(xù)性資料的頻數(shù)分布。6 散點(diǎn)圖(scatter diagram) 散點(diǎn)圖以直角坐標(biāo)系中各點(diǎn)的密集程度和趨勢(shì)來(lái)表示兩現(xiàn)象間的關(guān)系。常用在對(duì)資料進(jìn)行相關(guān)分析之前適用。 單變量資料 一,數(shù)值變量 統(tǒng)計(jì)描述1,頻數(shù)表的編制 求全距 定組段和組距 列頻數(shù)表 畫頻數(shù)圖2,頻數(shù)分布的兩個(gè)重要特征:集中趨勢(shì)和離散趨勢(shì)3,頻數(shù)分布可以分為正態(tài)分布和偏態(tài)分布4,頻數(shù)表的用途:揭示資料分布類型和分布特征,以便選取適當(dāng)?shù)慕y(tǒng)計(jì)

23、方法;便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理;便于發(fā)現(xiàn)某些特大或者特小的可疑值。5,集中趨勢(shì)的描述:均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù)6,均數(shù)(mean):算術(shù)均數(shù)的簡(jiǎn)稱。常用=表示。7,中位數(shù)(median):一組由小到大按順序排列的觀察值中位次居中的數(shù)值,用M表示。可用于描述任何分布,特別是偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無(wú)確切數(shù)據(jù)資料的中心位置。8,百分位數(shù)(percentile)是一種位置指標(biāo),用表示。一個(gè)百分位數(shù)P將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。可用于確定非正態(tài)分布資料的醫(yī)學(xué)參考值范圍。9,離散趨勢(shì)的描述:全距(range) 四分位數(shù)間距

24、(quartile) 方差 標(biāo)準(zhǔn)差10,全距(range) 亦稱極差,為一組同質(zhì)觀察值中最大值和最小值之差。反映個(gè)體差異的范圍,優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,缺點(diǎn)是:1)只考慮最大最小值之間的差異,不能反映組內(nèi)其他觀察值的變異度;2)樣本含量相差懸殊時(shí)不宜用全距比較。11,四分位數(shù)間距(quartile) 上四分位數(shù)與下四分位數(shù)之差。常用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度。12,方差(variance)離均差的平方和表示。13,標(biāo)準(zhǔn)差(standard variance)的作用:a,估計(jì)變量值的離散程度 b,計(jì)算變異系數(shù) c,與均數(shù)結(jié)合,估計(jì)變異值的頻數(shù)分布范圍 d,計(jì)算標(biāo)準(zhǔn)誤(

25、總體) s=(樣本)14,變異系數(shù)(coefficient of variation) 常用于比較度量單位不同或均數(shù)相差懸殊的兩組或多組資料的變異度。CV=100%假設(shè)檢驗(yàn)1,假設(shè)檢驗(yàn)(hypothesis test)亦稱顯著性檢驗(yàn)(significance test),其基本思想是先對(duì)總體的參數(shù)或分布做出某種假設(shè),如設(shè)總體均數(shù)(或率)為一定值;兩總體均數(shù)(或率)相等;總體服從正態(tài)分布或兩分布相同等,然后根據(jù)樣本信息選用適當(dāng)?shù)姆椒ǎ茢啻思僭O(shè)應(yīng)當(dāng)拒絕或不拒絕。2,假設(shè)檢驗(yàn)的一般步驟:(1)建立假設(shè)和確定檢驗(yàn)水準(zhǔn):根據(jù)實(shí)際情況確定單、雙側(cè)檢驗(yàn),建立假設(shè),確定檢驗(yàn)水準(zhǔn);(2)選定檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)

26、量:根據(jù)設(shè)計(jì)的類型及研究目的選擇合適的檢驗(yàn)方法并計(jì)算出對(duì)應(yīng)的統(tǒng)計(jì)量;(3)確定P值并做出推斷結(jié)論。若tt,v,則P,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,尚可認(rèn)為差異顯著有統(tǒng)計(jì)學(xué)意義;相反則差異不顯著,無(wú)統(tǒng)計(jì)學(xué)意義3,假設(shè)檢驗(yàn)時(shí)應(yīng)注意的事項(xiàng):(1)要有嚴(yán)密的抽樣研究設(shè)計(jì);樣本必須是從同質(zhì)總體中隨機(jī)抽取的,要保證組間的均衡性和資料的可比性,可能影響結(jié)果的非處理因素在對(duì)比組間應(yīng)盡可能相同或相近;(2)正確選擇檢驗(yàn)方法;根據(jù)現(xiàn)有的資料類型、設(shè)計(jì)類型、分析目的、樣本含量等因素選用適當(dāng)?shù)臋z驗(yàn)方法,如不符合條件可做適當(dāng)轉(zhuǎn)換;(3)正確理解“差別無(wú)顯著性”的含義,差別有統(tǒng)計(jì)學(xué)意義,不能理解為兩者差差大,也不能理解

27、為所分析的指標(biāo)在實(shí)際應(yīng)用上就有“顯著效果”。(4)檢驗(yàn)假設(shè)的推斷結(jié)論為概率結(jié)論,不能絕對(duì)化:檢驗(yàn)水準(zhǔn)人為規(guī)定,是相對(duì)的,報(bào)告結(jié)論時(shí)應(yīng)列出檢驗(yàn)統(tǒng)計(jì)量和P值的確切范圍。(5)注意是單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)I型錯(cuò)誤和II型錯(cuò)誤:I型錯(cuò)誤(type I error)拒絕了實(shí)際上成立的,即樣本原本來(lái)自的總體,由于抽樣的偶然性得到了較大的t值,所以拒絕了,接受了,這類棄真錯(cuò)誤稱為第一類錯(cuò)誤,犯第一類錯(cuò)誤的概率是。II型錯(cuò)誤(type II error)是不拒絕實(shí)際上不成立的,即“存?zhèn)巍奔礃颖驹緛?lái)自的總體,但是由于抽樣的偶然性,得到了較小的t值,得到了較大的P值,沒有拒絕,這類存?zhèn)五e(cuò)誤稱為第二類錯(cuò)誤,犯第二類

28、錯(cuò)誤的概率是1-正態(tài)性檢驗(yàn):用均數(shù)和標(biāo)準(zhǔn)差描述資料的分布特征,對(duì)例數(shù)n較小的樣本進(jìn)行t檢驗(yàn)時(shí),首先要求樣本取自正態(tài)分布的總體。兩個(gè)方差的齊性檢驗(yàn):兩樣本均數(shù)比較的t檢驗(yàn)和多個(gè)樣本均數(shù)比較的方差分析要求各樣本所來(lái)自的總體方差相等。兩樣本方差的齊性檢驗(yàn): (4.12)式中為較大的樣本方差,為較小的樣本方差,為分子的自由度,為分母的自由度,相應(yīng)的樣本例數(shù)分別為和。當(dāng)兩總體方差齊同時(shí),F(xiàn)值一般不會(huì)離1太遠(yuǎn);若算得的F值較大,大于我們規(guī)定的界值時(shí),就認(rèn)為兩樣本所在總體的方差不齊。t檢驗(yàn)t檢驗(yàn):常用于總體標(biāo)準(zhǔn)差未知且樣本含量較小時(shí)樣本均數(shù)與總體均數(shù)的比較,成組設(shè)計(jì)的 兩個(gè)小樣本的均數(shù)的比較及配對(duì)設(shè)計(jì)的兩樣

29、本均數(shù)的比較。t檢驗(yàn)的應(yīng)用條件:a,n50 b,樣本來(lái)自正態(tài)分布的總體 c,兩樣本均數(shù)比較時(shí)要求兩樣本總體方差相等。1,單樣本t檢驗(yàn)(one sample t-test):樣本均數(shù)與已知總體均數(shù)比較,目的是推斷樣本所代表的未知總體均數(shù)與已知總體均數(shù)有無(wú)差別。 () (4.1)式中為樣本均數(shù),為已知總體均數(shù),s為樣本標(biāo)準(zhǔn)差,n為樣本含量,為自由度。步驟如下(可為u檢驗(yàn))1)建立假設(shè),確定檢驗(yàn)水準(zhǔn)。H0:=0 H1:0=0.052)計(jì)算統(tǒng)計(jì)量。已知,(總體均數(shù))0=,n=,=,s=3)確定P值,做出推斷結(jié)論。按v=n-1,查t界值表,得P0.05(或P0.05(或P0.05(或P50),或n雖小但

30、總體標(biāo)準(zhǔn)差已知時(shí)的樣本均數(shù)與總體均數(shù)的比較、成組設(shè)計(jì)兩樣本均數(shù)的比較。1,單樣本u檢驗(yàn)(one sample u-test): (4.4)式中為樣本均數(shù),為已知總體均數(shù),s為樣本標(biāo)準(zhǔn)差,n為樣本含量。2,成組設(shè)計(jì)的兩樣本均數(shù)比較的u檢驗(yàn)(two-sample u-test for independent samples): (4.5)式中,分別為兩樣本均數(shù),為兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤,、為分別為兩樣本的方差,、分別為兩樣本例數(shù)。標(biāo)準(zhǔn)正態(tài)分布(u分布)與t分布有何異同?答:相同點(diǎn):t分布和標(biāo)準(zhǔn)正態(tài)分布(u分布)都是以0為中心的正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布是t分布的特例(自由度是無(wú)限大時(shí))。不同點(diǎn):t分布

31、為抽樣分布,u分布為理論分布;t分布比標(biāo)準(zhǔn)正態(tài)分布的峰值低,且尾部翹得更高;t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標(biāo)準(zhǔn)正態(tài)分布;t分布有無(wú)數(shù)條曲線,而u分布只有唯一一條曲線。 方差分析1,方差分析的基本思想:按研究目的和設(shè)計(jì)類型,將總變異中的離均差平方和SS和自由度分別分解成相應(yīng)的若干部分,然后求得各相應(yīng)部分的變異;由于其中的組內(nèi)(或誤差)變異主要反映個(gè)體差異或抽樣誤差,其他各部分的變異與之比較得出統(tǒng)計(jì)量F值,根據(jù)F值的大小確定P值,并做出推斷。2,方差分析的優(yōu)點(diǎn):(1)不受比較組數(shù)的限制,可比較多組均數(shù)(2)可同時(shí)分析多個(gè)因素的作用(3)可分析同類間的交互作用3,方差分析的應(yīng)

32、用范圍:(1)2個(gè)或多個(gè)樣本均數(shù)間的比較(2)分析2個(gè)或多個(gè)因素間的交互作用(3)回歸方程的線性假設(shè)檢驗(yàn)(4)多元線性回歸分析中偏回歸系數(shù)的假設(shè)檢驗(yàn)(5)兩樣本方差齊性檢驗(yàn) 完全隨機(jī)設(shè)計(jì)的方差分析: 是將總變異中的離均差平方和SS和自由度分別分解成組間和組內(nèi)兩部分,SS/ 和SS/SS分別為組間變異(MS)和組內(nèi)變異(MS),兩者之比即為統(tǒng)計(jì)量F。(1)總離均差平方和及自由度:SS= (5.2) = (5.3)(2)組間離均差平方和、自由度和均方:SS= (5.4) = (組數(shù)-1) (5.5) MS= (5.6)(3)組內(nèi)離均差平方和、自由度和均方:SS=SS-SS (5.7) =N-k (

33、樣本量-組數(shù)) (5.8) MS= (5.9)當(dāng)方差分析的推斷結(jié)果為拒絕H0,接受H1,各總體均數(shù)不同或不全相同時(shí),應(yīng)對(duì)均數(shù)進(jìn)一步兩兩比較,即多重比較(multiple comparisons)??捎胵 檢驗(yàn)進(jìn)行分析: (5.14)式中為方差分析的組內(nèi)均方,若為兩因素或兩因素以上的方差分析,則為誤差項(xiàng)均方;和分別為兩樣本的樣本含量。配伍組設(shè)計(jì)資料的方差分析配伍組設(shè)計(jì)亦稱隨機(jī)區(qū)組設(shè)計(jì)(randomized block design),其多個(gè)樣本均數(shù)比較可用無(wú)重復(fù)數(shù)據(jù)的兩因素方差分析(two-way ANOVA)。2個(gè)因素是指主要的研究因素和配伍組因素。兩因素的方差分析是把總變異中的離均差平方和與

34、自由度分別分解成處理組間、配伍組間和誤差三部分。計(jì)算公式如下:變異來(lái)源離均差平方和自由度均方MSF總-C處理組間k-1配伍組間b-1誤差SS-SS-SS(k-1)(b-1),為配伍組數(shù)二,分類變量統(tǒng)計(jì)描述 常用相對(duì)數(shù),即率,構(gòu)成比,和相對(duì)比對(duì)分類資料進(jìn)行統(tǒng)計(jì)描述1,率(rate):率又稱頻率指標(biāo),它說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度 率=2,構(gòu)成比(proportion):又稱構(gòu)成指標(biāo),它說(shuō)明一事物內(nèi)部各組成部分所占的比重或分布,常以百分?jǐn)?shù)表示 構(gòu)成比=3,相對(duì)比(relative ratio)亦稱比,是A,B 2個(gè)有關(guān)指標(biāo)之比,說(shuō)明A和B 的若干倍或百分之幾,是相對(duì)數(shù)的最簡(jiǎn)單形式。A,B性質(zhì)可相同可

35、不同。 相對(duì)比= 4,應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的事項(xiàng):(一) 計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。(二) 分析時(shí)不能以構(gòu)成比代替率。(三) 對(duì)觀察單位數(shù)不等的幾個(gè)率,不能直接用相加求其平均率。(四) 資料的對(duì)比應(yīng)注意可比性。(五) 對(duì)樣本率(或構(gòu)成比)的比較應(yīng)遵循隨機(jī)抽樣,要做假設(shè)檢驗(yàn)。(六) 區(qū)別清分子分母。5,率的u檢驗(yàn)1),樣本率與總體率比較:目的是推斷樣本率所代表的總體率與某已知總體率是否相等。根據(jù)資料的不同情況,可以采用不同的假設(shè)檢驗(yàn)方法:若很小,可用Poisson分布原理做檢驗(yàn);若不太靠近0或1時(shí),可用二項(xiàng)分布原理做檢驗(yàn);當(dāng)樣本含量n足夠大時(shí),或且,二項(xiàng)分布逼近正態(tài)分布,可用u檢驗(yàn)計(jì)算其樣本檢驗(yàn)統(tǒng)

36、計(jì)量。 (6.1)式中p為樣本率,為已知總體率(常為理論值或標(biāo)準(zhǔn)值),n為樣本含量。2),兩樣本率比較:兩個(gè)樣本率作比較的目的是推斷兩個(gè)樣本各自代表的兩總體率是否相等,當(dāng)兩個(gè)樣本滿足正態(tài)近似條件且樣本含量較大時(shí),可用u檢驗(yàn),其公式: (6.2)式中、分別為兩個(gè)樣本率,、分別為兩樣本含量,為兩個(gè)樣本率之差的標(biāo)準(zhǔn)誤,為合并陽(yáng)性率,、為兩個(gè)樣本陽(yáng)性例數(shù)。四格表資料的檢驗(yàn)適用于分類變量資料中推斷兩個(gè)或多個(gè)總體率(或構(gòu)成比)之間有無(wú)差別,兩個(gè)分類指標(biāo)之間有無(wú)相關(guān)關(guān)系的檢驗(yàn)以及檢驗(yàn)頻數(shù)分布的擬合優(yōu)度。 (6.3)式中A代表實(shí)際頻數(shù),T代表理論頻數(shù)。格子理論頻數(shù)可用同樣方法求得,其計(jì)算公式為: (6.4)

37、(6.5)四格表資料的專用公式: (6.6) 式中a、b、c、d分別為四格表的實(shí)際頻數(shù)=a+b+c+d。四格表的值的校正。 當(dāng)所有T5,n40時(shí)用上述公式; 當(dāng)有1T40時(shí),需進(jìn)行連續(xù)性校正: (6.7) (6.7)或n=40,T=5,n=40,1T5, n40或T3.84,P40時(shí):b+c3.84,P0.05,按=0.05檢驗(yàn)水準(zhǔn),不拒絕H0,可以認(rèn)為兩者的總體分布相同;若T值=界值或在界值范圍外,P25%),應(yīng)校正:uc=?1.96,P0.05。按=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,可以認(rèn)為兩的分布位置不同。非參數(shù)統(tǒng)計(jì)檢驗(yàn)的適用條件:(1)資料不符合參數(shù)統(tǒng)計(jì)法的應(yīng)用條件(總體為正態(tài)分布、且方差相等)或總體分布類型未知;(2)等級(jí)資料;(3)分布呈明顯偏態(tài)又無(wú)適當(dāng)?shù)淖兞哭D(zhuǎn)換方法使之滿足參數(shù)統(tǒng)計(jì)條件;(4)在資料滿足參數(shù)檢驗(yàn)的要求時(shí),應(yīng)首選參數(shù)法,以免降低檢驗(yàn)效能。直線回歸方程的應(yīng)用:(1)定量描述兩變量之間的依存關(guān)系;(2)利用回歸議程進(jìn)行預(yù)測(cè);(3)利用回歸議程進(jìn)行統(tǒng)計(jì)控制。應(yīng)用直線回歸的注意事項(xiàng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論