常用統(tǒng)計(jì)方法_第1頁
常用統(tǒng)計(jì)方法_第2頁
常用統(tǒng)計(jì)方法_第3頁
常用統(tǒng)計(jì)方法_第4頁
常用統(tǒng)計(jì)方法_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2009-12-282009-12-28常用醫(yī)學(xué)統(tǒng)計(jì)方法常用醫(yī)學(xué)統(tǒng)計(jì)方法2009-12-282009-12-282009-12-282009-12-28 1. 1.變量變量(variable, (variable, 又稱指標(biāo)又稱指標(biāo)/ /觀察項(xiàng)目觀察項(xiàng)目): 3): 3種類型:種類型: 數(shù)值型變量數(shù)值型變量(numeric), (numeric), 表現(xiàn)為定量、可測量表現(xiàn)為定量、可測量(scale)(scale)。例如。例如“身高身高” ” 169cm169cm。 等級(jí)型變量(等級(jí)型變量(ordinalordinal),表現(xiàn)為半定量、有順),表現(xiàn)為半定量、有順序性。例如序性。例如“療效療效”為

2、治愈為治愈顯效顯效無效。無效。 字符串型變量字符串型變量(string)(string),表現(xiàn)為定性、分類、名,表現(xiàn)為定性、分類、名詞性詞性(nominal)(nominal)、無順序性。、無順序性。 2.2.總體總體(population)(population):根據(jù)調(diào)研目的確定的、同質(zhì):根據(jù)調(diào)研目的確定的、同質(zhì)的觀察單位的全體。的觀察單位的全體。 3.3.樣本樣本(sample)(sample):從總體中隨機(jī)抽樣得到的部分觀:從總體中隨機(jī)抽樣得到的部分觀察單位。樣本數(shù)通常表示為察單位。樣本數(shù)通常表示為 n n。統(tǒng)計(jì)中的幾個(gè)基本概念統(tǒng)計(jì)中的幾個(gè)基本概念 2009-12-282009-12-

3、284.4.頻數(shù)頻數(shù)(frequence)(frequence):就是觀察值的個(gè)數(shù)。:就是觀察值的個(gè)數(shù)。5.5.頻數(shù)分布:就是觀察值在其所取值的范圍內(nèi)分布的頻數(shù)分布:就是觀察值在其所取值的范圍內(nèi)分布的情況。情況。 6.6.觀察單位:是獲得數(shù)據(jù)的最小單位。觀察單位:是獲得數(shù)據(jù)的最小單位。7.7.參數(shù)估計(jì):是用樣本的統(tǒng)計(jì)數(shù)值去估計(jì)總體的統(tǒng)計(jì)參數(shù)估計(jì):是用樣本的統(tǒng)計(jì)數(shù)值去估計(jì)總體的統(tǒng)計(jì)數(shù)值。數(shù)值。8.8.概率概率(probability, P)(probability, P):描述隨機(jī)事件發(fā)生的可能:描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值,性大小的數(shù)值,P P 總在總在 0 01(100%)1(100%

4、)。 統(tǒng)計(jì)中的幾個(gè)基本概念統(tǒng)計(jì)中的幾個(gè)基本概念 2009-12-282009-12-289.9.統(tǒng)計(jì)推斷:指通常只能用抽樣調(diào)查、用樣本數(shù)據(jù)來統(tǒng)計(jì)推斷:指通常只能用抽樣調(diào)查、用樣本數(shù)據(jù)來推斷總體的數(shù)值。推斷總體的數(shù)值。 10. 10. 誤差:是指測得值與真值之差或樣本指標(biāo)與總體誤差:是指測得值與真值之差或樣本指標(biāo)與總體指標(biāo)之差,可分為隨機(jī)誤差和系統(tǒng)誤差兩類。指標(biāo)之差,可分為隨機(jī)誤差和系統(tǒng)誤差兩類。11. 11. 隨機(jī)誤差:包括抽樣和隨機(jī)測量誤差。隨機(jī)誤差:包括抽樣和隨機(jī)測量誤差。 抽樣誤差抽樣誤差(sampling error)(sampling error):是指由于抽樣造成:是指由于抽樣造成

5、樣本指標(biāo)與總體指標(biāo)之差。樣本指標(biāo)與總體指標(biāo)之差。 隨機(jī)測量誤差是指由隨機(jī)測量變異引起的誤差。隨機(jī)測量誤差是指由隨機(jī)測量變異引起的誤差。 系統(tǒng)誤差:是指由確定的原因引起的觀察值與真值系統(tǒng)誤差:是指由確定的原因引起的觀察值與真值之間或樣本指標(biāo)與總體指標(biāo)之間的偏差。之間或樣本指標(biāo)與總體指標(biāo)之間的偏差。 統(tǒng)計(jì)中的幾個(gè)基本概念統(tǒng)計(jì)中的幾個(gè)基本概念 2009-12-282009-12-2812.12.自由度自由度(df)(df):指能自由取值的變量個(gè)數(shù)。:指能自由取值的變量個(gè)數(shù)。13.13.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standard deviation, (standard deviation, S, SD, Std

6、Dev)S, SD, StdDev):表示一組計(jì)量數(shù)據(jù)之間參差不齊的程度,即樣本數(shù)表示一組計(jì)量數(shù)據(jù)之間參差不齊的程度,即樣本數(shù)據(jù)的變異范圍據(jù)的變異范圍( (離散程度、變異度離散程度、變異度) )。 通常表示為通常表示為 S S 。 統(tǒng)計(jì)中的幾個(gè)基本概念統(tǒng)計(jì)中的幾個(gè)基本概念 Xn1n2X)(2XS2009-12-282009-12-2814.14.標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(standard error, (standard error, SE)SE):隨著樣本量的增:隨著樣本量的增大,樣本均數(shù)的變異范圍會(huì)逐漸縮小。樣本均數(shù)的大,樣本均數(shù)的變異范圍會(huì)逐漸縮小。樣本均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤:標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤:SE(S

7、E(總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差)= )= 。 15.15.平均數(shù)平均數(shù)(mean,(mean, ): ): 表示一組性質(zhì)相同的觀察值表示一組性質(zhì)相同的觀察值(x)(x)的平均水平。平均數(shù)包括算術(shù)均數(shù)的平均水平。平均數(shù)包括算術(shù)均數(shù)(mean,(mean, ) )、幾何均數(shù)幾何均數(shù)(geometric mean,(geometric mean,G)G)、中位數(shù)、中位數(shù)(median(median,M)M)、眾數(shù)、眾數(shù)(mode(mode,M M0 0) )、調(diào)和均數(shù)、調(diào)和均數(shù)(harmonic mean,(harmonic mean, H)H)和第和第5050百分位數(shù)百分位數(shù)(percentile,(p

8、ercentile,P P50 50 ,即中位數(shù)即中位數(shù)) )等。等。 統(tǒng)計(jì)中的幾個(gè)基本概念統(tǒng)計(jì)中的幾個(gè)基本概念 XXn2009-12-282009-12-28SPSS軟件包的安裝2009-12-282009-12-28 1.1.當(dāng)變量當(dāng)變量( (指標(biāo),指標(biāo),“列列”) )、例數(shù)、例數(shù)(“(“行行”) )不多時(shí)不多時(shí), , 可直接在可直接在 “ “程序編輯窗程序編輯窗” ” 中錄入數(shù)據(jù);中錄入數(shù)據(jù);2.2.當(dāng)變量多、例數(shù)多時(shí),要在當(dāng)變量多、例數(shù)多時(shí),要在 “ “數(shù)據(jù)編輯窗數(shù)據(jù)編輯窗” 中錄入:下方有中錄入:下方有Data ViewData View與與Variable ViewVariable

9、 View Data View: Data View: 顯示數(shù)據(jù)的顯示數(shù)據(jù)的“行行” ” 與與 “ “列列” ” ; Variable View: Variable View: 用于定義變量。用于定義變量。 SPSSSPSS軟件包數(shù)據(jù)庫的建立軟件包數(shù)據(jù)庫的建立2009-12-282009-12-28 變量名(變量名(namename);); 類型(類型(typetype);); 寬度(寬度(widthwidth);); 小數(shù)位數(shù)(小數(shù)位數(shù)(DecimalsDecimals);); 標(biāo)示(標(biāo)示(LabelLabel);); 數(shù)值標(biāo)示(數(shù)值標(biāo)示(ValuesValues);); 缺失值(缺失值(M

10、issingMissing);); 列寬(列寬(ColumnsColumns);); 對(duì)齊方式左、中、右(對(duì)齊方式左、中、右(AlignAlign);); 數(shù)據(jù)性質(zhì)(數(shù)據(jù)性質(zhì)(Measure: Measure: 定量數(shù)據(jù)定量數(shù)據(jù)ScaleScale、 有序數(shù)據(jù)有序數(shù)據(jù)OrdinalOrdinal和定性數(shù)據(jù)和定性數(shù)據(jù)NominalNominal)。)。SPSSSPSS軟件包數(shù)據(jù)庫的建立軟件包數(shù)據(jù)庫的建立2009-12-282009-12-28進(jìn)入系統(tǒng)界面2009-12-282009-12-28 數(shù)據(jù)庫窗口 左上圖為數(shù)據(jù)編輯窗左上圖為數(shù)據(jù)編輯窗 右下圖為變量編輯窗右下圖為變量編輯窗2009-12-

11、282009-12-28SPSSSPSS軟件包數(shù)據(jù)庫的建立軟件包數(shù)據(jù)庫的建立 一般定義了一般定義了 即可。例如即可。例如 “ “性別性別” ” : :n “ “變量名變量名” ” 為為 “ “sex ”sex ”(英文)(英文); ; n “ “類型類型” ” 一般定為一般定為“數(shù)據(jù)數(shù)據(jù)”(numericnumeric);); n “ “寬度寬度” ” 為為 “ “3”3”; n “ “小數(shù)位數(shù)小數(shù)位數(shù)” ” 為為 “ “0”0”; n “ “標(biāo)示標(biāo)示” ” 為為 “ “性別性別”(中文)(中文); ; n “ “數(shù)值標(biāo)示數(shù)值標(biāo)示” ” 時(shí)時(shí) “ “1” 1” 為為“男男”, “2” , “2

12、” 為為 “ “女女”。 數(shù)據(jù)多時(shí)要節(jié)省硬盤,把數(shù)據(jù)多時(shí)要節(jié)省硬盤,把 “ “列寬列寬”同時(shí)也定同時(shí)也定 為為 “ “3”3”。正確建立數(shù)據(jù)庫極為重要!。正確建立數(shù)據(jù)庫極為重要!n 一項(xiàng)科研如果正確建好了數(shù)據(jù)庫,可認(rèn)為有一項(xiàng)科研如果正確建好了數(shù)據(jù)庫,可認(rèn)為有 70%70%以上的以上的 “ “功勞功勞”。2009-12-282009-12-28一、頻數(shù)表與頻數(shù)分布一、頻數(shù)表與頻數(shù)分布頻數(shù):當(dāng)匯總大量的原始數(shù)據(jù)時(shí),把數(shù)據(jù)按類型頻數(shù):當(dāng)匯總大量的原始數(shù)據(jù)時(shí),把數(shù)據(jù)按類型 分組,其中每個(gè)組的數(shù)據(jù)個(gè)數(shù),稱為該組分組,其中每個(gè)組的數(shù)據(jù)個(gè)數(shù),稱為該組 頻數(shù)。頻數(shù)。頻數(shù)表(頻數(shù)分布):表示各組及它們對(duì)應(yīng)的組頻

13、數(shù)表(頻數(shù)分布):表示各組及它們對(duì)應(yīng)的組 頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。2009-12-282009-12-28表表1 1601 160名正常成年女子的血清甘油三酯名正常成年女子的血清甘油三酯(mmol/L) (mmol/L) 編號(hào)編號(hào)血清甘油三脂血清甘油三脂編號(hào)編號(hào)血清甘油三脂血清甘油三脂1 10.510.512 20.520.521531531.651.653 30.590.591541541.661.664 40.610.611551551.671.675 50.610.611561561.671.676 60.620.621571571.691.697

14、 70.630.631581581.71.78 80.640.641591591.711.711601601.771.772009-12-282009-12-281. 1. 頻數(shù)表的編制步驟頻數(shù)表的編制步驟(1)(1)求極差(求極差(rangerange):即最大值與最小值之差,又稱):即最大值與最小值之差,又稱為全距。本例極差:為全距。本例極差:R R=1.77=1.770.51=1.260.51=1.26(mmol/Lmmol/L)(2)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n n確定。組距確定。組距= =極差極差/ /組數(shù),通常分組

15、數(shù),通常分10-1510-15個(gè)組,為方便個(gè)組,為方便計(jì),組距參考極差的十分之一計(jì),組距參考極差的十分之一, , 再略加調(diào)整。再略加調(diào)整。 本例本例i i=R/10=1.26/10=0.1260.1=R/10=1.26/10=0.1260.1。(3)(3)列出組段:第一組段的下限略小于最小值,最后一列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4 4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。得到各組段的頻數(shù)。2009-12-282009-1

16、2-28 組段組段 (1) 劃劃 記記(2) 頻數(shù),頻數(shù),f(3) 組中值,組中值,X(4) fX(5)= (3)(4)0.5 30.551.650.6正正90.655.850.7正正正正120.759.000.8正正正正130.8511.050.9正正正正正正170.9516.151.0正正正正正正181.0518.901.1正正正正正正正正201.1523.001.2正正正正正正181.2522.501.3正正正正正正171.3522.951.4正正正正131.4518.851.5正正91.5512.401.6正正 81.6514.851.71.8 合計(jì)合計(jì) 31.755.25160182

17、.302009-12-282009-12-282. 2. 頻數(shù)表的分布特征頻數(shù)表的分布特征集中趨勢集中趨勢(central tendency):(central tendency):變量值集中位置。變量值集中位置。本例在組段本例在組段“1.11.1”。 平均水平指標(biāo)平均水平指標(biāo)離散趨勢離散趨勢(tendency of dispersion):(tendency of dispersion):變量值圍繞變量值圍繞集中位置的分布情況。本例集中位置的分布情況。本例0.90.91.41.4,共有,共有9090人,人,占占5656;離;離“中心中心”位置越遠(yuǎn),頻數(shù)越?。磺覈@位置越遠(yuǎn),頻數(shù)越?。磺覈@“

18、中心中心”左右對(duì)稱。左右對(duì)稱。 變異水平指標(biāo)變異水平指標(biāo) 2009-12-282009-12-283. 3. 正態(tài)分布與偏態(tài)分布正態(tài)分布與偏態(tài)分布1.1.頻數(shù)表頻數(shù)表正態(tài)分布正態(tài)分布normal distributionnormal distribution(圖(圖2-12-1)2.2.頻數(shù)表頻數(shù)表右偏態(tài)右偏態(tài)(skewed to the right)(skewed to the right),也稱正,也稱正偏態(tài)(偏態(tài)(positive skewedpositive skewed)(圖)(圖2-22-2)3.3.頻數(shù)表頻數(shù)表左偏態(tài)左偏態(tài)(skewed to the left)(skewed t

19、o the left),也稱負(fù),也稱負(fù)偏態(tài)偏態(tài)(negative skewed)(negative skewed)(圖圖2-3)2-3)2009-12-282009-12-28圖 2 - 1 1 6 0 名 正 常 成 年 女 子 的 血 清 甘 油 三 酯 的 頻 數(shù) 分 布 圖051 01 52 02 50 . 5 00 . 7 00 . 9 01 . 1 01 . 3 01 . 5 01 . 7 01 . 9 0血 清 甘 油 三 酯 ( m m o l / L )頻數(shù)圖2-2 59名鏈球菌咽喉炎患者的潛伏期(h)0246810121416181224364860728496108 12

20、0潛伏期(h)病例數(shù)病例數(shù)圖2-3 101名正常人的血清肌紅蛋白含量051015202505101520253035404550肌紅蛋白含量(ug/mL)人數(shù)正態(tài)分布:中間高正態(tài)分布:中間高兩邊低、左右對(duì)稱兩邊低、左右對(duì)稱正偏態(tài)正偏態(tài)分布:分布:長尾向長尾向右右延伸延伸負(fù)偏態(tài)負(fù)偏態(tài)分布:分布:長尾向長尾向左左延伸延伸2009-12-282009-12-28 a. a.尖峭峰尖峭峰 b.b.正態(tài)峰正態(tài)峰c.c.平闊峰平闊峰2009-12-282009-12-28正態(tài)分布的概念正態(tài)分布的概念n正態(tài)曲線:高峰位于中央,兩側(cè)逐漸下降并完全對(duì)正態(tài)曲線:高峰位于中央,兩側(cè)逐漸下降并完全對(duì)稱,曲線兩端永遠(yuǎn)不

21、與橫軸相交的鐘型曲線。稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。n該曲線的函數(shù)表達(dá)式該曲線的函數(shù)表達(dá)式f(x)f(x)稱為正態(tài)分布密度函數(shù),稱為正態(tài)分布密度函數(shù),n位置參數(shù):位置參數(shù):決定曲線的位置決定曲線的位置n變異度參數(shù):變異度參數(shù):決定曲線的形狀決定曲線的形狀 22221xexf2009-12-282009-12-28二、正態(tài)分布的特征二、正態(tài)分布的特征n均數(shù)處最高;均數(shù)處最高;n均數(shù)為中心對(duì)稱;均數(shù)為中心對(duì)稱;n2 2個(gè)參數(shù)個(gè)參數(shù)N N(u u, ) n標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布:N:N(0 0,1 1););n標(biāo)準(zhǔn)正態(tài)變換標(biāo)準(zhǔn)正態(tài)變換( (變換公式變換公式) ); n曲線下的面積有一定規(guī)

22、律。曲線下的面積有一定規(guī)律。n橫軸上、曲線下的面積為橫軸上、曲線下的面積為1 1;曲線下曲線下, ,橫軸上對(duì)稱于橫軸上對(duì)稱于0 0的面的面 積相等。積相等。2009-12-282009-12-28正態(tài)概率密度曲線的特點(diǎn)正態(tài)概率密度曲線的特點(diǎn)n(1 1)關(guān)于)關(guān)于x=x=對(duì)稱對(duì)稱n(2 2)n(3 3)曲線下面積為)曲線下面積為1 1。n(4 4)決定曲線在橫軸上的位置,決定曲線在橫軸上的位置,增大,曲增大,曲線沿橫軸向右移;反之,線沿橫軸向右移;反之,減小,曲線沿橫軸減小,曲線沿橫軸向左移。向左移。n(5 5)決定曲線的形狀,當(dāng)決定曲線的形狀,當(dāng)恒定時(shí),恒定時(shí),越大,越大,數(shù)據(jù)越分散,曲線越數(shù)

23、據(jù)越分散,曲線越“矮胖矮胖”;越小,數(shù)據(jù)越小,數(shù)據(jù)越集中,曲線越越集中,曲線越“瘦高瘦高”。習(xí)慣上用。習(xí)慣上用N N(,2 2)表示均數(shù)為表示均數(shù)為、標(biāo)準(zhǔn)差為、標(biāo)準(zhǔn)差為的正態(tài)分布。的正態(tài)分布。對(duì)對(duì)稱稱x型型曲曲線線處處有有拐拐點(diǎn)點(diǎn),表表現(xiàn)現(xiàn)為為鐘鐘在在x x數(shù)數(shù)的的最最大大值值處處取取得得該該概概率率密密度度函函在在x x2009-12-282009-12-282009-12-28正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下面積的分布規(guī)律由正態(tài)曲線下面積的分布規(guī)律由和和所決定。所決定。-3 -2- + +2 +368.27%95.44%99.74%2009-12-282009-1

24、2-28正態(tài)分布的應(yīng)用正態(tài)分布的應(yīng)用 確定醫(yī)學(xué)參考值范圍確定醫(yī)學(xué)參考值范圍: :n1.1.定義:醫(yī)學(xué)參考值范圍是指特定的定義:醫(yī)學(xué)參考值范圍是指特定的“正常正?!比巳喝巳海ㄅ懦藢?duì)所研究指標(biāo)有影響的疾病和有關(guān)因素的(排除了對(duì)所研究指標(biāo)有影響的疾病和有關(guān)因素的特定人群)的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)特定人群)的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個(gè)體的取值所在的范圍。人物含量等數(shù)據(jù)中大多數(shù)個(gè)體的取值所在的范圍。人們習(xí)慣用該人群們習(xí)慣用該人群95%95%的個(gè)體某項(xiàng)醫(yī)學(xué)指標(biāo)的取值范的個(gè)體某項(xiàng)醫(yī)學(xué)指標(biāo)的取值范圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。n2.2.確定

25、正常值范圍的一般原則和方法步驟確定正常值范圍的一般原則和方法步驟n 抽取足夠例數(shù)的正常人樣本。抽取足夠例數(shù)的正常人樣本。n 根據(jù)資料分布類型選擇方法。根據(jù)資料分布類型選擇方法。n 根據(jù)專業(yè)知識(shí)確定該范圍的單雙側(cè)根據(jù)專業(yè)知識(shí)確定該范圍的單雙側(cè)2009-12-282009-12-28應(yīng)用條件應(yīng)用條件 : :正態(tài)分布或近似正態(tài)分布資料正態(tài)分布或近似正態(tài)分布資料 計(jì)算(雙側(cè)):計(jì)算(雙側(cè)): 95% 95% 正常值正常值( (醫(yī)學(xué)參考值)范圍公式:醫(yī)學(xué)參考值)范圍公式: (x x 1.961.96* *S S,x x 1.961.96* *S S ) 即(即(x x1.96 1.96 * *S S )

26、 (1) (1)正態(tài)分布法正態(tài)分布法2009-12-282009-12-28(2)(2)百分位數(shù)法百分位數(shù)法n應(yīng)用條件應(yīng)用條件 : : 偏態(tài)分布資料偏態(tài)分布資料 n計(jì)算公式:計(jì)算公式: 雙側(cè)界值:雙側(cè)界值:P P2.52.5 -P -P97.597.5 單側(cè)單側(cè) 上界:上界:P P9595 單側(cè)單側(cè) 下界:下界:P P5 5 2009-12-282009-12-28%正態(tài)分布法正態(tài)分布法 百分位數(shù)法百分位數(shù)法雙側(cè)雙側(cè) 單單 側(cè)側(cè) 雙側(cè)雙側(cè)單單 側(cè)側(cè) 只有只有 下限下限 只有只有 上限上限只有只有 下限下限 只有只有 上限上限90 P5P95P10P9095P2.5P97.5P5P9599P0.

27、5P99.5P1P99sx64.1 sx96.1sx58.2sx28.1sx64.1sx33.2sx28.1sx64.1sx33.22009-12-282009-12-28三、平均指標(biāo)三、平均指標(biāo)總稱為平均數(shù)(總稱為平均數(shù)(averageaverage)反映了資料的集中趨勢)反映了資料的集中趨勢( central tendencycentral tendency)。常用的有:)。常用的有:1.1.算術(shù)均數(shù)算術(shù)均數(shù)(arithmetic mean)(arithmetic mean),簡稱均數(shù),簡稱均數(shù) (mean)(mean)2.2.幾何均數(shù)幾何均數(shù)(geometric mean)(geomet

28、ric mean)3.3.中位數(shù)中位數(shù) (median)(median)4.4.眾數(shù)(眾數(shù)(modemode)2009-12-282009-12-281. 1. 均數(shù)(均數(shù)(meanmean)nXnXXXXn21iikkkffXffffXffXfXXfX3213211為求和符號(hào),讀成為求和符號(hào),讀成sigmasigma適用條件:資料呈正態(tài)或近似正態(tài)。適用條件:資料呈正態(tài)或近似正態(tài)。2009-12-282009-12-28 組段組段 (1) 劃劃 記記(2) 頻數(shù),頻數(shù),f(3) 組中值,組中值,X(4) fX(5)= (3)(4)0.5 30.551.650.6正正90.655.850.7正正

29、正正120.759.000.8正正正正130.8511.050.9正正正正正正170.9516.151.0正正正正正正181.0518.901.1正正正正正正正正201.1523.001.2正正正正正正181.2522.501.3正正正正正正171.3522.951.4正正正正131.4518.851.5正正91.5513.951.6正正 81.6513.201.71.8 合計(jì)合計(jì) 31.755.25160182.30均數(shù)均數(shù)182.3/160182.3/1601.141.142009-12-282009-12-282. 2. 幾何均數(shù)(幾何均數(shù)(geometric meangeometric

30、 mean)nXXnXXXXnXXXXXGnGnnGlglglg)lglg(lg1lg12121為正值,為底的反對(duì)數(shù)表示以為底的對(duì)數(shù);表示以010lg10lg1X幾何均數(shù):變量幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。數(shù)的反對(duì)數(shù)。 2009-12-282009-12-28幾何均數(shù)的適用條件與實(shí)例幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料布(正偏態(tài))資料;如抗體滴度資料 血清的抗體效價(jià)滴度的倒數(shù)分別為:血清的抗體效價(jià)滴度的倒數(shù)分別為:1010、100100、10001000、100001

31、0000、100000100000,求幾何均數(shù)。,求幾何均數(shù)。1000510lg10lg10lg10lg10lglg543211G此例的算術(shù)均數(shù)為此例的算術(shù)均數(shù)為2222222222,顯然不能代表滴度的,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)平均水平。同一資料,幾何均數(shù) 中位數(shù)中位數(shù) 眾數(shù)眾數(shù)負(fù)偏態(tài)分布負(fù)偏態(tài)分布時(shí):均數(shù)時(shí):均數(shù) 中位數(shù)中位數(shù) 眾數(shù)眾數(shù)2009-12-282009-12-282009-12-282009-12-28四、變異(四、變異(variationvariation)指標(biāo))指標(biāo) 反映數(shù)據(jù)的離散度(反映數(shù)據(jù)的離散度(DispersionDispersion)。即個(gè)體)

32、。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:觀察值的變異程度。常用的指標(biāo)有: 1.1.極差極差(Range(Range) ( (全距全距) ) 2. 2.百分位數(shù)與四分位數(shù)間距百分位數(shù)與四分位數(shù)間距(Percentile and(Percentile and Quartile range) Quartile range) 3. 3.方差方差(Variance)(Variance) 4. 4.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(Standard Deviation)(Standard Deviation) 5. 5.變異系數(shù)變異系數(shù)(Coefficient of Variation)(Coefficient of Var

33、iation)2009-12-282009-12-28盤編盤編 甲甲乙乙丙丙1 14404404804804904902 24604604904904954953 35005005005005005004 45405405105105055055 5560560520520510510合計(jì)合計(jì)250025002500250025002500均數(shù)均數(shù)500500500500500500 例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)紅細(xì)胞計(jì)數(shù),每人數(shù)5 5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬/mm/mm3 3)甲乙丙2009-1

34、2-282009-12-281. 1.極差極差(Range(Range) ( (全距全距) )minmaxXXR優(yōu)點(diǎn):簡便優(yōu)點(diǎn):簡便缺點(diǎn):缺點(diǎn):1.1.只利用了兩個(gè)極端值只利用了兩個(gè)極端值2.2.n n大,大,R R也會(huì)大也會(huì)大3.3.不穩(wěn)定不穩(wěn)定12040202009-12-282009-12-282.2.百分位數(shù)與四分位數(shù)間距百分位數(shù)與四分位數(shù)間距百分位數(shù)百分位數(shù) :數(shù)據(jù)從?。簲?shù)據(jù)從小到大排列到大排列; ;在百分尺度在百分尺度下,所占百分比對(duì)應(yīng)的下,所占百分比對(duì)應(yīng)的值。記為值。記為P Px x。 四分位間距四分位間距:QRQRP P7575 P P2525四分位半間距四分位半間距quart

35、ile quartile deviation:deviation:QDQDQR/2QR/2P100(max)P75P50(中位數(shù)中位數(shù))P25P0(min)Px2009-12-282009-12-28頻數(shù)表資料的百分位數(shù)頻數(shù)表資料的百分位數(shù)m mL Lx xx xf f) )f fx x% %( (n ni iL LP P值值間間的的頻頻數(shù)數(shù)所所在在組組段段下下限限值值至至上上限限) )至至該該下下限限值值的的累累計(jì)計(jì)頻頻數(shù)數(shù)x x% %( (n n組組距距所所在在組組段段下下限限值值P P下限值下限值L L上限值上限值U Ui; fm百分位數(shù)百分位數(shù)P Px x)%(Lfxn2009-12-

36、282009-12-28 組段組段 (1) 劃劃 記記(2) 頻數(shù),頻數(shù),f(3) 累計(jì)頻數(shù)累計(jì)頻數(shù) f(4)累計(jì)百分率累計(jì)百分率0.5 331.9 (01.9)0.6正正9127.5 (1.97.5)0.7正正正正122415.0 (7.515.0) 0.8正正正正133723.1 (15.223.1)0.9正正正正正正175433.8 (23.133.8)1.0正正正正正正187245.0 (33.845.0)1.1正正正正正正正正209257.5 (45.057.5)1.2正正正正正正1811068.8 (57.568.8)1.3正正正正正正1712779.4 (68.879.4)1.4

37、正正正正1314087.5 (79.487.5)1.5正正914993.1 (87.593.1)1.6正正 815798.1 (93.198.1)1.71.8 合計(jì)合計(jì) 3160100.0 (98.1100)160P P25250.9+0.1x(160 x25%0.9+0.1x(160 x25%37)/1737)/170.920.92P P75751.3+0.1x(160 x75%1.3+0.1x(160 x75%110)/17110)/171.361.36QRQR1.36-0.921.36-0.920.440.44;QDQD0.220.222009-12-282009-12-28百分位數(shù)的應(yīng)

38、用百分位數(shù)的應(yīng)用確定醫(yī)學(xué)確定醫(yī)學(xué)參考值范圍參考值范圍(reference rangereference range):): 如如9595參考值范圍參考值范圍P P97.597.5P P2.52.5; 表示有表示有9595正常正常個(gè)體個(gè)體的測量值在此范圍。的測量值在此范圍。中位數(shù)中位數(shù)MdMd與與四分位半間距四分位半間距QDQD一起使用,描述偏態(tài)一起使用,描述偏態(tài)分布資料的特征分布資料的特征2009-12-282009-12-283.3.方差方差 方差(方差(variancevariance)也稱均方差()也稱均方差(mean square mean square deviationdeviat

39、ion),樣本觀察值的離均差平方和的均值。),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。表示一組數(shù)據(jù)的平均離散情況。N N) )- -( (X X總總體體方方差差) )- -( (X Xl ls sq qu ua ar re e) )S SS S o of f 離離均均差差平平方方和和( (s su um m0 0) )- -( (X X離離均均差差和和2 22 22 2x xx x11)(2222nnXXnXXS樣本方差2009-12-282009-12-28樣本方差為什么要除以(樣本方差為什么要除以(n n1 1) 與自由度(與自由度(degrees of freedom

40、degrees of freedom)有關(guān)。)有關(guān)。 自由度是數(shù)學(xué)名詞,在統(tǒng)計(jì)學(xué)中,自由度是數(shù)學(xué)名詞,在統(tǒng)計(jì)學(xué)中,n n個(gè)數(shù)據(jù)如不受個(gè)數(shù)據(jù)如不受任何條件的限制,則任何條件的限制,則n n個(gè)數(shù)據(jù)可取任意值,稱為有個(gè)數(shù)據(jù)可取任意值,稱為有n n個(gè)個(gè)自由度。若受到自由度。若受到k k個(gè)條件的限制,就只有個(gè)條件的限制,就只有( (n nk k) )個(gè)自由個(gè)自由度了。計(jì)算標(biāo)準(zhǔn)差時(shí),度了。計(jì)算標(biāo)準(zhǔn)差時(shí), n n個(gè)變量值本身有個(gè)變量值本身有n n個(gè)自由度。個(gè)自由度。但受到樣本均數(shù)的限制但受到樣本均數(shù)的限制, ,任何一個(gè)任何一個(gè)“離均差離均差”均可以用均可以用另外的(另外的(n n1 1)個(gè))個(gè)“離均差離均差”表示,所以只有(表示,所以只有(n n1 1)個(gè)獨(dú)立的)個(gè)獨(dú)立的“離均差離均差”。因此只有(。因此只有(n n1 1)個(gè)自由度)個(gè)自由度。11)(2222nnXXnXXS樣本方差2009-12-282009-12-284.4.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差1 1n nn nX XX X1 1n n) )X X( (X X標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差S S2 22 22 2樣本 標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)差(standard deviationstandard d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論