定量數(shù)據(jù)統(tǒng)計描述_第1頁
定量數(shù)據(jù)統(tǒng)計描述_第2頁
定量數(shù)據(jù)統(tǒng)計描述_第3頁
定量數(shù)據(jù)統(tǒng)計描述_第4頁
定量數(shù)據(jù)統(tǒng)計描述_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于定量數(shù)據(jù)的統(tǒng)計描述第一張,PPT共五十五頁,創(chuàng)作于2022年6月第一節(jié) 頻數(shù)分布 一、頻數(shù)分布表簡稱頻數(shù)表(frequency table)例2-1 從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇(mmol/L)的測量結(jié)果如下,試編制頻數(shù)分布表。第二張,PPT共五十五頁,創(chuàng)作于2022年6月2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.923.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.91 4.59 4.192.68 4.5

2、2 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.803.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.843.60 3.51 4.063.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.713.30 4.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.06 5.26 5.253.98 5.03 3.51 3.8

3、6 3.02 3.70 4.33 3.29 3.254.15 4.36 4.953.00 3.26試編制頻數(shù)分布表。第三張,PPT共五十五頁,創(chuàng)作于2022年6月1、頻數(shù)表的編制找全距(range)定組距(class interval):一般分為1015組,如組距約為全距/10寫組段:每個組段的起點稱為下限,lower limit;每個組段的終點稱為上限,upper limit;下限X50, 或 10)資料的分布不清。注意:在完全對稱的單峰曲線分布中,同一組資料的均數(shù)與中位數(shù)相同, Mean = Median第二十八張,PPT共五十五頁,創(chuàng)作于2022年6月中位數(shù)的優(yōu)缺點優(yōu)點:不受個別特大或特

4、小的觀察值影響;其它平均數(shù)不宜使用時,中位數(shù)就顯示出它的優(yōu)越性。缺點:掉失了大量信息,其敏感性不夠。第二十九張,PPT共五十五頁,創(chuàng)作于2022年6月百分位數(shù)(Percentile,Px)百分位數(shù)位置指標(biāo);界值;分布數(shù)列的百等份分割值。有x%的比Px小, 有(100-x)%的比Px大。中位數(shù)是一個特定的百分位數(shù)P50。第三十張,PPT共五十五頁,創(chuàng)作于2022年6月百分位數(shù)的計算fX 為PX所在組段的頻數(shù), i 為該組段的組距, L 為該組段的下限, fL 為小于L各組段的累計頻數(shù)。第三十一張,PPT共五十五頁,創(chuàng)作于2022年6月某傳染性疾病的潛伏期(天)如下表,求其 中位數(shù)和百分位數(shù)P95

5、潛伏期 (天)人數(shù)f累計頻數(shù)f累計頻率%4 262624.048 487468.5212259991.6716 610597.2220 3108100.00第三十二張,PPT共五十五頁,創(chuàng)作于2022年6月百分位數(shù)的應(yīng)用描述一組觀察值在某百分位置上的水平。用于確定醫(yī)學(xué)正常值范圍。用一組百分位數(shù)描述一組觀察值的變異度,如四分位數(shù)。第三十三張,PPT共五十五頁,創(chuàng)作于2022年6月應(yīng)用平均數(shù)時的注意事項同質(zhì)的變量值才能求平均數(shù);根據(jù)資料的分布特點,選用適應(yīng)的平均數(shù)指標(biāo)。第三十四張,PPT共五十五頁,創(chuàng)作于2022年6月平均水平SPSS統(tǒng)計描述命令A(yù)nalyze Descriptive Statis

6、tics Frequencies Descriptives注意:頻數(shù)表資料要用weight命令第三十五張,PPT共五十五頁,創(chuàng)作于2022年6月使用頻數(shù)表資料時SPSS操作中應(yīng)注意的事項頻數(shù)表資料要用weight命令;進(jìn)行數(shù)據(jù)輸入時要使用組中值;并且在Frequencies命令中要選擇 Values are group midpoints:根據(jù)分組資料計算百分位數(shù)。 第三十六張,PPT共五十五頁,創(chuàng)作于2022年6月SPSS操作求幾何均數(shù)時有三種方法: 1.是先計算對數(shù)的均數(shù),然后求其反對數(shù),得出幾何均數(shù);2.直接用Report Case Summaries 命令;3.用Compare Mea

7、ns 命令,但要個增加分組變量。第三十七張,PPT共五十五頁,創(chuàng)作于2022年6月第三節(jié) 變異程度的統(tǒng)計指標(biāo)例 有3組同齡男孩體重(kg)如下,其體重均數(shù) 都是30 (kg),試分析離散程度。甲組 26 28 30 32 34乙組 24 27 30 33 36丙組 26 29 30 31 34第三十八張,PPT共五十五頁,創(chuàng)作于2022年6月離散程度(或變異程度)指數(shù)據(jù)參差不齊的程度,反映資料的離散趨勢。將反映平均水平與離散程度的指標(biāo)結(jié)合起來使用,可全面地描述數(shù)據(jù)的分布規(guī)律。第三十九張,PPT共五十五頁,創(chuàng)作于2022年6月一、全距(或極差 , Range ) 全距 = 最大值 最小值優(yōu)點:簡

8、單明了缺點:不能反映組內(nèi)其他數(shù)據(jù)的變異,樣本含量相差較大時,不宜用極差比較分布的離散程度。第四十張,PPT共五十五頁,創(chuàng)作于2022年6月二、四分位數(shù)間距 (inter-quartile range)百分位數(shù):指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分為兩部分,在不包括PX的全部數(shù)據(jù)中有X%數(shù)據(jù)小于PX,有1-X%的數(shù)據(jù)大于PX%。中位數(shù)是一個特定的百分位數(shù)P50。四分位數(shù):下四分位數(shù)P25;上四分位數(shù)P75 P0 P25 P50 P75 P100 四分位數(shù)間距: P75 - P25 或 QU - QL 比極差穩(wěn)定,但仍未考慮每個數(shù)據(jù)的大小。常和中位數(shù)結(jié)合使用描述數(shù)據(jù)的分布規(guī)

9、律。第四十一張,PPT共五十五頁,創(chuàng)作于2022年6月三、離均差平方和 (sun of square)、方差(variance)和標(biāo)準(zhǔn)差(standard deviation)平均偏差(mean difference): 離均差平方和(sun of square, SS)第四十二張,PPT共五十五頁,創(chuàng)作于2022年6月方差和標(biāo)準(zhǔn)差離均差平方和: 考慮每個觀察值,但受N的影響。對離均差平方和求均數(shù),得總體方差2 ,開根號得標(biāo)準(zhǔn)差 。第四十三張,PPT共五十五頁,創(chuàng)作于2022年6月一般未知,常常用 來估計之,數(shù)理統(tǒng)計證明,如用樣本的變量個數(shù)n來代替N,計算出的樣本方差比實際2低,需要用n-1校

10、正,得樣本方差S2。開根號得樣本標(biāo)準(zhǔn)差s。 第四十四張,PPT共五十五頁,創(chuàng)作于2022年6月自由度,degree of freedom方差計算公式中的n-1被稱為自由度,它描述了當(dāng) 選定時,n個X中能自由變動的X(變量值)的個數(shù)。例:某樣本含有3個數(shù)據(jù),要求X=10。則在自由確定了2個數(shù)據(jù)后,第3個數(shù)據(jù)只能是10-(x1+x2)。 即有2個數(shù)據(jù)可以自由變動,其自由度=2 。推而廣之,任何統(tǒng)計量的自由度n-k,k為限制條件的個數(shù)。 自由度:是隨機(jī)變量可以“自由”取值的個數(shù)。第四十五張,PPT共五十五頁,創(chuàng)作于2022年6月總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 standard deviation應(yīng)用于頻

11、數(shù)表資料:第四十六張,PPT共五十五頁,創(chuàng)作于2022年6月標(biāo)準(zhǔn)差的計算甲組 26 28 30 32 34 標(biāo)準(zhǔn)差 3.16乙組 24 27 30 33 36 4.74丙組 26 29 30 31 34 2.92甲組:X=26+28+30+32+34=150X2=262+282+302+322+342=4540第四十七張,PPT共五十五頁,創(chuàng)作于2022年6月用頻數(shù)表法計算標(biāo)準(zhǔn)差見下表計算第四十八張,PPT共五十五頁,創(chuàng)作于2022年6月組段頻數(shù)f組中值Xf Xf X22.3012.452.456.002.6032.758.2522.692.9063.0518.3055.823.2083.35

12、26.8089.783.50 173.6562.05226.483.80 203.9579.00312.054.10 174.2572.25307.064.40 124.5554.60248.434.70 94.8543.65211.705.00 55.1525.75132.615.3025.4510.9059.415.605.901 5.755.7533.06合計101409.751705.09第四十九張,PPT共五十五頁,創(chuàng)作于2022年6月標(biāo)準(zhǔn)差的用途:反映一組觀察值的離散程度;計算變異系數(shù);計算標(biāo)準(zhǔn)誤;估計參考值范圍。第五十張,PPT共五十五頁,創(chuàng)作于2022年6月標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比

13、,反映了相對離散程度常用于比較度量衡單位不同的多組資料的變異度均數(shù)相差懸殊的多組資料的變異度四、變異系數(shù) CV(coefficient of variation)第五十一張,PPT共五十五頁,創(chuàng)作于2022年6月例:度量衡單位不同的變異度某地20歲男子110名身高 =172.73cm, s4.09cm;體重 55.04kg, s4.10kg,試比較兩組資料的變異程度,即身高、體重的變異程度哪個大?第五十二張,PPT共五十五頁,創(chuàng)作于2022年6月例:均數(shù)相差懸殊的變異度某地成年人舒張壓和收縮壓的變異程度均數(shù)標(biāo)準(zhǔn)差變異系數(shù)(%)舒張壓77.510.713.8收縮壓122.917.113.9第五十三

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。