第二章 數(shù)值變量的描述性統(tǒng)計_第1頁
第二章 數(shù)值變量的描述性統(tǒng)計_第2頁
第二章 數(shù)值變量的描述性統(tǒng)計_第3頁
第二章 數(shù)值變量的描述性統(tǒng)計_第4頁
第二章 數(shù)值變量的描述性統(tǒng)計_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章描述性統(tǒng)計《醫(yī)學(xué)統(tǒng)計學(xué)》余松林主編所謂描述性統(tǒng)計分析,就是對一組數(shù)據(jù)的各種特征進行分析,以便于描述測量樣本的各種特征及其所代表的總體的特征。描述性統(tǒng)計分析的項目很多,常用的如平均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、頻數(shù)分布、正態(tài)或偏態(tài)程度等等。這些分析是復(fù)雜統(tǒng)計分析的基礎(chǔ)。平均數(shù)、標(biāo)準(zhǔn)誤中位數(shù)、眾數(shù)、全距標(biāo)準(zhǔn)差、方差四分位、十分位、百分位數(shù)頻數(shù)分布、峰度、偏度平均數(shù)、標(biāo)準(zhǔn)誤返回本章首頁基本的描述性統(tǒng)計量中位數(shù)、眾數(shù)、全距返回本章首頁標(biāo)準(zhǔn)差、方差返回本章首頁嚴(yán)格地講,在方差和標(biāo)準(zhǔn)差的計算中,分母應(yīng)取n-1,因為數(shù)據(jù)變異的自由度是n-1。但在大樣本情況下,使用n和n-1差別不大。四分位、十分位、百分位數(shù)返回本章首頁頻數(shù)分布、峰度、偏度頻數(shù)(Frequency)就是一個變量的各個觀測值出現(xiàn)的次數(shù)。比如某班語文考試的成績,可以統(tǒng)計出各分?jǐn)?shù)值的人數(shù)。峰度(Kurtosis):是描述某變量所有取值的分布形態(tài)陡緩程度的統(tǒng)計量,而峰度對陡緩程度的度量是與正態(tài)分布進行比較的結(jié)果。如果峰度等于0,其數(shù)據(jù)分布的陡緩程度與正態(tài)分布相同;峰度大于0,其數(shù)據(jù)分布比正態(tài)分布更陡峭;峰度小于0,其數(shù)據(jù)分布比正態(tài)分布更平坦。返回本章首頁偏度(Skewness)是描述數(shù)據(jù)分布對稱性的統(tǒng)計量,而且也是與正態(tài)分布的對稱性相比較而得到的。如果分布的偏度等于0,則其數(shù)據(jù)分布的對稱性與正態(tài)分布相同;如果偏度大于0,則其分布為正偏或右偏,即在峰的右邊有大的偏差值,使右邊出現(xiàn)一個拖得較遠的尾巴;如果偏度小于0,則為負偏或左偏,即在峰的左邊有大的偏差值,使左邊出現(xiàn)一個拖得較遠的尾巴。返回本章首頁表格法主要有:頻數(shù)分布表和頻率分布表圖形法主要有:直方圖第一節(jié)表格法和圖形法一、頻數(shù)分布表常用來反映各變量取值及其相應(yīng)頻數(shù)之間的關(guān)系。研究資料的頻數(shù)分布類型是選擇合適的統(tǒng)計指標(biāo)進行統(tǒng)計描述的基礎(chǔ)。頻數(shù)分布表2-1130名健康成年男子脈搏數(shù)(次/分)編號脈搏數(shù)編號脈搏數(shù)編號脈搏數(shù)175…………2761058412377372106661246446910770125705661087312666672109601276975711076128738681118212978…………13076(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=84-57=27(次/分)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分8-15個組,為方便計,組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=27/10=2.7≈3。(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)列表劃記:用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。1.頻數(shù)分布表的制作步驟表2-2130名健康成年男子脈搏(次/分)的頻數(shù)分布表脈搏組段(1)劃記(2)頻數(shù)(3)相對頻數(shù)(%)(4)=(3)/N累積頻數(shù)(5)=(3)↓累積相對頻數(shù)(%)(6)=(5)/N56~┳21.5421.5459~

正53.8575.3862~正正┳129.231914.6265~

正正正1511.543426.1568~正正正正正2519.235945.3871~正正正正正一2620.008565.3874~正正正1914.6210480.0077~正正正1511.5411991.5480~

正正107.6912999.2383~85一10.77130100.00合計130直方圖第二節(jié)數(shù)值方法表示中心位置的數(shù)值算術(shù)平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)調(diào)和均數(shù)平均數(shù)的計算方法直接法:當(dāng)觀察例數(shù)不多(如樣本含量n小于30)時,或觀察例數(shù)雖然很多,但有計算機及統(tǒng)計軟件,均可選擇。加權(quán)法:適用于頻數(shù)表資料。當(dāng)觀察例數(shù)很多又缺乏計算機及統(tǒng)計軟件時,若用直接法很容易出錯,可選擇。1.算術(shù)平均數(shù)直接法:(式2-1)加權(quán)法:(式2-2)Σ為求和符號,讀成sigma2.中位數(shù)

中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號為Md,反映一批觀察值在位次上的平均水平。

中位數(shù)的計算直接法:加權(quán)法:例2-5:測定了107例正常人的尿鉛含量,見表2-4,試根據(jù)分布計算集中趨勢指標(biāo)。表2-4107例正常人的尿鉛含量(μg/L)的中位數(shù)計算表尿鉛含量(組段)(j)頻數(shù)(fj)累積頻數(shù)↓∑fj相對頻數(shù)(%)fj/n累積相對頻數(shù)(%)∑fj/n0~141413.0813.084~223620.5633.648~296527.1060.7512~188316.8277.5716~159814.0291.5920~61045.6197.2024~11050.9398.1328~21071.87100.00合計107100.00三、幾何均數(shù)適用條件: (1)當(dāng)一組觀察值不呈正態(tài)分布、且其差距較大時,若用均數(shù)表示其平均水平會受少數(shù)特大或特小值的影響; (2)數(shù)值按大小順序排列后,各觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系; (3)對數(shù)正態(tài)分布資料。(如:抗體的滴度、藥物的效價等)計算方法:直接法:加權(quán)法:例2-7:有50人的血清抗體效價,分別為:5人1:10,9人1:20,20人1:40,10人1:80,6人1:160,求平均抗體效價。解:將抗體效價的倒數(shù)直接代入上式,得:所以,50人的血清平均抗體效價為1:41.70。四、眾數(shù)眾數(shù)是一組觀察值中出現(xiàn)頻率最高的那個觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個組段。表示離散程度的數(shù)值全距百分位數(shù)四分位數(shù)間距方差標(biāo)準(zhǔn)差變異系數(shù)1.全距極差R=Xmax-Xmin頻數(shù)表資料的百分位數(shù)表2-4107例正常人的尿鉛含量(μg/L)的中位數(shù)計算表尿鉛含量(組段)(j)頻數(shù)(fj)累積頻數(shù)↓∑fj相對頻數(shù)(%)fj/n累積相對頻數(shù)(%)∑fj/n0~141413.0813.084~223620.5633.648~296527.1060.7512~188316.8277.5716~159814.0291.5920~61045.6197.2024~11050.9398.1328~21071.87100.00合計107100.002.方差總體方差在樣本中,μ未知,常用替代,樣本方差為什么要除以(n-1) 與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計學(xué)中,n個數(shù)據(jù)如不受任何條件的限制,則n個數(shù)據(jù)可取任意值,稱為有n個自由度。若受到k個條件的限制,就只有(n-k)個自由度了。計算標(biāo)準(zhǔn)差時,n個變量值本身有n個自由度。但受到樣本均數(shù)的限制,任何一個“離均差”均可以用另外的(n-1)個“離均差”表示,所以只有(n-1)個獨立的“離均差”。因此只有(n-1)個自由度。

3.標(biāo)準(zhǔn)差即方差的正平方根;其單位與原變量X的單位相同。例2-10:利用表2-3中的數(shù)據(jù)和頻數(shù)表法計算標(biāo)準(zhǔn)差。表2-3130名健康成年男子脈搏(次/分)的均數(shù)、標(biāo)準(zhǔn)差計算表脈搏組段(i)組中值(xi)頻數(shù)(fi)fixifixi256~572114649859~

6053001800062~63127564762865~

66159906534068~6925172511902571~7226187213478474~7519142510687577~781511709126080~

81108106561083~85841847056合計13092466

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論