第二章定量的基本統(tǒng)計(jì)方法_第1頁
第二章定量的基本統(tǒng)計(jì)方法_第2頁
第二章定量的基本統(tǒng)計(jì)方法_第3頁
第二章定量的基本統(tǒng)計(jì)方法_第4頁
第二章定量的基本統(tǒng)計(jì)方法_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章定量資料的基本統(tǒng)計(jì)方法張菊英復(fù)習(xí)總體與樣本、抽樣誤差小概率事件復(fù)習(xí)資料的兩種類型

數(shù)值變量資料分類資料問題:數(shù)值變量關(guān)注測(cè)定值的大小統(tǒng)計(jì)分析統(tǒng)計(jì)描述:是用統(tǒng)計(jì)圖(表)、統(tǒng)計(jì)指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。統(tǒng)計(jì)推斷:用樣本信息推斷總體特征。定量資料的統(tǒng)計(jì)描述

集中趨勢(shì)的統(tǒng)計(jì)描述定量資料的頻數(shù)表離散程度的統(tǒng)計(jì)描述

定量資料的頻數(shù)表在什么情況下需編頻數(shù)表?離散型計(jì)量資料的頻數(shù)表以變量取值為標(biāo)志分組,并列出各組的頻數(shù)

例2.1表2.1某年某地區(qū)434名少數(shù)民族已婚婦女

現(xiàn)有子女?dāng)?shù)的頻數(shù)分布連續(xù)性變量的頻數(shù)表的編制

求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示定組段和組距(classinterval)列出頻數(shù)表

定組段和組距根據(jù)全距的大小和樣本含量的多少確定“組段”數(shù)各組段的起點(diǎn)和終點(diǎn)分別稱為下限和上限,某組段的組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱組距,常用全距的1/10取整做組距第一組段應(yīng)包括全部觀察值中的最小值,最末組段應(yīng)包括全部觀察值中的最大值并且同時(shí)寫出其下限與上限。頻數(shù)分布的特征

集中趨勢(shì)(centraltendency)

一組數(shù)據(jù)向某一個(gè)位置聚集或集中的傾向離散趨勢(shì)(dispersiontendency)

一組數(shù)據(jù)的分散性頻數(shù)分布的類型

對(duì)稱分布:對(duì)稱分布偏態(tài)分布:

正偏態(tài)分布負(fù)偏態(tài)分布頻數(shù)表的用途揭示資料的分布類型,以便于選用相應(yīng)的統(tǒng)計(jì)分析方法;便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理;便于發(fā)現(xiàn)某些特大或特小的可疑值。集中趨勢(shì)的統(tǒng)計(jì)描述描述一組同質(zhì)觀察值的平均水平或中心位置的指標(biāo)有均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)現(xiàn)有2.1,2.2,2.3等3個(gè)觀察值,求其均數(shù)

1XX++LL均數(shù)(mean)

適用條件:對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布的定量資料。符號(hào):表示樣本均數(shù),希臘字母表示總體均數(shù)。計(jì)算方法:直接法:加權(quán)法(weightingmethod):例2.3120名5歲女孩身高均數(shù)均數(shù)的特性均數(shù)的應(yīng)用幾何均數(shù)(geometricmean)適用條件:某些呈正偏態(tài)分布,但數(shù)據(jù)經(jīng)過對(duì)數(shù)變換后呈正態(tài)分布的資料,也可用于觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)的資料。符號(hào):用G表示計(jì)算方法:直接法:或加權(quán)法(weightingmethod):例2.4例2.5幾何均數(shù)注意事項(xiàng)中位數(shù)(median)適用條件:偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料符號(hào):P50

或M計(jì)算方法:直接法:n為奇數(shù)時(shí):n為偶數(shù)時(shí):頻數(shù)表法(weightingmethod):

頻數(shù)表法計(jì)算Px表2.41503名中年知識(shí)分子SCL-90總分

中位數(shù)的應(yīng)用注意事項(xiàng)中位數(shù)可用于各種分布的資料。對(duì)于正態(tài)分布資料,中位數(shù)等于均數(shù);對(duì)于對(duì)數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù)。中位數(shù)不受極端值的影響,因此,實(shí)際工作中主要用于偏態(tài)分布資料、兩端無確切值或分布不明確的資料。三組同性別、同年齡兒童的體重(kg)如下:甲組2628303234乙組2427303336丙組2629303134離散程度的統(tǒng)計(jì)描述離散度指標(biāo)反映一組同質(zhì)觀察值的變異度;常用的指標(biāo)有全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù);值越大,表示資料的變異程度越大。全距(range,簡(jiǎn)記為R)涵義:亦稱極差,為一組同質(zhì)觀察值中最大值與最小值之差。它反映了個(gè)體差異的范圍,全距大,說明變異度大;反之,全距小,說明變異度小。計(jì)算:適用條件:常由于描述單峰對(duì)稱分布小樣本資料的變異程度或由于初步了解資料的變異程度。不足之處:只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時(shí)不宜用全距比較。四分位數(shù)間距(quartile,簡(jiǎn)記為Q)涵義:為上四分位數(shù)Qu(即)與下四分位數(shù)QL(即)之差。其間包括了一組觀察值的一半,故四分位數(shù)間距可看成是中間50%觀察值的極差。百分位數(shù)的計(jì)算

四分位數(shù)的計(jì)算適用條件常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。優(yōu)缺點(diǎn):四分位數(shù)間距較全距穩(wěn)定,但仍未考慮全部觀察值的變異度。例2.9某醫(yī)學(xué)院用自編生存質(zhì)量量表測(cè)得三組同年齡、同性別中年知識(shí)分子的軀體功能維度得分資料如下:

甲組88910111212

乙組56810121415

丙組12510151819

方差(variance)為了全面考慮每個(gè)觀察值的變異情況,克服全距和四分位數(shù)間距的缺點(diǎn),引入了“方差”自由度隨機(jī)變量能夠自由取值的個(gè)數(shù)符號(hào)為標(biāo)準(zhǔn)差因方差的度量單位是原度量單位的平方,故將方差開方,恢復(fù)成原度量單位,得總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差S

總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的計(jì)算直接法加權(quán)法例2.15方差和標(biāo)準(zhǔn)差的應(yīng)用條件正態(tài)或近似正態(tài)分布

變異系數(shù)(coefficientofvariation)

簡(jiǎn)記為CV適用:常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。計(jì)算公式描述數(shù)值變量分布特征的內(nèi)容分布范圍集中趨勢(shì),集中位置離散趨勢(shì),離散程度是否對(duì)稱描述數(shù)值變量的指標(biāo)的正確選擇正態(tài)或近似正態(tài)分布的資料均數(shù)和標(biāo)準(zhǔn)差偏態(tài)分布的資料中位數(shù)和四分位數(shù)間距等比級(jí)數(shù)或?qū)?shù)正態(tài)分布的資料幾何均數(shù)正態(tài)分布及其應(yīng)用正態(tài)分布的概念和特征

正態(tài)曲線下面積的分布規(guī)律

正態(tài)分布的應(yīng)用

正態(tài)分布的概念概念:正態(tài)分布是高峰位于中央(均數(shù)所在處)、兩側(cè)逐漸降低且左右對(duì)稱、不與橫軸相交的鐘型光滑曲線,也叫高斯分布。正態(tài)分布的圖形標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)

向左平移個(gè)單位后再縮小倍,即按式進(jìn)行變量代換得到標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示正態(tài)分布的特征正態(tài)曲線在橫軸上方均數(shù)處最高正態(tài)分布以均數(shù)為中心,左右對(duì)稱正態(tài)分布有兩個(gè)參數(shù),即均數(shù)與標(biāo)準(zhǔn)差正態(tài)曲線在1處各有一個(gè)拐點(diǎn)正態(tài)曲線下的面積分布有一定的規(guī)律

查附表1時(shí)注意事項(xiàng)曲線下橫軸上的總面積為100%或1。表中曲線下面積為-∞到u的面積。當(dāng)分布不是標(biāo)準(zhǔn)正態(tài)分布,但已知,和X時(shí),先按式求得u值,再查表求得曲線下某區(qū)間的面積。正態(tài)曲線下面積的分布規(guī)律采用“定積分法”可求出正態(tài)分布曲線下-∞到X之間的面積以及標(biāo)準(zhǔn)正態(tài)變量-∞到u的面積統(tǒng)計(jì)學(xué)家按標(biāo)準(zhǔn)正態(tài)分布的累積概率分布函數(shù)(u)編制了附表1,標(biāo)準(zhǔn)正態(tài)分布曲線下的面積常用的三個(gè)區(qū)間

1.645區(qū)間面積占總面積(或總觀察例數(shù))的90%

1.96區(qū)間面積占總面積(或總觀察例數(shù))的95%

2.58區(qū)間面積占總面積(或總觀察例數(shù))的99%正態(tài)分布的應(yīng)用估計(jì)頻數(shù)分布制定醫(yī)學(xué)參考值范圍質(zhì)量控制正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)制定醫(yī)學(xué)參考值范圍也稱醫(yī)學(xué)正常值范圍它是指所謂“正常人”的解剖、生理、生化等指標(biāo)的波動(dòng)范圍大多數(shù)“正常人”“正常人”所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。計(jì)算醫(yī)學(xué)參考值范圍常用的方法正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。雙側(cè)界值:?jiǎn)蝹?cè)上界:;單側(cè)下界:對(duì)數(shù)正態(tài)分布法:適用于對(duì)數(shù)正態(tài)分布資料雙側(cè)界值:百分位數(shù)法:常用于偏態(tài)分布資料雙側(cè)界值:和;單側(cè)上界:,如尿鉛、發(fā)汞;或單側(cè)下界:,如肺活量。例2.21某地調(diào)查正常成年男子200人的紅細(xì)胞數(shù)得均數(shù)=55.26×1012/L,標(biāo)準(zhǔn)差S=0.38×1012/L,試估計(jì)該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍

因紅細(xì)胞數(shù)過多或過少均屬異常,故取雙側(cè)。該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍為

下限:-1.96S

=55.26-1.96×0.38=54.52(/L)

上限:+1.96S

=55.26+1.96×0.38=56.00(/L)

例2.22某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù)=4.2L,標(biāo)準(zhǔn)差S=0.7L,試估計(jì)該地健康成年男性第一秒肺通氣量的95%參考值范圍。

因第一秒肺通氣量僅過低屬異常,故按取單側(cè)下限。該地健康成年男性第一秒肺通氣量的95%參考值范圍為:

下限:

即該地健康成年男性第一秒肺通氣量的95%參考值范圍為不低于3.05L。制定正常值范圍時(shí)注意事項(xiàng)要確定一批樣本含量足夠大的“正常人”;選定同質(zhì)正常人作為研究對(duì)象控制檢測(cè)誤差需根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值;根據(jù)研究目的和實(shí)用要求選定適當(dāng)?shù)陌俜纸缰?,?0%,90%,95%,和99%,常用95%;根據(jù)資料的分布特點(diǎn),選用恰當(dāng)?shù)挠?jì)算方法作業(yè)1.11.31.4總體均數(shù)的估計(jì)均數(shù)的抽樣誤差t分布總體均數(shù)的估計(jì)均數(shù)的抽樣誤差為什么進(jìn)行抽樣?概念:抽樣引起的總體參數(shù)與樣本統(tǒng)計(jì)量之間的差異稱為抽樣誤差(samplingerror)。均數(shù)的抽樣誤差:抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。從總體N(4.83,0.522)中抽出100個(gè)樣本的、S、t值與的95%的可信區(qū)間

100個(gè)樣本均數(shù)的均數(shù)為4.828,與總體均數(shù)4.83接近;樣本均數(shù)的標(biāo)準(zhǔn)差為0.18。

樣本均數(shù)抽樣誤差樣本1

樣本2

樣本k總體數(shù)理統(tǒng)計(jì)的中心極限定理從正態(tài)分布N(,2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布;即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;樣本均數(shù)的總體均數(shù)仍為,樣本均數(shù)的標(biāo)準(zhǔn)差為。標(biāo)準(zhǔn)誤(standarderror)樣本均數(shù)的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤,是說明均數(shù)抽樣誤差大小的指標(biāo),大,抽樣誤差大;反之,小,抽樣誤差小。標(biāo)準(zhǔn)誤的計(jì)算:標(biāo)準(zhǔn)誤的估計(jì)值:影響標(biāo)準(zhǔn)誤大小的因素

的大小與成正比與樣本含量n的平方根成反比t分布t分布的由來t分布的特征t分布曲線下的面積t分布的由來變量變換總體

樣本均數(shù)

中心極限定理標(biāo)準(zhǔn)正態(tài)分布

變量變換未知

從總體N(4.83,0.522)中抽出100個(gè)樣本的、S、t值與的95%的可信區(qū)間

圖3.2自由度分別為1、5、∞的t分布

自由度隨機(jī)變量能夠自由取值的個(gè)數(shù)

=n-限制條件的個(gè)數(shù)t分布的特征t分布是一簇單峰分布曲線。t分布以0為中心,左右對(duì)稱且均勻下降。其形態(tài)變化與自由度的大小有關(guān)。

自由度逐漸增大時(shí),t分布逐漸逼近u分布;當(dāng)=∞時(shí),t分布即為u分布。

t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%t分布曲線下面積以0為中心左右對(duì)稱由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個(gè)常量,而是隨自由度的大小而變化附表2,t分布表的特點(diǎn)附表2的橫標(biāo)目為自由度,縱標(biāo)目為概率P,表中數(shù)值為其相應(yīng)的t界值,記作t,

。附表2只列出正值,若計(jì)算的t值為負(fù)值時(shí),可用其絕對(duì)值查表。附表2右上附圖的陰影部分表示t,以外尾部面積的概率。單側(cè)t0.05,30=1.697其通式為單側(cè):P(t≤-t,)=或P(t≥t,)=

雙側(cè):P(t≤-t/2,)+P(t≥t/2,)=圖中非陰影部分面積的概率為,

P(-t/2,<t<t/2,)=1-總體均數(shù)的估計(jì)用樣本指標(biāo)估計(jì)總體指標(biāo)稱為參數(shù)估計(jì),是統(tǒng)計(jì)推斷的一個(gè)重要方面??傮w均數(shù)估計(jì)的兩種方法點(diǎn)估計(jì):是直接用統(tǒng)計(jì)量估計(jì)總體參數(shù).

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論