對(duì)數(shù)值離散程度的描述指標(biāo)_第1頁(yè)
對(duì)數(shù)值離散程度的描述指標(biāo)_第2頁(yè)
對(duì)數(shù)值離散程度的描述指標(biāo)_第3頁(yè)
對(duì)數(shù)值離散程度的描述指標(biāo)_第4頁(yè)
對(duì)數(shù)值離散程度的描述指標(biāo)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

對(duì)數(shù)值離散程度的描述指標(biāo)

學(xué)習(xí)目標(biāo):

1、熟悉離散程度的指標(biāo)種類(lèi);2、掌握標(biāo)準(zhǔn)差s、四分位間距p75-p25、變異系數(shù)CV的適用范圍;3、掌握標(biāo)準(zhǔn)差、正態(tài)分布、參考值范圍的概念;

4、掌握參考值范圍的制定方法。描述定量資料的分布特征僅有平均指標(biāo)是不夠的,還需要有描述離散程度的指標(biāo)。假如一班的5名同學(xué)成績(jī)60,70,80,90,100平均80分R=40二班的5名同學(xué)成績(jī)70,75,80,85,90平均80分R=20三班的5名同學(xué)成績(jī)65,75,80,85,95平均80分R=30描述離散程度的指標(biāo)有多種:極差、方差、標(biāo)準(zhǔn)差、四分位間距、變異系數(shù)。一、極差和四分位間距

1、極差(Range,全距)

R=max-min

缺點(diǎn)是:只反映最大和最小值的變異,不夠全面;容易受n大小的影響,不穩(wěn)定。

2、四分位間距(quartilerange,Q)

(1)百分位數(shù):表示一組觀察值按升序排列,并等分為100等份,位居第x%位置的數(shù)。用Px

表示。是一個(gè)位置指標(biāo)。

它將全部數(shù)據(jù)分成兩部分,有X%的數(shù)據(jù)小于Px,有1-X%的數(shù)據(jù)大于Px,,中位數(shù)M是特殊的百分位數(shù),M=P50。是表示集中趨勢(shì)的指標(biāo)。(2)四分位數(shù)

下四分位數(shù)即P25

;上四分位數(shù)即P75;四分位間距Q=P75-P25

是指上、下四分位數(shù)的間距,它是從小到大排列后中間一半數(shù)據(jù)所在的范圍。四分位數(shù)間距越大,數(shù)據(jù)分布的離散程度越大。它描述了中間50%數(shù)據(jù)的離散程度,比極差穩(wěn)定。

四分位數(shù)間距P75-P25,計(jì)算:例如對(duì)例2-8題求P25本例的四分位數(shù)間距:

Q=P75-P25

=73.20-40.91=32.29(h)。二、方差與標(biāo)準(zhǔn)差1、方差(Variance)

是描述數(shù)據(jù)分布離散程度的指標(biāo)。S2表示樣本方差,表示總體方差,總體方差一般未知,常用樣本方差來(lái)估計(jì),樣本方差的計(jì)算公式:

上式中的分子部分稱(chēng)為離均差平方和,它描述了每個(gè)x相對(duì)于分布的集中程度,若數(shù)據(jù)x分布相對(duì)于很集中,則分子部分很??;分子部分很大時(shí),則意味著數(shù)據(jù)分布分散。因?yàn)閷?duì)所有x,均有,所以樣本含量n越大,分子越大。為消除n大小不同的影響,將離均差平方和除以(n-1)即得方差。故方差既描述了所有數(shù)據(jù)的離散程度,又可用于不同樣本含量數(shù)據(jù)離散程度的比較。方差越大,數(shù)據(jù)分布的離散度也越大。方差計(jì)算公式中的n-1,稱(chēng)為自由度(degreeoffreedom)。自由度:允許其自由變動(dòng)的變量值個(gè)數(shù)。如有n個(gè)變量,不受任何條件的限制,可自由變動(dòng),其自由度則得n,如受到一個(gè)條件限制,自由度則得n-1。自由度用表示。

方差為一描述離散程度的指標(biāo),既有優(yōu)點(diǎn)也有缺點(diǎn),如5名兒童的體重方差

2、標(biāo)準(zhǔn)差(standarddeviation,s)

是描述正態(tài)分布的定量變量離散程度的指標(biāo)。標(biāo)準(zhǔn)差越大,說(shuō)明個(gè)體變異越大。為克服方差的單位是平方,與均數(shù)不符的缺點(diǎn),將S2開(kāi)方即為標(biāo)準(zhǔn)差S

標(biāo)準(zhǔn)差的計(jì)算:

公式中是變量值的平方和,是變量值和的平方。

如今有5名兒童的身高為110、115、120、125、112厘米,其平均身是其標(biāo)準(zhǔn)差是:式中

標(biāo)準(zhǔn)差的適用范圍:

適用于對(duì)稱(chēng)分布資料,尤其正態(tài)分布,近似正態(tài)分布的資料。與均數(shù)配套使用。三、變異系數(shù)(coefficientvariation,cv)(1)、計(jì)算

(2)、適用范圍:

①比較資料的變異度,度量衡單位不同時(shí)。②比較資料的變異度,均數(shù)相差較大時(shí)。例如調(diào)查得知,某農(nóng)村周歲女童其身高均數(shù)為74.2cm,標(biāo)準(zhǔn)差3.0cm;其體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差。欲比較身高與體重的變異情況,應(yīng)用變異系數(shù)。

身高體重

思考題1、為什么要把資料列出頻數(shù)分布表或圖?頻數(shù)分布表的劃記步驟?2、常用平均指標(biāo)在應(yīng)用上有哪些異同點(diǎn)?3、標(biāo)準(zhǔn)差、四分位間距、變異系數(shù)在應(yīng)用上有何區(qū)別?例如?

正態(tài)分布

55頁(yè)正態(tài)分布的概念和特征一、概念:一組變量值的頻數(shù)分布是中間多,兩邊少,且左右對(duì)稱(chēng)的連續(xù)性分布。如果設(shè)想成年男子的血清鐵觀察的人數(shù)很多,且組段分得很細(xì),則頻數(shù)分布圖中的直條變的很窄,其頂端窄到是一個(gè)點(diǎn),將這些點(diǎn)連線(xiàn)則成為一條光滑曲線(xiàn),這條光滑曲線(xiàn)呈鐘型,兩頭低中間高,左右對(duì)稱(chēng),則稱(chēng)其為正態(tài)分布曲線(xiàn)。見(jiàn)P56正態(tài)分布圖。二、正態(tài)分布(曲線(xiàn))的特征:

1、曲線(xiàn)在橫軸之上,以均數(shù)處最高;

2、以均數(shù)為中心左右對(duì)稱(chēng),兩端永遠(yuǎn)不與橫軸相交;

3、正態(tài)分布有兩個(gè)參數(shù):μ為位置參數(shù),σ為形狀參數(shù),μ描述了正態(tài)分布的集中位置,所以稱(chēng)μ為位置參數(shù),又稱(chēng)其為總體均數(shù);σ描述了正態(tài)分布的離散程度,σ決定了正態(tài)曲線(xiàn)的形狀,σ越小,分布越集中,所形成的曲線(xiàn)形狀越高尖,σ越大,分布越離散,所形成的曲線(xiàn)形狀越低平。所以稱(chēng)σ為形狀參數(shù),又稱(chēng)其為總體標(biāo)準(zhǔn)差。曲線(xiàn)形狀見(jiàn)P57圖三、正態(tài)曲線(xiàn)下面積分布規(guī)律

1、正態(tài)曲線(xiàn)下全面積為100%,或等于1。

2、占全面積的68.27%

占全面積的95.00%

占全面積的99.00%。一個(gè)服從正態(tài)分布的指標(biāo),只要求得均數(shù)和標(biāo)準(zhǔn)差,就可全面掌握該指標(biāo)的頻數(shù)分布規(guī)律。服從正態(tài)分布的指標(biāo),可簡(jiǎn)記為

x~N(μ,σ)

95.00%68.27%99.00%

標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換

雖然正態(tài)曲線(xiàn)下面積分布很有規(guī)律,對(duì)于服從正態(tài)分布的指標(biāo),只要知道均數(shù)μ,與標(biāo)準(zhǔn)差σ,就可用公式求得曲線(xiàn)下(x1,x2)范圍內(nèi)的面積,從而估計(jì)在(x1,x2)范圍內(nèi)的頻數(shù)分布比例,但上述積分是相當(dāng)困難的,這給實(shí)際應(yīng)用帶來(lái)諸多不便。為方便使用,又方便不同,使用,考慮對(duì)服從正態(tài)分布的變量x進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換:

則z(u)就服從均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布,這種正態(tài)分布稱(chēng)為標(biāo)準(zhǔn)正態(tài)分布。簡(jiǎn)記作z~N(0,1)。

引進(jìn)標(biāo)準(zhǔn)化轉(zhuǎn)換后,制定一個(gè)標(biāo)準(zhǔn)正態(tài)曲線(xiàn)下面積分布表,就可借助標(biāo)準(zhǔn)正態(tài)表估計(jì)任何(x1,x2)范圍內(nèi)的頻數(shù)分布比例。標(biāo)準(zhǔn)正態(tài)表即附表1(P433)。正態(tài)分布的應(yīng)用一、估計(jì)頻數(shù)分布例如出生體重低于2500克為低體重兒。若由某項(xiàng)研究得某地嬰兒出生體重均數(shù)3200克,標(biāo)準(zhǔn)差為350克,估計(jì)該地當(dāng)年低體重兒所占的比例。記X為當(dāng)年該地新生兒出生體重,則X服從正態(tài)分布N(3200,350)。先求(轉(zhuǎn)換)再查標(biāo)準(zhǔn)正態(tài)表得:即標(biāo)準(zhǔn)正態(tài)曲線(xiàn)下從-∞到u=-2范圍內(nèi)的面積為2.28%,從而在正態(tài)分布N(3200,350)曲線(xiàn)下,從-∞到X=2500的比例為2.28%,即X<2500克的比例為2.28%。故估計(jì)該地當(dāng)年低體重兒所占的比例為2.28%。二、確定醫(yī)學(xué)參考值范圍

1、概念:參考值范圍也稱(chēng)為正常值范圍。醫(yī)學(xué)上常把絕大多數(shù)正常人的某指標(biāo)波動(dòng)范圍,稱(chēng)為該指標(biāo)的正常值范圍。這里的“絕大多數(shù)”可以是90%、95%、99%等等,最常用的是95%。所謂“正常人”不是指完全健康的人,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。

2、估計(jì)方法:

常用的有百分位數(shù)法和正態(tài)分布法,見(jiàn)P59。

3、制定正常值選計(jì)算方法的原則:

(1)根據(jù)資料的分布類(lèi)型選方法對(duì)于服從正態(tài)分布的資料,其參考值范圍的制定可用正態(tài)分布法計(jì)算;

u是系數(shù),根據(jù)%大小定,

對(duì)于不服從正態(tài)分布的指標(biāo),直接利用百分位數(shù)法(或進(jìn)行變量變換使之服從正態(tài)分布)制定參考值范圍。求px(2)根據(jù)專(zhuān)業(yè)知識(shí)確定該指標(biāo)的參考值范圍是雙側(cè)范圍還是單側(cè)范圍。

若一個(gè)指標(biāo)過(guò)大過(guò)小均屬異常,制定雙側(cè)參考值范圍,即參考值范圍應(yīng)既有上限又有下限;若一個(gè)指標(biāo)僅過(guò)大屬異常,則此指標(biāo)的參考值范圍只有上限,是單側(cè)參考值范圍;若一個(gè)指標(biāo)僅過(guò)小屬異常,則此指標(biāo)的參考值范圍只有下限,也是單側(cè)參考值范圍。

對(duì)于一個(gè)指標(biāo),隨機(jī)抽取一個(gè)大樣本后,如何據(jù)樣本資料利用正態(tài)分布法或百分位數(shù)法制定參考值范圍。例如某地調(diào)查正常成年男子144人的紅細(xì)胞數(shù)(近似正態(tài)分布),得均數(shù)=55.38×1012/L,標(biāo)準(zhǔn)差S=0.44×1012/L,試估計(jì)該地成年男子紅細(xì)胞數(shù)的95%參考值范圍。因紅細(xì)胞數(shù)過(guò)多或過(guò)少均為異常,故此參考值范圍應(yīng)是雙側(cè)范圍。又因?yàn)榇酥笜?biāo)近似正態(tài),故可用正態(tài)分布法求95%參考值范圍如下:三、進(jìn)行質(zhì)量控制常用作為上、下警戒限作為上、下控制限四、正態(tài)分布是許多統(tǒng)計(jì)方法的基礎(chǔ)。如t檢驗(yàn),F(xiàn)檢驗(yàn)等。第五章參數(shù)估計(jì)一、均數(shù)的抽樣誤差(Samplingerrorofmean)由于個(gè)體存在差異,又因抽樣造成的樣本均數(shù)與總體均數(shù)間的差異,稱(chēng)為均數(shù)的抽樣誤差,用均數(shù)的標(biāo)準(zhǔn)誤(Standarderror,SE)表示。均數(shù)的標(biāo)準(zhǔn)誤是表示均數(shù)抽樣誤差大小的指標(biāo),描述樣本均數(shù)的離散程度,反映用樣本均數(shù)估計(jì)或推斷總體均數(shù)的可靠性.二、均數(shù)標(biāo)準(zhǔn)誤的計(jì)算

?表示總體標(biāo)準(zhǔn)差,當(dāng)?不知道,只知S時(shí),可用下式計(jì)算:

從公式中可看出,均數(shù)的標(biāo)準(zhǔn)誤與兩個(gè)因素有關(guān),與標(biāo)準(zhǔn)差成正比,與樣本例數(shù)的平方根成反比。若標(biāo)準(zhǔn)差固定不變時(shí),可增加n而縮小抽樣誤差。三、均數(shù)標(biāo)準(zhǔn)誤的應(yīng)用

1、表示均數(shù)抽樣誤差大小,描述(n相同)樣本均數(shù)的離散程度,反映用樣本均數(shù)估計(jì)或推斷總體均數(shù)的可靠性;

2、用于估計(jì)總體均數(shù)的可信區(qū)間;

3、用于進(jìn)行均數(shù)的假設(shè)檢驗(yàn)。第二節(jié)t分布

一、t分布概念:若干個(gè)t值分布所形成的曲線(xiàn)分布。t值是兩均數(shù)之差相當(dāng)于標(biāo)準(zhǔn)誤的倍數(shù)值。即如何理解t分布呢?不妨再回憶一下正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布:當(dāng)變量x服從均數(shù)為μ,標(biāo)準(zhǔn)差為?的正態(tài)分布時(shí),可簡(jiǎn)記為x~N(μ,?)。為了方便使用,可對(duì)變量x進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換:則u的分布服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),即u分布。若從N(μ,?)的正態(tài)分布總體中,隨機(jī)抽樣并算得多個(gè)樣本均數(shù),它們則服從總體均數(shù)為,總體標(biāo)準(zhǔn)差為的正態(tài)分布,對(duì)于也可經(jīng)過(guò)標(biāo)準(zhǔn)化轉(zhuǎn)換,使服從u~N(0,1)的標(biāo)準(zhǔn)正態(tài)分布。但在實(shí)際工作中,由于未知,多是知道,則服從t分布。二、t分布的圖形和特征

1、t分布的圖形:t分布是一簇曲線(xiàn)。它受自由度的影響(實(shí)際是受n不同的影響),自由度不同時(shí),曲線(xiàn)的形狀不同。

n小時(shí),亦小,t分布曲線(xiàn)的形狀越低平,n越大,亦越大,t分布曲線(xiàn)的形狀越高尖,當(dāng)時(shí),t分布曲線(xiàn)趨近于標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)。見(jiàn)P74圖。2、t分布的特征

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論