




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
對數(shù)值離散程度的描述指標(biāo)
學(xué)習(xí)目標(biāo):
1、熟悉離散程度的指標(biāo)種類;2、掌握標(biāo)準(zhǔn)差s、四分位間距p75-p25、變異系數(shù)CV的適用范圍;3、掌握標(biāo)準(zhǔn)差、正態(tài)分布、參考值范圍的概念;
4、掌握參考值范圍的制定方法。描述定量資料的分布特征僅有平均指標(biāo)是不夠的,還需要有描述離散程度的指標(biāo)。假如一班的5名同學(xué)成績60,70,80,90,100平均80分R=40二班的5名同學(xué)成績70,75,80,85,90平均80分R=20三班的5名同學(xué)成績65,75,80,85,95平均80分R=30描述離散程度的指標(biāo)有多種:極差、方差、標(biāo)準(zhǔn)差、四分位間距、變異系數(shù)。一、極差和四分位間距
1、極差(Range,全距)
R=max-min
缺點是:只反映最大和最小值的變異,不夠全面;容易受n大小的影響,不穩(wěn)定。
2、四分位間距(quartilerange,Q)
(1)百分位數(shù):表示一組觀察值按升序排列,并等分為100等份,位居第x%位置的數(shù)。用Px
表示。是一個位置指標(biāo)。
它將全部數(shù)據(jù)分成兩部分,有X%的數(shù)據(jù)小于Px,有1-X%的數(shù)據(jù)大于Px,,中位數(shù)M是特殊的百分位數(shù),M=P50。是表示集中趨勢的指標(biāo)。(2)四分位數(shù)
下四分位數(shù)即P25
;上四分位數(shù)即P75;四分位間距Q=P75-P25
是指上、下四分位數(shù)的間距,它是從小到大排列后中間一半數(shù)據(jù)所在的范圍。四分位數(shù)間距越大,數(shù)據(jù)分布的離散程度越大。它描述了中間50%數(shù)據(jù)的離散程度,比極差穩(wěn)定。
四分位數(shù)間距P75-P25,計算:例如對例2-8題求P25本例的四分位數(shù)間距:
Q=P75-P25
=73.20-40.91=32.29(h)。二、方差與標(biāo)準(zhǔn)差1、方差(Variance)
是描述數(shù)據(jù)分布離散程度的指標(biāo)。S2表示樣本方差,表示總體方差,總體方差一般未知,常用樣本方差來估計,樣本方差的計算公式:
上式中的分子部分稱為離均差平方和,它描述了每個x相對于分布的集中程度,若數(shù)據(jù)x分布相對于很集中,則分子部分很?。环肿硬糠趾艽髸r,則意味著數(shù)據(jù)分布分散。因為對所有x,均有,所以樣本含量n越大,分子越大。為消除n大小不同的影響,將離均差平方和除以(n-1)即得方差。故方差既描述了所有數(shù)據(jù)的離散程度,又可用于不同樣本含量數(shù)據(jù)離散程度的比較。方差越大,數(shù)據(jù)分布的離散度也越大。方差計算公式中的n-1,稱為自由度(degreeoffreedom)。自由度:允許其自由變動的變量值個數(shù)。如有n個變量,不受任何條件的限制,可自由變動,其自由度則得n,如受到一個條件限制,自由度則得n-1。自由度用表示。
方差為一描述離散程度的指標(biāo),既有優(yōu)點也有缺點,如5名兒童的體重方差
2、標(biāo)準(zhǔn)差(standarddeviation,s)
是描述正態(tài)分布的定量變量離散程度的指標(biāo)。標(biāo)準(zhǔn)差越大,說明個體變異越大。為克服方差的單位是平方,與均數(shù)不符的缺點,將S2開方即為標(biāo)準(zhǔn)差S
標(biāo)準(zhǔn)差的計算:
公式中是變量值的平方和,是變量值和的平方。
如今有5名兒童的身高為110、115、120、125、112厘米,其平均身是其標(biāo)準(zhǔn)差是:式中
標(biāo)準(zhǔn)差的適用范圍:
適用于對稱分布資料,尤其正態(tài)分布,近似正態(tài)分布的資料。與均數(shù)配套使用。三、變異系數(shù)(coefficientvariation,cv)(1)、計算
(2)、適用范圍:
①比較資料的變異度,度量衡單位不同時。②比較資料的變異度,均數(shù)相差較大時。例如調(diào)查得知,某農(nóng)村周歲女童其身高均數(shù)為74.2cm,標(biāo)準(zhǔn)差3.0cm;其體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差。欲比較身高與體重的變異情況,應(yīng)用變異系數(shù)。
身高體重
思考題1、為什么要把資料列出頻數(shù)分布表或圖?頻數(shù)分布表的劃記步驟?2、常用平均指標(biāo)在應(yīng)用上有哪些異同點?3、標(biāo)準(zhǔn)差、四分位間距、變異系數(shù)在應(yīng)用上有何區(qū)別?例如?
正態(tài)分布
55頁正態(tài)分布的概念和特征一、概念:一組變量值的頻數(shù)分布是中間多,兩邊少,且左右對稱的連續(xù)性分布。如果設(shè)想成年男子的血清鐵觀察的人數(shù)很多,且組段分得很細(xì),則頻數(shù)分布圖中的直條變的很窄,其頂端窄到是一個點,將這些點連線則成為一條光滑曲線,這條光滑曲線呈鐘型,兩頭低中間高,左右對稱,則稱其為正態(tài)分布曲線。見P56正態(tài)分布圖。二、正態(tài)分布(曲線)的特征:
1、曲線在橫軸之上,以均數(shù)處最高;
2、以均數(shù)為中心左右對稱,兩端永遠(yuǎn)不與橫軸相交;
3、正態(tài)分布有兩個參數(shù):μ為位置參數(shù),σ為形狀參數(shù),μ描述了正態(tài)分布的集中位置,所以稱μ為位置參數(shù),又稱其為總體均數(shù);σ描述了正態(tài)分布的離散程度,σ決定了正態(tài)曲線的形狀,σ越小,分布越集中,所形成的曲線形狀越高尖,σ越大,分布越離散,所形成的曲線形狀越低平。所以稱σ為形狀參數(shù),又稱其為總體標(biāo)準(zhǔn)差。曲線形狀見P57圖三、正態(tài)曲線下面積分布規(guī)律
1、正態(tài)曲線下全面積為100%,或等于1。
2、占全面積的68.27%
占全面積的95.00%
占全面積的99.00%。一個服從正態(tài)分布的指標(biāo),只要求得均數(shù)和標(biāo)準(zhǔn)差,就可全面掌握該指標(biāo)的頻數(shù)分布規(guī)律。服從正態(tài)分布的指標(biāo),可簡記為
x~N(μ,σ)
95.00%68.27%99.00%
標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換
雖然正態(tài)曲線下面積分布很有規(guī)律,對于服從正態(tài)分布的指標(biāo),只要知道均數(shù)μ,與標(biāo)準(zhǔn)差σ,就可用公式求得曲線下(x1,x2)范圍內(nèi)的面積,從而估計在(x1,x2)范圍內(nèi)的頻數(shù)分布比例,但上述積分是相當(dāng)困難的,這給實際應(yīng)用帶來諸多不便。為方便使用,又方便不同,使用,考慮對服從正態(tài)分布的變量x進行標(biāo)準(zhǔn)化轉(zhuǎn)換:
則z(u)就服從均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布,這種正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布。簡記作z~N(0,1)。
引進標(biāo)準(zhǔn)化轉(zhuǎn)換后,制定一個標(biāo)準(zhǔn)正態(tài)曲線下面積分布表,就可借助標(biāo)準(zhǔn)正態(tài)表估計任何(x1,x2)范圍內(nèi)的頻數(shù)分布比例。標(biāo)準(zhǔn)正態(tài)表即附表1(P433)。正態(tài)分布的應(yīng)用一、估計頻數(shù)分布例如出生體重低于2500克為低體重兒。若由某項研究得某地嬰兒出生體重均數(shù)3200克,標(biāo)準(zhǔn)差為350克,估計該地當(dāng)年低體重兒所占的比例。記X為當(dāng)年該地新生兒出生體重,則X服從正態(tài)分布N(3200,350)。先求(轉(zhuǎn)換)再查標(biāo)準(zhǔn)正態(tài)表得:即標(biāo)準(zhǔn)正態(tài)曲線下從-∞到u=-2范圍內(nèi)的面積為2.28%,從而在正態(tài)分布N(3200,350)曲線下,從-∞到X=2500的比例為2.28%,即X<2500克的比例為2.28%。故估計該地當(dāng)年低體重兒所占的比例為2.28%。二、確定醫(yī)學(xué)參考值范圍
1、概念:參考值范圍也稱為正常值范圍。醫(yī)學(xué)上常把絕大多數(shù)正常人的某指標(biāo)波動范圍,稱為該指標(biāo)的正常值范圍。這里的“絕大多數(shù)”可以是90%、95%、99%等等,最常用的是95%。所謂“正常人”不是指完全健康的人,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。
2、估計方法:
常用的有百分位數(shù)法和正態(tài)分布法,見P59。
3、制定正常值選計算方法的原則:
(1)根據(jù)資料的分布類型選方法對于服從正態(tài)分布的資料,其參考值范圍的制定可用正態(tài)分布法計算;
u是系數(shù),根據(jù)%大小定,
對于不服從正態(tài)分布的指標(biāo),直接利用百分位數(shù)法(或進行變量變換使之服從正態(tài)分布)制定參考值范圍。求px(2)根據(jù)專業(yè)知識確定該指標(biāo)的參考值范圍是雙側(cè)范圍還是單側(cè)范圍。
若一個指標(biāo)過大過小均屬異常,制定雙側(cè)參考值范圍,即參考值范圍應(yīng)既有上限又有下限;若一個指標(biāo)僅過大屬異常,則此指標(biāo)的參考值范圍只有上限,是單側(cè)參考值范圍;若一個指標(biāo)僅過小屬異常,則此指標(biāo)的參考值范圍只有下限,也是單側(cè)參考值范圍。
對于一個指標(biāo),隨機抽取一個大樣本后,如何據(jù)樣本資料利用正態(tài)分布法或百分位數(shù)法制定參考值范圍。例如某地調(diào)查正常成年男子144人的紅細(xì)胞數(shù)(近似正態(tài)分布),得均數(shù)=55.38×1012/L,標(biāo)準(zhǔn)差S=0.44×1012/L,試估計該地成年男子紅細(xì)胞數(shù)的95%參考值范圍。因紅細(xì)胞數(shù)過多或過少均為異常,故此參考值范圍應(yīng)是雙側(cè)范圍。又因為此指標(biāo)近似正態(tài),故可用正態(tài)分布法求95%參考值范圍如下:三、進行質(zhì)量控制常用作為上、下警戒限作為上、下控制限四、正態(tài)分布是許多統(tǒng)計方法的基礎(chǔ)。如t檢驗,F(xiàn)檢驗等。第五章參數(shù)估計一、均數(shù)的抽樣誤差(Samplingerrorofmean)由于個體存在差異,又因抽樣造成的樣本均數(shù)與總體均數(shù)間的差異,稱為均數(shù)的抽樣誤差,用均數(shù)的標(biāo)準(zhǔn)誤(Standarderror,SE)表示。均數(shù)的標(biāo)準(zhǔn)誤是表示均數(shù)抽樣誤差大小的指標(biāo),描述樣本均數(shù)的離散程度,反映用樣本均數(shù)估計或推斷總體均數(shù)的可靠性.二、均數(shù)標(biāo)準(zhǔn)誤的計算
?表示總體標(biāo)準(zhǔn)差,當(dāng)?不知道,只知S時,可用下式計算:
從公式中可看出,均數(shù)的標(biāo)準(zhǔn)誤與兩個因素有關(guān),與標(biāo)準(zhǔn)差成正比,與樣本例數(shù)的平方根成反比。若標(biāo)準(zhǔn)差固定不變時,可增加n而縮小抽樣誤差。三、均數(shù)標(biāo)準(zhǔn)誤的應(yīng)用
1、表示均數(shù)抽樣誤差大小,描述(n相同)樣本均數(shù)的離散程度,反映用樣本均數(shù)估計或推斷總體均數(shù)的可靠性;
2、用于估計總體均數(shù)的可信區(qū)間;
3、用于進行均數(shù)的假設(shè)檢驗。第二節(jié)t分布
一、t分布概念:若干個t值分布所形成的曲線分布。t值是兩均數(shù)之差相當(dāng)于標(biāo)準(zhǔn)誤的倍數(shù)值。即如何理解t分布呢?不妨再回憶一下正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布:當(dāng)變量x服從均數(shù)為μ,標(biāo)準(zhǔn)差為?的正態(tài)分布時,可簡記為x~N(μ,?)。為了方便使用,可對變量x進行標(biāo)準(zhǔn)化轉(zhuǎn)換:則u的分布服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),即u分布。若從N(μ,?)的正態(tài)分布總體中,隨機抽樣并算得多個樣本均數(shù),它們則服從總體均數(shù)為,總體標(biāo)準(zhǔn)差為的正態(tài)分布,對于也可經(jīng)過標(biāo)準(zhǔn)化轉(zhuǎn)換,使服從u~N(0,1)的標(biāo)準(zhǔn)正態(tài)分布。但在實際工作中,由于未知,多是知道,則服從t分布。二、t分布的圖形和特征
1、t分布的圖形:t分布是一簇曲線。它受自由度的影響(實際是受n不同的影響),自由度不同時,曲線的形狀不同。
n小時,亦小,t分布曲線的形狀越低平,n越大,亦越大,t分布曲線的形狀越高尖,當(dāng)時,t分布曲線趨近于標(biāo)準(zhǔn)正態(tài)分布曲線。見P74圖。2、t分布的特征
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國紫外線燈累積計時器數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國單層凳數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國切條刀行業(yè)投資前景及策略咨詢報告
- 2025年中國外接報警測試面板市場調(diào)查研究報告
- 2024年中國雙側(cè)彎鏈?zhǔn)袌稣{(diào)查研究報告
- 2025年水文測量儀器項目合作計劃書
- 幼兒園獲獎公開課:大班語言繪本《方格子老虎》教案
- 2025年醫(yī)用混合氣體系統(tǒng)項目建議書
- 2025年錫壓延加工材項目合作計劃書
- 江西省景德鎮(zhèn)市2025屆高三上學(xué)期第一次質(zhì)量檢測語文試題及參考答案
- 《預(yù)算編制要點講解》課件
- 2025年交管12123學(xué)法減分試題庫附參考答案
- 2025年360億方智能航空AI白皮書-愛分析
- 2025(人教版)音樂三年級下冊全冊教案及教學(xué)設(shè)計
- 福建省廈門市第一中學(xué)2023-2024學(xué)年高二上學(xué)期開學(xué)考試英語試題(解析版)
- 2025年山東新華書店集團限公司臨沂市縣分公司招聘錄取人員高頻重點提升(共500題)附帶答案詳解
- 宮頸癌篩查與預(yù)防:2025年健康教育
- 2025年極兔速遞有限公司招聘筆試參考題庫含答案解析
- 酒店資產(chǎn)管理制度
- 公司綠色可持續(xù)發(fā)展規(guī)劃報告
- 機械制造工藝與裝備 習(xí)題及答案 葉文華 ch01 -ch09
評論
0/150
提交評論