![平均數標準差_第1頁](http://file4.renrendoc.com/view/09042908d9bc609e30d6c55d02e0b658/09042908d9bc609e30d6c55d02e0b6581.gif)
![平均數標準差_第2頁](http://file4.renrendoc.com/view/09042908d9bc609e30d6c55d02e0b658/09042908d9bc609e30d6c55d02e0b6582.gif)
![平均數標準差_第3頁](http://file4.renrendoc.com/view/09042908d9bc609e30d6c55d02e0b658/09042908d9bc609e30d6c55d02e0b6583.gif)
![平均數標準差_第4頁](http://file4.renrendoc.com/view/09042908d9bc609e30d6c55d02e0b658/09042908d9bc609e30d6c55d02e0b6584.gif)
![平均數標準差_第5頁](http://file4.renrendoc.com/view/09042908d9bc609e30d6c55d02e0b658/09042908d9bc609e30d6c55d02e0b6585.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
平均數標準差第1頁,共91頁,2023年,2月20日,星期一本次課內容一、計量資料的頻數分布二、集中趨勢指標三、離散趨勢指標四、正態(tài)分布第2頁,共91頁,2023年,2月20日,星期一計量資料(復習)統(tǒng)計描述(statisticaldescription):對資料的屬性、特點進行的有關敘述、顯示、計算等,是統(tǒng)計推斷的基礎。描述必須基于資料的分布(distribution)類型,主要是資料的分布特征。分布類型不同,統(tǒng)計指標不同。第3頁,共91頁,2023年,2月20日,星期一分布:數值在所研究樣本(或總體)中的存在狀態(tài),通常用頻數(frequency)來表示。頻數:某變量值出現的次數(某現象發(fā)生的次數)。第4頁,共91頁,2023年,2月20日,星期一某市1995年110名7歲男童的身高(cm)頻數表第5頁,共91頁,2023年,2月20日,星期一身高(cm)某市1995年110名7歲男童的身高分布直方圖第6頁,共91頁,2023年,2月20日,星期一頻數表揭示頻數的兩個重要特征:集中趨勢(centraltendency):數值高低不等,但中等水平的人數最多。離散趨勢(tendencyofdispersion):數值之間參差不齊;逐漸變大(或變?。┑娜藬禎u少。向兩端分散。兩方面含義:數值大小和位置。第7頁,共91頁,2023年,2月20日,星期一集中趨勢centraltendency平均數(average):用于描述數值變量資料的集中趨勢(平均水平)。特點:簡明概括,便于比較。包括:算術平均數,幾何平均數,中位數,百分位數第8頁,共91頁,2023年,2月20日,星期一1、算術平均數(arithmeticmean)一組變量值之和除以變量值個數所得的商,簡稱均數。總體均數μ,樣本均數表示。適用條件:資料成正態(tài)分布(或近似正態(tài),或對稱分布)。計算方法:直接法,加權法第9頁,共91頁,2023年,2月20日,星期一直接法:當樣本的觀察值個數不多時,將各觀察值X1,X2,……,Xn相加再除以觀察值的個數n(樣本含量)即得均數。公式:第10頁,共91頁,2023年,2月20日,星期一加權法weightedmethod當觀察值個數較多時,可先將各觀察值分組歸納成頻數表,用加權法求均數。利用頻數表,計算組中值(為本組段的下限與相鄰較大組段的下限的均值),各組段頻數與組中值的乘積,近似等于該組變量值之和,各乘積之和除以總頻數,所得的商,就是均數。第11頁,共91頁,2023年,2月20日,星期一加權法計算算數均數的公式第12頁,共91頁,2023年,2月20日,星期一例題:計算算術均數直接法:略第13頁,共91頁,2023年,2月20日,星期一加權法第14頁,共91頁,2023年,2月20日,星期一均數的兩個重要屬性:(1)各離均差(各觀察值與均數之差)的總和等于零。(2)離均差的平方和小于各個觀察值X與任何數a()之差的平方和。均數是一組觀察值理想的代表值。第15頁,共91頁,2023年,2月20日,星期一均數的應用:(1)只能在合理分布的基礎上,對同質事物求均數才有意義,才能反映事物的特性。(2)均數最適用于對稱分布,尤其是正態(tài)分布資料。此時,均數位于分布的中央,能反映觀察值的集中趨勢。第16頁,共91頁,2023年,2月20日,星期一2、幾何均數geometricmeanG將n個觀察值的乘積再開n次方的方根(或各觀察值對數值均值的反對數)。適用條件:(1)觀察值為非對稱分布,差距較大,用算術均數表示其平均水平會受少數特大或特小值影響;第17頁,共91頁,2023年,2月20日,星期一(2)數值按大小順序排列后,各觀察值呈倍數關系或近似倍數關系。如:抗體滴度,藥物效價等幾何均數是算數均數的近似值。第18頁,共91頁,2023年,2月20日,星期一直接法:當觀察例數不多時采用。加權法:觀察例數多時采用。第19頁,共91頁,2023年,2月20日,星期一為什么滴度資料的幾何均數需校正?假設有13人接種疫苗后抗體滴度為:1/20,1/20,1/40,1/40,1/40,1/80,1/80,1/80,1/80,1/80,1/80,1/160,1/320可以證明,這種取下限值的計算,會使得到的幾何均數偏小,即:幾何均數在取反對數之前偏小半個組距(在作d倍稀釋時就是1/2lgd)。第20頁,共91頁,2023年,2月20日,星期一幾何均數的應用:(1)常用于等比級數資料,滴度,效價,衛(wèi)生事業(yè)平均發(fā)展速度,人口幾何增長,對數正態(tài)分布資料;(2)觀察值不能有0;(3)觀察值不能同時有正值和負值。(4)同一組資料求得的幾何均數小于算術均數。第21頁,共91頁,2023年,2月20日,星期一幾何均數的計算3,4,5,6,17,算數均數:幾何均數:第22頁,共91頁,2023年,2月20日,星期一3、中位數(median,M):位于中間位置上的數值。把一組觀察值,按大小順序排列,位置居中的變量值(奇數個)或位置居中的兩個變量值的均值(偶數個)。是位置指標,以中位數為界,將觀察值分為兩半,有一半比它大,一般比它小。第23頁,共91頁,2023年,2月20日,星期一中位數適用于:(1)資料偏態(tài)分布;(2)兩端無確定數值;(3)資料分布不清楚;潛伏期,毒物測定值等用中位數表示其集中趨勢。第24頁,共91頁,2023年,2月20日,星期一中位數的算法:未分組資料,依變量個數定。
第25頁,共91頁,2023年,2月20日,星期一分組資料,用下公式。L:中位數所在組的下限W:中位數所在組的寬度f:中位數所在組的頻數(例數)n:總頻數C:中位數所在組的前一組的累計頻數第26頁,共91頁,2023年,2月20日,星期一中位數常用于描述偏態(tài)分布資料的集中趨勢,它反映居中位置的變量值的大小。不受特大,特小值的影響,只受位置居中的觀察值的影響,因而不夠敏感。
而均數,幾何均數是由全部觀察值綜合計算出的,敏感性好。理論上,中位數等于算術均數。第27頁,共91頁,2023年,2月20日,星期一例題:
中位數的計算P24
第28頁,共91頁,2023年,2月20日,星期一4、百分位數(percentile,P):位于某個百分位置上的數值。把一組數據從小到大排列,分成100等份,各等份含1%的觀察值,處在分割界線上的數值,就是百分位數,Pr表示。第29頁,共91頁,2023年,2月20日,星期一百分位數將總體或樣本的全部觀察值分為兩部分,理論上有r%的觀察值比它小,有(100-r)%的觀察值比它大。如含量為n的樣本,P5即表示:理論上有n5%個觀察值比P5小,有n95%個觀察值比P5大。常用的百分位數:5,25,75,95分位數。第30頁,共91頁,2023年,2月20日,星期一百分位數頻數表法計算:Pr:百分位數;L:該百分位數所在組段的下限;W:組距;f:該百分位數所在組段的頻數;C:小于L的各組段的累積頻數;n:樣本數中位數是特殊的百分位數。第31頁,共91頁,2023年,2月20日,星期一第32頁,共91頁,2023年,2月20日,星期一圖解法計算百分位數也可用圖解法:橫軸:變量值;縱軸:累計百分數p25第33頁,共91頁,2023年,2月20日,星期一百分位數常用于描述一組資料在某百分位置上的水平和分布特征。多個百分位數結合使用,可更全面地描述總體或樣本的分布特征,包括位置大小和變異度。第34頁,共91頁,2023年,2月20日,星期一例題:百分位數的計算,P25第35頁,共91頁,2023年,2月20日,星期一百分位數常用于確定醫(yī)學正常值范圍(normalrange)。醫(yī)學正常值范圍,不用樣本觀察值的極差,習慣上用包括95%正常人的界值,百分位數是數列的百分界值。如:白細胞數的確定,過高,過低都屬異常,故計算P2.5,P97.5,為雙側的正常值范圍。第36頁,共91頁,2023年,2月20日,星期一如:肺活量95%正常值范圍,只有過低算異常,故計算P5.如:尿鉛,過高為異常,故計算P95.第37頁,共91頁,2023年,2月20日,星期一一般地說,分布中部的百分位數相當穩(wěn)定,具有較好代表性,靠近兩端的百分位數,只在樣本含量足夠大時,才穩(wěn)定,故樣本量不夠大時,不應取太近兩端的百分位數。以上是集中趨勢指標。第38頁,共91頁,2023年,2月20日,星期一腦筋急轉彎:
請看下面數據,有問題嗎?A:89101112B:37101317兩組均數都為10,但離散程度不同,B組較大。均數只反映平均水平,不能反映離散度。第39頁,共91頁,2023年,2月20日,星期一離散趨勢tendencyofdispersion全距,四分位數間距,方差,標準差,變異系數。全距(Range):極大與極小值之差。全距大,資料離散程度大,但易受極端值大小的影響。樣本量越大,抽到極端值的可能性越大,全距可能會越大。故:全距不宜單獨使用。第40頁,共91頁,2023年,2月20日,星期一
四分位數間距(quartileintervalQ):將一組資料分為四等份,上四分位數P75和下四分位數P25之差,叫四分位數間距。意義:Q越大,離散程度越大,通常用于描述偏態(tài)分布資料的離散程度。第41頁,共91頁,2023年,2月20日,星期一優(yōu)點:比全距穩(wěn)定;若資料一端或兩端無確切數值,只能選擇Q作為離散指標。
缺點:未考慮全部觀察值,不能全面反映資料離散趨勢。第42頁,共91頁,2023年,2月20日,星期一方差(variance)和標準差(standarddeviationSD)對總體而言,為了克服極差和四分位數間距的缺點,要描述資料的離散趨勢,必須考慮到各個觀察值,離均差的平方和是最好的指標,
第43頁,共91頁,2023年,2月20日,星期一總體方差:樣本方差:為了消除例數的影響,其取均值,就是方差。第44頁,共91頁,2023年,2月20日,星期一標準差:方差的平方根的正值??傮w的標準差:樣本的標準差:自由度=n-1第45頁,共91頁,2023年,2月20日,星期一自由度:一組數據中可以自由取值的數據的個數。當樣本數據的個數為n時,若樣本均值x確定后,只有n-1個數據可以自由取值,其中必有一個數據則不能自由取值。第46頁,共91頁,2023年,2月20日,星期一樣本方差除以自由度,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量.第47頁,共91頁,2023年,2月20日,星期一樣本的標準差:第48頁,共91頁,2023年,2月20日,星期一第49頁,共91頁,2023年,2月20日,星期一xx21181392412214884989604104108161221488412214884686(合計)78996(合計)血紅蛋白數據標準差的計算:第50頁,共91頁,2023年,2月20日,星期一分組資料的標準差計算第51頁,共91頁,2023年,2月20日,星期一方差,標準差意義:方差,標準差越大,變異程度越大。其值越小,觀察值的離散度越小,用均數反映平均水平的代表性越好。第52頁,共91頁,2023年,2月20日,星期一了解一下:離均差平方和是表示某變量總變異的一種形式,即:第53頁,共91頁,2023年,2月20日,星期一關于離均差平方和的三條規(guī)則1、原始數據加(減)一個數,離均差平方和或積和不變。2、原始數據除以一個數,則簡化計算出的離均差平方和要乘上該數的平方。3、如將兩變量之一除以一個數,則離均差積和要乘以該數;如同時另一變量也除以一個數,則離均差積和要同時乘上該兩數。第54頁,共91頁,2023年,2月20日,星期一標準差應用(1)反映一組觀察值的離散程度:
直接比較標準差:數值單位相同;計算變異系數:數值單位不同;第55頁,共91頁,2023年,2月20日,星期一變異系數(coefficientofvariation,CV)也稱離散系數(coefficientofdispersion)標準差與均數之比用百分數表示。公式:第56頁,共91頁,2023年,2月20日,星期一常用于比較度量單位不同或均數相差懸殊的資料的變異。同時考慮了均數和標準差,更客觀。比如:身高,體重的變異比較;第57頁,共91頁,2023年,2月20日,星期一(2)估計變量值的頻數分布正態(tài)曲線,正態(tài)分布normaldistribution正態(tài)分布標準正態(tài)分布面積(或概率)μ-1σ~μ+1σ-1~+168.27%μ–1.96σ~μ+1.96σ-1.96~+1.9695.00%μ–2.58σ~μ+2.58σ-2.58~+2.5899.00%第58頁,共91頁,2023年,2月20日,星期一(3)計算標準誤(4)估計醫(yī)學正常值范圍:雙側:均數±1.96倍標準差單側:均數±1.645倍標準差第59頁,共91頁,2023年,2月20日,星期一概念:又稱高斯分布。頻數分布以均數為中心,左右兩側基本對稱,靠近均數兩側頻數較多,離均數愈遠,頻數愈少,形成一個中間多,兩側逐漸減少,基本對稱的分布。是一種連續(xù)型分布。正態(tài)分布(normaldistribution)第60頁,共91頁,2023年,2月20日,星期一當樣本量擴大,組段分細,頻數分布圖中的直條變窄,表現出中間高,兩側逐漸降低,并完全對稱的特點;如果將各直條頂端的中點連線,就接近于一條光滑的曲線,稱為正態(tài)曲線。用N(μ,)表示,其位置與均數有關,形狀與標準差有關。第61頁,共91頁,2023年,2月20日,星期一醫(yī)學現象許多呈正態(tài)分布,或近似正態(tài)分布。如:正常人的生理,生化指標變量,等。第62頁,共91頁,2023年,2月20日,星期一高斯(JohannCarlFriedrichGauss)生于1777年4月30日于不倫瑞克,卒于1855年2月23日于哥廷根,德國著名數學家、天文學家、大地測量學家、物理學家。被認為是最重要的數學家,并有數學王子的美譽。第63頁,共91頁,2023年,2月20日,星期一第64頁,共91頁,2023年,2月20日,星期一對稱分布正(右)偏分布負(左)偏分布幾種常見的頻數分布第65頁,共91頁,2023年,2月20日,星期一正態(tài)分布之所以重要,原因很多,三個主要的原因:1.正態(tài)分布在分析上較易處理。2.正態(tài)分布之p.d.f.的圖形為鐘形曲線(bell-shapedcurve),再加上對稱性,使得很適合當做不少事件之機率模式。3.正態(tài)分布可當做不少大樣本的近似分布。概率密度函數(p.d.f.,probabilitydensityfunction)描述了隨機變量的機率分布,為累積分布函數的導函數。
第66頁,共91頁,2023年,2月20日,星期一概率密度函數(p.d.f.,probabilitydensityfunction)對于一維實隨機變量X,任何一個滿足下列條件的函數fX(x)都可以被定義為其概率密度函數:
隨機變量X在區(qū)間上的概率可以由其概率密度函數的定積分表示:而是X的累積分布函數,顯然概率密度函數是它的導函數。第67頁,共91頁,2023年,2月20日,星期一從直方圖到正態(tài)曲線的過渡第68頁,共91頁,2023年,2月20日,星期一正態(tài)分布的兩個參數:μ,決定了曲線的形狀和位置第69頁,共91頁,2023年,2月20日,星期一第70頁,共91頁,2023年,2月20日,星期一正態(tài)分布的密度函數(概率密度函數probabilitydensityfunction,p.d.f):式中μ為均數;σ為標準差;π為圓周率;е為自然對數的底,即2.71828。以上均為常數,僅x為變量。第71頁,共91頁,2023年,2月20日,星期一標準正態(tài)分布:為了應用方便,常將式進行變量變換,u變換,u變換后,μ=0,σ=1,使原來的正態(tài)分布變換為標準正態(tài)分布(SND,standardnormaldistribution)亦稱u分布。第72頁,共91頁,2023年,2月20日,星期一標準正態(tài)分布的概率密度函數:正態(tài)分布曲線的模擬第73頁,共91頁,2023年,2月20日,星期一正態(tài)分布的特征和分布規(guī)律:(1)曲線在x軸的上方,與x軸不相交,當x=μ時,曲線位于最高點。(2)曲線關于直線x=μ左右對稱。(3)正態(tài)分布有兩個參數:均數,標準差;標準正態(tài)的參數分別為:0,1(4)正態(tài)曲線在1σ,標準正態(tài)曲線在1處各有一個拐點,(5)正態(tài)分布的面積分布有一定規(guī)律。第74頁,共91頁,2023年,2月20日,星期一正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下,橫軸上一定區(qū)間的面積,等于該區(qū)間的頻數發(fā)生的概率。面積可用積分求得。F(x)為正態(tài)變量X的累計分布函數,反映正態(tài)曲線下,自-到x的面積,即左側累計面積。第75頁,共91頁,2023年,2月20日,星期一第76頁,共91頁,2023年,2月20日,星期一統(tǒng)計學家已經按(4)編成了附表,標準正態(tài)分布曲線下的面積。應用時注意:(1)當總體μ,σ已知時,先計算u值,再用u值查表,得出所求區(qū)間面積占總面積的比例。如果未知,常分別用樣本均數和樣本標準差來估計。(2)曲線下對稱于0的區(qū)間,面積相等。如:區(qū)間(,-2.58)與區(qū)間(2.58,)的面積相等。(3)曲線下橫軸上的總面積為100%或為1。根據后兩個特征,可計算右側累計面積。正態(tài)分布表的用法P545第77頁,共91頁,2023年,2月20日,星期一單側,雙側的概念:以均數為對稱軸,只考慮低于(或高于)某值,為單側;若關心數值可高,可低,為雙側。第78頁,共91頁,2023年,2月20日,星期一正態(tài)分布標準正態(tài)分布面積(或概率)μ-1σ__μ+1σ-1__+168.27%μ–1.96σ__μ+1.96σ-1.96__+1.9695.00%μ–2.58σ__μ+2.58σ-2.58__+2.5899.00%正態(tài)分布和標準正態(tài)分布曲線下面積分布規(guī)律第79頁,共91頁,2023年,2月20日,星期一標準正態(tài)曲線下任意區(qū)間的面積有規(guī)律第80頁,共91頁,2023年,2月20日,星期一(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%雙側概率第81頁,共91頁,2023年,2月20日,星期一單側概率第82頁,共91頁,2023年,2月20日,星期一正態(tài)曲線下面積的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動勞動合同范本
- 廣東省廉江市實驗學校高中政治 8.2 征稅和納稅說課稿(必修1)
- 倉庫長期保管合同范本
- 廚房定制合同范例
- 基礎分包合同范例
- 全日制勞務合同范例
- 唐山勞務合同范本定制
- 公司還債合同范本
- 保密條款 英文合同范本
- 代理工地合同范例
- 七上 U2 過關單 (答案版)
- 五年級上冊小數遞等式計算200道及答案
- 口腔頜面外科:第十六章-功能性外科與計算機輔助外科課件
- 信用證審核課件
- 植物工廠,設計方案(精華)
- 原發(fā)性膽汁性肝硬化(PBC)課件
- 貸款新人電銷話術表
- 音箱可靠性測試規(guī)范
- 社區(qū)經濟基本內涵及我國社區(qū)經濟發(fā)展現狀
- 數據結構ppt課件完整版
- 新北師大版四年級下冊小學數學全冊導學案(學前預習單)
評論
0/150
提交評論