正態(tài)分布及抽樣誤差_第1頁(yè)
正態(tài)分布及抽樣誤差_第2頁(yè)
正態(tài)分布及抽樣誤差_第3頁(yè)
正態(tài)分布及抽樣誤差_第4頁(yè)
正態(tài)分布及抽樣誤差_第5頁(yè)
已閱讀5頁(yè),還剩69頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

正態(tài)分布及其應(yīng)用Normaldistribution

anditsapplications

統(tǒng)計(jì)學(xué)中最重要的理論分布之一

1可編輯版正態(tài)分布(Normaldistribution)法國(guó)概率論學(xué)者狄莫弗德國(guó)數(shù)學(xué)家Gauss最早用于物理學(xué)、天文學(xué)

Gaussiandistribution2233可編輯版4為什么如此擺放獎(jiǎng)品?平時(shí),我們很少有人會(huì)去關(guān)心小球下落位置的規(guī)律性,人們可能不相信它是有規(guī)律的。

高爾頓釘板試驗(yàn)

正態(tài)分布的背景-一個(gè)街頭賭博游戲4可編輯版5Ox-8-7

-6

-5

-4

-3

-2

-1

12345678這條曲線就是我們將要介紹的正態(tài)分布曲線。正態(tài)分布的背景-高爾頓釘板試驗(yàn)5可編輯版612413214014815616400.100.200.300.40頻率圖某市120名12歲男童身高(cm)的頻數(shù)分布6可編輯版組段頻數(shù)頻率

124~ 1 0.0083

128~ 2 0.0167

132~ 10 0.0833

136~ 22 0.1834

140~ 37 0.3083

144~ 26 0.2167

148~ 15 0.1250

152~ 4 0.0333

156~ 2 0.0167

160~164 1 0.0083合計(jì) 120 1.00007極差=160.9-125.9=35分10組,組距=極差/10=35/10=3.5,組距取4下界124,上界1647可編輯版8身高的分布8可編輯版正態(tài)分布的概率密度函數(shù)

如果隨機(jī)變量X的概率密度函數(shù)

則稱(chēng)X服從正態(tài)分布,記作X~N(,2),其中,為分布的均數(shù),為分布的標(biāo)準(zhǔn)差。

(-∞<X

<+∞)

9可編輯版正態(tài)分布圖示x0.1.2.3.4f(x)10可編輯版方差相等、均數(shù)不等的正態(tài)分布圖示31211可編輯版均數(shù)相等、方差不等的正態(tài)分布圖示21312可編輯版正態(tài)分布的特征正態(tài)分布有兩個(gè)參數(shù)(parameter),即位置參數(shù)(均數(shù))和變異度參數(shù)(標(biāo)準(zhǔn)差)。高峰在均數(shù)處;均數(shù)兩側(cè)完全對(duì)稱(chēng)。正態(tài)曲線下的面積分布有一定的規(guī)律。13可編輯版正態(tài)曲線下的面積規(guī)律X軸與正態(tài)曲線所夾面積恒等于1。對(duì)稱(chēng)區(qū)域面積相等。S(-,

-X)S(

+X,)=S(-,-X)X14可編輯版正態(tài)曲線下的面積規(guī)律對(duì)稱(chēng)區(qū)域面積相等。S(-x1,-x2)-x1

-x2

x2

x1S(x1,x2)=S(-x2,-x1)15可編輯版正態(tài)曲線下的面積規(guī)律

-4-3-2-101234-3-2-++2+3

S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.8413S(-,)=116可編輯版正態(tài)曲線下的面積規(guī)律

-4-3-2-101234-3-2-++2+3

1-S(-3

,+3)=0.00261-S(-2

,+2)=0.04561-S(-

,+)=0.317417可編輯版正態(tài)曲線下的面積規(guī)律-3-2-++2+3

S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0215S(-2,-1)=0.1359S(-1,)=0.3413

-4-3-2-10123418可編輯版正態(tài)曲線下的面積規(guī)律-1.96+1.962.5%2.5%95%19可編輯版正態(tài)曲線下的面積規(guī)律-1.64+1.645%5%90%20可編輯版正態(tài)曲線下的面積規(guī)律-2.58+2.580.5%0.5%99%21可編輯版S(-1.96,+1.64)=?思考22可編輯版正態(tài)曲線下的面積規(guī)律正態(tài)曲線下面積總和為1;正態(tài)曲線關(guān)于均數(shù)對(duì)稱(chēng);對(duì)稱(chēng)的區(qū)域內(nèi)面積相等;對(duì)任意正態(tài)曲線,按標(biāo)準(zhǔn)差為單位,對(duì)應(yīng)的面積相等;-1.64~+1.64內(nèi)面積為90%;-1.96~+1.96內(nèi)面積為95%;-2.58~+2.58內(nèi)面積為99%。小于-3的面積為0.13%;小于-2的面積為2.28%;小于-的面積為15.87%。23可編輯版標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)是均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。記為N(0,1)。標(biāo)準(zhǔn)正態(tài)分布是一條曲線。概率密度函數(shù):

(-∞<u

<+∞)

24可編輯版正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布若

X~N(,2),作變換:

則u服從標(biāo)準(zhǔn)正態(tài)分布。u稱(chēng)為標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)25標(biāo)準(zhǔn)正態(tài)分布曲線下面積(u)

u 0.00 0.02 0.04 0.06 0.08-3.0 0.0013 0.0013 0.0012 0.0011 0.0010-2.5 0.0062 0.0059 0.0055 0.0052 0.0049-2.0 0.0228 0.0217 0.0207 0.0197 0.0188-1.9 0.0287 0.0274 0.0262 0.0250 0.0239-1.6 0.0548 0.0526 0.0505 0.0485 0.0465-1.0 0.1587 0.1539 0.1492 0.1446 0.1401-0.5 0.3085 0.3015 0.2946 0.2877 0.28100 0.5000 0.4920 0.4840 0.4761 0.46810u26可編輯版正態(tài)分布的應(yīng)用估計(jì)頻數(shù)分布質(zhì)量控制確定臨床參考值范圍27可編輯版估計(jì)頻數(shù)分布某項(xiàng)目研究嬰兒的出生體重服從正態(tài)分布,其均數(shù)為3150g,標(biāo)準(zhǔn)差為350g。若以2500g作為低體重兒,試估計(jì)低體重兒的比例。首先計(jì)算標(biāo)準(zhǔn)離差:查標(biāo)準(zhǔn)正態(tài)分布表:(-1.86)=0.0314結(jié)果:估計(jì)低體重兒的比例為3.14%.28可編輯版質(zhì)量控制質(zhì)量控制的意義監(jiān)控日常工作、科研過(guò)程、生產(chǎn)過(guò)程中誤差的變化,分析變化的趨勢(shì)是否出現(xiàn)異常,從而引起警覺(jué)和注意,以便分析原因,并及時(shí)采取措施。29可編輯版參考值范圍(referenceinterval)參考值范圍又稱(chēng)正常值范圍(normalrange)。什么是參考值范圍:是絕大多數(shù)正常人的某觀察指標(biāo)所在的范圍。絕大多數(shù):90%,95%,99%等等。確定參考值范圍的意義:用于判斷正常與異常。“正常人”的定義:排除了影響所研究的指標(biāo)的疾病和有關(guān)因素的同質(zhì)的人群。30可編輯版參考值范圍確定的原則選定同質(zhì)的正常人作為研究對(duì)象控制檢測(cè)誤差判斷是否分組(性別,年齡組)選擇百分界值(90%,95%)確定可疑范圍單、雙側(cè)問(wèn)題31可編輯版單側(cè)與雙側(cè)參考值范圍根據(jù)醫(yī)學(xué)專(zhuān)業(yè)知識(shí)確定!雙側(cè):白細(xì)胞計(jì)數(shù),血清總膽固醇,單側(cè):上限:轉(zhuǎn)氨酶,尿鉛,發(fā)汞……

下限:肺活量,IQ,32可編輯版參考值范圍的估計(jì)方法方法 雙側(cè) 單側(cè)下限 單側(cè)上限正態(tài)分布法33可編輯版例20~

29歲正常成年男子尿酸濃度求雙側(cè)95%的參考值范圍:下限上限34可編輯版總結(jié)正態(tài)分布是描述個(gè)體變異的重要分布之一,也是統(tǒng)計(jì)學(xué)理論中的重要分布之一;正態(tài)分布是一簇分布,由兩個(gè)參數(shù)決定:均數(shù)和標(biāo)準(zhǔn)差;正態(tài)分布曲線下的面積是有規(guī)律的,且與標(biāo)準(zhǔn)正態(tài)分布曲線下的面積對(duì)應(yīng)(以標(biāo)準(zhǔn)正態(tài)離差為單位)。35可編輯版需要掌握的內(nèi)容正態(tài)分布的性質(zhì)正態(tài)曲線下面積的分布規(guī)律參考值范圍確定的原則和方法36可編輯版抽樣誤差及其規(guī)律性Samplingvariability

anditsattributes37可編輯版從一個(gè)例子來(lái)談抽樣誤差假如事先知道某地七歲男童的平均身高為119.41cm。研究者從所有符合要求的七歲男童中每次抽取100人,共計(jì)抽取了五次。3838122.7121.0118.1108.3124.5121.1115.8120.9117.9……39μ=119.4cmσ

=4.38cm=118.4cmS=4.41cm119.4u3940μ=119.41cmσ=4.38cm40可編輯版導(dǎo)致總體均數(shù)與樣本均數(shù)、樣本均數(shù)之間有差別的可能原因是?4141可編輯版抽樣誤差的定義五次抽樣得到了不同的結(jié)果,原因何在?42個(gè)體變異隨機(jī)抽樣不同男童的身高不同每次抽到的人幾乎不同抽樣誤差42可編輯版抽樣誤差的表現(xiàn)43抽樣誤差的表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別樣本均數(shù)和樣本均數(shù)間的差別43可編輯版抽樣誤差定義:由于個(gè)體變異的存在,由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別。原因:個(gè)體變異+抽樣表現(xiàn):不同樣本統(tǒng)計(jì)量間的差別樣本統(tǒng)計(jì)量與總體參數(shù)間的差別抽樣誤差是不可避免的!抽樣誤差是有規(guī)律的!44★★★★★44可編輯版均數(shù)的抽樣誤差之特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)間存在差異;樣本均數(shù)的分布很有規(guī)律;4545可編輯版中心極限定理(centrallimittheorem)Case1:

從正態(tài)分布總體N(μ,σ)

中隨機(jī)抽樣(每個(gè)樣本的含量為n[如10]),可得無(wú)限多個(gè)樣本[如1000次],每個(gè)樣本計(jì)算樣本均數(shù),則樣本均數(shù)也服從正態(tài)分布。樣本均數(shù)的均數(shù)為μ;樣本均數(shù)的標(biāo)準(zhǔn)差為。4646可編輯版中心極限定理(centrallimittheorem)Case2:

從非正態(tài)分布總體(均數(shù)為μ,方差為σ)中隨機(jī)抽樣(每個(gè)樣本的含量為n),可得無(wú)限多個(gè)樣本,每個(gè)樣本計(jì)算樣本均數(shù),則只要抽樣次數(shù)足夠大(n>50),樣本均數(shù)也近似服從正態(tài)分布。樣本均數(shù)的均數(shù)為μ;樣本均數(shù)的標(biāo)準(zhǔn)差為。4747可編輯版標(biāo)準(zhǔn)誤(standarderror)樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱(chēng)為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)差稱(chēng)為均數(shù)的標(biāo)準(zhǔn)誤。均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的變異度。前者稱(chēng)為理論標(biāo)準(zhǔn)誤,后者稱(chēng)為樣本標(biāo)準(zhǔn)誤。48這個(gè)公式是怎么來(lái)的?48可編輯版已知變量x的方差V(x)=S2,則2x的方差為?已知變量x1的方差V(x1)=S12,變量x2的方差V(x2)=S22,則x1+x2的方差為?4949可編輯版標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差(1)聯(lián)系:都表示變異的大??;樣本含量一定時(shí),標(biāo)準(zhǔn)差越大,標(biāo)準(zhǔn)誤越大。50可編輯版標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差(2)標(biāo)準(zhǔn)差含義:一組變量值離散程度;標(biāo)準(zhǔn)差越小,均數(shù)的代表性越好;應(yīng)用:估計(jì)參考值范圍;與n的關(guān)系:樣本含量越大,標(biāo)準(zhǔn)差越穩(wěn)定,n很大時(shí),標(biāo)準(zhǔn)差趨向于總體標(biāo)準(zhǔn)差。51可編輯版標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差(3)標(biāo)準(zhǔn)誤含義:樣本統(tǒng)計(jì)量的離散程度;標(biāo)準(zhǔn)誤越小,用樣本均數(shù)來(lái)反映總體均數(shù)越可靠;應(yīng)用:計(jì)算可信區(qū)間;與n的關(guān)系:樣本含量越大,均數(shù)的標(biāo)準(zhǔn)誤越小,n很大時(shí),標(biāo)準(zhǔn)誤趨向于0。52可編輯版53

SamplingDistributionofsamplemeansSamplingDistributionofsamplemeans

SamplingDistributionofsamplemeansPopulationBX

XPopulationC

XPopulationDXPopulationAn=10n=4n=25n=2SamplingDistributionofsamplemeans樣本均數(shù)的抽樣分布

53與樣本含量的關(guān)系n

越大,均數(shù)的均數(shù)就越接近總體均數(shù);n越大,變異越小,分布越窄;對(duì)稱(chēng)分布接近正態(tài)分布的速度,大于非對(duì)稱(chēng)分布。分布越偏,接近正態(tài)分布所需樣本含量就越大。5454可編輯版抽樣誤差的規(guī)律性(1)均數(shù)的抽樣誤差規(guī)律:在樣本含量足夠大時(shí),無(wú)論總體分布如何,其均數(shù)的分布趨于正態(tài)分布5555可編輯版56

f(t)(標(biāo)準(zhǔn)正態(tài)曲線)

=30.10.2-4-3-2-1012340.3如果樣本含量較小時(shí)均數(shù)的抽樣分布?56可編輯版t分布5757可編輯版正態(tài)分布的標(biāo)準(zhǔn)化變化若X~N(μ,σ2),則。58因,則。58可編輯版t

分布的概念實(shí)際工作中,總體方差未知。所以,用樣本方差代替總體方差,且當(dāng)樣本含量較小時(shí)的分布如何?5959可編輯版t分布起源6060t

分布的概念用樣本方差代替總體方差,此時(shí)不服從正態(tài)分布。而服從

t分布。記為:6161可編輯版62

f(t)

=∞(標(biāo)準(zhǔn)正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3自由度分別為1、5、∞時(shí)的

t分布62可編輯版t分布的性質(zhì)t分布為一簇單峰分布曲線。t分布以0為中心,左右對(duì)稱(chēng)。分布的高峰位置比u分布低,尾部高。即相同的尾部面積對(duì)應(yīng)的界值,比u分布大。例如:P=0.05,u=1.64,而自由度為3的t分布界值,t=3.182。t分布與自由度有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無(wú)窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表。63可編輯版t界值表單側(cè):

P(t<=-tα,ν)=α或

P(t>=tα,ν)=α雙側(cè):

P(t<=-tα,ν)+P(t>=tα,ν)=α

即:P(-tα,ν<t<tα,ν)=1-α[例]查t界值表得t值表達(dá)式

t0.05,10=2.228(雙側(cè))

t0.05,10=1.812(單側(cè))-tt064t

分布曲線下面積雙側(cè):t0.05,10=2.228

表明,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,由該樣本計(jì)算的t值大與等于2.228的概率為0.025,小于等于-2.228的概率亦為0.025

P(t≤-2.228)+P(t≥2.228)=0.05

或:P(-2.228<t

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論