統(tǒng)計量及抽樣分布課件_第1頁
統(tǒng)計量及抽樣分布課件_第2頁
統(tǒng)計量及抽樣分布課件_第3頁
統(tǒng)計量及抽樣分布課件_第4頁
統(tǒng)計量及抽樣分布課件_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章統(tǒng)計量及其抽樣分布PowerPoint統(tǒng)計學(xué)2008年8月第六章統(tǒng)計量及其抽樣分布PowerPoint統(tǒng)計學(xué)206.1統(tǒng)計量6.1.1統(tǒng)計量的概念6.1.2常用統(tǒng)計量6.1.3次序統(tǒng)計量6.1.4充分統(tǒng)計量6.1統(tǒng)計量6.1.1統(tǒng)計量的概念參數(shù)和統(tǒng)計量參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值一個總體的參數(shù):總體均值()、標(biāo)準(zhǔn)差()、總體比例();兩個總體參數(shù):(1-2)、(1-2)、(1/2)總體參數(shù)通常用希臘字母表示統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)一個總體參數(shù)推斷時的統(tǒng)計量:樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等兩個總體參數(shù)推斷時的統(tǒng)計量:(x1-x2)、(p1-p2)、(s1/s2)樣本統(tǒng)計量通常用小寫英文字母來表示2008年8月參數(shù)和統(tǒng)計量參數(shù)(parameter)2008年8月常用統(tǒng)計量樣本均值樣本方差樣本標(biāo)準(zhǔn)差2008年8月常用統(tǒng)計量樣本均值樣本方差樣本標(biāo)準(zhǔn)差2008年8月常用統(tǒng)計量樣本變異系數(shù)K階距K階中心距2008年8月常用統(tǒng)計量樣本變異系數(shù)K階距K階中心距2008年8月次序統(tǒng)計量哪些是次序統(tǒng)計量:中位數(shù)、分位數(shù)、四分位數(shù)、極差和均值次序統(tǒng)計量哪些是次序統(tǒng)計量:充分統(tǒng)計量統(tǒng)計計量加工過程中一點信息都不損失的統(tǒng)計量通常稱為充分統(tǒng)計量。充分統(tǒng)計量統(tǒng)計計量加工過程中一點信息都不損6.2關(guān)于分布的幾個概念6.2.1抽樣分布6.2.2漸近分布6.2.3隨機(jī)模擬獲得的近似分布6.2關(guān)于分布的幾個概念6.2.1抽樣分布樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機(jī)變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)2008年8月樣本統(tǒng)計量的概率分布,是一種理論分布抽樣分布

(sampl抽樣分布的形成過程

(samplingdistribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本抽樣分布的形成過程

(samplingdistribut漸近分布當(dāng)n較大時,就用極限分布作為抽樣分布的一種近似,這種極限分布稱為漸近分布。漸近分布當(dāng)n較大時,就用極限分布作為抽樣分2分布2分布由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則y服從自由度為1的2分布,即對于n個正態(tài)隨機(jī)變量y1,y2,yn,則隨機(jī)變量稱為具有n個自由度的2分布,記為c2-分布

(2-distribution)2008年8月由阿貝(Abbe)于1863年首先給出,后來由海爾墨特(H不同自由度的c2-分布c2n=1n=4n=10n=202008年8月不同自由度的c2-分布c2n=1n=4n=10n=2020分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布c2-分布

(性質(zhì)和特點)2008年8月分布的變量值始終為正c2-分布

(性質(zhì)和特點)2008年8c2-分布

(用Excel計算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom)

,其中df為自由度,x,是隨機(jī)變量的取值利用【CHIINV】函數(shù)則可以計算給定右尾概率和自由度時相應(yīng)的反函數(shù)值語法:CHIINV(probability,degrees_freedom)

用Excel計算c2分布的概率2008年8月c2-分布

(用Excel計算c2分布的概率)利用Excel2008年8月2008年8月t分布t分布t-分布

(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z2008年8月t-分布

(t-distribution)提出者是Willt分布臨界值—t分布的上α分位點t

α(n)αtα(n)n>45,t

α(n)≈zαZα為標(biāo)準(zhǔn)正態(tài)分布上α分位點t1-α=-t

αα2008年8月t分布臨界值—t分布的上α分位點tα(n)αtα(n)n>結(jié)論1:設(shè)總體X服從正態(tài)分布N(μ,σ2),σ2未知.(x1,x2,…xn)為來自該總體的樣本,則統(tǒng)計量兩個重要結(jié)論2008年8月結(jié)論1:兩個重要結(jié)論2008年8月結(jié)論2:設(shè)總體X服從正態(tài)分布N(μ1,σ2)總體Y服從正態(tài)分布N(μ2,σ2)(σ2未知),X與Y獨立,且X1,X2,…,Xn1和Y1,Y2,…,Yn2分別是來自總體X和Y的樣本,則統(tǒng)計量兩個重要結(jié)論2008年8月結(jié)論2:兩個重要結(jié)論2008年8月2008年8月2008年8月t-分布

(用Excel計算t分布的概率和臨界值)利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自由度時分布的概率值語法:TDIST(x,degrees_freedom,tails)

利用【TINV】函數(shù)則可以計算給定概率和自由度時的相應(yīng)

語法:TINV(probability,degrees_freedom)用Excel計算t分布的臨界值2008年8月t-分布

(用Excel計算t分布的概率和臨界值)利用ExcF分布2008年8月F分布2008年8月為紀(jì)念統(tǒng)計學(xué)家費希爾(R.A.Fisher)

以其姓氏的第一個字母來命名則設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為F-分布

(F

distribution)2008年8月為紀(jì)念統(tǒng)計學(xué)家費希爾(R.A.Fisher)以其姓氏的第一不同自由度的F分布F(1,10)(5,10)(10,10)2008年8月不同自由度的F分布F(1,10)(5,10)(10,10)2F分布的上α分位點F

α(n1,n2)αFα(n1,n2)2008年8月F分布的上α分位點Fα(n1,n2)αFα(n1,n2)2~F(n1―1,n2―1)其中s12和s22分別是總體X和Y的樣本方差。

F分布在假設(shè)檢驗、區(qū)間估計、方差分析、回歸分析及試驗設(shè)計等領(lǐng)域有重要的應(yīng)用設(shè)總體X~N(μ1,σ12),Y~N(μ2,σ22),X與Y獨立,且X1,X2,…,Xnl與Y1,Y2,…,Yn2分別是來自總體X和Y的樣本,則統(tǒng)計量F=一個重要結(jié)論2008年8月設(shè)總體X~N(μ1,σ12),Y~N(μ2,F(xiàn)-分布

(用Excel計算F分布的概率和臨街值)利用Excel提供的【FDIST】統(tǒng)計函數(shù),計算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計算給定單尾概率和自由度時的相應(yīng)

語法:

FINV(probability,degrees_freedom1,degrees_freedom2)

用Excel計算F分布的概率2008年8月F-分布

(用Excel計算F分布的概率和臨街值)利用Exc2008年8月2008年8月樣本均值的分布與中心極限定理樣本均值的分布與中心極限定理在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的分布2008年8月在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相樣本均值的分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差2008年8月樣本均值的分布

(例題分析)【例】設(shè)一個總體,含有4個元素(樣本均值的分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)2008年8月樣本均值的分布

(例題分析)現(xiàn)從總體中抽取n=2的簡單樣本均值的分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.52008年8月樣本均值的分布

(例題分析)計算出各樣本的均值,如下表樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布樣本均值分布比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/n2008年8月樣本均值的分布與總體分布的比較

(例題分析)=2樣本均值的分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x的期望值為μ,方差為σ2/n。即x~N(μ,σ2/n)2008年8月樣本均值的分布

與中心極限定理=50=10X總體分中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x2008年8月中心極限定理

(centrallimittheorem)中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程2008年8月中心極限定理

(centrallimittheorem抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布2008年8月抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣樣本均值的分布

(實例)解:根據(jù)中心極限定理,不論總體的分布是什么形狀,在假定總體分布不是很偏的情形下,當(dāng)從總體中隨機(jī)選取n=36的樣本時,樣本均值x的分布近似服從均值x==10、標(biāo)準(zhǔn)差的正態(tài)分布,即

X~N(10,0.12)

【例6.4】設(shè)從一個均值=10、標(biāo)準(zhǔn)差=0.6的總體中隨機(jī)選取容量為n=36的樣本。假定該總體不是很偏的,要求:(1)計算樣本均值x小于9.9近似概率。(2)計算樣本均值x超過9.9近似概率。(3)計算樣本均值x在總體均值=10附近0.1范圍內(nèi)的近似概率。

2008年8月樣本均值的分布

(實例)解:根據(jù)中心極限定理,不論總體的分布樣本均值的分布

(實例)2008年8月樣本均值的分布

(實例)2008年8月樣本均值的分布

(實例)2008年8月樣本均值的分布

(實例)2008年8月樣本比例的分布樣本比例的分布總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的分布

(proportion)2008年8月總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比樣本比例在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似,即

樣本比例的分布2008年8月在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相樣本比例的抽樣分布

(實例)解:(1)盡管我們對電瓶的壽命分布形狀不甚了解,但根據(jù)中心極限定理可以推出50個電瓶的平均壽命的分布近似服從正態(tài)分布,其均值【例6.5】某汽車電瓶商聲稱其生產(chǎn)的電瓶具有均值為60個月、標(biāo)準(zhǔn)差為6個月的壽命分布?,F(xiàn)假設(shè)質(zhì)檢部門決定檢驗該廠的說法是否正確,為此隨機(jī)抽取了50個該廠生產(chǎn)的電瓶進(jìn)行壽命檢驗。(1假定廠商聲稱是正確的,試描述50個電瓶的平均壽命的抽樣分布。(2)假定廠商聲稱正確,則50個樣品組成的樣本的平均壽命不超過57個月的概率是多少?2008年8月樣本比例的抽樣分布

(實例)解:(1)盡管我們對電瓶的壽命分樣本比例的抽樣分布

(實例)(2)如果廠方聲稱是正確的,則觀察到50個電池的平均壽命不超過57個月的概率為:如果廠方聲稱是正確的,則觀察到50個電池的平均壽命不超過57個月的概率為0.0002。一個不可能時間。根據(jù)小概率事件原理,觀察到的50個電瓶的平均壽命低于57個月的事件是不可能的;反之如果真的觀察到50個電瓶的壽命低于57個月,則有理由懷疑廠方說法的正確性,即認(rèn)為廠方的說法是不正確的。2008年8月樣本比例的抽樣分布

(實例)(2)如果廠方聲稱是正確的,則觀樣本比例抽樣分布

(實例)解:已知X~N(9,22),根據(jù)上述性質(zhì)10X也服從正態(tài)分布,由于所以【例6.6】設(shè)X~N(9,22),試描述10X的分布。2008年8月樣本比例抽樣分布

(實例)解:已知X~N(9,22),根據(jù)上樣本比例的分布

(實例)解:設(shè)600份報表中至少有一處錯誤的報表所占的比例為由題意可知:

【例6.7】假定某統(tǒng)計人員在其填寫的報表中有2%至少會有一處錯誤,如果我們檢查了一個由600份報表組成的隨機(jī)樣本,其中至少有一處錯誤的報表所占的比重在0.025~0.070之間的概率為多大?2008年8月樣本比例的分布

(實例)解:設(shè)600份報表中至少有一處錯誤的樣本比例的分布

(實例)因為2008年8月樣本比例的分布

(實例)因為2008年8月樣本比例的分布

(實例)即該統(tǒng)計人員所填寫的報告中至少有一處錯誤的報表所占的比例在0.025~0.070之間的概率為19.02%。2008年8月樣本比例的分布

(實例)即該統(tǒng)計人員所填寫的報告中至少有一處解:因為兩個總體均為正態(tài)分布,所以8個新生的平均成績x1

,x2

分別為正態(tài)分布,x1

-x2

也為正態(tài)分布,且兩個總體比例之差分布

(實例)【例6.8】設(shè)有甲、乙兩所著名高校在某年錄取新生時,甲校的平均分為655分,且服從正態(tài)分布,標(biāo)準(zhǔn)差為20分;乙校的平均分為625分,也是正態(tài)分布,標(biāo)準(zhǔn)差為25分。先從甲、乙兩校各隨機(jī)抽取8名新生計算其平均分?jǐn)?shù),出現(xiàn)甲校比乙校的平均分低的可能性有多大?2008年8月解:因為兩個總體均為正態(tài)分布,所以8個新生的平均成績x1兩個總體比例之差的估計

(實例)【例6.9】一項抽樣調(diào)查表明甲城市的消費者中有15%的人喝過商標(biāo)為“圣潔”牌的礦泉水,而城市的消費者中只有8%的人喝過該種礦泉水。如果這些數(shù)據(jù)是真實的,那么當(dāng)我們分別從甲城市抽取120人,乙城市抽取140人組成兩個獨立隨機(jī)樣本時,樣本比例差不低于0.08的概率有多大?^解:根據(jù)題意2008年8月兩個總體比例之差的估計

(實例)【例6.9】一項抽樣調(diào)查表明樣本方差的分布樣本方差的分布樣本方差的分布在重復(fù)選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布對于來自正態(tài)總體的簡單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即2008年8月樣本方差的分布在重復(fù)選取容量為n的樣本時,由樣本方差的所有可統(tǒng)計量的標(biāo)準(zhǔn)誤差統(tǒng)計量的標(biāo)準(zhǔn)誤差統(tǒng)計量的標(biāo)準(zhǔn)誤差

(standarderror)樣本統(tǒng)計量抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計量的標(biāo)準(zhǔn)誤差衡量統(tǒng)計量的離散程度,測度了用樣本統(tǒng)計量估計總體參數(shù)的精確程度樣本均值和樣本比例的標(biāo)準(zhǔn)誤差分別為2008年8月統(tǒng)計量的標(biāo)準(zhǔn)誤差

(standarderror)樣本統(tǒng)計估計的標(biāo)準(zhǔn)誤差

(standarderrorofestimation)當(dāng)計算標(biāo)準(zhǔn)誤時涉及的總體參數(shù)未知時,用樣本統(tǒng)計量代替計算的標(biāo)準(zhǔn)誤差,稱為估計的標(biāo)準(zhǔn)誤差以樣本均值為例:當(dāng)總體標(biāo)準(zhǔn)差未知時,可用樣本標(biāo)準(zhǔn)差s代替,則在重復(fù)抽樣條件下,樣本均值的估計標(biāo)準(zhǔn)誤為2008年8月估計的標(biāo)準(zhǔn)誤差

(standarderrorofesExcel中的統(tǒng)計函數(shù)BINOMDIST—計算二項分布的概率POISSON—計算泊松分布的概率HYPGEOMDIST—計算超幾何分布的概率NORMDIST—計算正態(tài)分布的概率NORMINV—計算正態(tài)分布的區(qū)間點(臨界值)NORMSDIST—計算標(biāo)準(zhǔn)正態(tài)分布的概率NORMSINV—計算標(biāo)準(zhǔn)正態(tài)分布的區(qū)間點(分位數(shù))CHIDIST—計算c2分布的右尾概率CHIINV—計算給定c2分布的右尾概率的臨界值FDIST—計算F分布的右尾概率FINV—計算給定F右尾概率的臨界TDIST—計算給定t值的分布概率TINV—計算給定概率的t值2008年8月Excel中的統(tǒng)計函數(shù)BINOMDIST—計算二項分布的概率本章小結(jié)度量事件發(fā)生的可能性—概率離散型概率分布二項分布,泊松分布,超幾何分布連續(xù)型概率分布正態(tài)分布由正態(tài)分布導(dǎo)出的幾個重要分布c2-分布,t-分布,F(xiàn)-分布樣本統(tǒng)計量的概率分布2008年8月本章小結(jié)度量事件發(fā)生的可能性—概率2008年8月結(jié)束THANKS2008年8月結(jié)束THANKS2008年8月第六章統(tǒng)計量及其抽樣分布PowerPoint統(tǒng)計學(xué)2008年8月第六章統(tǒng)計量及其抽樣分布PowerPoint統(tǒng)計學(xué)206.1統(tǒng)計量6.1.1統(tǒng)計量的概念6.1.2常用統(tǒng)計量6.1.3次序統(tǒng)計量6.1.4充分統(tǒng)計量6.1統(tǒng)計量6.1.1統(tǒng)計量的概念參數(shù)和統(tǒng)計量參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值一個總體的參數(shù):總體均值()、標(biāo)準(zhǔn)差()、總體比例();兩個總體參數(shù):(1-2)、(1-2)、(1/2)總體參數(shù)通常用希臘字母表示統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)一個總體參數(shù)推斷時的統(tǒng)計量:樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等兩個總體參數(shù)推斷時的統(tǒng)計量:(x1-x2)、(p1-p2)、(s1/s2)樣本統(tǒng)計量通常用小寫英文字母來表示2008年8月參數(shù)和統(tǒng)計量參數(shù)(parameter)2008年8月常用統(tǒng)計量樣本均值樣本方差樣本標(biāo)準(zhǔn)差2008年8月常用統(tǒng)計量樣本均值樣本方差樣本標(biāo)準(zhǔn)差2008年8月常用統(tǒng)計量樣本變異系數(shù)K階距K階中心距2008年8月常用統(tǒng)計量樣本變異系數(shù)K階距K階中心距2008年8月次序統(tǒng)計量哪些是次序統(tǒng)計量:中位數(shù)、分位數(shù)、四分位數(shù)、極差和均值次序統(tǒng)計量哪些是次序統(tǒng)計量:充分統(tǒng)計量統(tǒng)計計量加工過程中一點信息都不損失的統(tǒng)計量通常稱為充分統(tǒng)計量。充分統(tǒng)計量統(tǒng)計計量加工過程中一點信息都不損6.2關(guān)于分布的幾個概念6.2.1抽樣分布6.2.2漸近分布6.2.3隨機(jī)模擬獲得的近似分布6.2關(guān)于分布的幾個概念6.2.1抽樣分布樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機(jī)變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)2008年8月樣本統(tǒng)計量的概率分布,是一種理論分布抽樣分布

(sampl抽樣分布的形成過程

(samplingdistribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本抽樣分布的形成過程

(samplingdistribut漸近分布當(dāng)n較大時,就用極限分布作為抽樣分布的一種近似,這種極限分布稱為漸近分布。漸近分布當(dāng)n較大時,就用極限分布作為抽樣分2分布2分布由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則y服從自由度為1的2分布,即對于n個正態(tài)隨機(jī)變量y1,y2,yn,則隨機(jī)變量稱為具有n個自由度的2分布,記為c2-分布

(2-distribution)2008年8月由阿貝(Abbe)于1863年首先給出,后來由海爾墨特(H不同自由度的c2-分布c2n=1n=4n=10n=202008年8月不同自由度的c2-分布c2n=1n=4n=10n=2020分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布c2-分布

(性質(zhì)和特點)2008年8月分布的變量值始終為正c2-分布

(性質(zhì)和特點)2008年8c2-分布

(用Excel計算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom)

,其中df為自由度,x,是隨機(jī)變量的取值利用【CHIINV】函數(shù)則可以計算給定右尾概率和自由度時相應(yīng)的反函數(shù)值語法:CHIINV(probability,degrees_freedom)

用Excel計算c2分布的概率2008年8月c2-分布

(用Excel計算c2分布的概率)利用Excel2008年8月2008年8月t分布t分布t-分布

(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z2008年8月t-分布

(t-distribution)提出者是Willt分布臨界值—t分布的上α分位點t

α(n)αtα(n)n>45,t

α(n)≈zαZα為標(biāo)準(zhǔn)正態(tài)分布上α分位點t1-α=-t

αα2008年8月t分布臨界值—t分布的上α分位點tα(n)αtα(n)n>結(jié)論1:設(shè)總體X服從正態(tài)分布N(μ,σ2),σ2未知.(x1,x2,…xn)為來自該總體的樣本,則統(tǒng)計量兩個重要結(jié)論2008年8月結(jié)論1:兩個重要結(jié)論2008年8月結(jié)論2:設(shè)總體X服從正態(tài)分布N(μ1,σ2)總體Y服從正態(tài)分布N(μ2,σ2)(σ2未知),X與Y獨立,且X1,X2,…,Xn1和Y1,Y2,…,Yn2分別是來自總體X和Y的樣本,則統(tǒng)計量兩個重要結(jié)論2008年8月結(jié)論2:兩個重要結(jié)論2008年8月2008年8月2008年8月t-分布

(用Excel計算t分布的概率和臨界值)利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自由度時分布的概率值語法:TDIST(x,degrees_freedom,tails)

利用【TINV】函數(shù)則可以計算給定概率和自由度時的相應(yīng)

語法:TINV(probability,degrees_freedom)用Excel計算t分布的臨界值2008年8月t-分布

(用Excel計算t分布的概率和臨界值)利用ExcF分布2008年8月F分布2008年8月為紀(jì)念統(tǒng)計學(xué)家費希爾(R.A.Fisher)

以其姓氏的第一個字母來命名則設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為F-分布

(F

distribution)2008年8月為紀(jì)念統(tǒng)計學(xué)家費希爾(R.A.Fisher)以其姓氏的第一不同自由度的F分布F(1,10)(5,10)(10,10)2008年8月不同自由度的F分布F(1,10)(5,10)(10,10)2F分布的上α分位點F

α(n1,n2)αFα(n1,n2)2008年8月F分布的上α分位點Fα(n1,n2)αFα(n1,n2)2~F(n1―1,n2―1)其中s12和s22分別是總體X和Y的樣本方差。

F分布在假設(shè)檢驗、區(qū)間估計、方差分析、回歸分析及試驗設(shè)計等領(lǐng)域有重要的應(yīng)用設(shè)總體X~N(μ1,σ12),Y~N(μ2,σ22),X與Y獨立,且X1,X2,…,Xnl與Y1,Y2,…,Yn2分別是來自總體X和Y的樣本,則統(tǒng)計量F=一個重要結(jié)論2008年8月設(shè)總體X~N(μ1,σ12),Y~N(μ2,F(xiàn)-分布

(用Excel計算F分布的概率和臨街值)利用Excel提供的【FDIST】統(tǒng)計函數(shù),計算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計算給定單尾概率和自由度時的相應(yīng)

語法:

FINV(probability,degrees_freedom1,degrees_freedom2)

用Excel計算F分布的概率2008年8月F-分布

(用Excel計算F分布的概率和臨街值)利用Exc2008年8月2008年8月樣本均值的分布與中心極限定理樣本均值的分布與中心極限定理在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的分布2008年8月在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相樣本均值的分布

(例題分析)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差2008年8月樣本均值的分布

(例題分析)【例】設(shè)一個總體,含有4個元素(樣本均值的分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)2008年8月樣本均值的分布

(例題分析)現(xiàn)從總體中抽取n=2的簡單樣本均值的分布

(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.52008年8月樣本均值的分布

(例題分析)計算出各樣本的均值,如下表樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布樣本均值分布比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值2.樣本均值的方差等于總體方差的1/n2008年8月樣本均值的分布與總體分布的比較

(例題分析)=2樣本均值的分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x的期望值為μ,方差為σ2/n。即x~N(μ,σ2/n)2008年8月樣本均值的分布

與中心極限定理=50=10X總體分中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x2008年8月中心極限定理

(centrallimittheorem)中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程2008年8月中心極限定理

(centrallimittheorem抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布2008年8月抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣樣本均值的分布

(實例)解:根據(jù)中心極限定理,不論總體的分布是什么形狀,在假定總體分布不是很偏的情形下,當(dāng)從總體中隨機(jī)選取n=36的樣本時,樣本均值x的分布近似服從均值x==10、標(biāo)準(zhǔn)差的正態(tài)分布,即

X~N(10,0.12)

【例6.4】設(shè)從一個均值=10、標(biāo)準(zhǔn)差=0.6的總體中隨機(jī)選取容量為n=36的樣本。假定該總體不是很偏的,要求:(1)計算樣本均值x小于9.9近似概率。(2)計算樣本均值x超過9.9近似概率。(3)計算樣本均值x在總體均值=10附近0.1范圍內(nèi)的近似概率。

2008年8月樣本均值的分布

(實例)解:根據(jù)中心極限定理,不論總體的分布樣本均值的分布

(實例)2008年8月樣本均值的分布

(實例)2008年8月樣本均值的分布

(實例)2008年8月樣本均值的分布

(實例)2008年8月樣本比例的分布樣本比例的分布總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的分布

(proportion)2008年8月總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比樣本比例在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似,即

樣本比例的分布2008年8月在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相樣本比例的抽樣分布

(實例)解:(1)盡管我們對電瓶的壽命分布形狀不甚了解,但根據(jù)中心極限定理可以推出50個電瓶的平均壽命的分布近似服從正態(tài)分布,其均值【例6.5】某汽車電瓶商聲稱其生產(chǎn)的電瓶具有均值為60個月、標(biāo)準(zhǔn)差為6個月的壽命分布?,F(xiàn)假設(shè)質(zhì)檢部門決定檢驗該廠的說法是否正確,為此隨機(jī)抽取了50個該廠生產(chǎn)的電瓶進(jìn)行壽命檢驗。(1假定廠商聲稱是正確的,試描述50個電瓶的平均壽命的抽樣分布。(2)假定廠商聲稱正確,則50個樣品組成的樣本的平均壽命不超過57個月的概率是多少?2008年8月樣本比例的抽樣分布

(實例)解:(1)盡管我們對電瓶的壽命分樣本比例的抽樣分布

(實例)(2)如果廠方聲稱是正確的,則觀察到50個電池的平均壽命不超過57個月的概率為:如果廠方聲稱是正確的,則觀察到50個電池的平均壽命不超過57個月的概率為0.0002。一個不可能時間。根據(jù)小概率事件原理,觀察到的50個電瓶的平均壽命低于57個月的事件是不可能的;反之如果真的觀察到50個電瓶的壽命低于57個月,則有理由懷疑廠方說法的正確性,即認(rèn)為廠方的說法是不正確的。2008年8月樣本比例的抽樣分布

(實例)(2)如果廠方聲稱是正確的,則觀樣本比例抽樣分布

(實例)解:已知X~N(9,22),根據(jù)上述性質(zhì)10X也服從正態(tài)分布,由于所以【例6.6】設(shè)X~N(9,22),試描述10X的分布。2008年8月樣本比例抽樣分布

(實例)解:已知X~N(9,22),根據(jù)上樣本比例的分布

(實例)解:設(shè)600份報表中至少有一處錯誤的報表所占的比例為由

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論