統(tǒng)計量及其抽樣分布2_第1頁
統(tǒng)計量及其抽樣分布2_第2頁
統(tǒng)計量及其抽樣分布2_第3頁
統(tǒng)計量及其抽樣分布2_第4頁
統(tǒng)計量及其抽樣分布2_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計量及其抽樣分布當前1頁,總共59頁。第6章統(tǒng)計量及其抽樣分布6.1統(tǒng)計量6.2關(guān)于分布的幾個概念6.3由正態(tài)分布導(dǎo)出的幾個重要分布

6.4樣本均值的分布與中心極限定理6.5樣本比例的抽樣分布6.6兩個樣本平均值之差的分布6.7關(guān)于樣本方差的分布

當前2頁,總共59頁。了解統(tǒng)計量及其分布的幾個概念了解由正態(tài)分布導(dǎo)出的幾個重要分布

理解樣本均值的分布與中心極限定理掌握單樣本比例和樣本方差的抽樣分布學(xué)習(xí)目標當前3頁,總共59頁。6.1

統(tǒng)計量6.1.1統(tǒng)計量的概念6.1.2常用統(tǒng)計量6.1.3次序統(tǒng)計量

6.1.4充分統(tǒng)計量

當前4頁,總共59頁。設(shè)X1,X2,…,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構(gòu)造一個函數(shù)T(X1,X2,…,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,…,Xn)是一個統(tǒng)計量樣本均值、樣本比例、樣本方差等都是統(tǒng)計量統(tǒng)計量是樣本的一個函數(shù)統(tǒng)計量是統(tǒng)計推斷的基礎(chǔ)統(tǒng)計量

(statistic)當前5頁,總共59頁。一組樣本觀測值X1,X2,…,Xn由小到大的排序

X(1)≤X(2)≤…≤X(i)≤…≤X(n)后,稱X(1),X(2),…,X(n)為次序統(tǒng)計量中位數(shù)、分位數(shù)、四分位數(shù)等都是次序統(tǒng)計量次序統(tǒng)計量當前6頁,總共59頁。6.2

關(guān)于分布的幾個概念6.2.1抽樣分布6.2.2漸進分布6.2.3隨機模擬獲得的近似分布

當前7頁,總共59頁。樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機變量是樣本統(tǒng)計量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)當前8頁,總共59頁。6.3由正態(tài)分布導(dǎo)出的幾個重要分布6.3.12分布6.3.2t

分布6.3.3F

分布當前9頁,總共59頁。2分布當前10頁,總共59頁。χ2

分布的使用如果一個變量的諸數(shù)值可視為幾個獨立變量值的平方和,則該變量服從χ2

分布方差就可視為若干隨機變量值的平方和樣本中各隨機數(shù)值與均值之離差的平方和(即樣本方差的n-1倍)與總體方差之比,服從自由度為n-1的χ2

分布當前11頁,總共59頁。由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來設(shè),則令,則Y服從自由度為1的2分布,即

當總體,從中抽取容量為n的樣本,則2分布

(2

distribution)當前12頁,總共59頁。分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布2分布

(性質(zhì)和特點)當前13頁,總共59頁。c2分布

(圖示)不同容量樣本的抽樣分布c2n=1n=4n=10n=20當前14頁,總共59頁。t

分布當前15頁,總共59頁。t分布高塞特(W.S.Gosset)于1908年在一篇以“Student”(學(xué)生)為筆名的論文中首次提出

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布當前16頁,總共59頁。t分布圖示xt

分布與標準正態(tài)分布的比較t分布標準正態(tài)分布t不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)z當前17頁,總共59頁。T

分布的圖形當前18頁,總共59頁。T

分布的使用當前19頁,總共59頁。F

分布當前20頁,總共59頁。F分布兩個都服從χ2

分布的變量之比的分布規(guī)律。可以設(shè)想為兩個方差之比方差之比會接近1(因為前面已經(jīng)假設(shè)各變量都服從標準正態(tài)分布),似乎存在一個“兩端少,中間多”的特征,但不對稱(除非其中存在一個無限總體,使樣本數(shù)量為無窮大,則樣本方差有無窮多個)當前21頁,總共59頁。由統(tǒng)計學(xué)家費希爾()

提出的,以其姓氏的第一個字母來命名設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為F分布

(F

distribution)當前22頁,總共59頁。F分布兩個都服從χ2

分布的變量之比的分布規(guī)律。可以設(shè)想為兩個方差之比方差之比會接近1(因為前面已經(jīng)假設(shè)各變量都服從標準正態(tài)分布),似乎存在一個“兩端少,中間多”的特征,但不對稱(除非其中存在一個無限總體,使樣本數(shù)量為無窮大,則樣本方差有無窮多個)當前23頁,總共59頁。F分布

(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)當前24頁,總共59頁。F分布的圖形此處的n和m分別相當于n1、n2當前25頁,總共59頁。F分布的使用應(yīng)用很廣泛,可用來檢驗兩狀態(tài)總體方差是否相等,檢驗回歸方差是否有代表性,在方差分析和多元統(tǒng)計中都是重要的檢驗手段。當前26頁,總共59頁。三種抽樣分布的對比χ2分布可視為關(guān)于方差的分布規(guī)律。t分布中的兩個變量,一個服從正態(tài)分布,另一個服從χ2分布??梢暈榫蹬c方差之比的分布規(guī)律。F分布的變量都服從χ2分布,可以設(shè)想為兩個方差之比的分布規(guī)律。這些“分布”都說明變量的規(guī)律,某些具有相同特征的變量具有什么樣的共同規(guī)律。現(xiàn)實中,按圖索驥,依樣畫葫蘆。當前27頁,總共59頁。三種抽樣分布綜述為什么要使用統(tǒng)計方法?因為要了解事物的數(shù)量特征幾乎惟一的方法是抽樣,隨機抽樣抽樣可以有很多結(jié)果,眾結(jié)果的隨機性規(guī)律是正態(tài)分布為什么要導(dǎo)出三大抽樣分布?因為要了解的數(shù)量特征的性質(zhì)不同,比如,可能要了解樣本方差的規(guī)律若干個變量都服從正態(tài)分布,每變量有不同取值,計算每組取值中各值的平方,再加起來,該總和服從χ2

分布每次抽樣的誤差與平均誤差之比服從t分布兩個樣本的方差之比服從F分布什么是分布?骰子點數(shù)服從均勻分布,身高服從正態(tài)分布。分布就是各種情況發(fā)生概率的全體組合。當前28頁,總共59頁。6.4樣本均值的分布與中心極限定理當前29頁,總共59頁。抽樣分布抽樣分布從總體種抽出容量相同的樣本,計算統(tǒng)計量的值,然后按統(tǒng)計量的值所編制的頻數(shù)分布。抽樣分布的作用:根據(jù)抽樣分布研究統(tǒng)計量的性質(zhì)對統(tǒng)計推斷方法進行評價當前30頁,總共59頁。

抽樣分布:樣本統(tǒng)計量所有可能值的概率分布。樣本統(tǒng)計量總體未知參數(shù)樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量分布的形狀及接近總體參數(shù)的程度STAT當前31頁,總共59頁。知道這些“分布”有什么用?從現(xiàn)象上看,事物非常復(fù)雜,但其中某些內(nèi)容具有某種意義上的相同性質(zhì)(比如7條魚與7天之間都有7這個數(shù)量)從邏輯上看,可以在某些限定條件下構(gòu)造許多模型,即數(shù)量關(guān)系(此處都用“等于”關(guān)系),這些關(guān)系的總和都符合邏輯,現(xiàn)實中事物如果符合那些限定條件,則其本角度的其他特征(可視為進一步的發(fā)展結(jié)果)都會服從邏輯模型所表述的變化規(guī)律統(tǒng)計分布類型就是:在某些限定條件下,考察不同類型的個別數(shù)量現(xiàn)象在總體上具有什么樣的分布特征,熟知的如正態(tài)分布。這些模型的結(jié)果告訴我們各種情況出現(xiàn)的可能性。當前32頁,總共59頁。抽樣分布分布的特征值:均值和標準差樣本主要統(tǒng)計量:平均數(shù)比率(成數(shù))方差STAT《統(tǒng)計學(xué)》第四章抽樣估計當前33頁,總共59頁。在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布當前34頁,總共59頁。樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)當前35頁,總共59頁。中心極限定理

(centrallimittheorem)當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x當前36頁,總共59頁。學(xué)生ABCDEFG成績30405060708090按隨機原則抽選出4名學(xué)生,并計算平均分數(shù)。平均數(shù)的抽樣分布樣本均值樣本均值樣本均值A(chǔ)BCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211二者均值相等樣本均值的平均數(shù)總體的平均數(shù)當前37頁,總共59頁。平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的。STAT當前38頁,總共59頁。

AnexampleAdieisthrowninfinitelymanytimes.LetXrepresentthenumberofspotsshowingonanythrow.一個骰子被投擲了無數(shù)次,用X表示每一次出現(xiàn)的點數(shù).TheprobabilitydistributionofXisx123456p(x)1/61/61/61/61/61/6E(X)=1(1/6)+2(1/6)+3(1/6)+………=3.5V(X)=(1-3.5)2+(2-3.5)2+……………….=2.92當前39頁,總共59頁。Supposewewanttoestimatemfromthemeanofasampleofsizen=2.Whatisthedistributionthatcanfollow樣本平均的分布是什么樣?當前40頁,總共59頁。11.52.02.53.03.54.04.55.05.56.06/365/364/363/362/361/36E()=1.0(1/36)+1.5(2/36)+….=3.5V(X)=(1.0-3.5)2(1/36)+(1.5-3.5)2(2/36)...=1.46當前41頁,總共59頁。111666Noticethatissmallerthansx.Thelargerthesamplesizethesmaller.Therefore,tendstofallclosertom,asthesamplesizeincreases.當前42頁,總共59頁。Simulationofdicetossingn=2n=5n=10Mean=3.494 Stand.Dev.=0.544Mean=3.486 Stand.Dev.=1.215Mean=3.495 Stand.Dev.=0.749當前43頁,總共59頁。Thevarianceofthesamplemeanissmallerthanthevarianceofthepopulation.樣本平均數(shù)方差小于總體方差123Also,Expectedvalueofthepopulation=(1+2+3)/3=2Mean=1.5Mean=2.5Mean=2.Population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222Expectedvalueofthesamplemean=(1.5+2+2.5)/3=2Comparethevariabilityofthepopulationtothevariabilityofthesamplemean.Letustakesamplesoftwoobservations當前44頁,總共59頁。TheSamplingDistributionoftheSampleMean樣本平均數(shù)分布當前45頁,總共59頁。抽樣推斷的理論基礎(chǔ)

大數(shù)定律大數(shù)定律是闡明大量隨機現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理的總稱。其一般意義是:在隨機試驗過程中,每次試驗的結(jié)果不同,但大量重復(fù)試驗后,所出現(xiàn)結(jié)果的平均值總是接近某一確定的值。

中心極限定理

第一,如果總體很大,而且服從正態(tài)分布,樣本平均數(shù)(或成數(shù))的分布也同樣服從正態(tài)分布。第二,如果總體很大,但不服從正態(tài)分布,只要樣本容量足夠大(n≥30),樣本平均數(shù)(或成數(shù))的分布趨近于正態(tài)分布。第三,樣本平均數(shù)(或成數(shù))的平均數(shù),等于總體平均數(shù)(或成數(shù))。

當前46頁,總共59頁。當前47頁,總共59頁。當前48頁,總共59頁。STAT《統(tǒng)計學(xué)》第四章抽樣估計樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445離差-15-12.5-10-7.5-5-2.50樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211離差2.557.51012.515學(xué)生ABCDEFG成績30405060708090離差-30-20-10010203020=s當前49頁,總共59頁。中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程當前50頁,總共59頁。6.5樣本比例的抽樣分布當前51頁,總共59頁??傮w(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

比例

(proportion)當前52頁,總共59頁。在重復(fù)選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論