第6章樣本分布_第1頁
第6章樣本分布_第2頁
第6章樣本分布_第3頁
第6章樣本分布_第4頁
第6章樣本分布_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1 數(shù)理統(tǒng)計是數(shù)理統(tǒng)計是研究研究如何有效地收集、整理如何有效地收集、整理和和分析帶分析帶有有隨機(jī)影隨機(jī)影響的數(shù)據(jù),從而對所觀察的現(xiàn)象做出推斷或預(yù)測,為決策響的數(shù)據(jù),從而對所觀察的現(xiàn)象做出推斷或預(yù)測,為決策提供依據(jù)的一門學(xué)科。提供依據(jù)的一門學(xué)科。 在近一個在近一個多多世紀(jì)的發(fā)展中,數(shù)理統(tǒng)計不同程度地滲透到世紀(jì)的發(fā)展中,數(shù)理統(tǒng)計不同程度地滲透到人類活動的許多領(lǐng)域。人口調(diào)查、稅收預(yù)算、測量誤差、人類活動的許多領(lǐng)域。人口調(diào)查、稅收預(yù)算、測量誤差、出生與死亡統(tǒng)計、保險業(yè)中賠款額和保險金的確定等,這出生與死亡統(tǒng)計、保險業(yè)中賠款額和保險金的確定等,這些數(shù)理統(tǒng)計早期主要研究的問題,直到現(xiàn)在仍然值得認(rèn)真些數(shù)理統(tǒng)

2、計早期主要研究的問題,直到現(xiàn)在仍然值得認(rèn)真研究。在近半個世紀(jì)以來,數(shù)理統(tǒng)計在理論、方法、應(yīng)用研究。在近半個世紀(jì)以來,數(shù)理統(tǒng)計在理論、方法、應(yīng)用上都有較大的發(fā)展。抽樣調(diào)查、試驗(yàn)設(shè)計、回歸分析與回上都有較大的發(fā)展。抽樣調(diào)查、試驗(yàn)設(shè)計、回歸分析與回歸診斷、多元分析、時間序列分析、非參數(shù)統(tǒng)計、統(tǒng)計決歸診斷、多元分析、時間序列分析、非參數(shù)統(tǒng)計、統(tǒng)計決策函數(shù)、統(tǒng)計計算、隨機(jī)模擬、探索性數(shù)據(jù)分析等統(tǒng)計方策函數(shù)、統(tǒng)計計算、隨機(jī)模擬、探索性數(shù)據(jù)分析等統(tǒng)計方法相繼產(chǎn)生并在實(shí)踐中普遍使用,把以描述為主的統(tǒng)計發(fā)法相繼產(chǎn)生并在實(shí)踐中普遍使用,把以描述為主的統(tǒng)計發(fā)展到以推斷為主的統(tǒng)計。數(shù)理統(tǒng)計的內(nèi)容已異常豐富,應(yīng)展到以推

3、斷為主的統(tǒng)計。數(shù)理統(tǒng)計的內(nèi)容已異常豐富,應(yīng)用用廣泛廣泛,成為當(dāng)前最活躍的學(xué)科之一。,成為當(dāng)前最活躍的學(xué)科之一。2總體總體指研究對象的某項(xiàng)數(shù)量指標(biāo)值的全體。組成總體指研究對象的某項(xiàng)數(shù)量指標(biāo)值的全體。組成總體的每個元素稱為的每個元素稱為個體個體。由于每個個體的出現(xiàn)帶有隨機(jī)。由于每個個體的出現(xiàn)帶有隨機(jī)性,即相應(yīng)的數(shù)量指標(biāo)值的出現(xiàn)帶有隨機(jī)性。從而可性,即相應(yīng)的數(shù)量指標(biāo)值的出現(xiàn)帶有隨機(jī)性。從而可把此種數(shù)量指標(biāo)看作隨機(jī)變量,我們用一個隨機(jī)變量把此種數(shù)量指標(biāo)看作隨機(jī)變量,我們用一個隨機(jī)變量及其分布來描述總體。為此常用隨機(jī)變量的符號或分及其分布來描述總體。為此常用隨機(jī)變量的符號或分布的符號布的符號X,Y,Z,

4、F(x) 來表示總體。來表示總體。例例7.1研究某燈泡的使用壽命時研究某燈泡的使用壽命時,總體可用隨機(jī)變量總體可用隨機(jī)變量X來表示來表示,或用其分布函數(shù)或用其分布函數(shù)F(x)表示。表示。3二、樣本二、樣本為了推斷總體分布及其各種特征,就必須從總體中為了推斷總體分布及其各種特征,就必須從總體中按一定法則抽取若干個體進(jìn)行觀測或試驗(yàn),以獲得按一定法則抽取若干個體進(jìn)行觀測或試驗(yàn),以獲得有關(guān)總體的信息有關(guān)總體的信息.這一抽取過程稱為這一抽取過程稱為抽樣抽樣.所抽取的所抽取的部分個體稱為部分個體稱為樣本樣本,樣本中個體的樣本中個體的數(shù)目數(shù)目稱為稱為樣本容量樣本容量.例如容量為例如容量為n的樣本可以看作是的

5、樣本可以看作是n維隨機(jī)變量維隨機(jī)變量( ), 其觀察值為其觀察值為( ).nXXX,21nxxx,21例例7.2研究某地區(qū)學(xué)齡前兒童發(fā)育情況研究某地區(qū)學(xué)齡前兒童發(fā)育情況,人們關(guān)心的人們關(guān)心的是其體重是其體重X和身和身高高Y這兩個數(shù)量指標(biāo)這兩個數(shù)量指標(biāo),則此總體就可則此總體就可用二維隨機(jī)變量用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)或其聯(lián)合分布函數(shù)F(x,y)表示表示.4簡單隨機(jī)抽樣簡單隨機(jī)抽樣它要求滿足兩點(diǎn)它要求滿足兩點(diǎn):(1)代表性代表性. 樣本中每個個體與所考慮的總體有相同樣本中每個個體與所考慮的總體有相同的分布的分布.即樣本中每個個體與總體即樣本中每個個體與總體X具有相同的分布具有相同的分

6、布.(2)獨(dú)立性獨(dú)立性. 樣本中每個個體取什么值并不影響其它樣本中每個個體取什么值并不影響其它個體取什么值個體取什么值.即必須是相互獨(dú)立的隨機(jī)變量即必須是相互獨(dú)立的隨機(jī)變量.由簡單隨機(jī)抽樣所得到的樣本稱為由簡單隨機(jī)抽樣所得到的樣本稱為簡單隨機(jī)樣本簡單隨機(jī)樣本.假假如總體的分布函數(shù)為如總體的分布函數(shù)為F(x),則其簡單隨機(jī)樣本的聯(lián)合則其簡單隨機(jī)樣本的聯(lián)合分布函數(shù)為分布函數(shù)為niinniinxfxxfxFxxF1111)(),()(),(5在概率論研究中,隨機(jī)變量的分布總是假設(shè)給定在概率論研究中,隨機(jī)變量的分布總是假設(shè)給定的,但在數(shù)理統(tǒng)計的研究中,總體的分布是未知的,但在數(shù)理統(tǒng)計的研究中,總體的分

7、布是未知的,但總可以假定總體的分布是某一個分布族的的,但總可以假定總體的分布是某一個分布族的成員成員.例例7.3 在研究某批燈泡的質(zhì)量時在研究某批燈泡的質(zhì)量時,若關(guān)心的是其質(zhì)量若關(guān)心的是其質(zhì)量是否合格是否合格,若合格記為若合格記為0,不合格記為不合格記為1,因此該總體就因此該總體就可用僅取可用僅取0和和1的隨機(jī)變量的隨機(jī)變量X來表示來表示.顯然顯然,這個總體這個總體的分布就是一個參數(shù)為的分布就是一個參數(shù)為p的二點(diǎn)分布的二點(diǎn)分布b(1,p),由于由于p未知未知,故這個總體分布也是未知的故這個總體分布也是未知的,但可以假定該總但可以假定該總體分布是二點(diǎn)分布族體分布是二點(diǎn)分布族 F=b(1,p);0

8、p0.0, 00,)(xxexfx7例例7.4 我們通常飲用的礦泉水有我們通常飲用的礦泉水有19個指標(biāo)個指標(biāo).某市某市技術(shù)監(jiān)督局一次抽查了技術(shù)監(jiān)督局一次抽查了58批礦泉水批礦泉水,記錄每一批記錄每一批礦泉水的每個指標(biāo)是否合格礦泉水的每個指標(biāo)是否合格,從中可統(tǒng)計出每批礦從中可統(tǒng)計出每批礦泉水不合格指標(biāo)的個數(shù)泉水不合格指標(biāo)的個數(shù)X.這里這里X是一個離散型隨是一個離散型隨機(jī)變量機(jī)變量,其一切可能取值為其一切可能取值為0,1,19。 58批礦批礦泉水的指標(biāo)不合格數(shù)構(gòu)成了一個容量為泉水的指標(biāo)不合格數(shù)構(gòu)成了一個容量為58的樣本的樣本的觀察值的觀察值,每個可取每個可取0,1,19中某個值中某個值,將它們整將

9、它們整理后列成表理后列成表1.1.18不合格 指標(biāo)數(shù) 頻數(shù) 頻率 0 33 0.57 1 17 0.293 2 5 0.086 3 1 0.017 4 2 0.034 合計 58 1 表表 1 58批礦泉水不合格指標(biāo)數(shù)的頻率、批礦泉水不合格指標(biāo)數(shù)的頻率、 頻數(shù)分布表頻數(shù)分布表910樣本直方圖可以形象地去描述總體概率密度函數(shù)大樣本直方圖可以形象地去描述總體概率密度函數(shù)大致形狀致形狀,經(jīng)驗(yàn)分布函數(shù)將可以用來描述總體分布函數(shù)經(jīng)驗(yàn)分布函數(shù)將可以用來描述總體分布函數(shù)的大致形狀的大致形狀.定義定義1.1.1 設(shè)總體設(shè)總體X的分布函數(shù)為的分布函數(shù)為F(x),從中獲得從中獲得的樣本觀察值為的樣本觀察值為 ,將

10、它們從小到大排將它們從小到大排列成列成 ,令令 nxx,1)()2()1(nxxx)()1()()1(, 1, 0)(nkknxxxxxnkxxxF稱稱 為該樣本的經(jīng)驗(yàn)分布函數(shù)為該樣本的經(jīng)驗(yàn)分布函數(shù).)(xFn11某食品廠用自動裝罐機(jī)生產(chǎn)凈重量為某食品廠用自動裝罐機(jī)生產(chǎn)凈重量為345克的午餐肉克的午餐肉罐頭罐頭,由于隨機(jī)性由于隨機(jī)性,每個罐頭的凈重有差別每個罐頭的凈重有差別,現(xiàn)從中隨現(xiàn)從中隨機(jī)取機(jī)取10個罐頭個罐頭,其凈重如下其凈重如下:344,336,345,342,340,338,344,343,344,343,求經(jīng)驗(yàn)分布函數(shù)求經(jīng)驗(yàn)分布函數(shù).xxxxxxxxxFn34513453449 .

11、 03443436 . 03433424 . 03423403 . 03403382 . 03383361 . 03360)(121.定義定義1.2.1 設(shè)設(shè) 是取自某總體的一個是取自某總體的一個容量為容量為n的樣本的樣本,假如樣本函數(shù)假如樣本函數(shù) 中不含任何未知參數(shù)中不含任何未知參數(shù),則稱則稱T為為統(tǒng)計量統(tǒng)計量.統(tǒng)計量的統(tǒng)計量的分布稱為分布稱為抽樣分布抽樣分布.nXX,11(,)nTT XX2.2.常用的幾個統(tǒng)計量常用的幾個統(tǒng)計量設(shè)設(shè) 是來自總體是來自總體X的樣本的樣本nXX,1樣本均值樣本均值 樣本均值是反映總體數(shù)學(xué)期望所在位置信息的一樣本均值是反映總體數(shù)學(xué)期望所在位置信息的一個統(tǒng)計量個統(tǒng)

12、計量,是總體數(shù)學(xué)期望的一個很好的估計是總體數(shù)學(xué)期望的一個很好的估計.niiXnX1113樣本方差樣本方差 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 樣本方差與樣本標(biāo)準(zhǔn)差反映了數(shù)據(jù)取值分散與樣本方差與樣本標(biāo)準(zhǔn)差反映了數(shù)據(jù)取值分散與集中的程度集中的程度,即反映了總體方差與標(biāo)準(zhǔn)差的信息即反映了總體方差與標(biāo)準(zhǔn)差的信息.niiXXnS122)(112SS 樣本樣本k階階(原點(diǎn)原點(diǎn))矩矩樣本樣本k階中心矩階中心矩 它們分別反映了總體它們分別反映了總體k階階(原點(diǎn)原點(diǎn))矩與矩與k階中心矩的階中心矩的信息信息.nikikXnA11nikikXXnB1)(114樣本偏度樣本偏度 SK反映了總體分布密度曲線的對稱性信息反映了總體分布

13、密度曲線的對稱性信息.當(dāng)當(dāng)SK0時時,分布的形狀是右尾長分布的形狀是右尾長,稱為正偏的稱為正偏的;當(dāng)當(dāng)SK0時時,分布密度曲線在其峰比正態(tài)分分布密度曲線在其峰比正態(tài)分布來得陡布來得陡;當(dāng)當(dāng)KU0是形是形狀參數(shù)狀參數(shù),0是尺度參數(shù)是尺度參數(shù).而而(,);0,0就是就是分分布族布族當(dāng)當(dāng)=1時的時的分布為指數(shù)分布其密度曲線如下分布為指數(shù)分布其密度曲線如下: (1,0.5) 26 =0.5 =1.0 =1.6 =2.8 =0.3 27分布族分布族性質(zhì)性質(zhì) 21( , ),(),()ifXthen E XD X 12122(, ),(, ),(, )ifXYX and Y are independent

14、then XY 3( , ),( ,),0ifXthen YX kkk 214( , )( ),1,2 2nnE28定義定義1.2.6:定義在定義在0,1上上,且密度函數(shù)且密度函數(shù)10 ,)1 ()()()(),;(11xxxbababaxfba表示的概率分布稱為表示的概率分布稱為分布記為分布記為(a,b),其中其中a0,b0.而而(a,b): a0,b0為為分布族分布族. a=0.6,b=0.3 a=1.2 b=1.5 分布有幾個重要的特分布有幾個重要的特例例.當(dāng)當(dāng)a=1,b=1時時, 分分布就是布就是U(0,1)29xP Xxx1、設(shè)隨機(jī)變量、設(shè)隨機(jī)變量XF(x),給定常數(shù)給定常數(shù) :0

15、1,uuP Xu若存在若存在 , 滿足滿足 ,則稱則稱 為分布為分布F(x)的上的上(側(cè)側(cè)) 分位點(diǎn)分位點(diǎn).2、設(shè)隨機(jī)變量、設(shè)隨機(jī)變量XN(0,1) , 給定常數(shù)給定常數(shù) :0 1,若存在若存在 , 滿足滿足 ,則稱則稱 為標(biāo)準(zhǔn)正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布的上側(cè)的上側(cè) 分位點(diǎn)分位點(diǎn).30u0.001 0.005 0.01 0.025 0.05 0.10 3.090 2.576 2.327 1.96 1.645 1.28231設(shè)設(shè)X 2(n),若對于,若對于 :0 1, 滿足滿足)(2n,)(2nXP)(2n )(2n 則稱則稱 為為 分布的上分布的上 分位點(diǎn)。分位點(diǎn)。)(2n分布分位點(diǎn)分布分位點(diǎn)22

16、32t t分布分位點(diǎn)分布分位點(diǎn)設(shè)設(shè)T Tt(n)t(n),若對,若對 :0:0 1,tPTt (n)=(n)= ,則稱則稱t t (n)(n)為為t(n)t(n)的上側(cè)的上側(cè) 分位點(diǎn)分位點(diǎn). .)(nt)()(1ntnt 33F F分布的分位點(diǎn)分布的分位點(diǎn) 設(shè)設(shè)F F(n1, n2)對于對于 :00 1FPFF (n(n1 1, , n n2 2)=)= , 則稱則稱F F (n(n1 1, , n n2 2) )為為F(nF(n1 1, , n n2 2) )的上側(cè)的上側(cè) 分位點(diǎn)分位點(diǎn)),(21nnF ),(1),(12211nnFnnF 34211.,( ,),i i dnXXN 若則) 1, 0(/1NnXU)(相互獨(dú)立與2)2(SX) 1() 1()3(2222nSn) 1(/)4(ntnSXT(1)證明)證明:niiXnX11 是是n 個獨(dú)立的正態(tài)個獨(dú)立的正態(tài)隨機(jī)變量的線性組合隨機(jī)變量的線性組合,故服從正態(tài)分布故服從正態(tài)分布niiXEnXE1)(1)(nXDnXDnii212)(1)(3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論