基本概念與抽樣分布_第1頁
基本概念與抽樣分布_第2頁
基本概念與抽樣分布_第3頁
基本概念與抽樣分布_第4頁
基本概念與抽樣分布_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、中南大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院第1章 數(shù)理統(tǒng)計的基本概念與抽樣分布應(yīng)用統(tǒng)計數(shù)理統(tǒng)計計的基本本概念與與抽樣分分布 例:某鋼筋廠廠每天可可以生產(chǎn)產(chǎn)某型號號鋼筋10000根,鋼筋筋廠每天天需要對對生產(chǎn)過過程進行行控制,對產(chǎn)品品的質(zhì)量量進行檢檢驗。如如果把鋼鋼筋的強強度作為為鋼筋質(zhì)質(zhì)量的重重有指標(biāo)標(biāo),于是是質(zhì)量管管理人員員需要做做如下方方面的工工作第一,對對生產(chǎn)出出來的鋼鋼筋的強強度進行行檢測,獲得必必要的數(shù)數(shù)據(jù)。第二,對對通過抽抽樣獲取取的部分分?jǐn)?shù)據(jù)進進行整理理、分析析并推斷斷出這10000根鋼筋的的質(zhì)量是是否合乎乎要求。1.2總體、個個體、樣樣本1.2.1總體與個個體我們把所所研究對對象的全全體稱為為總體

2、或或母體。組成總總體的每每個單元元稱為個個體總體X可看作一一個隨機機變量,稱X的概率分分布為總總體分布布,稱X的數(shù)字特特征為總總體的數(shù)數(shù)字特征征,對總體進進行研究究就是對對總體的的分布或或?qū)傮w體的數(shù)字字特征進進行研究究.1.2.2樣本從總體中中抽取的的一部分分個體稱稱為樣本本或者子子樣,其其中所含含個體的的個數(shù)稱稱為樣本本容量.樣本具有有二重性性:隨機機性和確確定性定義1.1設(shè)總體X的樣本滿滿足 獨立立性:每每次觀測測結(jié)果既既不影響響其它結(jié)結(jié)果,也也不受其其它結(jié)果果的影響響;即相相互獨立立;代代表性:樣本中中每一個個個體都都與總體體X有相同分分布。則稱此樣樣本為簡簡單隨機機樣本。進行有放放回

3、抽樣樣就是簡簡單隨機機樣本,無放回抽抽樣就不不是簡單單隨機樣樣本。但但N很大,n相對較小小時無放放回抽樣樣得到的的樣本可可以近似似看作簡簡單隨機機樣本.稱樣本的的分布為為樣本分分布。如如果為為簡單單隨機樣樣本,為為總體X的分布函函數(shù),則則樣本分分布有比比較簡單單的形式式 。它完全由由總體X的分布函函數(shù)確定定兩種形式式例1.1設(shè)有一批批產(chǎn)品,其次品品率為p,如果記記“”表表示抽取取一件產(chǎn)產(chǎn)品是次次品;“”表表示抽抽取一件件產(chǎn)品是是正品;那么,產(chǎn)品的的質(zhì)量可可以用X的分布來來衡量。X服從0-1分布,參參數(shù)就是是次品率率p。如果為為簡單隨隨機樣本,求樣樣本分布布.解:總體體X的概率分分布為例1.2設(shè)

4、總體X服從參數(shù)數(shù)為的的正態(tài)態(tài)分布,求樣本本的的分分布密度度。解:總體體X的分布密密度為所以的的概率率分布為為統(tǒng)計量統(tǒng)計量的的定義定義1.2設(shè)為為總總體X的一個樣樣本,為的的連續(xù)續(xù)函數(shù),且不含含有任何何未知參參數(shù),則則稱T為一個統(tǒng)統(tǒng)計量。注:1.統(tǒng)計量是是完全由由樣本確確定的一一個量,即樣本本有一個個觀測值值時,統(tǒng)計量就就有一個個唯一確確定的值值;2.統(tǒng)計量是是一個隨隨機變量量,它將將高維隨隨機變量量問題轉(zhuǎn)轉(zhuǎn)化為一一維隨機機變量來來處理,但不會損損失所討討論問題題的信息息量.常見的統(tǒng)統(tǒng)計量1.樣本均值值2.樣本方差差3.k階原點矩矩4.k階中心矩矩5.順序統(tǒng)計計量6.樣本極差差 與中中位數(shù)例1.

5、3設(shè)總體X為連續(xù)型型的,求最大順順序統(tǒng)計計量與最最小順序序統(tǒng)計量量的分布布密度.解:最大順序序統(tǒng)計量量的的分分布函數(shù)數(shù)為最小順序序統(tǒng)計量量 的分分布函數(shù)數(shù)為如果總體體中服從從均勻分分布則其分布密密度為充分統(tǒng)計計量例:某廠廠要了解解其產(chǎn)品品的不合合格率p,檢驗員員檢查了了10件產(chǎn)品,檢查結(jié)結(jié)果是,除前二二件是不不合格品品(記為為)外,其其它都是是合格品品(記為為)。當(dāng)廠長長問及檢檢查結(jié)果果時檢驗驗員可作作如下兩兩種回答答:(1)10件中有兩兩件不合合格;(2)前兩件不不合格。這兩種回回答反映映了檢驗驗員對樣樣本的兩兩種不同同的加工工方法。其所用用的統(tǒng)計計量分別別為顯然,第第二種回回答是不不能令人

6、人滿意的的,因為為統(tǒng)計量量不包含含樣本中中有關(guān)p的全部信信息。而而第一種種回答是是綜合了了樣本中中有關(guān)p的全部信信息。因因為樣本本提提供了了兩種信信息:(1)10次檢驗中中不合格格品出現(xiàn)現(xiàn)了幾次次;(2)不合格品品出現(xiàn)在在哪幾次次試驗上上。第二種信信息(試試驗編號號信息)對了解解不合格格品率p是沒有什什么幫助助的.充分統(tǒng)計計量就是是能把含含在樣本本中有關(guān)關(guān)總體或或者參數(shù)數(shù)的信息息一點都都不損失失地提取取出來。或者說說充分統(tǒng)統(tǒng)計量包包含了有有關(guān)總體體或有關(guān)關(guān)參數(shù)的的全部信信息.考慮樣本本的分布 由于 且是是服服從二項項分布故它與無無關(guān)定義1.3設(shè)總體X的分布為為一個含含未知參參數(shù)的分分布族,是是

7、X的一個樣樣本。是一個統(tǒng)統(tǒng)計量,對給定的的t,樣本在在的的條件下下的條條件分布布與參數(shù)數(shù)無無關(guān),則則稱統(tǒng)計計量T是參數(shù)的的充分統(tǒng)統(tǒng)計量。上例的一一般情況況是設(shè)是是來自自0-1分布的一個簡簡單隨機機樣本,其中,則則是參參數(shù)的充充分統(tǒng)計計量。由定義可可得定理1.1設(shè)是是參數(shù)數(shù)的的充充分統(tǒng)計計量,是是單值值可逆函函數(shù),則則也也是是參數(shù)的的充分統(tǒng)統(tǒng)計量。當(dāng)總體為為連續(xù)型型總體時時,充分分統(tǒng)計量量要用條條件分布布密度來來描述。奈曼(J.Neyman)和哈爾爾斯(P.R.Halmos)在20世紀(jì)40年代提出出并嚴(yán)格格證明了了一個判判別充分分統(tǒng)計量量的方法法:因子子分解定定理。定理1.2(因子分分解定理理)

8、設(shè)樣樣本的聯(lián)聯(lián)合分布布為一個個含未知知參數(shù)的的分布族族,則是是一個充充分統(tǒng)計計量當(dāng)且且僅當(dāng)存存在這樣樣的兩個個函數(shù):(1)與無無關(guān)的的非負(fù)函函數(shù);(2)與有有關(guān)關(guān),且僅僅與統(tǒng)計計量T的值有關(guān)關(guān)的非負(fù)負(fù)函數(shù)使使得得其中在在離散總總體的情情況下表表示樣本本的分布布列,在在連續(xù)總總體的情情況下表表示樣本本的分布布密度。例設(shè)設(shè)是是來自分分布布,即它的分分布密度度為的一個簡簡單隨機機樣本,其中則則分分別是參參數(shù)的充分統(tǒng)統(tǒng)計量解:樣本的的聯(lián)合分分布密度度為如果令由因子分分解定理理知是是的的充分統(tǒng)統(tǒng)計量。例 設(shè)總總體X的分布密密度為是X的一個簡簡單隨機機樣本,試證明明最小順順序統(tǒng)計計量的的充充分統(tǒng)計計量。證

9、:樣本的的聯(lián)合分分布密度度為如果令由因子分分解定理理知是是的的充充分統(tǒng)計計量。1.4抽樣分布布我們稱統(tǒng)統(tǒng)計量的的分布為為抽樣分分布,不同的統(tǒng)統(tǒng)計量其其分布不不一定相相同.常見的分分布類型型有:正態(tài)分布布伽瑪分布布卡方分布布t分布F分布伽瑪分布布定義1.4如果連續(xù)續(xù)型隨機機變量X的密度函函數(shù)為其中 為函函數(shù)數(shù),則稱稱X為服從參參數(shù)是的的伽伽瑪分布布,記為為伽瑪分布布的性質(zhì)質(zhì)(1)由此可得得(2)如果,并且且X和Y相互獨立立,容易易求得這個性質(zhì)質(zhì)稱為可可加性,即伽瑪分分布具有有可加性性.卡方分布布用構(gòu)造性性的方式式定義是是定義1.5設(shè)為為相相互獨立立的隨機機變量,且均服服從,則它們們的平方方和也是

10、一個個隨機變變量,它它所服從從的分布布稱為自自由度為為n的分分布,記記為它的密度度函數(shù)為為其密度函函數(shù)與參參數(shù)n有關(guān),它它的圖形形也有一一定差異異卡方分布布的性質(zhì)質(zhì)若,則即卡方分分布是一一種伽瑪瑪分布,因此具具有伽瑪瑪分布的的性質(zhì)()()如果,并且且X和Y相互獨立立,有 卡方分布布也具有有可加性性例是來自參參數(shù)為的的指數(shù)數(shù)分布總體,試證明明:總體的的密度為為當(dāng)時時,我我們有密度為說明假定子樣樣是簡單單隨機子子樣,則且它們之之間相互互獨立,故有t分布構(gòu)造性的的方式定定義定義1.6設(shè),且X與Y相互獨立立,記則也是是一個隨隨機變量量,它所所服從的的分布稱稱為自由由度為n的t分布,記記為它的密度度函數(shù)

11、為為與參數(shù)n有關(guān),不不同的n其圖形也也有差異異性質(zhì)若則則()當(dāng)當(dāng)時時,t分布是柯柯西分布布,柯西西分布不不存在數(shù)數(shù)學(xué)期望望和方差差參數(shù)數(shù)為2的t分布也不不存在數(shù)數(shù)學(xué)期望望和方差差()時時,()可可以證明明這是標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布的分分布密度度,即當(dāng)當(dāng)n充分大時時,T近似服從從標(biāo)準(zhǔn)正正態(tài)分布布分布構(gòu)造性的的方式定定義定義1.設(shè)設(shè),且X與Y相互獨立立,記則也是是一個隨隨機變量量,它所所服從的的分布稱稱為自由由度為(m,n)的F分布,記記為它的密度度函數(shù)為為它與m,n有關(guān),其其圖形也也有一定定差異容易得到到若,則例設(shè)試試證證明:證明:由由t分布的構(gòu)構(gòu)造性定定義知,存在相相互獨立立的變量量和,使得得于是,

12、仍相互獨獨立,由由分布布的定義義知結(jié)論論成立分位數(shù):定義1.6設(shè)X為連續(xù)型型隨機變變量,其其密度函函數(shù)為,對,如果存存在數(shù)滿滿足足則稱為為此分分布的分分位位數(shù)分位數(shù)的的幾何意意義可可用圖形形表示,它的值值可查表表得到,不同的的分布有有不同的的分位數(shù)數(shù),有不不同的表表可查常見的分分位數(shù)有有它們的值值可以通通過附表表1、附表2、附表3、附表4查得分位數(shù)具具有性質(zhì)質(zhì)(1)(2)(3)當(dāng)n足夠大時時(一般般n 45)有近似似公式例:查表求下下列分位位數(shù)的值值抽樣分布布定理定理1.1設(shè)總體,為為X的一個簡簡單隨機機樣本,為為樣樣本均值值與樣本本方差,則有:(1) (2)(3)相互獨立立;(4)定理1.2設(shè)有兩個個總體與,從兩個個總體與中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論