第五部分 數理統(tǒng)計方法之概率統(tǒng)計模型.docx_第1頁
第五部分 數理統(tǒng)計方法之概率統(tǒng)計模型.docx_第2頁
第五部分 數理統(tǒng)計方法之概率統(tǒng)計模型.docx_第3頁
第五部分 數理統(tǒng)計方法之概率統(tǒng)計模型.docx_第4頁
第五部分 數理統(tǒng)計方法之概率統(tǒng)計模型.docx_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五部分 數理統(tǒng)計方法第十章 概率統(tǒng)計模型在現實當中,未來的不確定性事件是我們研究的對象。概率論和數理統(tǒng)計是研究的主要工具。其特點是在隨機變量的概率分布或密度函數已知的情況下,然后去研究性質、特點和規(guī)律性。首先我們歸納一下有關的理論知識,然后給出一些模型實例。10.1 統(tǒng)計知識為了更好地統(tǒng)計建立模型,我們先系統(tǒng)地總結一下有關基礎知識。假如我們要研究某廠所生產的一批燈泡的平均壽命。由于測試燈泡的壽命具有破壞性,所以我們只能從這批產品中抽取一部分進行壽命測試,并且根據這部分產品壽命數據對整批產品的平均壽命作出統(tǒng)計推斷,即由部分推斷整體。為此我們引入總體和個體這二個概念。定義1 在統(tǒng)計學中,常把研究對象的全體稱為總體,也稱母體,而把組成總體的每個元素稱為個體 。例如上述的一批燈泡的全體就組成一個總體,其中每一個燈泡就是一個個體。但是,在統(tǒng)計學中,我們并不籠統(tǒng)地研究所關心對象的一切情況,而只是對它的某一個或幾個數值指標感興趣。例如,考察燈泡時,我們并不研究它的形狀、式樣等特征,而只是關心燈泡壽命、亮度等數值指標的大小。當我們只考察燈泡壽命這項數值指標時,一批燈泡中的每一個燈泡均有一個確定的壽命值,因此,很自然地,我們應該把所有的這些燈泡壽命的全體當作總體,這時,每個燈泡壽命值就是個體。我們知道,即使在相同的生產條件下生產燈泡,由于種種微小的偶然因素的影響,它們的壽命值也不盡相同,但確有一定的統(tǒng)計規(guī)律,這說明燈泡壽命是一個隨機變量,這時,每只燈泡的壽命值就是隨機變量的可能取值,而總體就是隨機變量的所有這些可能取值的全體。因而我們可以用隨機變量X來描述總體,簡稱總體X,X的分布函數稱為總體X的分布函數。這樣就把對總體的研究轉化為對表示總體的隨機變量X的研究。這種聯系也可以推廣到多維。例如,要研究總體中個體的兩個數值指標X和Y,比如X表示燈泡的壽命和Y表示燈泡的亮度,我們可以把這兩個指標所構成的二維隨機向量可能取值的全體看作一個總體,簡稱的二維總體,的聯合分布函數稱為總體的聯合分布函數。由于總體可用隨機變量來描述,因而研究總體就需要研究其分布,一般來說,其分布是未知的,或分布類型的已知,但其中的參數未知。為了要確定總體的分布,我們可以從總體中按機會均等的原則隨機地抽取一些個體,然后對這些個體進行觀測或測試某個指標的數值。這種按機會均等的原則選取一些個體進行觀測或測試的過程稱為隨機抽樣,簡稱抽樣。定義2從總體X中,隨機地抽取n個個體,這n個個體的指標分別為,通常記為,稱為總體X的一個樣本 ,或稱子樣,n稱為樣本的容量 。樣本中的每個是一個隨機變量,從而我們可以把容量為n的樣本看作為一個n維隨機向量,在一次抽樣以后,觀測到的一組確定的值()稱作容量為n的樣本的觀測值,此觀測值()可以看作隨機實驗的一個結果。由于抽樣是隨機的,樣本就有兩重性:(1)在抽樣進行之前,它們是隨機的,因而是n維隨機向量;(2)在抽樣結束之后,它們是一組確定的數,即觀測值()。實際上,從總體中抽取樣本可以有各種不同的方法。為了要使抽到的樣本能夠對總體作出較可靠的推斷,就要求抽到的樣本能很好地反映總體的特性,為此就需要對抽樣方法提出一些要求。現在介紹一種滿足下面兩個要求的抽樣方法:(1)代表性:總體的每一個體有同等機會被抽到,使樣本能代表總體,即要求每個必須與總體X具有相同的分布;(2)獨立性:觀測結果之間互不影響,即要求是相互獨立的。定義3 若總體X的一個樣本滿足代表性和獨立性,則稱為總體X的一個簡單隨機樣本 ,或稱為來自總體X的簡單隨機樣本。今后如不作特別說明,凡提到樣本總是指簡單隨機樣本。一般而言,有放回抽樣所得到的樣本就是簡單隨機樣本。而對于不放回抽樣,當樣本容量n相對于樣品總數N很?。ㄒ话悖r,可以把所得到的樣本近似地看作一個簡單隨機樣本。因此,在許多情況下,代表性和獨立性可以得到滿足和近似滿足,而在統(tǒng)計方法的研究上,有代表性和獨立性這兩個條件將是十分方便的。若總體X的分布函數是,由代表性知的分布函數為,再由獨立性,顯然可得樣本的聯合分布函數為 。同樣,若總體X為離散型隨機變量,且其概率分布為則的聯合概率分布為,其中的取值范圍為。若總體X為連續(xù)型隨機變量,且其密度函數為,則的聯合密度函數為 。10.2 統(tǒng)計量樣本是總體的代表和反映,即樣本含有總體的信息,但較為分散,為了對總體進行推斷,需要將分散在樣本中有關總體的信息集中起來以反映總體的各種特征,這就需要對樣本進行加工。一種有效的方法是構造樣本的函數,不同的樣本函數反映總體的不同特征,這種樣本函數便是統(tǒng)計量。定義4設是來自某總體X的一個容量為n的樣本,若樣本函數中不含任何未知參數,則稱T為統(tǒng)計量 。定義中“不含任何未知參數”是指在獲得了樣本的觀測值()后,代入統(tǒng)計量立即可以算得統(tǒng)計量的觀測值 。例1設總體X服從正態(tài)分布N(),其中為已知參數,為未知參數,是來自總體X的樣本,則,均是統(tǒng)計量,而,都不是統(tǒng)計量。在具體的統(tǒng)計問題中,選用什么樣的統(tǒng)計量是一個依賴于具體情況與要求而定的問題。統(tǒng)計量的選取既要針對問題的需要,又要具備較好的性質,便于應用。下面介紹一些常用的統(tǒng)計量。以后,我們記總體X的數學期望EX為,即EX;總體X的方差DX為,即DX。注意,只是將EX和DX分別記為和,總體X并不一定服從。10.2.1樣本均值定義5設樣本來自總體X,則稱統(tǒng)計量為樣本均值 。當獲得了樣本觀測值后代入,可求得樣本均值的觀測值: ,亦簡稱樣本均值。性質1設總體X的數學期望EX及方差DX存在,樣本來自總體X,則 。由性質1知,樣本均值反映了總體X的數學期望EX的信息。這是因為,的取值雖然有時會比大,有時會比小,但是,的中心位置正好是,并且圍繞的擺動幅度(即方差)隨樣本容量n的增大而減小,這就是說n越大,越向總體的數學期望集中。所以,當n較大時,樣本均值可作為總體的數學期望的近似值,為近似的精度。其實切比雪夫大數定律(即平均值具有穩(wěn)定性)也是說明了這個問題。10.2.2樣本方差定義6設樣本來自總體,則稱統(tǒng)計量為樣本方差 ,稱為樣本標準差 。稱統(tǒng)計量。 為修正樣本方差 ,稱為修正樣本標準差 。把觀測值代入和,可得樣本方差和修正樣本方差的觀測值 。在實際應用中也簡稱它們?yōu)闃颖痉讲詈托拚龢颖痉讲?。?,此式為計算和提供了方便。性質2 設總體X的數學期望EX及方差DX存在,樣本來自總體X,則。由性質2知,修正樣本方差反映了總體X的方差的信息。這是因為,的取值圍繞擺動,的中心位置正好是??梢栽O想一下,當總體方差較大時,樣本的觀測值就較為分散,從而使偏差平方和較大,也即也較大,反之也如此。因此,修正樣本方差反映了數據取值分散與集中的程度,即反映了總體方差的信息。雖然,也一定程度反映總體X的方差,但是有系統(tǒng)誤差(除了隨機性以外),而克服了的缺點,無系統(tǒng)誤差。當n較大時,和差別不大。10.2.3樣本的相關系數我們可以模擬總體X的相關系數的定義構造出樣本的相關系數。定義7設是來自二維總體的一個樣本,則稱統(tǒng)計量為樣本的相關系數 。由構造的方法知的,樣本的相關系數反映了二維總體中X與Y的相關系數的信息。10.2.4樣本矩定義8 設樣本來自總體,統(tǒng)計量 稱為樣本階矩或樣本階原點矩,其中是正整數。而統(tǒng)計量 稱為樣本階中心矩,其中是正整數。當時,即其為樣本均值;當時,為樣本方差。樣本階矩和樣本階中心矩常被用來作為總體相應矩的估計。10.3 抽象分布統(tǒng)計量是我們對總體的分布或數字特征進行統(tǒng)計推斷的基礎。因此求統(tǒng)計量的分布是數理統(tǒng)計的基本問題之一。定義9 我們稱統(tǒng)計量的分布為抽樣分布 。關于抽樣分布,我們關心兩類問題:(1)當已知總體X的分布類型時,若能對固定的樣本容量n推導出統(tǒng)計量的分布,則稱這種抽樣分布為精確分布,它在小樣本問題(n較?。┲刑貏e有用;(2)不對任何個別的n求出統(tǒng)計量的分布,而只求出當時,統(tǒng)計量的極限分布,則稱這種抽樣分布為極限分布,它在大樣本問題(n較大)中很有用。由于正態(tài)總體(即服從正態(tài)分布的總體)在數理統(tǒng)計中占有特別重要的地位,下面主要推導正態(tài)總體的幾個常用的精確抽樣分布。10.3.1正態(tài)總體樣本的線性函數的分布設總體X服從正態(tài)分布N(),為來自此總體的樣本。考察統(tǒng)計量:,其中為已知常數。關于U,我們有以下定理。定理1 設是來自正態(tài)總體N()的一個樣本,統(tǒng)計量U是樣本的任一確定的線性函數,即則U也是正態(tài)隨機變量,即 。推論1 設是來自正態(tài)總體N()的一個樣本,則樣本均值也是正態(tài)隨機變量,即 。將標準化,即得:推論2 設是來自正態(tài)總體N()的一個樣本,則 。10.3.2 分布定義10 設是相互獨立且服從于N(0,1)的隨機變量,則稱隨機變量服從自由度為n的分布,記作。若,則它的密度函數為其中為函數。性質3 設,且和相互獨立,則。即分布具有可加性。證明:由分布的定義即知本性質成立。推論3 設且它們相互獨立,則證明:由性質73及歸納法即知來推論成立。下面的重要定理是分布在正態(tài)總體抽樣中的應用。定理2 設是來自正態(tài)總體N()的一個樣本,且,則(1);(2)與相互獨立。10.3.3 t-分布定義11 設,且X與Y相互獨立,則稱隨機變量服從自由度為n的t-分布,記作 。若,則它的密度函數為。在圖7-2中給出了當n=5,時,t-分布的密度函數曲線。必須對t-分布的密度函數曲線形狀有所了解。性質4 t-分布的極限分布為標準正態(tài)分布N(0,1),即 。下面的二個重要定理是分布在正態(tài)總體抽樣中的應用。定理3設是來自正態(tài)總體的一個樣本,則統(tǒng)計量。定理4設和是分別來自正態(tài)總體和的二個獨立樣本,記,,則 。,10.3.4 F分布定義12 設,且X與Y獨立,則稱隨機變量服從自

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論