版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
5第五章參數(shù)估計通過本章的學(xué)習,我們應(yīng)該知道:統(tǒng)計推斷的基本問題、概念與原理參數(shù)點估計的方法與評價正態(tài)總體均值的區(qū)間估計參數(shù)估計所需的樣本容量的確定Statistics統(tǒng)計抽樣推斷是統(tǒng)計學(xué)研究的重要內(nèi)容,包括兩大核心內(nèi)容:參數(shù)估計和假設(shè)檢驗。兩者都是根據(jù)樣本資料,運用科學(xué)的統(tǒng)計理論和方法對總體的參數(shù)進行推斷。參數(shù)估計對所要研究的總體參數(shù),運用某原理給出一個估計量或估計區(qū)間來假設(shè)檢驗對提出的關(guān)于總體或總體參數(shù)的某個陳述進行檢驗,判斷真?zhèn)谓y(tǒng)計推斷總體指標:參數(shù)(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣推斷學(xué)習參數(shù)估計和假設(shè)檢驗要注意:1、明確要研究的問題,并給出正確的提法2、確定合適的統(tǒng)計量3、樣本資料要有代表性4、參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計方法的主要區(qū)別:前者已知總體的分布,只是分布中含有未知參數(shù),后者對總體的分布幾乎是未知的5、給出推斷結(jié)果的合理解釋1統(tǒng)計推斷的基本問題和概念在統(tǒng)計學(xué)中,往往把所研究的問題或現(xiàn)象視為隨機變量,有自己的概率分布。但絕大多數(shù)情況下,要研究的隨機現(xiàn)象(或變量)服從什么分布可能完全不知道,或者由于現(xiàn)象的某些事實而知道其服從什么類型的分布,比如正態(tài)分布、指數(shù)分布等,但不知道分布中所含的參數(shù)。怎樣才能知道一個隨機現(xiàn)象的分布或其參數(shù)呢?這正是統(tǒng)計推斷所要解決的基本問題。如何根據(jù)觀測或試驗所得到的有限信息對總體作出推斷,并同時指出所作的這種推斷有多大的可靠性(用概率表示),是統(tǒng)計推斷的基本問題。抽樣推斷的作用(1)有些現(xiàn)象和事物不可能進行全面調(diào)查,如對具有破壞性或消耗性的產(chǎn)品進行質(zhì)量檢驗如燈泡電視抗震食品質(zhì)量檢驗人體白血球數(shù)量化驗(2)有些總體理論上可以進行全面調(diào)查,實際上辦不到如森林的樹木數(shù)量河流中的魚尾數(shù)污染狀況(3)抽樣調(diào)查可以節(jié)省人力費用和實踐,而且比較靈活(4)有些狀況下,抽樣調(diào)查結(jié)果比全面調(diào)查準確;可以用抽樣調(diào)查資料修正和補充全面調(diào)查資料如10年一次人口普查,中間的人口抽樣調(diào)查1%(5)利用抽樣推斷方法,可以對總體進行假設(shè)檢驗,判斷真?zhèn)?,決定取舍
假如我們從總體中按機會均等的原則隨機地抽取n個個體,然后對這n個個體就我們關(guān)心的數(shù)值指標X進行觀測,這一過程稱為隨機抽樣。這n個個體的數(shù)值指標稱為一個樣本,它是一個隨機向量。在一次抽樣以后,觀測到的一組確定的值或數(shù)據(jù)稱為該樣本的觀測值或樣本數(shù)據(jù)。樣本所有可能觀測值的全體就構(gòu)成了樣本空間。
X是一個隨機變量,假設(shè)X的分布函數(shù)是F(x)。由于樣本中每一個個體都來自總體X,所以樣本中的任一個體的分布函數(shù)和總體相同,即的分布函數(shù)為一般用大寫英文字母或希臘字母表示隨機變量,而用小寫英文字母表示隨機變量的觀測值或數(shù)據(jù)簡單隨機抽樣為了避免在抽樣時引入偏差,最簡單、應(yīng)用很普遍的抽樣方法是簡單隨機抽樣(也稱純隨機抽樣),它滿足以下兩個條件:
1、總體的每一個個體都有同等機會被選入樣本
2、樣本的分量是相互獨立的隨機變量,即樣本中任一個體的取值不影響其他個體的取值抽樣誤差1抽樣誤差(Samplingerror)
總體未知參數(shù)(或數(shù)字特征)和相應(yīng)的基于樣本的統(tǒng)計量之間的差異
數(shù)學(xué)表示:如何理解:
(1)抽樣誤差僅指抽樣的隨機性而產(chǎn)生的那部分代表性誤差
(2)抽樣誤差是實際誤差:即樣本指標與總體指標之差。這無法確知,并且隨著樣本的不同而變化抽樣誤差的影響因素:σ,n,抽樣方法等
影響抽樣誤差的因素總體各單位的差異程度(即標準差的大?。涸酱?,抽樣誤差越大;樣本單位數(shù)的多少:越大,抽樣誤差越??;抽樣方法:不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差?。唤y(tǒng)計量及其抽樣分布一、統(tǒng)計量定義
為什么引入統(tǒng)計量:樣本是我們進行分析和推斷的起點,但實際上我們并不直接用樣本進行推斷,而需對樣本進行“加工”和“提煉”,將分散于樣本中的信息集中起來,為此引入統(tǒng)計量的概念。
統(tǒng)計量是不依賴于任何未知參數(shù)的樣本的可測函數(shù),它是一個隨機變量。它有自己的分布密度和分布函數(shù)。例如樣本均值和樣本方差是常見的統(tǒng)計量一般而言,統(tǒng)計量是隨機變量,它有自己的分布密度和分布函數(shù);統(tǒng)計量的分布稱為抽樣分布。由樣本推斷總體特征時要依據(jù)統(tǒng)計量的抽樣分布由于正態(tài)分布應(yīng)用十分普遍,我們將給出總體為正態(tài)分布的樣本均值和樣本方差的抽樣分布,它們是統(tǒng)計推斷的理論依據(jù)和基礎(chǔ)幾個常見的抽樣分布(一)2—分布1、定義:設(shè)n個相互獨立的隨機變量X1,X2,…,Xn,Xi~N(0,1),i=1,2,…,n則稱為自由度為n的2分布。n個相互獨立的服從標準正態(tài)分布的隨機變量的平方和服從2(n)。2—分布的密度函數(shù)f(y)曲線2、性質(zhì)(1)(2)2分布的可加性X1,X2相互獨立,則X1+X2~2(n1+n2)例4(X1,X2,X3)為X的一個樣本求的分布。解因為(X1,X2,X3)為X的一個樣本則i=1,2,33、2分布表及有關(guān)計算(1)構(gòu)成P{2(n)>λ}=α,已知n,α可查表求得λ;(2)有關(guān)計算λ為2分布的α分位點α1、定義若X~N(0,1),Y~2(n),X與Y獨立,則t(n)稱為自由度為n的t—分布。(二)t—分布例
(X1,X2,X3)為X的一個樣本,求的分布i=1,2,3t(n)的概率密度為2、基本性質(zhì):(1)f(t)關(guān)于t=0(縱軸)對稱;(2)f(t)的極限為N(0,1)的密度函數(shù),即3、t分布表及有關(guān)計算(1)構(gòu)成:P{t(n)>λ}=α(2)有關(guān)計算P{t(n)>λ}=α
,λ=tα(n)α注:(三)F—分布1、定義若X~2(n1),Y~2(n2),X,Y獨立,則
稱為第一自由度為n1
,第二自由度為n2的F—分布,其概率密度為2、F分布表及有關(guān)計算(1)構(gòu)成:P{F(n1,n2)>λ}=α(2)有關(guān)計算P{F(n1,n2)>λ}=αλ=Fα(n1,n2)α例6(X1,X2,…,X5)為取自正態(tài)總體X~(0,σ2)的樣本,求統(tǒng)計量的分布解三、有關(guān)正態(tài)總體的幾個主要結(jié)果證明組合,故服從正態(tài)分布。1、若則是n
個獨立的正態(tài)隨機變量的線性2、設(shè)(X1,X2,…,Xn)是正態(tài)總體N(μ,σ2)的樣本,則(證明略)(1)(2)與S2獨立3、設(shè)(X1,X2,…,Xn)是正態(tài)總體N(μ,σ2)的樣本,則證明(X1,X2,…,Xn)是正態(tài)總體N(μ,σ2)的樣本,則由分布定理1、2可知與S2獨立且所以由t分布的定義,可知總體成數(shù)與樣本成數(shù)
總體成數(shù)(或比例)是指總體中具有某一特征的個體在總體中所占的比重,用表示
如果總體中的個體用表示,總體容量為N,則總體均值等于總體成數(shù)說明:個體具有該特征賦值“1”,不具有賦“0”
總體方差為
樣本成數(shù)是指樣本中具有某一特征的個體在該樣本中所占的比重,用p表示設(shè)X1,X2,…,Xn是從該總體抽取的一個樣本,則
樣本均值就是樣本中具有該特征的個體數(shù)占樣本總數(shù)的百分比,即就是樣本成數(shù)p,
樣本方差為則未知參數(shù),這種問題稱為參數(shù)估計問題.在實際中我們經(jīng)常遇到這樣的問題:總體的分布函數(shù)的形式為已知,是未知參數(shù).是的一個樣本,為相應(yīng)的一個樣本值.我們希望用樣本值去估計一、點估計問題的提出在數(shù)理統(tǒng)計中稱統(tǒng)計量
點估計常用方法:矩估計和極大似然估計法.解決上述參數(shù)的點估計問題的思路是:設(shè)法作出合理的估計.的估計值.構(gòu)造一個合適的統(tǒng)計量,對為的估計量,的觀測值稱為矩估計法是由英國統(tǒng)計學(xué)家矩估計法的基本思想是用樣本的階原點矩去估計總體的階原點矩;皮爾遜(K.Pearson)在1894年提出.用樣本的階中心矩去估計總體并由此得到未知參數(shù)的估計量.矩估計法的k階中心矩設(shè)總體的分布函數(shù)為,是個待估計的未知參數(shù).設(shè)存在,對任意,現(xiàn)用樣本矩作為總體矩的估計,即令這樣得到含個參數(shù)的個方程組,解該方程組得以作為參數(shù)的估計量.這種求出估計量的方法稱為矩估計法.求總體的均值和方差的矩估計.解
設(shè)是總體的一個樣本,由于故令解得例極大似然估計作為一種點估計方法最初是由德國數(shù)學(xué)家高斯(Gauss)于1821年提出,英國統(tǒng)計學(xué)家費歇爾(R.A.Fisher)在1922年作了進一步發(fā)展使之成為數(shù)理統(tǒng)計中最重要應(yīng)用最廣泛的方法之一.GaussFisher極大似然估計極大似然原理的直觀想法:在試驗中概率最大的事件最有可能出現(xiàn).一個試驗如有若干個
可能結(jié)果,若在一次試驗中,結(jié)果出現(xiàn),則認為出現(xiàn)的概率最大.極大似然估計法設(shè)總體的分布律為或分布密度為,其中是未知參數(shù),的分布律(或分布密度)為,當給定樣本值后,
它只是參數(shù)的函數(shù),記為,即則稱為似然函數(shù),似然函數(shù)實質(zhì)上是樣本的分布律或分布密度.似然函數(shù)既然在一次試驗中得到的樣本值,那么樣本取該樣本值的概率應(yīng)較大,所以選取使似然函數(shù)達到最大的參數(shù)值作為估計值,稱為極大似然估計法.是樣本的一個觀測值,設(shè)總體的分布律為的概率為則樣本設(shè)總體的分布密度(或分布律)為,其中為未知參數(shù).又設(shè)是總體的一個樣本值,如果似然函數(shù)在處達到最大,則稱分別為的極大似然估計量.由于與有相同的極大值點.因此,為極大似然估計的必要條件為
稱它為似然方程,其中求極大似然估計量的一般步驟為:(1)求似然函數(shù);(2)求出及似然方程(3)解似然方程得到極大似然估計值
(4)最后得到極大似然估計量
設(shè)總體,求參數(shù)的極大似然估計量.解設(shè)是總體的樣本,其觀測值為,由總體,分布密度為例似然函數(shù)解似然方程得極大似然估計量為.兩種求點估計的方法:矩估計法極大似然估計法在統(tǒng)計問題中往往先使用極大似然估計法,
在極大似然估計法使用不方便時,再用矩估計法.內(nèi)容小結(jié)點估計的評價標準設(shè)為待估計的總體參數(shù),為樣本統(tǒng)計量,則的優(yōu)良標準為:若,則稱為的無偏估計量指樣本指標的均值應(yīng)等于被估計的總體指標無偏性若,則稱為比更有效的估計量作為優(yōu)良的估計量,除了滿足無偏性的要求外,其方差應(yīng)比較小有效性指隨著樣本單位數(shù)的增大,樣本估計量將在概率意義下越來越接近于總體真實值一致性點估計量的評價標準若對于任意ε>0,有為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。數(shù)理統(tǒng)計可以證明:點估計量的評價標準3、正態(tài)總體均值的區(qū)間估計一.置信區(qū)間概念對于未知參數(shù),除了得到它的點估計外,我們還希望估計出一個范圍,并希望知道這個范圍包含參數(shù)真值的可信程度.這樣的范圍通常以區(qū)間的形式給出,而可信程度由概率給出.這種估計稱為區(qū)間估計或置信區(qū)間,以下先給出置信區(qū)間概念.定義
設(shè)為總體X的一個未知參數(shù),是預(yù)先給定一個數(shù),,是兩個估計量,如果
則稱隨機區(qū)間為未知參數(shù)的一個置信度為的置信區(qū)間(ConfidenceInterval).置信度也常稱為置信水平(confidencelevel)或置信系數(shù)(confidencecoefficient).通常取0.05,0.01,0.10,視具體需要而定.二.求區(qū)間估計的一般方法首先根據(jù)樣本尋找一個隨機變量(樞軸變量),使其分布完全已知.對給定的置信度,由T的分布確定兩個常數(shù)C1,C2使將事件表示為則即的置信度為的置信區(qū)間為.三.正態(tài)總體均值的區(qū)間估計
鑒于實際問題中最常見的參數(shù)估計問題多數(shù)是要求估計總體的均值和方差,且正態(tài)總體又是實際問題中最常遇到的總體,因此,以下著重討論正態(tài)總體均值和方差的區(qū)間估計.總體X~N
,μ
是未知參數(shù),現(xiàn)在我們分兩種情形討論μ的區(qū)間估計問題從該總體X中抽取隨機樣本,并以作為μ=EX的點估計,服從正態(tài)分布1.已知情形下μ的置信區(qū)間若是已知參數(shù),這時可選取樞軸變量~N(0,1)則對給定的置信度,存在,使
這里是標準正態(tài)分布的-上側(cè)分位數(shù),其值可查附表求得.將U的表示式代入上式可得
所以μ的置信度為的置信區(qū)間是
其長度為
2.為未知情形下,μ的置信區(qū)間
若是未知參數(shù),則以的無偏估計代替,這時由于樞軸變量~所以對給定的置信度,存在使
這里的是自由度為n-1的t分布的-上側(cè)分位數(shù),它的值可查附表求得,將T代入可得因此有
所以μ的置信度為的置信區(qū)間是
其長度為
需要說明的是:置信區(qū)間公式中的,,在實際問題中都是具體觀測值,計算時應(yīng)是.四.大樣本情形下總體均值的區(qū)間估計.對一般的總體X,無論它服從什么分布,只要其均值μ=EX和方差σ2=DX都存在,我們便可以用增大樣本容量的辦法對其均值μ作區(qū)間估計.根據(jù)中心極限定理,當樣本容量n充分大時,便近似服從正態(tài)分布.又因為
,所以
N(0,1)又因為樣本二階中心矩Sn是σ的無偏估計,當n充分大時,σ近似等于Sn,從而上式中以Sn代替σ,可得樞軸變量
N(0,1)對于指定的α∈(0,1),查附表可得到,使即故的置信度為的置信區(qū)間近似為
1.兩個正態(tài)總體均值差的區(qū)間估計設(shè)總體,總體,兩總體相互獨立.現(xiàn)從兩總體中各取一個容量分別為n1和n2的樣本,并記兩個樣本的均值、方差分別為和取作為的點估計,顯然這個估計是無偏的,并且,有~N(0,1)于是可得的置信度為的置
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度工程項目承包經(jīng)營協(xié)議
- 2024年工程人員勞務(wù)派遣協(xié)議范本
- 濟南版七年級生物(上)導(dǎo)學(xué)案
- 籃球 基礎(chǔ)教案
- 小學(xué)體育-足球-教案
- 企業(yè)技術(shù)開發(fā)共建協(xié)議
- 倉儲物流清潔保養(yǎng)服務(wù)協(xié)議
- 交通運輸優(yōu)化貸款協(xié)議
- 交通運輸展合作協(xié)議模板
- 二手空調(diào)太陽能機組購銷合同模板
- 9天干地支與十神的對照表
- 醫(yī)院新進護士輪轉(zhuǎn)手冊
- 混合痔優(yōu)化中醫(yī)護理方案
- 質(zhì)量目標分解
- (完整word版)搶救車急救藥品、物品一覽表(表格版)
- 數(shù)學(xué)方格紙(共3頁)
- 農(nóng)產(chǎn)品市場營銷策略PPT課件
- 古代官職變動用詞(完整版).ppt
- A760(761)E自動變速器ppt課件
- 防呆法(防錯法)Poka-Yoke
- 超星爾雅學(xué)習通《國際金融》章節(jié)測試答案
評論
0/150
提交評論