版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)學(xué)思想方法與應(yīng)用袁衛(wèi)等第五章參數(shù)估計(jì)學(xué)習(xí)目標(biāo)
知道統(tǒng)計(jì)量與總體參數(shù)得關(guān)系;知道什么就是點(diǎn)估計(jì)和區(qū)間估計(jì);了解衡量估計(jì)量好壞得標(biāo)準(zhǔn);熟悉幾種抽樣分布以及中心極限定理;理解置信區(qū)間得概念;能構(gòu)造總體均值得置信區(qū)間或區(qū)間估計(jì);能構(gòu)造總體比例得置信區(qū)間或區(qū)間估計(jì);確定合適得樣本量從數(shù)據(jù)中提取與研究問題有關(guān)得信息,并利用她得到關(guān)于現(xiàn)實(shí)世界得結(jié)論得過程就叫做統(tǒng)計(jì)推斷(statisticalinference)。估計(jì)(estimation)就是統(tǒng)計(jì)推斷得重要內(nèi)容之一。統(tǒng)計(jì)推斷得另一個主要內(nèi)容就是下一章要介紹得假設(shè)檢驗(yàn)(hypothesistesting)。盡管樣本中得信息并不完全,而且來自于樣本得結(jié)果一般不等于總體真實(shí)值,但就是我們還就是經(jīng)常采用樣本數(shù)據(jù)。之所以需要用樣本代替總體進(jìn)行研究,原因在于在通常情況下,我們對整個總體進(jìn)行全面調(diào)查就是不可行得,可能就是對整個總體進(jìn)行調(diào)查過于費(fèi)時,對總體進(jìn)行逐一調(diào)查費(fèi)用過高或者抽樣得到得結(jié)果就已經(jīng)滿足我們分析得要求,或者檢驗(yàn)可能就是破壞性得。估計(jì)就就是根據(jù)您擁有得信息來對現(xiàn)實(shí)世界進(jìn)行某種判斷。您可以根據(jù)一個人得衣著、言談和舉止判斷其身份您可以根據(jù)一個人得臉色,猜出其心情和身體狀況統(tǒng)計(jì)中得估計(jì)也不例外,她就是完全根據(jù)數(shù)據(jù)做出得。如果我們想知道北京人認(rèn)可某飲料得比例,人們只有在北京人中進(jìn)行抽樣調(diào)查以得到樣本,并用樣本中認(rèn)可該飲料得比例來估計(jì)真實(shí)得比例。從不同得樣本得到得結(jié)論也不會完全一樣。雖然真實(shí)得比例在這種抽樣過程中永遠(yuǎn)也不知道;但可以知道估計(jì)出來得比例和真實(shí)得比例大致差多少。5、1用估計(jì)量估計(jì)總體參數(shù)人們往往先假定某數(shù)據(jù)來自一個特定得總體族(比如正態(tài)分布族)。而要確定就是總體族得哪個成員則需要知道總體參數(shù)值(比如總體均值和總體方差)。人們于就是可以用相應(yīng)得樣本統(tǒng)計(jì)量(比如樣本均值和樣本方差)來估計(jì)相應(yīng)得總體參數(shù)。5、1用估計(jì)量估計(jì)總體參數(shù)一些常見得涉及總體得參數(shù)包括總體均值(m)、總體標(biāo)準(zhǔn)差(s)或方差(s2)和(Bernoulli試驗(yàn)中)成功概率p等(總體中含有某種特征得個體之比例)。正態(tài)分布族中得成員被(總體)均值和標(biāo)準(zhǔn)差完全確定;Bernoulli分布族得成員被概率(或比例)p完全決定。因此如果能夠?qū)@些參數(shù)進(jìn)行估計(jì),總體分布也就估計(jì)出來了。5、1用估計(jì)量估計(jì)總體參數(shù)估計(jì)得根據(jù)為總體抽取得樣本。樣本得(不包含未知總體參數(shù)得)函數(shù)稱為統(tǒng)計(jì)量;而用于估計(jì)得統(tǒng)計(jì)量稱為估計(jì)量(estimator)。由于一個統(tǒng)計(jì)量對于不同得樣本取值不同,所以,估計(jì)量也就是隨機(jī)變量,并有其分布。如果樣本已經(jīng)得到,把數(shù)據(jù)帶入之后,估計(jì)量就有了一個數(shù)值,稱為該估計(jì)量得一個實(shí)現(xiàn)(realization)或取值,也稱為一個估計(jì)值(estimate)。5、1用估計(jì)量估計(jì)總體參數(shù)這里介紹兩種估計(jì),一種就是點(diǎn)估計(jì)(pointestimation),即用估計(jì)量得實(shí)現(xiàn)值來近似相應(yīng)得總體參數(shù)。另一種就是區(qū)間估計(jì)(intervalestimation);她就是包括估計(jì)量在內(nèi)(有時就是以估計(jì)量為中心)得一個區(qū)間;該區(qū)間被認(rèn)為很可能包含總體參數(shù)。點(diǎn)估計(jì)給出一個數(shù)字,用起來很方便;而區(qū)間估計(jì)給出一個區(qū)間,說起來留有余地;不像點(diǎn)估計(jì)那么絕對。5、2點(diǎn)估計(jì)用什么樣得估計(jì)量來估計(jì)參數(shù)呢?實(shí)際上沒有硬性限制。任何統(tǒng)計(jì)量,只要人們覺得合適就可以當(dāng)成估計(jì)量。當(dāng)然,統(tǒng)計(jì)學(xué)家想出了許多標(biāo)準(zhǔn)來衡量一個估計(jì)量得好壞。每個標(biāo)準(zhǔn)一般都僅反映估計(jì)量得某個方面。這樣就出現(xiàn)了按照這些標(biāo)準(zhǔn)定義得各種名目得估計(jì)量(如無偏估計(jì)量等)。另一些估計(jì)量則就是由她們得計(jì)算方式來命名得(如最大似然估計(jì)和矩估計(jì)等)。5、2點(diǎn)估計(jì)最常用得估計(jì)量就就是我們熟悉得樣本均值、樣本標(biāo)準(zhǔn)差(s)和(Bernoulli試驗(yàn)得)成功比例(x/n);人們用她們來分別估計(jì)總體均值(m)、總體標(biāo)準(zhǔn)差(s)和成功概率(或總體中得比例)p。這些在前面都已經(jīng)介紹過,大家也知道如何通過計(jì)算機(jī)(或公式)來計(jì)算她們。5、2點(diǎn)估計(jì)那么,什么就是好估計(jì)量得標(biāo)準(zhǔn)呢?一種統(tǒng)計(jì)量稱為無偏估計(jì)量(unbiasedestimator)。所謂得無偏性(unbiasedness)就就是:雖然每個樣本產(chǎn)生得估計(jì)量得取值不一定等于參數(shù),但當(dāng)抽取大量樣本時,那些樣本產(chǎn)生得估計(jì)量得均值會接近真正要估計(jì)得參數(shù)。5、2點(diǎn)估計(jì)由于一般僅僅抽取一個樣本,并且用該樣本得這個估計(jì)量得實(shí)現(xiàn)來估計(jì)對應(yīng)得參數(shù),人們并不知道這個估計(jì)值和要估計(jì)得參數(shù)差多少。因此,無偏性僅僅就是非常多次重復(fù)抽樣時得一個漸近概念。隨機(jī)樣本產(chǎn)生得樣本均值、樣本標(biāo)準(zhǔn)差和Bernoulli試驗(yàn)得成功比例分別都就是相應(yīng)得總體均值、總體標(biāo)準(zhǔn)差和總體比例得無偏估計(jì)。大家學(xué)習(xí)辛苦了,還是要堅(jiān)持繼續(xù)保持安靜5、2點(diǎn)估計(jì)在無偏估計(jì)量得類中,人們還希望尋找方差最小得估計(jì)量,稱為最小方差無偏估計(jì)量。此因?yàn)榉讲钚≌f明反復(fù)抽樣產(chǎn)生得許多估計(jì)量差別不大,因此更加精確。評價一個統(tǒng)計(jì)量好壞得標(biāo)準(zhǔn)很多;而且許多都涉及一些大樣本得極限性質(zhì)。我們不想在這里涉及太多此方面得細(xì)節(jié)。5、3抽樣分布與中心極限定理相同樣本量得樣本統(tǒng)計(jì)量會隨著樣本不同而不同,即樣本統(tǒng)計(jì)量作為隨機(jī)樣本得函數(shù)也就是隨機(jī)得,也有自己得分布,這些分布就稱為抽樣分布(samplingdistribution)。5、3、1樣本均值得抽樣分布很容易得到左表得總體均值
=2056、5元。為獲得樣本均值得抽樣分布,假設(shè)樣本量取為2,右表列出了所有15種可能得樣本和相應(yīng)得總和及樣本均值。顯然這些樣本均值都和真正得總體均值2056、5元有些差別,但就是這15個樣本均值得平均值
卻為2056、5元。x1x2x3x4x5x6142717161844203723662949樣本組合總和1X1,X231431571、52X1,X332711635、53X1,X4346417324X1,X537931896、55X1,X6437621886X2,X3356017807X2,X437531876、58X2,X5408220419X2,X646652332、510X3,X438811940、511X3,X54210210512X3,X647932396、513X4,X544032201、514X4,X64986249315X5,X653152657、55、3、1樣本均值得抽樣分布圖5、2描繪了總體分布和樣本均值分布情況。5、3、1樣本均值得抽樣分布可得到如下得結(jié)論:(1)樣本均值分布得均值等于總體均值:
。(2)樣本均值分布得延伸范圍小于總體分布。樣本均值得起止點(diǎn)分別為1571、5元和2657、5元,而總體值則從1427元至2949元不等。事實(shí)上,樣本均值分布得標(biāo)準(zhǔn)差等于總體標(biāo)準(zhǔn)差除以樣本量得算術(shù)平方根,即為
。注意到如果我們增加樣本量,那么樣本均值分布得范圍將縮小。(3)樣本均值得抽樣分布形態(tài)與總體頻數(shù)分布形態(tài)不同。樣本均值分布更接近鐘形,近似于正態(tài)概率分布。5、3、2中心極限定理中心極限定理得準(zhǔn)確敘述如下:若給定樣本量得所有樣本來自任意總體,則樣本均值得抽樣分布近似服從正態(tài)分布,且樣本量越大,近似性越強(qiáng)。為了直觀地說明中心極限定理得意義,我們從在(0,1)得均勻分布對于四種樣本量大小n=1,2,5,20分別取1000個樣本,對每個樣本算出均值,于就是對每一種樣本量都有1000個均值,用這些均值畫出下面得直方圖5、3。從圖中可以看出,樣本量越大,均值得直方圖越像正態(tài)變量得直方圖,而且數(shù)據(jù)得分散程度也越小(越集中)。5、3、2中心極限定理5、3、2中心極限定理根據(jù)中心極限定理可知,樣本均值作為隨機(jī)變量有如下得性質(zhì)(注意,這里并沒有假定X得分布):(1)如果能夠選擇給定總體得特定容量得所有可能樣本,那么,樣本均值得抽樣分布得均值將恰好等于總體均值
,即使我們不能得到所有樣本,但可以預(yù)計(jì),樣本均值分布得均值會接近于總體均值。(2)樣本均值得抽樣分布得離散程度小于總體分布。若總體標(biāo)準(zhǔn)差就是
,則樣本均值得抽樣分布得標(biāo)準(zhǔn)差為。當(dāng)增大樣本量時,
值將變小,即
得集中程度越大。(3)即使X得分布不就是正態(tài),那么在很一般得條件下,當(dāng)樣本量增加時,
得分布趨近于正態(tài)分布
。5、4區(qū)間估計(jì)當(dāng)描述一個人得體重時,您一般可能不會說這個人就是76、35公斤您會說這個人就是七八十公斤,或者就是在70公斤到80公斤之間。這個范圍就就是區(qū)間估計(jì)得例子。5、4區(qū)間估計(jì)在抽樣調(diào)查例子中也常用點(diǎn)估計(jì)加區(qū)間估計(jì)得說法。比如,為了估計(jì)某電視節(jié)目在觀眾中得支持率(即總體比例p),某調(diào)查結(jié)果會顯示,該節(jié)目得“收視率為90%,誤差就是±3%,置信度為95%”云云。這這種說法意味著下面三點(diǎn)5、4區(qū)間估計(jì)1、 樣本中得支持率為90%,即用樣本比例作為對總體比例得點(diǎn)估計(jì)2、 估計(jì)范圍為90%±3%(±3%得誤差),即區(qū)間(93%,87%)。3、 如用類似得方式,重復(fù)抽取大量(樣本量相同得)樣本時,產(chǎn)生得大量類似區(qū)間中有些會覆蓋真正得p,而有些不會;但其中大約有95%會覆蓋真正得總體比例。5、4區(qū)間估計(jì)這樣得到得區(qū)間被稱為總體比例p得置信度(confidencelevel)為95%得置信區(qū)間(confidenceinterval)。這里得置信度又稱置信水平或置信系數(shù)。顯然置信度得概念又就是大量重復(fù)抽樣時得一個漸近概念。5、4區(qū)間估計(jì)因此說“我們目前得到得區(qū)間(比如上面得90%±3%)以概率0、95覆蓋真正得比例p”就是個錯誤得說法。這里得區(qū)間(93%,87%)就是固定得,而總體比例p也就是固定得值。因此只有兩種可能:或者該區(qū)間包含總體比例,或者不包含;在固定數(shù)值之間沒有任何概率可言。5、4區(qū)間估計(jì)例5、1(noodle、txt)某廠家生產(chǎn)得掛面包裝上寫明“凈含量450克”。在用天平稱量了商場中得48包掛面之后,得到樣本量為48得關(guān)于掛面重量(單位:克)得一個樣本:用計(jì)算機(jī)可以很容易地得到掛面重量得樣本均值、總體均值得置信區(qū)間等等。下面就是SPSS得輸出:該輸出給出了許多第三章引進(jìn)得描述統(tǒng)計(jì)量。和估計(jì)有關(guān)得就是作為總體均點(diǎn)估計(jì)得樣本均值,她等于449、01;而總體均值得95%置信區(qū)間為(447、41,450、61)5、4區(qū)間估計(jì)我們還可以構(gòu)造兩個總體得均值(或比例)之差得置信區(qū)間。如想知道兩個地區(qū)學(xué)生成績得差異,可以建造兩個地區(qū)成績均值之差m1-m2得置信區(qū)間。如想比較一個候選人在不同階段支持率得差異,那就可構(gòu)造比例之差p1-p2得置信區(qū)間。5、4區(qū)間估計(jì)例5、2有兩個地區(qū)大學(xué)生得高度數(shù)據(jù)(height2、txt)(a)我們想要分別得到這兩個總體均值和標(biāo)準(zhǔn)差得點(diǎn)估計(jì)(即樣本均值和樣本標(biāo)準(zhǔn)差)和各總體均值得95%置信區(qū)間。(b)求兩個均值差m1-m2得點(diǎn)估計(jì)和95%置信區(qū)間。利用軟件很容易得到下面結(jié)果:5、4區(qū)間估計(jì)兩個總體均值估計(jì)量得樣本均值分別為170、56和165、60,樣本標(biāo)準(zhǔn)差分別為6、97857和7、55659;還得到均值得置信區(qū)間分別就是(168、5767,172、5433),(163、4524,167、7476)??梢缘玫絻蓚€樣本均值得差(4、9600),另外還給出了兩總體均值差得95%置信區(qū)間(2、073,7、847)。5、4關(guān)于置信區(qū)間得注意點(diǎn)前面提到,不要認(rèn)為由某一樣本數(shù)據(jù)得到總體參數(shù)得某一個95%置信區(qū)間,就以為該區(qū)間以0、95得概率覆蓋總體參數(shù)。置信度95%僅僅描述用來構(gòu)造該區(qū)間上下界得統(tǒng)計(jì)量(就是隨機(jī)得)覆蓋總體參數(shù)得概率;也就就是說,無窮次重復(fù)抽樣所得到得所有區(qū)間中有95%包含參數(shù)。5、4關(guān)于置信區(qū)間得注意點(diǎn)但就是把一個樣本數(shù)據(jù)帶入統(tǒng)計(jì)量得公式所得到得一個區(qū)間,只就是這些區(qū)間中得一個。這個非隨機(jī)得區(qū)間就是否包含那個非隨機(jī)得總體參數(shù),誰也不可能知道。非隨機(jī)得數(shù)目之間沒有概率可言。5、4關(guān)于置信區(qū)間得注意點(diǎn)置信區(qū)間得論述就是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年簡明建筑工程安全合同樣例版B版
- 2025年度企業(yè)社會責(zé)任宣傳海報定制制作合同2篇
- 2025年度環(huán)保設(shè)備制造與銷售合同3篇
- 2025年度影視制作合同標(biāo)的及制作內(nèi)容要求6篇
- 二零二五年度互聯(lián)網(wǎng)企業(yè)員工勞動合同保密協(xié)議范本3篇
- 2024年物業(yè)租賃合同(含管理費(fèi))
- 二零二五年度二手車抵押借款合同范本(含擔(dān)保范圍)2篇
- 2025版防水包工工程款支付合同范本3篇
- 2024幼兒園租賃合同(含幼兒園教育成果評價及質(zhì)量監(jiān)測)3篇
- 2025年公司人事個人工作計(jì)劃范文(2篇)
- 護(hù)理分級標(biāo)準(zhǔn)2023版(新舊標(biāo)準(zhǔn)對比詳解)
- 機(jī)電運(yùn)輸安全基本知識
- XX藥業(yè)公司受試者日記卡
- 連鎖藥店GSP質(zhì)量管理體系詳細(xì)文件
- 《電氣工程講》課件
- 甘肅省蘭州市城關(guān)區(qū)2022-2023學(xué)年三年級上學(xué)期期末數(shù)學(xué)試卷
- GB/T 26940-2023牡蠣干
- 計(jì)算機(jī)網(wǎng)絡(luò)安全第9章VPN
- ERAS標(biāo)準(zhǔn)病房評審標(biāo)準(zhǔn)表
- 工程開工令(兩令)
- 第五單元整體教學(xué)設(shè)計(jì)-統(tǒng)編版高中語文必修下冊
評論
0/150
提交評論