MBA統(tǒng)計學(xué)05總體參數(shù)的估計_第1頁
MBA統(tǒng)計學(xué)05總體參數(shù)的估計_第2頁
MBA統(tǒng)計學(xué)05總體參數(shù)的估計_第3頁
MBA統(tǒng)計學(xué)05總體參數(shù)的估計_第4頁
MBA統(tǒng)計學(xué)05總體參數(shù)的估計_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)─從數(shù)據(jù)到結(jié)論第五章總體參數(shù)的估計估計就是根據(jù)他擁有的信息來對現(xiàn)實世界進展某種判別。他可以根據(jù)一個人的穿著、言談和舉止判別其身份他可以根據(jù)一個人的神色,猜出其心境和身體情況統(tǒng)計中的估計也不例外,它是完全根據(jù)數(shù)據(jù)做出的。假設(shè)我們想知道北京人認(rèn)可某飲料的比例,人們只需在北京人中進展抽樣調(diào)查以得到樣本,并用樣本中認(rèn)可該飲料的比例來估計真實的比例。從不同的樣本得到的結(jié)論也不會完全一樣。雖然真實的比例在這種抽樣過程中永遠也不知道;但可以知道估計出來的比例和真實的比例大致差多少。從數(shù)據(jù)得到關(guān)于現(xiàn)實世界的結(jié)論的過程就叫做統(tǒng)計推斷(statisticalinference)。上面調(diào)查例子是估計總體參數(shù)〔某種意見的比例〕的一個過程。估計(estimation)是統(tǒng)計推斷的重要內(nèi)容之一。統(tǒng)計推斷的另一個主要內(nèi)容是下一章要引進的假設(shè)檢驗(hypothesistesting)。§5.1用估計量估計總體參數(shù)人們往往先假定某數(shù)據(jù)來自一個特定的總體族〔比如正態(tài)分布族〕。而要確定是總體族的哪個成員那么需求知道總體參數(shù)值〔比如總體均值和總體方差〕。人們于是可以用相應(yīng)的樣本統(tǒng)計量〔比如樣本均值和樣本方差〕來估計相應(yīng)的總體參數(shù)§5.1用估計量估計總體參數(shù)一些常見的涉及總體的參數(shù)包括總體均值(m)、總體規(guī)范差(s)或方差(s2)和(Bernoulli實驗中)勝利概率p等〔總體中含有某種特征的個體之比例〕。正態(tài)分布族中的成員被〔總體〕均值和規(guī)范差完全確定;Bernoulli分布族的成員被概率〔或比例〕p完全決議。因此假設(shè)可以對這些參數(shù)進展估計,總體分布也就估計出來了?!?.1用估計量估計總體參數(shù)估計的根據(jù)為總體抽取的樣本。樣本的〔不包含未知總體參數(shù)的〕函數(shù)稱為統(tǒng)計量;而用于估計的統(tǒng)計量稱為估計量(estimator)。由于一個統(tǒng)計量對于不同的樣本取值不同,所以,估計量也是隨機變量,并有其分布。假設(shè)樣本曾經(jīng)得到,把數(shù)據(jù)帶入之后,估計量就有了一個數(shù)值,稱為該估計量的一個實現(xiàn)(realization)或取值,也稱為一個估計值(estimate)。§5.1用估計量估計總體參數(shù)這里引見兩種估計,一種是點估計(pointestimation),即用估計量的實現(xiàn)值來近似相應(yīng)的總體參數(shù)。另一種是區(qū)間估計(intervalestimation);它是包括估計量在內(nèi)〔有時是以估計量為中心〕的一個區(qū)間;該區(qū)間被以為很能夠包含總體參數(shù)。點估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不像點估計那么絕對?!?.2點估計用什么樣的估計量來估計參數(shù)呢?實踐上沒有硬性限制。任何統(tǒng)計量,只需人們覺得適宜就可以當(dāng)成估計量。當(dāng)然,統(tǒng)計學(xué)家想出了許多規(guī)范來衡量一個估計量的好壞。每個規(guī)范普通都僅反映估計量的某個方面。這樣就出現(xiàn)了按照這些規(guī)范定義的各種名目的估計量〔如無偏估計量等〕。另一些估計量那么是由它們的計算方式來命名的〔如最大似然估計和矩估計等〕?!?.2點估計最常用的估計量就是我們熟習(xí)的樣本均值、樣本規(guī)范差(s)和(Bernoulli實驗的)勝利比例(x/n);人們用它們來分別估計總體均值(m)、總體規(guī)范差(s)和勝利概率(或總體中的比例)p。這些在前面都曾經(jīng)引見過,大家也知道如何經(jīng)過計算機〔或公式〕來計算它們?!?.2點估計那么,什么是好估計量的規(guī)范呢?一種統(tǒng)計量稱為無偏估計量(unbiasedestimator)。所謂的無偏性(unbiasedness)就是:雖然每個樣本產(chǎn)生的估計量的取值不一定等于參數(shù),但當(dāng)抽取大量樣本時,那些樣本產(chǎn)生的估計量的均值會接近真正要估計的參數(shù)?!?.2點估計由于普通僅僅抽取一個樣本,并且用該樣本的這個估計量的實現(xiàn)來估計對應(yīng)的參數(shù),人們并不知道這個估計值和要估計的參數(shù)差多少。因此,無偏性僅僅是非常多次反復(fù)抽樣時的一個漸近概念。隨機樣本產(chǎn)生的樣本均值、樣本規(guī)范差和Bernoulli實驗的勝利比例分別都是相應(yīng)的總體均值、總體規(guī)范差和總體比例的無偏估計?!?.2點估計在無偏估計量的類中,人們還希望尋覓方差最小的估計量,稱為最小方差無偏估計量。此由于方差小闡明反復(fù)抽樣產(chǎn)生的許多估計量差別不大,因此更加準(zhǔn)確。評價一個統(tǒng)計量好壞的規(guī)范很多;而且許多都涉及一些大樣本的極限性質(zhì)。我們不想在這里涉及太多此方面的細節(jié)?!?.3區(qū)間估計當(dāng)描畫一個人的體重時,他普通能夠不會說這個人是76.35公斤他會說這個人是七八十公斤,或者是在70公斤到80公斤之間。這個范圍就是區(qū)間估計的例子?!?.3區(qū)間估計在抽樣調(diào)查例子中也常用點估計加區(qū)間估計的說法。比如,為了估計某電視節(jié)目在觀眾中的支持率〔即總體比例p〕,某調(diào)查結(jié)果會顯示,該節(jié)目的“收視率為90%,誤差是±3%,置信度為95%〞云云。這這種說法意味著下面三點§5.3區(qū)間估計1. 樣本中的支持率為90%,即用樣本比例作為對總體比例的點估計2. 估計范圍為90%±3%(±3%的誤差),即區(qū)間(93%,87%)。3. 如用類似的方式,反復(fù)抽取大量〔樣本量一樣的〕樣本時,產(chǎn)生的大量類似區(qū)間中有些會覆蓋真正的p,而有些不會;但其中大約有95%會覆蓋真正的總體比例?!?.3區(qū)間估計這樣得到的區(qū)間被稱為總體比例p的置信度(confidencelevel)為95%的置信區(qū)間(confidenceinterval)。這里的置信度又稱置信程度或置信系數(shù)。顯然置信度的概念又是大量反復(fù)抽樣時的一個漸近概念。§5.3區(qū)間估計因此說“我們目前得到的區(qū)間〔比如上面的90%±3%〕以概率0.95覆蓋真正的比例p〞是個錯誤的說法。這里的區(qū)間(93%,87%)是固定的,而總體比例p也是固定的值。因此只需兩種能夠:或者該區(qū)間包含總體比例,或者不包含;在固定數(shù)值之間沒有任何概率可言?!?.3區(qū)間估計例5.1(noodle.txt)某廠家消費的掛面包裝上寫明“凈含量450克〞。在用天平稱量了商場中的48包掛面之后,得到樣本量為48的關(guān)于掛面分量〔單位:克〕的一個樣本:用計算機可以很容易地得到掛面分量的樣本均值、總體均值的置信區(qū)間等等。下面是SPSS的輸出:該輸出給出了許多第三章引進的描畫統(tǒng)計量。和估計有關(guān)的是作為總體均點估計的樣本均值,它等于449.01;而總體均值的95%置信區(qū)間為〔447.41,450.61〕§5.3區(qū)間估計我們還可以構(gòu)造兩個總體的均值〔或比例〕之差的置信區(qū)間。如想知道兩個地域?qū)W生成果的差別,可以建造兩個地域成果均值之差m1-m2的置信區(qū)間。如想比較一個候選人在不同階段支持率的差別,那就可構(gòu)造比例之差p1-p2的置信區(qū)間?!?.3區(qū)間估計例5.2有兩個地域大學(xué)生的高度數(shù)據(jù)(height2.txt)(a)我們想要分別得到這兩個總體均值和規(guī)范差的點估計〔即樣本均值和樣本規(guī)范差〕和各總體均值的95%置信區(qū)間。(b)求兩個均值差m1-m2的點估計和95%置信區(qū)間。利用軟件很容易得到下面結(jié)果:§5.3區(qū)間估計兩個總體均值估計量的樣本均值分別為170.56和165.60,樣本規(guī)范差分別為6.97857和7.55659;還得到均值的置信區(qū)間分別是(168.5767,172.5433),(163.4524,167.7476)??梢缘玫絻蓚€樣本均值的差(4.9600),另外還給出了兩總體均值差的95%置信區(qū)間(2.073,7.847)。§5.4關(guān)于置信區(qū)間的留意點前面提到,不要以為由某一樣本數(shù)據(jù)得到總體參數(shù)的某一個95%置信區(qū)間,就以為該區(qū)間以0.95的概率覆蓋總體參數(shù)。置信度95%僅僅描畫用來構(gòu)造該區(qū)間上下界的統(tǒng)計量(是隨機的)覆蓋總體參數(shù)的概率;也就是說,無窮次反復(fù)抽樣所得到的一切區(qū)間中有95%包含參數(shù)?!?.4關(guān)于置信區(qū)間的留意點但是把一個樣本數(shù)據(jù)帶入統(tǒng)計量的公式所得到的一個區(qū)間,只是這些區(qū)間中的一個。這個非隨機的區(qū)間能否包含那個非隨機的總體參數(shù),誰也不能夠知道。非隨機的數(shù)目之間沒有概率可言。§5.4關(guān)于置信區(qū)間的留意點置信區(qū)間的論述是由區(qū)間和置信度兩部分組成。有些新聞媒體報道一些調(diào)查結(jié)果只給出百分比和誤差〔即置信區(qū)間〕,并不闡明置信度,也不給出被調(diào)查的人數(shù),這是不擔(dān)任的表現(xiàn)。由于降低置信度可以使置信區(qū)間變窄〔顯得“準(zhǔn)確〞〕,有誤導(dǎo)讀者之嫌。在公布調(diào)查結(jié)果時給出被調(diào)查人數(shù)是擔(dān)任任的表現(xiàn)。這樣那么可以由此推算出置信度〔由后面給出的公式〕,反之亦然?!?.4關(guān)于置信區(qū)間的留意點一個描畫性例子:有10000個人回答的調(diào)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論