MBA統(tǒng)計學(xué)05總體參數(shù)的估計

上傳人：明*** IP屬地：廣東上傳時間：2024-02-02 格式：PPT 頁數(shù)：28 大?。?52.50KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)─從數(shù)據(jù)到結(jié)論第五章總體參數(shù)的估計估計就是根據(jù)他擁有的信息來對現(xiàn)實世界進展某種判別。他可以根據(jù)一個人的穿著、言談和舉止判別其身份他可以根據(jù)一個人的神色，猜出其心境和身體情況統(tǒng)計中的估計也不例外，它是完全根據(jù)數(shù)據(jù)做出的。假設(shè)我們想知道北京人認(rèn)可某飲料的比例，人們只需在北京人中進展抽樣調(diào)查以得到樣本，并用樣本中認(rèn)可該飲料的比例來估計真實的比例。從不同的樣本得到的結(jié)論也不會完全一樣。雖然真實的比例在這種抽樣過程中永遠也不知道；但可以知道估計出來的比例和真實的比例大致差多少。從數(shù)據(jù)得到關(guān)于現(xiàn)實世界的結(jié)論的過程就叫做統(tǒng)計推斷(statisticalinference)。上面調(diào)查例子是估計總體參數(shù)〔某種意見的比例〕的一個過程。估計(estimation)是統(tǒng)計推斷的重要內(nèi)容之一。統(tǒng)計推斷的另一個主要內(nèi)容是下一章要引進的假設(shè)檢驗(hypothesistesting)。§5.1用估計量估計總體參數(shù)人們往往先假定某數(shù)據(jù)來自一個特定的總體族〔比如正態(tài)分布族〕。而要確定是總體族的哪個成員那么需求知道總體參數(shù)值〔比如總體均值和總體方差〕。人們于是可以用相應(yīng)的樣本統(tǒng)計量〔比如樣本均值和樣本方差〕來估計相應(yīng)的總體參數(shù)§5.1用估計量估計總體參數(shù)一些常見的涉及總體的參數(shù)包括總體均值(m)、總體規(guī)范差(s)或方差(s2)和(Bernoulli實驗中)勝利概率p等〔總體中含有某種特征的個體之比例〕。正態(tài)分布族中的成員被〔總體〕均值和規(guī)范差完全確定；Bernoulli分布族的成員被概率〔或比例〕p完全決議。因此假設(shè)可以對這些參數(shù)進展估計，總體分布也就估計出來了?！?.1用估計量估計總體參數(shù)估計的根據(jù)為總體抽取的樣本。樣本的〔不包含未知總體參數(shù)的〕函數(shù)稱為統(tǒng)計量；而用于估計的統(tǒng)計量稱為估計量(estimator)。由于一個統(tǒng)計量對于不同的樣本取值不同，所以，估計量也是隨機變量，并有其分布。假設(shè)樣本曾經(jīng)得到，把數(shù)據(jù)帶入之后，估計量就有了一個數(shù)值，稱為該估計量的一個實現(xiàn)(realization)或取值，也稱為一個估計值(estimate)。§5.1用估計量估計總體參數(shù)這里引見兩種估計，一種是點估計(pointestimation)，即用估計量的實現(xiàn)值來近似相應(yīng)的總體參數(shù)。另一種是區(qū)間估計(intervalestimation)；它是包括估計量在內(nèi)〔有時是以估計量為中心〕的一個區(qū)間；該區(qū)間被以為很能夠包含總體參數(shù)。點估計給出一個數(shù)字，用起來很方便；而區(qū)間估計給出一個區(qū)間，說起來留有余地；不像點估計那么絕對?！?.2點估計用什么樣的估計量來估計參數(shù)呢？實踐上沒有硬性限制。任何統(tǒng)計量，只需人們覺得適宜就可以當(dāng)成估計量。當(dāng)然，統(tǒng)計學(xué)家想出了許多規(guī)范來衡量一個估計量的好壞。每個規(guī)范普通都僅反映估計量的某個方面。這樣就出現(xiàn)了按照這些規(guī)范定義的各種名目的估計量〔如無偏估計量等〕。另一些估計量那么是由它們的計算方式來命名的〔如最大似然估計和矩估計等〕?！?.2點估計最常用的估計量就是我們熟習(xí)的樣本均值、樣本規(guī)范差(s)和(Bernoulli實驗的)勝利比例(x/n)；人們用它們來分別估計總體均值(m)、總體規(guī)范差(s)和勝利概率(或總體中的比例)p。這些在前面都曾經(jīng)引見過，大家也知道如何經(jīng)過計算機〔或公式〕來計算它們?！?.2點估計那么，什么是好估計量的規(guī)范呢？一種統(tǒng)計量稱為無偏估計量(unbiasedestimator)。所謂的無偏性(unbiasedness)就是：雖然每個樣本產(chǎn)生的估計量的取值不一定等于參數(shù)，但當(dāng)抽取大量樣本時，那些樣本產(chǎn)生的估計量的均值會接近真正要估計的參數(shù)?！?.2點估計由于普通僅僅抽取一個樣本，并且用該樣本的這個估計量的實現(xiàn)來估計對應(yīng)的參數(shù)，人們并不知道這個估計值和要估計的參數(shù)差多少。因此，無偏性僅僅是非常多次反復(fù)抽樣時的一個漸近概念。隨機樣本產(chǎn)生的樣本均值、樣本規(guī)范差和Bernoulli實驗的勝利比例分別都是相應(yīng)的總體均值、總體規(guī)范差和總體比例的無偏估計?！?.2點估計在無偏估計量的類中，人們還希望尋覓方差最小的估計量，稱為最小方差無偏估計量。此由于方差小闡明反復(fù)抽樣產(chǎn)生的許多估計量差別不大，因此更加準(zhǔn)確。評價一個統(tǒng)計量好壞的規(guī)范很多；而且許多都涉及一些大樣本的極限性質(zhì)。我們不想在這里涉及太多此方面的細節(jié)?！?.3區(qū)間估計當(dāng)描畫一個人的體重時，他普通能夠不會說這個人是76.35公斤他會說這個人是七八十公斤，或者是在70公斤到80公斤之間。這個范圍就是區(qū)間估計的例子?！?.3區(qū)間估計在抽樣調(diào)查例子中也常用點估計加區(qū)間估計的說法。比如，為了估計某電視節(jié)目在觀眾中的支持率〔即總體比例p〕，某調(diào)查結(jié)果會顯示，該節(jié)目的“收視率為90%，誤差是±3%，置信度為95%〞云云。這這種說法意味著下面三點§5.3區(qū)間估計1. 樣本中的支持率為90%，即用樣本比例作為對總體比例的點估計2. 估計范圍為90%±3%(±3%的誤差)，即區(qū)間(93%，87%)。3. 如用類似的方式，反復(fù)抽取大量〔樣本量一樣的〕樣本時，產(chǎn)生的大量類似區(qū)間中有些會覆蓋真正的p，而有些不會；但其中大約有95%會覆蓋真正的總體比例?！?.3區(qū)間估計這樣得到的區(qū)間被稱為總體比例p的置信度(confidencelevel)為95%的置信區(qū)間(confidenceinterval)。這里的置信度又稱置信程度或置信系數(shù)。顯然置信度的概念又是大量反復(fù)抽樣時的一個漸近概念。§5.3區(qū)間估計因此說“我們目前得到的區(qū)間〔比如上面的90%±3%〕以概率0.95覆蓋真正的比例p〞是個錯誤的說法。這里的區(qū)間(93%，87%)是固定的，而總體比例p也是固定的值。因此只需兩種能夠：或者該區(qū)間包含總體比例，或者不包含；在固定數(shù)值之間沒有任何概率可言?！?.3區(qū)間估計例5.1(noodle.txt)某廠家消費的掛面包裝上寫明“凈含量450克〞。在用天平稱量了商場中的48包掛面之后，得到樣本量為48的關(guān)于掛面分量〔單位：克〕的一個樣本：用計算機可以很容易地得到掛面分量的樣本均值、總體均值的置信區(qū)間等等。下面是SPSS的輸出：該輸出給出了許多第三章引進的描畫統(tǒng)計量。和估計有關(guān)的是作為總體均點估計的樣本均值，它等于449.01；而總體均值的95%置信區(qū)間為〔447.41，450.61〕§5.3區(qū)間估計我們還可以構(gòu)造兩個總體的均值〔或比例〕之差的置信區(qū)間。如想知道兩個地域?qū)W生成果的差別，可以建造兩個地域成果均值之差m1-m2的置信區(qū)間。如想比較一個候選人在不同階段支持率的差別，那就可構(gòu)造比例之差p1-p2的置信區(qū)間?！?.3區(qū)間估計例5.2有兩個地域大學(xué)生的高度數(shù)據(jù)(height2.txt)(a)我們想要分別得到這兩個總體均值和規(guī)范差的點估計〔即樣本均值和樣本規(guī)范差〕和各總體均值的95%置信區(qū)間。(b)求兩個均值差m1-m2的點估計和95%置信區(qū)間。利用軟件很容易得到下面結(jié)果：§5.3區(qū)間估計兩個總體均值估計量的樣本均值分別為170.56和165.60，樣本規(guī)范差分別為6.97857和7.55659；還得到均值的置信區(qū)間分別是(168.5767,172.5433),(163.4524,167.7476)?？梢缘玫絻蓚€樣本均值的差(4.9600)，另外還給出了兩總體均值差的95%置信區(qū)間(2.073，7.847)。§5.4關(guān)于置信區(qū)間的留意點前面提到，不要以為由某一樣本數(shù)據(jù)得到總體參數(shù)的某一個95%置信區(qū)間，就以為該區(qū)間以0.95的概率覆蓋總體參數(shù)。置信度95%僅僅描畫用來構(gòu)造該區(qū)間上下界的統(tǒng)計量(是隨機的)覆蓋總體參數(shù)的概率；也就是說，無窮次反復(fù)抽樣所得到的一切區(qū)間中有95%包含參數(shù)?！?.4關(guān)于置信區(qū)間的留意點但是把一個樣本數(shù)據(jù)帶入統(tǒng)計量的公式所得到的一個區(qū)間，只是這些區(qū)間中的一個。這個非隨機的區(qū)間能否包含那個非隨機的總體參數(shù)，誰也不能夠知道。非隨機的數(shù)目之間沒有概率可言。§5.4關(guān)于置信區(qū)間的留意點置信區(qū)間的論述是由區(qū)間和置信度兩部分組成。有些新聞媒體報道一些調(diào)查結(jié)果只給出百分比和誤差〔即置信區(qū)間〕，并不闡明置信度，也不給出被調(diào)查的人數(shù)，這是不擔(dān)任的表現(xiàn)。由于降低置信度可以使置信區(qū)間變窄〔顯得“準(zhǔn)確〞〕，有誤導(dǎo)讀者之嫌。在公布調(diào)查結(jié)果時給出被調(diào)查人數(shù)是擔(dān)任任的表現(xiàn)。這樣那么可以由此推算出置信度〔由后面給出的公式〕，反之亦然?！?.4關(guān)于置信區(qū)間的留意點一個描畫性例子：有10000個人回答的調(diào)

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

MBA統(tǒng)計學(xué)05總體參數(shù)的估計

文檔簡介

溫馨提示

最新文檔

評論

MBA統(tǒng)計學(xué)05總體參數(shù)的估計

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔