MBA統(tǒng)計學總體參數(shù)的估計_第1頁
MBA統(tǒng)計學總體參數(shù)的估計_第2頁
MBA統(tǒng)計學總體參數(shù)的估計_第3頁
MBA統(tǒng)計學總體參數(shù)的估計_第4頁
MBA統(tǒng)計學總體參數(shù)的估計_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學─從數(shù)據(jù)到結(jié)論第五章總體參數(shù)的估計估計就是根據(jù)你擁有的信息來對現(xiàn)實世界進行某種判斷。你可以根據(jù)一個人的衣著、言談和舉止判斷其身份你可以根據(jù)一個人的臉色,猜出其心情和身體狀況統(tǒng)計中的估計也不例外,它是完全根據(jù)數(shù)據(jù)做出的。如果我們想知道北京人認可某飲料的比例,人們只有在北京人中進行抽樣調(diào)查以得到樣本,并用樣本中認可該飲料的比例來估計真實的比例。從不同的樣本得到的結(jié)論也不會完全一樣。雖然真實的比例在這種抽樣過程中永遠也不知道;但可以知道估計出來的比例和真實的比例大致差多少。從數(shù)據(jù)得到關(guān)于現(xiàn)實世界的結(jié)論的過程就叫做統(tǒng)計推斷(statisticalinference)。上面調(diào)查例子是估計總體參數(shù)(某種意見的比例)的一個過程。估計(estimation)是統(tǒng)計推斷的重要內(nèi)容之一。統(tǒng)計推斷的另一個主要內(nèi)容是下一章要引進的假設(shè)檢驗(hypothesistesting)?!?.1用估計量估計總體參數(shù)人們往往先假定某數(shù)據(jù)來自一個特定的總體族(比如正態(tài)分布族)。而要確定是總體族的哪個成員則需要知道總體參數(shù)值(比如總體均值和總體方差)。人們于是可以用相應(yīng)的樣本統(tǒng)計量(比如樣本均值和樣本方差)來估計相應(yīng)的總體參數(shù)§5.1用估計量估計總體參數(shù)一些常見的涉及總體的參數(shù)包括總體均值(m)、總體標準差(s)或方差(s2)和(Bernoulli試驗中)成功概率p等(總體中含有某種特征的個體之比例)。正態(tài)分布族中的成員被(總體)均值和標準差完全確定;Bernoulli分布族的成員被概率(或比例)p完全決定。因此如果能夠?qū)@些參數(shù)進行估計,總體分布也就估計出來了?!?.1用估計量估計總體參數(shù)估計的根據(jù)為總體抽取的樣本。樣本的(不包含未知總體參數(shù)的)函數(shù)稱為統(tǒng)計量;而用于估計的統(tǒng)計量稱為估計量(estimator)。由于一個統(tǒng)計量對于不同的樣本取值不同,所以,估計量也是隨機變量,并有其分布。如果樣本已經(jīng)得到,把數(shù)據(jù)帶入之后,估計量就有了一個數(shù)值,稱為該估計量的一個實現(xiàn)(realization)或取值,也稱為一個估計值(estimate)?!?.1用估計量估計總體參數(shù)這里介紹兩種估計,一種是點估計(pointestimation),即用估計量的實現(xiàn)值來近似相應(yīng)的總體參數(shù)。另一種是區(qū)間估計(intervalestimation);它是包括估計量在內(nèi)(有時是以估計量為中心)的一個區(qū)間;該區(qū)間被認為很可能包含總體參數(shù)。點估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不像點估計那么絕對。§5.2點估計用什么樣的估計量來估計參數(shù)呢?實際上沒有硬性限制。任何統(tǒng)計量,只要人們覺得合適就可以當成估計量。當然,統(tǒng)計學家想出了許多標準來衡量一個估計量的好壞。每個標準一般都僅反映估計量的某個方面。這樣就出現(xiàn)了按照這些標準定義的各種名目的估計量(如無偏估計量等)。另一些估計量則是由它們的計算方式來命名的(如最大似然估計和矩估計等)。§5.2點點估估計最常用用的估估計量量就是是我們們熟悉悉的樣樣本均均值、、樣本本標準準差(s)和(Bernoulli試試驗的的)成成功比比例(x/n);人們用用它們們來分分別估估計總總體均均值(m)、總總體標標準差差(s)和成成功概概率(或總總體中中的比比例)p。這些些在前前面都都已經(jīng)經(jīng)介紹紹過,,大家家也知知道如如何通通過計計算機機(或或公式式)來來計算算它們們?!?.2點點估估計那么,,什么么是好好估計計量的的標準準呢??一種統(tǒng)統(tǒng)計量量稱為為無偏估估計量量(unbiasedestimator)。所謂的的無偏性性(unbiasedness)就是::雖然然每個個樣本本產(chǎn)生生的估估計量量的取取值不不一定定等于于參數(shù)數(shù),但但當抽抽取大大量樣樣本時時,那那些樣樣本產(chǎn)產(chǎn)生的的估計計量的的均值值會接接近真真正要要估計計的參參數(shù)。。§5.2點點估估計由于一一般僅僅僅抽抽取一一個樣樣本,,并且且用該該樣本本的這這個估估計量量的實實現(xiàn)來來估計計對應(yīng)應(yīng)的參參數(shù),,人們們并不不知道道這個個估計計值和和要估估計的的參數(shù)數(shù)差多多少。。因此,,無偏偏性僅僅僅是是非常常多次次重復(fù)復(fù)抽樣樣時的的一個個漸近近概念念。隨機樣樣本產(chǎn)產(chǎn)生的的樣本本均值值、樣樣本標標準差差和Bernoulli試驗驗的成成功比比例分分別都都是相相應(yīng)的的總體體均值值、總總體標標準差差和總總體比比例的的無偏偏估計計。§5.2點點估估計在無偏偏估計計量的的類中中,人人們還還希望望尋找找方差差最小小的估估計量量,稱稱為最最小方方差無無偏估估計量量。此因為為方差差小說說明反反復(fù)抽抽樣產(chǎn)產(chǎn)生的的許多多估計計量差差別不不大,,因此此更加加精確確。評價一一個統(tǒng)統(tǒng)計量量好壞壞的標標準很很多;;而且且許多多都涉涉及一一些大大樣本本的極極限性性質(zhì)。。我們們不想想在這這里涉涉及太太多此此方面面的細細節(jié)。。§5.3區(qū)區(qū)間間估計計當描述述一個個人的的體重重時,,你一一般可可能不不會說說這個個人是是76.35公公斤你會說說這個個人是是七八八十公公斤,,或者者是在在70公斤斤到80公公斤之之間。。這個個范圍圍就是是區(qū)間間估計計的例例子。?!?.3區(qū)區(qū)間間估計計在抽樣樣調(diào)查查例子子中也也常用用點估估計加加區(qū)間間估計計的說說法。。比如,,為了了估計計某電電視節(jié)節(jié)目在在觀眾眾中的的支持持率((即總總體比比例p),某某調(diào)查查結(jié)果果會顯顯示,,該節(jié)節(jié)目的的“收收視率率為90%,誤誤差是是±3%,,置信信度為為95%””云云云。這這這種種說法法意味味著下下面三三點§5.3區(qū)間間估計1.樣樣本中的的支持率率為90%,即即用樣本本比例作作為對總總體比例例的點估估計2.估估計范圍圍為90%±3%(±±3%的的誤差),即區(qū)區(qū)間(93%,,87%)。3.如如用類似似的方式式,重復(fù)復(fù)抽取大大量(樣樣本量相相同的))樣本時時,產(chǎn)生生的大量量類似區(qū)區(qū)間中有有些會覆覆蓋真正正的p,而有些些不會;;但其中中大約有有95%會覆蓋蓋真正的的總體比比例?!?.3區(qū)間間估計這樣得到到的區(qū)間間被稱為為總體比比例p的置信度度(confidencelevel)為95%的置置信區(qū)間間(confidenceinterval)。這里的置置信度又又稱置信水平平或置信系數(shù)數(shù)。顯然置信信度的概概念又是是大量重重復(fù)抽樣樣時的一一個漸近近概念。?!?.3區(qū)間間估計因此說““我們目目前得到到的區(qū)間間(比如如上面的的90%±3%)以概概率0.95覆覆蓋真正正的比例例p”是個錯誤誤的說法法。這里的區(qū)區(qū)間(93%,87%)是固定的的,而總總體比例例p也是是固定的的值。因因此只有有兩種可可能:或或者該區(qū)區(qū)間包含含總體比比例,或或者不包包含;在固定數(shù)數(shù)值之間間沒有任任何概率率可言。?!?.3區(qū)間間估計例5.1(noodle.txt)某廠家家生產(chǎn)的的掛面包包裝上寫寫明“凈凈含量450克克”。在在用天平平稱量了了商場中中的48包掛面面之后,,得到樣樣本量為為48的的關(guān)于掛掛面重量量(單位位:克))的一個個樣本::用計算機機可以很很容易地地得到掛掛面重量量的樣本本均值、、總體均均值的置置信區(qū)間間等等。。下面是是SPSS的輸輸出:該輸出給給出了許許多第三三章引進進的描述述統(tǒng)計量量。和估估計有關(guān)關(guān)的是作作為總體體均點估估計的樣樣本均值值,它等等于449.01;而而總體均均值的95%置置信區(qū)間間為(447.41,,450.61)§5.3區(qū)間間估計我們還可可以構(gòu)造造兩個總總體的均均值(或或比例))之差的的置信區(qū)區(qū)間。如想知道道兩個地地區(qū)學生生成績的的差異,,可以建建造兩個個地區(qū)成成績均值值之差m1-m2的置信區(qū)區(qū)間。如想比較較一個候候選人在在不同階階段支持持率的差差異,那那就可構(gòu)構(gòu)造比例例之差p1-p2的置信區(qū)區(qū)間。§5.3區(qū)間間估計例5.2有兩個個地區(qū)大大學生的的高度數(shù)數(shù)據(jù)(height2.txt)(a)我我們想要要分別得得到這兩兩個總體體均值和和標準差差的點估估計(即即樣本均均值和樣樣本標準準差)和和各總體體均值的的95%置信區(qū)區(qū)間。(b)求求兩個均均值差m1-m2的點估計計和95%置信信區(qū)間。。利用軟軟件很容容易得到到下面結(jié)結(jié)果:§5.3區(qū)間間估計兩個總體體均值估估計量的的樣本均均值分別別為170.56和165.60,,樣本標標準差分分別為6.97857和7.55659;;還得到到均值的的置信區(qū)區(qū)間分別別是(168.5767,172.5433),(163.4524,167.7476)??梢缘玫降絻蓚€樣樣本均值值的差(4.9600),另另外還給給出了兩兩總體均均值差的的95%置信區(qū)區(qū)間(2.073,7.847)。?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點前面提到到,不要要認為由由某一樣本本數(shù)據(jù)得到到總體參參數(shù)的某一個95%置置信區(qū)間間,就以以為該區(qū)間以0.95的概率率覆蓋總總體參數(shù)數(shù)。置信度95%僅僅僅描述述用來構(gòu)構(gòu)造該區(qū)區(qū)間上下下界的統(tǒng)計量(是隨機機的)覆蓋總體體參數(shù)的的概率;;也就是說說,無窮窮次重復(fù)復(fù)抽樣所所得到的的所有區(qū)區(qū)間中有有95%包含參參數(shù)?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點但是把一一個樣本本數(shù)據(jù)帶帶入統(tǒng)計計量的公公式所得得到的一一個區(qū)間間,只是是這些區(qū)區(qū)間中的的一個。。這個非隨隨機的區(qū)區(qū)間是否否包含那那個非隨隨機的總總體參數(shù)數(shù),誰也也不可能能知道。。非隨機機的數(shù)目目之間沒沒有概率率可言。?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點置信區(qū)間間的論述述是由區(qū)區(qū)間和置置信度兩兩部分組組成。有些新聞聞媒體報報道一些些調(diào)查結(jié)結(jié)果只給給出百分分比和誤誤差(即即置信區(qū)區(qū)間),,并不說說明置信信度,也也不給出出被調(diào)查查的人數(shù)數(shù),這是是不負責責的表現(xiàn)現(xiàn)。因為降低低置信度度可以使使置信區(qū)區(qū)間變窄窄(顯得得“精確確”),,有誤導(dǎo)導(dǎo)讀者之之嫌。在在公布調(diào)調(diào)查結(jié)果果時給出出被調(diào)查查人數(shù)是是負責任任的表現(xiàn)現(xiàn)。這樣樣則可以以由此推推算出置置信度((由后面面給出的的公式)),反之之亦然。?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點一個描述述性例子子:有10000個人人回答的的調(diào)查顯顯示,同同意某觀觀點人的的比例為為70%(有7000人同意意)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論