




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第6章 統(tǒng)計(jì)量與抽樣分布【引例】 1899年,戈塞特(1876-1937)進(jìn)入都柏林A.吉尼斯父子釀酒公司擔(dān)任釀酒化學(xué)技師,主要從事統(tǒng)計(jì)和實(shí)驗(yàn)工作。他在工作中發(fā)現(xiàn),供釀酒的每批麥子質(zhì)量相差很大,而同一批麥子中能抽樣供試驗(yàn)的麥子又很少,每批樣本在不同的溫度下做實(shí)驗(yàn),其結(jié)果相差很大。這就決定了不同批次和溫度的麥子樣本是不相同的,不能進(jìn)行樣本合并。這樣一來,實(shí)際上取得的麥子樣本,不可能是大樣本,只能是小樣本。他在工作中還發(fā)現(xiàn),利用小樣本得出的結(jié)果,和正態(tài)分布有較大的差異,特別是兩端尾部的概率,比正態(tài)分布明顯高。因此1907年戈塞特決心把小樣本和大樣本之間的差別搞清楚。為此,他試圖把一個(gè)總體中的所有小
2、樣本的平均數(shù)的分布刻畫出來。做法是:在一個(gè)大容器里放了一批紙牌,把它們弄亂,隨機(jī)地抽若干張(小樣本),對(duì)這一樣本記錄觀察值,然后再把紙牌弄亂,抽出幾張,對(duì)相應(yīng)的樣本再記錄觀察值。大量地記錄這種隨機(jī)抽樣的小樣本觀察值,就可以獲得小樣本觀察值的分布。1908年,戈塞特以“學(xué)生(Student)”為筆名在生物計(jì)量學(xué)雜志發(fā)表了論文平均數(shù)的規(guī)律誤差。這篇論文開創(chuàng)了小樣本統(tǒng)計(jì)理論的先河,為研究樣本分布理論奠定了重要基礎(chǔ)。被統(tǒng)計(jì)學(xué)家譽(yù)為統(tǒng)計(jì)推斷理論發(fā)展史上的里程碑。那么總體和樣本是如何聯(lián)系的?大樣本和小樣本下究竟有什么差異?什么是t分布?它和正態(tài)分布有什么不同?它有什么作用?統(tǒng)計(jì)推斷中常用的分布還有哪些?這
3、些問題都將在本章中找到答案。統(tǒng)計(jì)研究的目的是為了探索現(xiàn)象內(nèi)在的數(shù)量規(guī)律性。為了解總體的數(shù)量特征,可以直接對(duì)總體進(jìn)行全面調(diào)查,得到總體數(shù)據(jù),進(jìn)而歸納出數(shù)量特征;也可以對(duì)總體進(jìn)行抽樣,利用樣本對(duì)總體進(jìn)行推斷,后一種方法稱為統(tǒng)計(jì)推斷。抽樣分布是進(jìn)行統(tǒng)計(jì)推斷的理論基礎(chǔ)。本章將主要介紹統(tǒng)計(jì)推斷所涉及的總體、樣本、統(tǒng)計(jì)量及抽樣分布等概念,以及在統(tǒng)計(jì)推斷中最常用的分布,分布和分布和抽樣分布定理。§6.1 總體與樣本的統(tǒng)計(jì)分布 總體與樣本是統(tǒng)計(jì)推斷中的兩個(gè)基本概念。統(tǒng)計(jì)推斷的目的是從樣本信息出發(fā),運(yùn)用概率論的方法,推斷總體的特征;因此如何將統(tǒng)計(jì)學(xué)的總體、樣本和概率論的基礎(chǔ)隨機(jī)變量與分布聯(lián)系起來,就成
4、為統(tǒng)計(jì)推斷首先要解決的問題。§6.1.1 統(tǒng)計(jì)推斷中的總體及總體分布第一章中已經(jīng)明確統(tǒng)計(jì)所研究的是由同類事物構(gòu)成的總體的數(shù)量特征,總體是根據(jù)一定的目的確定的所要研究的事物的全體,它是由客觀存在的、具有某種共同性質(zhì)的眾多個(gè)體構(gòu)成的??傮w中的每個(gè)單位稱為個(gè)體。比如前面引例中,每一批麥子的全體就是一個(gè)總體,而其中每單位的麥子就是個(gè)體。這是統(tǒng)計(jì)學(xué)中關(guān)于總體的概念,我們可以稱其為實(shí)物總體。在前面章節(jié)的學(xué)習(xí)中,我們已經(jīng)發(fā)現(xiàn):我們真正關(guān)心和收集研究的并不是這些總體中的個(gè)體本身,而是這些個(gè)體的某些特征及其數(shù)值,在前面我們將這些特征用變量來描述,對(duì)應(yīng)的數(shù)值稱為變量值。關(guān)心這批麥子,主要關(guān)心的是其釀酒的
5、效果出酒量。此時(shí)出酒量成為需要研究的變量,每單位麥子出酒量的具體數(shù)值成為變量值。在研究這批麥子時(shí),并不需要將全部這批麥子都收集過來,只需要記錄這批麥子每單位出酒量的數(shù)值,再對(duì)這些數(shù)值進(jìn)行研究就可以了。此時(shí)的總體實(shí)質(zhì)是這批麥子的出酒量對(duì)應(yīng)的若干個(gè)數(shù)值,總體已經(jīng)從實(shí)物抽象到了數(shù)值,可以稱之為數(shù)值總體。這是對(duì)總體概念的第一次抽象。如果實(shí)物總體中個(gè)體很多,則對(duì)應(yīng)的數(shù)值總體其規(guī)模將非常大,而且往往其中重復(fù)的值會(huì)很多,即使沒有重復(fù)值(變量取值連續(xù)時(shí)),在不同值周圍的“密集程度”也會(huì)不相同。逐一研究每個(gè)變量值將會(huì)非常繁瑣,當(dāng)總體規(guī)模趨于無窮時(shí),研究每個(gè)變量值更是變得不可能。若統(tǒng)計(jì)出變量的所有不同取值(或取值
6、區(qū)間)及其出現(xiàn)的頻率,編制變量的分布數(shù)列,則可以對(duì)變量的全部取值情況一覽無遺。研究一個(gè)變量的全部數(shù)值,就轉(zhuǎn)化為研究該變量的分布了。用變量及其分布來描述一個(gè)總體,可以稱之為分布總體。例如研究某批麥子的出酒量X,這是個(gè)連續(xù)變量,可以統(tǒng)計(jì)出X在不同區(qū)間取值的頻率,得到X的分布。對(duì)全部單位出酒量的數(shù)值的研究,就可轉(zhuǎn)化研究出酒量X的分布了。這是對(duì)總體概念的第二次抽象。對(duì)于隨機(jī)變量X,其取值是隨機(jī)的,關(guān)注該變量的全部取值,也就是要關(guān)注其各個(gè)可能取值(或取值區(qū)間)及其相應(yīng)概率,即關(guān)注該隨機(jī)變量的概率分布。在統(tǒng)計(jì)推斷中利用隨機(jī)變量X及其概率分布來描述一個(gè)總體,應(yīng)用起來非常有優(yōu)勢(shì),尤其是當(dāng)總體容量趨于無窮時(shí),另
7、外一個(gè)好處是可以利用概率論的理論和方法來研究總體。例如麥子出酒量的總體分布如果是正態(tài)分布,就可以利用正態(tài)分布的密度函數(shù)計(jì)算出酒量在各區(qū)間的概率。經(jīng)過上述討論,完成了從“實(shí)物總體數(shù)值總體分布總體”的兩次抽象,也完成了我們將統(tǒng)計(jì)學(xué)中“總體”與概率論中“分布”的銜接,這是統(tǒng)計(jì)推斷對(duì)總體概念的延伸,也是概率論知識(shí)應(yīng)用于統(tǒng)計(jì)推斷的基礎(chǔ)。以后在本章及以后統(tǒng)計(jì)推斷的相關(guān)章節(jié)中,如無特別說明,總體均表示分布總體,給定一個(gè)總體,只需要給出總體的分布即可。§6.1.2 統(tǒng)計(jì)推斷中的樣本及樣本性質(zhì) 統(tǒng)計(jì)推斷的重要任務(wù)是通過對(duì)總體中隨機(jī)抽取的部分個(gè)體的觀測(cè)結(jié)果來推斷總體的特征。按照隨機(jī)原則,通過觀測(cè)或試驗(yàn)的
8、方法所獲得的總體中一部分個(gè)體的取值稱為樣本,每個(gè)個(gè)體的取值稱為樣本點(diǎn)或樣品。抽出樣本之前,由于總體中各個(gè)體有同等被抽中的可能,抽中那個(gè)個(gè)體不能確定,因此樣本是一組隨機(jī)變量,每個(gè)樣本點(diǎn)都可以取總體中任意一個(gè)值;但是當(dāng)樣本被抽取并觀測(cè)記錄后,若干個(gè)體被抽出,各樣本點(diǎn)的取值確定,樣本成為是一組確定的數(shù)值。統(tǒng)計(jì)推斷中為了區(qū)分此二重性,將抽取前具有隨機(jī)性的樣本稱為樣本,用大寫字母表示;將抽取的一組確定的數(shù)值稱為樣本觀測(cè)值,用小寫字母表示。如要推斷某種燈泡使用壽命總體X的特征,擬隨機(jī)抽取n只燈泡進(jìn)行測(cè)試,其使用壽命(X1, X2,Xn)稱為燈泡使用壽命總體X的樣本,一次具體抽樣測(cè)試得到n個(gè)燈泡使用壽命的數(shù)
9、值(x1, x2,xn),稱為總體X的樣本觀察值。統(tǒng)計(jì)推斷中,把具有以下兩個(gè)重要性質(zhì)的樣本稱為簡(jiǎn)單隨機(jī)樣本:1. 樣本點(diǎn)與總體同分布這一點(diǎn)很容易從數(shù)值總體的角度加以理解:由于采取隨機(jī)原則抽取樣本點(diǎn),每個(gè)個(gè)體被抽中的可能性相同。假設(shè)總體容量為N,則每個(gè)個(gè)體被抽中的概率為1/N,假設(shè)對(duì)離散型總體取值等于x,或?qū)B續(xù)型總體取值在區(qū)間(x, x+x)中的個(gè)體總數(shù)為M,那么抽出樣本點(diǎn)取值為x或在區(qū)間(x, x+x)中的概率就是M/N,恰好等于總體X取值為x或取值在區(qū)間(x, x+x)中的頻率(或概率),從而可以看出樣本點(diǎn)與總體分布相同。2. 樣本點(diǎn)之間相互獨(dú)立從總體中抽取樣本的方法有重復(fù)抽樣和不重復(fù)抽樣
10、兩種。采用重復(fù)抽樣時(shí),每次隨機(jī)抽取一個(gè)樣本點(diǎn)并記錄其特征以后,又將它放回總體中參加下一次抽取,每次抽取樣本點(diǎn)都是在總體的N個(gè)單位中進(jìn)行的,前一次抽取的結(jié)果不會(huì)影響后一次抽取的結(jié)果,因此樣本點(diǎn)之間相互獨(dú)立。采用不重復(fù)抽樣時(shí),每次隨機(jī)抽出一個(gè)樣本點(diǎn)后不再將它放回總體中,下一次只能在其余個(gè)體中抽取,前面抽取的結(jié)果就會(huì)影響后面的抽取,因此樣本點(diǎn)之間不是相互獨(dú)立的。但通常實(shí)際工作中總體容量非常大,采用不重復(fù)抽樣時(shí)也可以近似認(rèn)為樣本點(diǎn)之間相互獨(dú)立。對(duì)于總體容量無限的情形,無論采取重復(fù)抽樣還是不重復(fù)抽樣,都可以認(rèn)為樣本點(diǎn)是相互獨(dú)立的。在本書后面的敘述中,常常將以上兩個(gè)性質(zhì)一同簡(jiǎn)寫為 “樣本點(diǎn)獨(dú)立同分布(i.
11、i.d)”。沒有特別說明的情況下,我們討論的樣本均指的是簡(jiǎn)單隨機(jī)樣本。§6.2 統(tǒng)計(jì)量§6.2.1 統(tǒng)計(jì)量的概念在統(tǒng)計(jì)推斷中,總體信息是未知的,但從總體中抽取的樣本中含有總體的信息,統(tǒng)計(jì)推斷就是利用樣本的信息來推測(cè)總體的信息。然而樣本的信息是隱蔽的、分散的,必須經(jīng)過必要的加工對(duì)樣本信息進(jìn)行集中和提煉才能用來推斷總體信息,構(gòu)造樣本統(tǒng)計(jì)量是集中和提煉樣本信息來推斷總體信息的有效手段之一。設(shè)是來自總體的一個(gè)樣本,如果是樣本的函數(shù), 中不含任何未知參數(shù),則稱為一個(gè)統(tǒng)計(jì)量。如果為樣本的觀測(cè)值,則為統(tǒng)計(jì)量的觀測(cè)值。統(tǒng)計(jì)量的觀測(cè)值是確定的,沒有隨機(jī)性。統(tǒng)計(jì)量有以下兩個(gè)特征:統(tǒng)計(jì)量是樣本的
12、函數(shù),統(tǒng)計(jì)量通常為隨機(jī)變量;統(tǒng)計(jì)量不能含有未知的參數(shù)。例如,當(dāng)從正態(tài)總體中抽出樣本時(shí),考查隨機(jī)變量,當(dāng)總體均值為已知時(shí),該變量是統(tǒng)計(jì)量;當(dāng)總體均值未知時(shí),該變量就不是統(tǒng)計(jì)量。統(tǒng)計(jì)量既然是隨機(jī)變量,那么它應(yīng)該有概率分布,統(tǒng)計(jì)量的分布稱為抽樣分布。抽樣分布和統(tǒng)計(jì)推斷有著密切的聯(lián)系。統(tǒng)計(jì)量明確以后,必須要知道其抽樣分布才能在統(tǒng)計(jì)推斷中使用,因?yàn)橹挥兄懒私y(tǒng)計(jì)量的分布,才能利用概率論對(duì)總體的特征進(jìn)行推斷,并得到相應(yīng)的推斷置信度。所以在統(tǒng)計(jì)推斷中,一項(xiàng)重要的工作就是尋找統(tǒng)計(jì)量和導(dǎo)出統(tǒng)計(jì)量的抽樣分布或漸近抽樣分布?!纠?-1】總體X服從兩點(diǎn)分布,概率分布律如下:,從總體中抽取容量為n的樣本,構(gòu)造統(tǒng)計(jì)量,求
13、此統(tǒng)計(jì)量的分布。解:由于樣本是獨(dú)立的,服從兩點(diǎn)分布,統(tǒng)計(jì)量T為隨機(jī)變量,其取值是0到n之間的所有整數(shù),其分布恰好是二項(xiàng)分布:,從上面的例子中,可以看出抽樣分布未必與總體的分布一致?!纠?-2】總體分布為,抽取容量為n的樣本,構(gòu)造如下三個(gè)統(tǒng)計(jì)量:,和。求此三個(gè)統(tǒng)計(jì)量的抽樣分布。解:由于樣本是獨(dú)立的,服從均值和方差都為1的正態(tài)分布,三個(gè)統(tǒng)計(jì)量都是樣本的線性函數(shù),由正態(tài)分布的性質(zhì),三個(gè)統(tǒng)計(jì)量仍服從正態(tài)分布,下面分別求解其均值和方差:,由上面計(jì)算可以得出,統(tǒng)計(jì)量服從均值和方差都為1的正態(tài)分布,這和總體的分布相同;統(tǒng)計(jì)量服從均值和方差都為2的正態(tài)分布,而統(tǒng)計(jì)量服從均值為1,方差為1/n的正態(tài)分布。
14、67;6.2.2 常用統(tǒng)計(jì)量 常用統(tǒng)計(jì)量還包括樣本相關(guān)系數(shù),我們將在第9章介紹。1.樣本均值和樣本方差設(shè)是總體中抽出的簡(jiǎn)單隨機(jī)樣本,則樣本均值為,樣本方差為。2.樣本矩稱為樣本的原點(diǎn)矩,稱為樣本的中心矩。特別當(dāng)時(shí),稱為樣本的未修正方差,常記,顯然有。3.順序統(tǒng)計(jì)量設(shè)是總體中抽出的簡(jiǎn)單隨機(jī)樣本,把樣本點(diǎn)排序?yàn)椋瑒t稱為順序統(tǒng)計(jì)量,其中稱為第個(gè)順序統(tǒng)計(jì)量?;陧樞蚪y(tǒng)計(jì)量計(jì)算的常用統(tǒng)計(jì)量有:最大順序統(tǒng)計(jì)量和最小順序統(tǒng)計(jì)量; 樣本極差 ;樣本中位數(shù)樣本的p分位數(shù) 其中,為不超過np的最大整數(shù);樣本的切尾均值 ,樣本的切尾均值是分別去掉k個(gè)最小的和k個(gè)最大的觀測(cè)值后得到的均值。§6.3 抽樣分布
15、及抽樣分布定理為了在正態(tài)分布假定下,得到樣本統(tǒng)計(jì)量的精確分布,本節(jié)需要討論幾個(gè)十分重要的隨機(jī)變量函數(shù)的分布,它們是分布、分布和分布。在此基礎(chǔ)上討論抽樣分布的重要定理。§6.3.1 分布分布是海爾墨特(Hermert)和卡.皮爾遜(K.Pearson)分別于1875年和1890年提出的,是統(tǒng)計(jì)推斷中的重要分布。它主要應(yīng)用于對(duì)總體方差的估計(jì)或檢驗(yàn)以及對(duì)總體概率密度函數(shù)的檢驗(yàn)等。1. 分布的定義及其密度函數(shù)定義6-1 若隨機(jī)變量獨(dú)立且同標(biāo)準(zhǔn)正態(tài)分布,則它們的平方和 (6.1)服從自由度為的分布,記為。根據(jù)服從卡方分布隨機(jī)變量的定義,我們可以根據(jù)求隨機(jī)變量函數(shù)的概率分布的方法求出分布的概率密
16、度函數(shù) 推導(dǎo)過程略,有興趣的讀者可以參考陳希孺,數(shù)理統(tǒng)計(jì)引論,高教出版社。如果隨機(jī)變量服從自由度為的分布,其概率密度為: (6.2)其中為gamma函數(shù)。2. 分布的性質(zhì)特征(1)分布的數(shù)學(xué)期望與方差若X服從自由度為n的分布,其數(shù)學(xué)期望和方差分別為, (6.3)可見隨著自由度的增大,分布的期望和方差隨之增大,自由度決定了分布的形狀。從密度函數(shù)定義可以看出,分布是一種不對(duì)稱偏峰分布,其取值區(qū)域?yàn)?;隨著自由度的逐漸增大,分布曲線的最高點(diǎn)逐漸下降并向右移動(dòng),分布曲線趨于對(duì)稱,如圖6-1所示。n=20n=4圖6-1的概率密度曲線自由度為的分布上側(cè)分位數(shù)記為,滿足關(guān)于分布上側(cè)分位數(shù)可以通過書后附表求得,
17、附表給出了自由度的分布上側(cè)分位數(shù)。也可通過EXCEL的CHINV函數(shù)求得。例如,。(2)分布的自由度分布中稱為自由度。對(duì)于變量,如果存在一組不全為零的常數(shù),使得成立,則稱變量之間存在一個(gè)線性約束條件。如果變量中存在個(gè)獨(dú)立的線性約束條件,則中獨(dú)立變量的個(gè)數(shù)為,稱它為自由度。自由度也可粗略解釋為可以自由選擇數(shù)值的變量個(gè)數(shù)。例如,由個(gè)獨(dú)立的隨機(jī)變量構(gòu)成,由于它們之間沒有線性約束條件(即),所以它的自由度為。的自由度為,這是因?yàn)橛?jì)算時(shí)要用,滿足限制條件,即相對(duì)于的個(gè)離差變量,只有個(gè)可以任意確定,第個(gè)失去了“自由”,所以能其自由度為。(3)分布的可加性若、相互獨(dú)立,且分別服從自由度為、的分布,則服從自由
18、度為+的分布,即【例6-3】設(shè)是獨(dú)立同服從分布的隨機(jī)變量,求a,b和c使服從分布。因?yàn)楠?dú)立同分布,所以,則,從而,則,從而,則,從而。由于分布的可加性,則,自由度為3。且,和。§6.3.2 t分布t分布又稱為“學(xué)生分布”,是統(tǒng)計(jì)推斷中的重要分布。它在總體均值的估計(jì)與檢驗(yàn)、相關(guān)與回歸分析等方面有著廣泛的應(yīng)用。1. t分布的定義及其密度函數(shù)定義6-2 若隨機(jī)變量,隨機(jī)變量,且隨機(jī)變量與相互獨(dú)立,則隨機(jī)變量 (6.4)服從自由度為的分布,記為。分布的概率密度函數(shù)比較復(fù)雜。如果隨機(jī)變量服從自由度為的分布,則其概率密度函數(shù)為 (6.5)觀察分布的概率密度函數(shù),可以發(fā)現(xiàn)它是偶函數(shù),所以分布是關(guān)于
19、原點(diǎn)對(duì)稱的,這一點(diǎn)和分布是不同的,卻和標(biāo)準(zhǔn)正態(tài)分布相似。圖6-2的三條曲線分別是標(biāo)準(zhǔn)正態(tài)曲線以及自由度為19和5的t分布曲線。n=5的分布n=19的分布標(biāo)準(zhǔn)正態(tài)分布圖6-2密度函數(shù)曲線通過比較可以發(fā)現(xiàn)分布和標(biāo)準(zhǔn)正態(tài)分布類似,都是對(duì)稱分布,均在上取值。但是分布與標(biāo)準(zhǔn)正態(tài)分布也有區(qū)別, 分布尾部厚,即服從分布的隨機(jī)變量取到尾部值的概率比標(biāo)準(zhǔn)正態(tài)分布略大。而對(duì)于接近原點(diǎn)的坐標(biāo)點(diǎn),分布密度函數(shù)的值比標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的值小。因而分布曲線尾部厚于標(biāo)準(zhǔn)正態(tài)分布,而峰低于標(biāo)準(zhǔn)正態(tài)分布。滿足的稱為自由度為的分布上側(cè)分位數(shù)。關(guān)于分布上側(cè)分位數(shù)可以通過書后附表求得,附表給出了自由度的分布上側(cè)分位數(shù)。例如,由于分
20、布是對(duì)稱分布,所以。2. t分布的性質(zhì)特征(1) 分布的數(shù)學(xué)期望與方差分布的數(shù)學(xué)期望與方差分別是, (6.6) 由于分布是對(duì)稱分布,其數(shù)學(xué)期望當(dāng)然為0。需要注意的是:只有當(dāng)自由度大于1,其數(shù)學(xué)期望才為0,自由度為1時(shí),數(shù)學(xué)期望不存在;同時(shí)注意到分布的方差與其自由度有關(guān),自由度小于等于2時(shí),方差不存在,當(dāng)自由度,方差極限為1。(2) 分布的自由度分布的自由度是由生成分布的分母即卡方分布隨機(jī)變量的自由度而來。 分布的形狀和自由度有較大關(guān)系,自由度越小,分布曲線與標(biāo)準(zhǔn)正態(tài)分布曲線的區(qū)別越明顯,分布“比較平”,而自由度增大,分布曲線與標(biāo)準(zhǔn)正態(tài)分布曲線的差異逐漸縮小。這一點(diǎn)也可以由分布的方差來說明,當(dāng)自
21、由度較小時(shí),分布的方差較大,此時(shí)其分布就“比較平”;而當(dāng)自由度較大時(shí),方差較小,而且越來越接近1,此時(shí)分布與標(biāo)準(zhǔn)正態(tài)分布逐漸接近?!纠?-4】設(shè)是獨(dú)立同服從分布的隨機(jī)變量,如果隨機(jī)變量服從自由度為5的t分布,求c等于多少。因?yàn)楠?dú)立同服從分布,所以,則。又因?yàn)槎c相互獨(dú)立,則由t分布的構(gòu)造,有 所以。§6.3.3 F分布F分布是統(tǒng)計(jì)學(xué)家費(fèi)雪(R.A.Fisher)于1924年提出的,F(xiàn)分布在假設(shè)檢驗(yàn)、總體方差的統(tǒng)計(jì)推斷、方差分析、回歸分析和多元統(tǒng)計(jì)分析等方面有著廣泛的應(yīng)用。1 F分布的定義及其密度函數(shù)定義6-3 若隨機(jī)變量、分別服從自由度為、的卡方分布,且、相互獨(dú)立,則隨機(jī)變量 (6.
22、7)服從第一自由度為,第二自由度為的分布,記為。從F分布的定義可以看出,F(xiàn)分布是兩個(gè)獨(dú)立的卡方分布隨機(jī)變量與其各自自由度商的比值,因而F分布具有兩個(gè)自由度,作為分子的卡方分布隨機(jī)變量的自由度稱為第一自由度,作為分母的卡方分布隨機(jī)變量的自由度稱為第二自由度。F分布的密度函數(shù)比較復(fù)雜,若隨機(jī)變量F服從第一自由度為,第二自由度為的F分布,那么其密度函數(shù)為:(6.8)如圖6-3所示,F(xiàn)分布曲線有些類似于卡方分布,也是一種非對(duì)稱的正偏分布。其值域?yàn)?,但它有兩個(gè)自由度和。F分布的分布曲線隨著兩個(gè)自由度的不同組合而不同。兩個(gè)自由度的不同組合形成F分布曲線的不同形態(tài),這在F分布的圖形中可清楚看到。隨著第一自由
23、度的增大,分布曲線逐漸趨向?qū)ΨQ,隨著兩個(gè)自由度的增大,分布曲線逐漸趨于正態(tài)分布。 圖6-3F分布密度函數(shù)曲線滿足的稱為自由度為的F分布上側(cè)分位數(shù)。由于F分布有兩個(gè)自由度,所以附表僅僅給出了某些較小值對(duì)應(yīng)的值。例如。對(duì)于任意的和自由度,其分位數(shù)都可通過EXCEL的FINV函數(shù)求得。2. F分布的性質(zhì)特征(1) F分布的數(shù)學(xué)期望和方差F分布的數(shù)學(xué)期望和方差分別為(6.9) 從F分布的均值和方差表達(dá)式可以看出,隨著第二自由度增大,F(xiàn)分布的均值趨于1,而方差則取決于兩個(gè)自由度。(2)F分布的自由度F分布的自由度是由構(gòu)造F分布的分子和分母的兩個(gè)分布的自由度而來,由于其分子和分母的分布可以交換,所以F分布
24、的兩個(gè)自由度有一個(gè)重要性質(zhì),就是它們是可以互相轉(zhuǎn)化的。若,則1/F 。這個(gè)重要性質(zhì)對(duì)于查F分布求大的分位數(shù)提供了方便: (6.10)【例6-5】給定顯著水平,查的上側(cè)分位點(diǎn)。因?yàn)橐话鉌分布表并未給出的上側(cè)分位點(diǎn)。則要根據(jù)F分布的性質(zhì),首先查,根據(jù)公式(6.9)可求得: 也可以通過EXCEL的統(tǒng)計(jì)函數(shù)功能中的函數(shù)FINV直接計(jì)算該分位數(shù) 分布和分布的百分位點(diǎn),也可分別通過EXCEL的統(tǒng)計(jì)函數(shù)CHINV和TINV得到。調(diào)出EXCEL的函數(shù),選中函數(shù)FINV,根據(jù)對(duì)話框輸入相關(guān)信息即可。FINV的對(duì)話框如圖6-4所示。圖6-4 EXCEL的函數(shù)FINV的對(duì)話框§6.3.4 抽樣分布定理下面
25、討論總體為正態(tài)分布時(shí)樣本統(tǒng)計(jì)量的抽樣分布。這是因?yàn)樵趯?shí)際應(yīng)用中許多總體分布或是正態(tài)分布,或是近似可以認(rèn)為是正態(tài)的。即使總體分布非正態(tài),由中心極限定理可知,大樣本下,樣本均值的分布也可以近似認(rèn)為是正態(tài)分布。定理6-1若是從總體抽取的一個(gè)簡(jiǎn)單隨機(jī)樣本,則有:1. (6.11) (6.12)2. (6.13)3.樣本均值與樣本方差相互獨(dú)立定理證明略,讀者可以參看茆詩松等著概率論與數(shù)理統(tǒng)計(jì)。 其中,。【例6-6】在正態(tài)總體中抽出一個(gè)容量為25的樣本, 為樣本方差,這里和均為未知。求(1)當(dāng)時(shí),求;(2);(3); 解:(1)因?yàn)?,所以?dāng),時(shí)有: =2×0.985-1=0.97(2)因?yàn)闃颖緛?/p>
26、自于總體,樣本容量,所以則 (查分布表得出)(3)因?yàn)?,所以由?6.3)可知:。而 定理6-2 若總體服從,從中抽取容量為的樣本,則 (6.14)證明:樣本相互獨(dú)立,且都服從,由公式(6.12)和(6.13)有:和 而且隨機(jī)變量與相互獨(dú)立。結(jié)合分布的定義有: 【例6-7】設(shè)總體服從正態(tài)分布,是來自總體的一個(gè)樣本,記和,試求的分布。由于來自總體的簡(jiǎn)單隨機(jī)樣本,則分別有和,且和相互獨(dú)立,則,且。因?yàn)?,而且根?jù)定理6-1的結(jié)論有和相互獨(dú)立, 所以 。定理6-3 若總體服從,總體服從,且兩個(gè)總體相互獨(dú)立。從兩總體中分別抽取容量為和的樣本和。則(1) (6.15)(2)當(dāng),則 (6.16)其中。證明:
27、(1)因?yàn)?,并且兩組樣本是相互獨(dú)立的。所以,并且和相互獨(dú)立,從而則。(2)因?yàn)橛桑?.12)式可以得到:,且和相互獨(dú)立,從而并且(1)中的和上述相互獨(dú)立。根據(jù)t分布定義并化簡(jiǎn)可得所以,上述變量服從自由度為的分布。定理6-4 若總體,另一總體,從第一總體中抽取容量為的樣本,從第二個(gè)總體中抽取容量為的樣本,兩個(gè)總體是獨(dú)立的,則變量 (6.17)證明:因?yàn)闃颖鞠嗷オ?dú)立且和總體具有相同的分布,所以由前面定理6-13,兩個(gè)總體相互獨(dú)立,所以隨機(jī)變量和相互獨(dú)立,從而所以該隨機(jī)變量服從第一自由度為,第二自由度為的F分布。本章小結(jié)1.總體可抽象為所感興趣的變量及其取值的分布。通過觀測(cè)或試驗(yàn)的方法獲得的總體中一
28、部分個(gè)體稱為樣本,樣本中每個(gè)個(gè)體稱為樣本點(diǎn)。2.統(tǒng)計(jì)量是樣本的函數(shù)且不含任何未知參數(shù)。在統(tǒng)計(jì)推斷問題中,經(jīng)常需要利用取自總體的樣本構(gòu)造出合適的統(tǒng)計(jì)量,并使其服從或漸進(jìn)地服從已知的分布。常用統(tǒng)計(jì)量有樣本均值和方差等。統(tǒng)計(jì)量的分布為抽樣分布。3.在正態(tài)分布假定下三種常用分布分布、t分布和F分布。本章介紹了三種分布的定義、構(gòu)造原理和重要性質(zhì),以及相應(yīng)分位數(shù)的含義和計(jì)算方法。4. 本章介紹了抽樣分布理論中的幾個(gè)重要定理。它們是對(duì)正態(tài)總體的均值、方差等參數(shù)進(jìn)行統(tǒng)計(jì)推斷的重要理論基礎(chǔ)?;局R(shí)梳理基本知識(shí)點(diǎn)含義或公式總體指所研究事物的全體(實(shí)物總體),或指所研究事物在某個(gè)特征上的取值的全體(數(shù)值總體)。樣
29、本按照隨機(jī)原則從總體中抽出的n個(gè)個(gè)體。簡(jiǎn)單隨機(jī)樣本的性質(zhì):(1)樣本點(diǎn)和總體具有相同的分布(2)樣本點(diǎn)之間是獨(dú)立的統(tǒng)計(jì)量是樣本的函數(shù),如果中不含任何未知參數(shù),則稱為一個(gè)統(tǒng)計(jì)量。常用統(tǒng)計(jì)量有:樣本均值和樣本方差、樣本矩統(tǒng)計(jì)量、樣本相關(guān)函數(shù)、樣本的順序統(tǒng)計(jì)量。抽樣分布統(tǒng)計(jì)量的分布稱為抽樣分布,常用的抽樣分布有分布、t分布、F分布。分布相互獨(dú)立的且服從標(biāo)準(zhǔn)正態(tài)分布,則它們的平方和服從自由度為n的分布,即。分布的性質(zhì)自由度為n的分布變量,均值和方差分別為n和2n;隨自由度的增加,分布趨近正態(tài)分布;獨(dú)立分布變量具有可加性。自由度自由度也可粗略解釋為可以自由選擇數(shù)值的變量個(gè)數(shù),即變量的總個(gè)數(shù)減去線性約束的
30、個(gè)數(shù)。t分布相互獨(dú)立;,;即服從自由度為n的t分布,即。t分布的性質(zhì)均值,方差;t分布的自由度和分母中Y的自由度相同;分布曲線比標(biāo)準(zhǔn)正態(tài)曲線低峰厚尾,隨自由度的增加,分布趨近標(biāo)準(zhǔn)正態(tài)分布。F分布相互獨(dú)立;, ;即服從第一自由度為,第二自由度為的F分布,即。F分布的性質(zhì)F分布的均值隨著第二自由度增大而趨于1,方差則取決于兩個(gè)自由度;若,則1/F 。抽樣分布重要定理在正態(tài)總體的假定條件下,有,;練習(xí)題一、單項(xiàng)選擇題(在4個(gè)備選答案中選擇1個(gè)正確答案)1. 某產(chǎn)品出廠檢驗(yàn)規(guī)定:次品率p不超過4%才能出廠,現(xiàn)從一批產(chǎn)品中抽取12件進(jìn)行檢查,假設(shè)取值為1代表次品,取值為0代表合格品,則數(shù)值總體是( )A
31、.0 B.1 C.0和1 D.許多取值為0或1的數(shù)的全體2. 某廠生產(chǎn)的螺絲釘,其標(biāo)準(zhǔn)長度為6.8,而其真實(shí)的長度,從上述敘述中,假設(shè)總體均值就是標(biāo)準(zhǔn)長度,從生產(chǎn)的螺絲釘中抽取了1個(gè)螺絲釘作為樣本,其長度為6.7mm,則該樣本的分布是( )A. B. C. D.3. 樣本和樣本觀測(cè)值的關(guān)系是( )A.兩者都是隨機(jī)變量,分布相同 B.兩者都是隨機(jī)變量,但分布不同C.樣本觀測(cè)值是樣本的一次實(shí)現(xiàn) D.樣本只能取樣本觀測(cè)值4. 設(shè)總體服從參數(shù)的Poisson分布,從總體中抽取n個(gè)樣本,樣本的聯(lián)合分布為( )A. B.C. D.以上都不對(duì)5. 以下不是統(tǒng)計(jì)量是( )A.樣本均值 B.樣本方差 C.樣本極
32、差 D.樣本量6. 設(shè)總體XN(0,1),從總體中抽取n個(gè)樣本,下列統(tǒng)計(jì)量中不服從分布的是( )A. B. C. D.7. 設(shè)總體X服從自由度為3的分布,從總體中抽取n個(gè)樣本,下列統(tǒng)計(jì)量服從自由度為9的卡方分布的是( )A. B. C. D.8. 比較標(biāo)準(zhǔn)正態(tài)分布和自由度為5的t分布的0.05分位數(shù)和,可以得到( )A.< B.> C.= D.不能比較9. 假設(shè)獨(dú)立總體X和Y都服從標(biāo)準(zhǔn)正態(tài)分布,從兩個(gè)總體中分別抽取10個(gè)和15個(gè)樣本,則下列說法中,正確的是( )A.服從自由度為10的分布 B.服從自由度為14的分布 C.服從自由度為15和10的F分布 D.服從自由度為15和10的F
33、分布10. 根據(jù)抽樣分布重要定理,以下結(jié)論錯(cuò)誤的是( )A.服從正態(tài)分布 B.服從自由度為(n-1)的分布C. D. 二、多項(xiàng)選擇題(在5個(gè)備選答案中選擇2-5個(gè)正確答案)1.設(shè)表示從總體X中抽出的樣本,表示樣本觀測(cè)值,總體的均值和標(biāo)準(zhǔn)差都是未知的,以下是統(tǒng)計(jì)量的有( )A. B. C. D. E.2. 設(shè)總體X是標(biāo)準(zhǔn)正態(tài)分布, 表示從總體中抽出的樣本,以下統(tǒng)計(jì)量中,服從自由度為1的分布的有( )A. B. C. D.E.3. 假設(shè)總體是標(biāo)準(zhǔn)正態(tài)分布,用表示從總體中抽出的樣本,以下統(tǒng)計(jì)量中,服從自由度為1的t分布的有( )A. B. C. D. E.4. 假設(shè)獨(dú)立總體.Y是標(biāo)準(zhǔn)正態(tài)分布,用,表
34、示從總體中抽出的兩個(gè)樣本,以下統(tǒng)計(jì)量中,服從F分布的有( )A. B. C. D. E. 5.正態(tài)總體的抽樣分布定理和統(tǒng)計(jì)量,以下說法正確的是( )A. 樣本均值的分布是正態(tài)分布 B. 當(dāng)總體方差未知時(shí),不能用正態(tài)分布對(duì)總體均值進(jìn)行推斷C. 當(dāng)兩個(gè)獨(dú)立總體方差已知時(shí),應(yīng)該用t分布對(duì)均值的差異進(jìn)行推斷D. 當(dāng)兩個(gè)獨(dú)立總體方差未知且相等時(shí),可以用t分布對(duì)均值差異進(jìn)行推斷E. 可以用F分布統(tǒng)計(jì)量對(duì)兩個(gè)獨(dú)立總體的方差是否相等進(jìn)行推斷三、判斷分析題1. 樣本點(diǎn)是相互獨(dú)立的,并且和總體具有同一分布。2. 因?yàn)榫哂锌杉有?,所以t分布也具有可加性。3. t分布隨機(jī)變量的平方服從F分布。四、簡(jiǎn)答題1. 什么叫抽樣分布?為什么要研究抽樣分布?2. 和的百分位點(diǎn)有什么關(guān)系?3.統(tǒng)計(jì)量的定義是什么?樣本點(diǎn)是不是統(tǒng)計(jì)量?4.為什么說標(biāo)準(zhǔn)正態(tài)分布是抽樣分布理論的重要基礎(chǔ)?五、計(jì)算題1.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 母親節(jié)策劃活動(dòng)方案
- 梨園踏青活動(dòng)方案
- 欒城宴會(huì)活動(dòng)方案
- 水果節(jié)日活動(dòng)方案
- 植樹節(jié)杭州活動(dòng)方案
- 水利系統(tǒng)三八節(jié)活動(dòng)方案
- 汽貿(mào)活動(dòng)策劃活動(dòng)方案
- 民族團(tuán)結(jié)戶外活動(dòng)方案
- 樓盤泳池活動(dòng)方案
- 汝州市植樹活動(dòng)方案
- 職工食堂工作人員HSE安全培訓(xùn)課件
- 《MLCC制程介紹》課件
- 環(huán)境衛(wèi)生管理方案
- 咖啡有關(guān)知識(shí)
- 中國居民投資理財(cái)行為調(diào)研報(bào)告2024-高金智庫x螞蟻理財(cái)智庫-202412
- 醫(yī)院感染管理制度培訓(xùn)
- 投資咨詢業(yè)可持續(xù)發(fā)展策略-洞察分析
- 2024進(jìn)戶門、單元門、防火門采購及安裝合同 標(biāo)準(zhǔn)版 模板
- 天立中學(xué)招生測(cè)試卷
- 詳盡的委托協(xié)議書范本
- 網(wǎng)絡(luò)輿情分析操作手冊(cè)
評(píng)論
0/150
提交評(píng)論