第7抽樣與抽樣分布_第1頁
第7抽樣與抽樣分布_第2頁
第7抽樣與抽樣分布_第3頁
第7抽樣與抽樣分布_第4頁
第7抽樣與抽樣分布_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本章學(xué)習(xí)目標1.理解隨機抽樣、非隨機抽樣兩類不同抽樣方法的本質(zhì)區(qū)別2.了解重復(fù)抽樣、不重復(fù)抽樣下的樣本可能數(shù)目3.區(qū)別簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、多階段抽樣等不同的隨機抽樣組織形式4.了解總體分布、樣本分布、抽樣分布的關(guān)系,明確二項分布、正態(tài)分布、t分布、χ2分布等重要分布的特征5.理解抽樣分布的理論基礎(chǔ)6.重點掌握樣本均值、樣本比例在不同條件下的抽樣分布2023/3/81當前1頁,總共80頁。一、抽樣概述(一)抽樣的方法(二)隨機抽樣的組織形式(三)抽樣方案的設(shè)計2023/3/82當前2頁,總共80頁。(一)抽樣的方法隨機抽樣方便抽樣判斷抽樣自愿樣本滾雪球抽樣定額抽樣非隨機抽樣常用的抽樣方法重復(fù)抽樣不重復(fù)抽樣考慮順序抽樣不考慮順序抽樣2023/3/83當前3頁,總共80頁。根據(jù)隨機原則從總體中直接抽選部分單位構(gòu)成樣本的方法。也稱概率抽樣特點按隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的某一總體單位能否被抽中,與其它單位是否被抽中沒有關(guān)聯(lián)。

隨機抽樣2023/3/84當前4頁,總共80頁。重復(fù)抽樣從總體N個單位中隨機抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結(jié)果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣不重復(fù)抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數(shù)N不變,同一單位可能多次被抽中??傮w單位數(shù)減少n,同一單位只可能被抽中一次。隨機抽選樣本的方式

2023/3/85當前5頁,總共80頁??紤]順序的重復(fù)抽樣可能的樣本數(shù)目不考慮順序的重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的不重復(fù)抽樣考慮各單位的中選順序AB≠BA不考慮各單位的中選順序。AB=BA2023/3/86當前6頁,總共80頁?!纠?】某一總體含有A、B、C、D、E共5個總體單位,從中隨機抽取2個單位構(gòu)成樣本,可能的樣本數(shù)目有多少?

采用考慮順序的重復(fù)抽樣,樣本可能數(shù)目為5×5=25個

采用不考慮順序的重復(fù)抽樣,樣本可能數(shù)目為(52+5)/2=15個

采用不考慮順序的不重復(fù)抽樣,樣本可能數(shù)目為

5!/(2!×(5-2)!=10個

采用考慮順序的不重復(fù)抽樣,樣本可能數(shù)目為5×4=20個

2023/3/87當前7頁,總共80頁。相對于概率抽樣而言抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、定額抽樣等方式非隨機抽樣2023/3/88當前8頁,總共80頁。方便抽樣調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場所進行攔截調(diào)查廠家在出售產(chǎn)品柜臺前對路過顧客進行的調(diào)查優(yōu)點:容易實施,調(diào)查的成本低缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體2023/3/89當前9頁,總共80頁。判斷抽樣研究人員根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本有重點抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒有依據(jù)隨機的原則,調(diào)查結(jié)果不能用于對推斷總體2023/3/810當前10頁,總共80頁。自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問卷活動,向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機性無關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體2023/3/811當前11頁,總共80頁。定額抽樣先將體中的所有單位按一定的標志(變量)分為若干類,然后在每個類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似抽取具體樣本單位時,不是依據(jù)隨機原則,屬于非概率抽樣2023/3/812當前12頁,總共80頁。隨機抽樣與非隨機抽樣的比較隨機抽樣依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非隨機抽樣不是依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的分布是不確定的使用樣本結(jié)果推斷總體的效果要差一些2023/3/813當前13頁,總共80頁。1·簡單隨機抽樣(純隨機抽樣)

根據(jù)隨機原則直接從總體中抽取單位構(gòu)成樣本的一種抽樣方式。

僅適用于規(guī)模不大、分布比較均勻的總體(二)隨機抽樣的組織方式每個容量為n的樣本都有同等機會(概率)被抽中簡單、直觀,是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式一般有抽簽、抓鬮、隨機數(shù)碼表、抽樣函數(shù)等2023/3/814當前14頁,總共80頁。63271599867174451102151418071458683931081355479945885470989695436791150830301041200306375408459283645595757243838650991119761663554010226646601471570246276874534479067122455738435821625169991338522782553630744934835152907661667191127772186168689032636939392785499025844742048303788761826933406401628113186294318819004588387338129089541702904011308243177262865256836783514732718518922225520127340104933652064465055503015782242295206975372602237565493581628361003925456835376360242198063896416495399337

在隨機數(shù)碼表中,可以從任何一個位置、任何方向開始挑選隨機數(shù)字。一旦選擇一個任意起點,就采用事先確定的程序抽取樣本。

隨機數(shù)字表(摘錄)2023/3/815當前15頁,總共80頁。2·類型抽樣(分類抽樣或分層抽樣)將總體全部單位分類,形成若干個類型組,然后從各類型中分別隨機抽取若干單位組成樣本的抽樣形式??傮wN樣本n等比例抽取不等比例抽取······能使樣本結(jié)構(gòu)更接近于總體結(jié)構(gòu),提高樣本的代表性,適宜于單位標志值差異程度較大的總體,能同時推斷總體指標和各組的指標2023/3/816當前16頁,總共80頁。3·等距抽樣(機械抽樣或系統(tǒng)抽樣)將總體單位按某一標志排序,然后按相等間隔抽取樣本單位構(gòu)成樣本的抽樣形式······隨機起點半距起點對稱起點(總體單位按某一標志排序)按無關(guān)標志排隊,其抽樣效果相當于簡單隨機抽樣;按有關(guān)標志排隊,其抽樣效果相當于類型抽樣。2023/3/817當前17頁,總共80頁。4·整群抽樣將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本的抽樣方式。例:總體群數(shù)R=16樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節(jié)省人力、物力、財力和時間,但其樣本代表性可能較差,產(chǎn)生的抽樣誤差較大。2023/3/818當前18頁,總共80頁。5·多階段抽樣指分兩個或兩個以上的階段來完成抽取樣本單位過程的抽樣方式例:在某省有100多萬農(nóng)戶,需要抽取1000戶調(diào)查農(nóng)戶生產(chǎn)性投資情況。第一階段:從該省所有縣中抽取5個縣第二階段:從被抽中的5個縣中各抽4個鄉(xiāng)第三階段:從被抽中的20個鄉(xiāng)中各抽5個村第四階段:從被抽中的100個村中各抽10戶樣本n=100×10=1000(戶)既可以相對節(jié)約人力和物力,又可以利用現(xiàn)成的行政區(qū)劃、組織系統(tǒng)作為劃分各階段的依據(jù),但抽樣誤差的計算要復(fù)雜得多。

2023/3/819當前19頁,總共80頁。調(diào)查對象的性質(zhì)特點對調(diào)查對象的了解程度(抽樣框的特點)抽樣誤差的大小人力、財力和物力等條件的限制在實際工作中,選擇適當?shù)某闃咏M織方式主要應(yīng)考慮:如何確定抽樣組織方式2023/3/820當前20頁,總共80頁。明確調(diào)查目的明確總體及抽樣單位確定或構(gòu)建抽樣框

提出指標精度要求選擇抽樣組織形式(三)抽樣方案的設(shè)計確定樣本容量制定具體辦法步驟1.抽樣方案的設(shè)計內(nèi)容2023/3/821當前21頁,總共80頁。2.抽樣方案設(shè)計的基本原則(1)保證實現(xiàn)抽樣隨機性的原則(2)保證實現(xiàn)最大的抽樣效果原則3.抽樣方案設(shè)計中的重要問題(1)保證隨機原則的實現(xiàn)(2)要考慮樣本容量和結(jié)構(gòu)問題(3)關(guān)于抽樣的組織形式問題(4)關(guān)于調(diào)查費用的問題2023/3/822當前22頁,總共80頁。(一)關(guān)于分布的幾個概念(二)抽樣分布的理論基礎(chǔ)(三)樣本均值的抽樣分布(四)樣本比例的抽樣分布二、抽樣分布2023/3/823當前23頁,總共80頁。總體變量x的概率分布,它由變量x的所有取值和與之相應(yīng)的概率組成。反映總體分布特征的常用指標有總體均值μ和總體標準差σ總體分布通常是未知的總體(一)關(guān)于分布的幾個概念總體分布N=∑FP=F/∑F2023/3/824當前24頁,總共80頁。樣本中各觀察值的概率分布,它由一個樣本的所有觀察值x和與之相應(yīng)的概率p組成。樣本分布的特征值主要有樣本均值與樣本標準差s當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布樣本樣本分布2023/3/825當前25頁,總共80頁。樣本統(tǒng)計量(樣本均值,樣本比例,樣本方差等)的概率分布,由各樣本統(tǒng)計量的值和與之相應(yīng)的概率組成。樣本統(tǒng)計量是隨機變量,其結(jié)果來自容量相同的所有可能樣本是一種理論概率分布。提供了樣本統(tǒng)計量穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布2023/3/826當前26頁,總共80頁??傮w樣本樣本樣本抽樣分布的形成過程計算樣本統(tǒng)計量如:樣本均值2023/3/827當前27頁,總共80頁?!纠吭O(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為X1=1、X2=2、X3=3

、X4=4

??傮w的均值、方差及分布如下:總體分布142300.10.20.3均值和方差2023/3/828當前28頁,總共80頁。

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)2023/3/829當前29頁,總共80頁。計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.10.20.3P(X)1.53.04.03.52.02.502023/3/830當前30頁,總共80頁。比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n2023/3/831當前31頁,總共80頁。

=2.5σ2=1.25總體分布142300.10.20.3抽樣分布P(X)1.000.10.20.31.53.04.03.52.02.5XP(X)2023/3/832當前32頁,總共80頁。進行n

次重復(fù)試驗,出現(xiàn)“成功”的次數(shù)X的概率分布稱為二項分布,記為:設(shè)X為n次重復(fù)試驗中事件A出現(xiàn)的次數(shù),X取x

的概率為P二項分布X=xix1,x2

,…

,xnP(X=xi)=PiP1,P2

,…

,Pn重復(fù)試驗的條件:①一次試驗只有兩個可能結(jié)果;②試驗可以重復(fù)進行;③每一次試驗成功的概率都是p。2023/3/833當前33頁,總共80頁。二項分布的數(shù)學(xué)期望為

E(X)=np方差為

D(X)=npq二項分布的數(shù)學(xué)期望和方差:2023/3/834當前34頁,總共80頁。1.描述連續(xù)型隨機變量的最重要的分布2.經(jīng)典統(tǒng)計推斷的基礎(chǔ)3.若隨機變量的概率密度函數(shù)為:xf(x)正態(tài)分布則稱X服從均值為μ、方差為σ2的正態(tài)分布,記為2023/3/835當前35頁,總共80頁。概率密度函數(shù)在x

的上方,即f(x)>0正態(tài)曲線的最高點在均值,它也是分布的中位數(shù)和眾數(shù),即對稱分布正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值和標準差來區(qū)分。決定了圖形的中心位置,決定曲線的平緩程度,即寬度曲線f(x)相對于均值對稱,尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相交隨機變量的概率由曲線下的面積給出正態(tài)曲線下的總面積等于1正態(tài)分布的特點2023/3/836當前36頁,總共80頁。和對正態(tài)曲線的影響xf(x)CAB2023/3/837當前37頁,總共80頁。正態(tài)分布的概率概率是曲線下的面積!abxf(x)2023/3/838當前38頁,總共80頁。正態(tài)分布函數(shù)隨機變量的概率也可以用分布函數(shù)F(x)來表示分布函數(shù)定義為根據(jù)分布函數(shù),P(a<X<b)可以寫為f(x)xx0F(x0

)2023/3/839當前39頁,總共80頁。標準正態(tài)分布一般的正態(tài)分布取決于均值和標準差計算概率時,每一個正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無窮多的若能將一般的正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布,計算概率時只需要查一張表2023/3/840當前40頁,總共80頁。標準正態(tài)分布函數(shù)標準正態(tài)分布的概率密度函數(shù)任何一個一般的正態(tài)分布,均可通過下面的線性變換轉(zhuǎn)化為標準正態(tài)分布標準正態(tài)分布的分布函數(shù)2023/3/841當前41頁,總共80頁。標準正態(tài)分布表的使用將一個一般的正態(tài)分布轉(zhuǎn)換為標準正態(tài)分布計算概率時,只要查標準正態(tài)概率分布表即可對于負的x

,可由(-x)x得到對于標準正態(tài)分布,即X~N(0,1),有P(aXb)baP(|X|a)2a1對于一般正態(tài)分布,即X~N(,),則有2023/3/842當前42頁,總共80頁。x=5=10一般正態(tài)分布6.2

=1Z標準正態(tài)分布00.12.04782023/3/843當前43頁,總共80頁?!纠?】設(shè)X~N(0,1)分布,求以下概率:

(1)P(X<1.5);(2)P(X>2);(3)P(-1<X

3);(4)P(|X|2)

解:(1)P(X<1.5)=(1.5)=0.9332(2)P(X>2)=1-P(X

2)=1-0.9973=0.0227(3)P(-1<X

3)=P(X

3)-P(X<-1)=(3)-(-1)=(3)–[1-(1)]=0.9987-(1-0.8413)=0.84(4)P(|X|2)=P(-2

X

2)=(2)-(-2)=(2)-[1-(2)]=2(2)-1=0.95452023/3/844當前44頁,總共80頁?!纠?】設(shè)X~N(5,32),求以下概率

(1)P(X

10);(2)P(2<X

<10)

解:

(1)(2)2023/3/845當前45頁,總共80頁。對于來自正態(tài)總體的簡單隨機樣本,其比值

的抽樣分布服從自由度為(n-1)2分布,即

n個相互獨立的標準正態(tài)隨機變量z的平方和的分布稱為具有n個自由度的χ2分布,記為χ2(n)。2分布2023/3/846當前46頁,總共80頁。2分布的圖示

選擇容量為n的簡單隨機樣本計算樣本方差S2計算卡方值2=(n-1)S2/σ2計算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20

ms總體2023/3/847當前47頁,總共80頁。密度曲線位于第一象限。分布的形狀取決于其自由度n的大小,通常為不對稱的右偏分布,但隨著自由度的增大逐漸趨于對稱數(shù)學(xué)期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的2分布隨機變量,U~2(n1),V~2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布2分布的特點2023/3/848當前48頁,總共80頁。設(shè)X~N(0,1),Y~

Χ2(n),并且X、Y獨立,則稱隨機變量服從自由度為n的t分布,記為t分布xt

分布與標準正態(tài)分布的比較t分布標準正態(tài)分布x不同自由度的t分布標準正態(tài)分布t(df=13)t(df=5)t分布是類似正態(tài)分布的一種對稱分布,通常比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布2023/3/849當前49頁,總共80頁。獨立同分布大數(shù)定律:設(shè)x1,x2,…是獨立同分布的隨機變量序列,且存在有限的數(shù)學(xué)期望E(xi)=μ和方差D(xi

)=σ2(i=1,2,…),則對任意小的正數(shù)ε,有:該定律表明:當n足夠大時,獨立同分布的一系列隨機變量的均值接近數(shù)學(xué)期望,即平均數(shù)具有穩(wěn)定性。(二)抽樣分布的理論基礎(chǔ)大數(shù)定律闡述大量同類隨機現(xiàn)象的平均結(jié)果穩(wěn)定性的一系列定理的總稱。2023/3/850當前50頁,總共80頁。貝努里大數(shù)定律:設(shè)m是n次獨立重復(fù)試驗中事件A發(fā)生的次數(shù),π是每次試驗中事件A發(fā)生的概率,則對任意的ε>0,有:該定律表明:當重復(fù)試驗次數(shù)n充分大時,事件A發(fā)生的頻率m/n依概率收斂于事件A發(fā)生的概率,即頻率具有穩(wěn)定性。大數(shù)定律的實踐意義:一是抽樣必須遵循隨機原則;二是抽樣必須遵循大量原則。

2023/3/851當前51頁,總共80頁。闡述大量隨機變量之和的極限分布是正態(tài)分布的一系列定理的總稱。中心極限定理獨立同分布中心極限定理(也稱為列維-林德伯格定理):設(shè)x1,x2,x3…是獨立同分布的隨機變量序列,且存在有限的數(shù)學(xué)期望μ和方差σ,那么當n→∞時:該定理表明:不論總體服從什么分布,只要其數(shù)學(xué)期望和方差存在,對這一總體進行重復(fù)抽樣,當樣本容量充分大時,或就趨近于正態(tài)分布。中心極限定理2023/3/852當前52頁,總共80頁。當樣本容量足夠大時(n

>30),樣本均值的抽樣分布逐漸趨于正態(tài)分布設(shè)從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X2023/3/853當前53頁,總共80頁。2023/3/854當前54頁,總共80頁。中心極限定理的意義在于:當我們的認識對象分布未知時,只要堅持隨機抽取足夠多的樣本單位,就可以使樣本統(tǒng)計量服從或近似服從正態(tài)分布,繼而便可運用正態(tài)分布理論,根據(jù)樣本信息來推斷認識對象總體的數(shù)量特征。2023/3/855當前55頁,總共80頁。在隨機選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) (三)樣本均值的抽樣分布2023/3/856當前56頁,總共80頁。樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布特征2023/3/857當前57頁,總共80頁。3.樣本均值的標準誤差所有可能的樣本均值的標準差,測度所有樣本均值的離散程度計算公式為2023/3/858當前58頁,總共80頁。σ2已知時,樣本均值的抽樣分布

總體是否正態(tài)分布否是大小樣本容量n正態(tài)分布正態(tài)分布非正態(tài)分布2023/3/859當前59頁,總共80頁。表明:當總體服從正態(tài)分布時,不論樣本容量多大,樣本均值都服從正態(tài)分布,且樣本均值的數(shù)學(xué)期望等于總體均值,樣本均值的方差等于總體方差的1/n當總體分布為非正態(tài)總體或分布形式未知時,樣本容量充分大時(一般要求n≥30),樣本均值的抽樣分布可以近似地用正態(tài)分布來描述。

總體為非正態(tài)總體或分布形式未知,如果樣本容量太小,我們無法從理論上探討樣本均值的抽樣分布

2023/3/860當前60頁,總共80頁。

【例】設(shè)從一個均值μ=10,標準差σ=0.6的總體中,隨機抽取容量n=36的樣本。要求:2023/3/861當前61頁,總共80頁。解:根據(jù)中心極限定理,不論總體分布是什么形狀,只要樣本足夠大(n≥30時),樣本均值2023/3/862當前62頁,總共80頁。2023/3/863當前63頁,總共80頁?!纠磕硰S生產(chǎn)的某種節(jié)能燈管的使用壽命服從正態(tài)分布,對某批產(chǎn)品測試的結(jié)果,平均使用壽命為1050小時,標準差為200小時。試求:(a)使用壽命在500小時以下的燈管占多大比例?(b)使用壽命在850~1450小時的燈管占多大比例?(c)以均值為中心,95%的燈管的使用壽命在什么范圍內(nèi)?2023/3/864當前64頁,總共80頁。解:設(shè)X=使用壽命,則X~N(1050,2002

)=Ф(2)-Ф(-1)=0.97725-0.15865=0.8186

95%的燈管壽命在均值392左右(即658~1442)小時=1-Ф(2.75)=1-0.99702=0.002982023/3/865當前65頁,總共80頁。σ2未知時,樣本均值的抽樣分布

總體是否正態(tài)分布否是大小樣本容量n

t分布

t分布非正態(tài)分布2023/3/866當前66頁,總共80頁。表明:當總體方差未知時,對于正態(tài)總體(無論樣本容量的大?。蛘呖傮w非正態(tài)或分布形式未知但樣本容量充分大時,樣本均值的標準化值服從分布值得注意的是,當樣本容量逐漸增大時,t分布逐漸逼近標準正態(tài)分布。所以,當樣本容量很大時,除了可以利用進行相關(guān)計算外,也可以利用近似服從標準正態(tài)分布來計算

2023/3/867當前67頁,總共80頁。【例】已知湖南省2009年的全省糧食總平均畝產(chǎn)為600公斤,其分布形式及方差均未知。現(xiàn)從全省隨機抽取4900畝進行調(diào)查了解,測得該樣本的標準差為400公斤,求這4900畝的平均畝產(chǎn)不低于620公斤的概率。分析:解:糧食單產(chǎn)x的分布形式及方差均未知,故以樣本方差代替總體方差,從理論上講,

2023/3/868當前68頁,總共80頁。一般情況下,根據(jù)t值與自由度在t分布表中可以查找相應(yīng)的概率。由于這里的t分布的自由度很大,為4900-1=4899,這時的t分布與標準正態(tài)分布幾乎一樣,故可以查標準正態(tài)分布表,得

結(jié)果表明:這4900畝的平均畝產(chǎn)不低于620公斤的概率只有0.0233%。

2023/3/869當前69頁,總共80頁。(四)樣本比例的抽樣分布

1.是非標志均值與比例的關(guān)系對于是非標志總體X而言,X的取值只有兩個:0和1。設(shè)總體的單位數(shù)為N,具有某一特征(如產(chǎn)品合格)的比例為π,則:

2023/3/870當前70頁,總共80頁。對于是非標志的樣本來說,其取值也是兩個:0和1。設(shè)樣本容量為n,具有某一特征(如產(chǎn)品合格)的比例為p,則:

結(jié)論:是非標志的均值等于其比例。

2023/3/871當前71頁,總共80頁。樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布特征樣本比例的抽樣分布是容量相同的所有可能樣本的樣本比例的概率分布。其分布特征如下:2023/3/872當前72頁,總共80頁。容量相同的所有可能樣本的樣本比例的概率分布是非標志的總體方差已知,且樣本比例的抽樣分布可用正態(tài)分布近似,一種理論概率分布推斷總體比例π的理論基礎(chǔ) 2.樣本比例的抽樣分布——正態(tài)分布2023/3/873當前73頁,總共80頁?!纠考僭O(shè)有一批種子的發(fā)芽率為0.7。現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論