版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1、抽樣推斷的概念和特點(diǎn)抽樣推斷概念:從總體中隨機(jī)抽樣,利用樣本的實(shí)際資料計(jì)算樣本指標(biāo),并據(jù)以推算總體相應(yīng)數(shù)量特征的一種統(tǒng)計(jì)方法。 從總體中抽樣進(jìn)行調(diào)查叫抽樣調(diào)查。抽樣推斷特點(diǎn):(1)按隨機(jī)原則從總體中抽樣抽樣調(diào)查的目的是推斷總體,抽樣時(shí)保證每個(gè)單位有同等的機(jī)會(huì)被選取,才能使所選樣本和總體有相同分布特征,樣本才有代表性。第四章 環(huán)境參數(shù)的抽樣估計(jì)(2)通過抽樣調(diào)查,取得部分單位的實(shí)際資料計(jì)算樣本的綜合指標(biāo),然后對(duì)總體的規(guī)模、水平、結(jié)構(gòu)等數(shù)量指標(biāo)做出估計(jì)和推斷。(3)用樣本指標(biāo)估計(jì)總體指標(biāo),利用的是不確定的概率估計(jì)的方法。(4)抽樣誤差可以計(jì)算和控制。采取一定得組織措施來控制誤差的范圍,保證抽樣
2、推斷的結(jié)果達(dá)到一定的可取程度。有關(guān)抽樣調(diào)查的幾個(gè)基本概念 (1)總體和樣本??傮w是指被研究對(duì)象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全體單位所組成的集合體。總體的單位數(shù)用N表示;樣本是從總體中隨機(jī)抽取出來的那部分單位的集合體。樣本的單位數(shù)用n來表示。(2)抽樣框。劃定一個(gè)盡可能接近總體的便于操作的框架,作為抽樣總體,即抽樣框。抽樣框?qū)嶋H上是被抽單位的目錄。 (3)參數(shù)和統(tǒng)計(jì)量。根據(jù)總體各單位的標(biāo)志值或標(biāo)志屬性計(jì)算的,反映總體數(shù)量特征的綜合指標(biāo)稱為總體指標(biāo),它是總體變量的函數(shù),其數(shù)值是由總體各單位的標(biāo)志值或標(biāo)志屬性決定的,一個(gè)總體指標(biāo)是一個(gè)確定的、唯一的數(shù)值,也稱真值,因此稱為參數(shù)。根據(jù)樣
3、本各單位標(biāo)志值或標(biāo)志屬性計(jì)算的綜合指標(biāo)稱為統(tǒng)計(jì)量,也可稱為樣本指標(biāo)。(4)樣本容量和樣本個(gè)數(shù)。樣本容量又稱樣本含量,是指一個(gè)樣本包含的觀察單位數(shù)。樣本容量的大小直接影響著抽樣調(diào)查的效果。一般將n30的樣本稱之為小樣本,n30的樣本稱為大樣本。樣本個(gè)數(shù)又稱樣本可能數(shù)目,是指從一個(gè)總體中可能抽取的樣本個(gè)數(shù)。(5)重復(fù)抽樣與不重復(fù)抽樣。重復(fù)抽樣也稱回置抽樣,即從總體中每次抽取一個(gè)單位之后,再放回總體,保持總體單位數(shù)不變,再進(jìn)行下一個(gè)單位的抽取,如此重復(fù)抽足一個(gè)樣本。重復(fù)抽樣每個(gè)單位中選的機(jī)會(huì)在各次都完全相等。從總體N個(gè)單位中,用重復(fù)抽樣的方法,隨機(jī)抽取n個(gè)單位構(gòu)成一個(gè)樣本,則共可抽取Nn個(gè)樣本。 不
4、重復(fù)抽樣也稱不回置抽樣,即從總體中每抽取一個(gè)單位,就不再放回參加下次的抽選,這樣每抽出一個(gè)單位,總體中就少一個(gè)單位,因而每個(gè)單位只有一次被抽中的機(jī)會(huì)。從總體N個(gè)單位中,用不重復(fù)抽樣的方法抽取n個(gè)單位樣本,全部可能抽取的樣 本數(shù)目為 個(gè)。2.2分層抽樣 分層抽樣也稱類型抽樣或分類抽樣。它是先將總體各單位按主要標(biāo)志進(jìn)行分層,然后再按比例從各層中隨機(jī)抽取一定數(shù)目的單位構(gòu)成樣本。 分層抽樣需要確定各層的樣本數(shù)目分配,樣本單位在各層中的數(shù)目分配,可以是等比例的分層抽樣,也可以是不等比例的分層抽樣。(1)等比例分層抽樣。就是按總體各層單位數(shù)的多少來分配每層應(yīng)抽的樣本單位數(shù)。(2)不等比例抽樣。 2.3等距
5、抽樣等距抽樣又稱機(jī)械隨機(jī)抽樣或系統(tǒng)抽樣。它是先將總體各單位按某一標(biāo)志順序排列,然后按固定的順序和間隔抽取一定數(shù)目的總體單位構(gòu)成樣本。 在按無(wú)關(guān)標(biāo)志排隊(duì)的等距抽樣中,可在第一個(gè)間隔內(nèi)隨機(jī)抽取第一個(gè)樣本單位作為起點(diǎn),然后每隔K個(gè)單位抽取一個(gè)樣本單位,直到抽夠所需要的樣本單位數(shù)。 在按有關(guān)標(biāo)志排隊(duì)的等距抽樣中,第一個(gè)樣本單位通常按以下方法來確定。 (1)中點(diǎn)取樣法。 (2)平均取樣法。 (3)隨機(jī)起點(diǎn),對(duì)稱等距取樣。 2.5階段抽樣 階段抽樣亦稱多階段抽樣。階段抽樣是將總體先分成若干大組,大組中再分小組,還可以往下細(xì)分。抽樣時(shí)先隨機(jī)抽取大組,再?gòu)某橹械拇蠼M中隨機(jī)抽取小組,最后根據(jù)最終抽取的所有單位組
6、成樣本,進(jìn)行調(diào)查。階段抽樣方法多用簡(jiǎn)單隨機(jī)抽樣方法,也可將幾種抽樣方法結(jié)合使用。 3抽樣分布3.1總體分布、樣本分布與抽樣分布從概率論角度看,總體各單位標(biāo)志值Xi(i = 1,2,N )可以看作是隨機(jī)變量X的N種取值。 因此,統(tǒng) 計(jì)上 常將隨機(jī)變量 X 的 全 部 取 值 X1,X2, ,XN 的集合稱為變量總體 ( 簡(jiǎn)稱總體,記為X ), X1,X2,XN 被稱為總體單位(個(gè)體),從總體中隨機(jī)抽取的 n 個(gè)個(gè)體 X1,X2,Xn ,稱為總體 X 的一個(gè)容量為 n 的樣本,其中 X1,X2,Xn 被稱為“樣本單位”。樣本單位 X1,X2,Xn 可以看作是 n 個(gè)相互獨(dú)立且與 X 具有相同概率分
7、布的隨機(jī)變量,從總體 X 中進(jìn)行一次 具體抽樣,所獲得的具體數(shù)據(jù) x1,x2,xn 是 n 個(gè)隨機(jī)變量(樣本) X1,X2,Xn 的具體數(shù)值,常稱為樣本觀察值或樣本值。 設(shè) X1,X2,Xn 為總體X的一個(gè)樣本, f(X1,X2,Xn) 為一個(gè)連續(xù)函數(shù), 若 f(X1,X2,Xn)中不含任何未知參數(shù), 則稱 f(X1,X2,Xn)為一個(gè)統(tǒng)計(jì)量。如果x1,x2,xn為樣本X1,X2,Xn的具體樣本觀察值,則 f(x1,x2,xn)是f(X1,X2,Xn)的一個(gè)觀察值。例如,樣本X1,X2,Xn 的均值 、方差S2都是統(tǒng)計(jì)量,對(duì)于從總體X中抽出的某一具體樣本x1,x2,xn,其均值、s2分別被稱為
8、統(tǒng)計(jì)量及 S2 的一個(gè)觀察值。例5.1 設(shè)有5臺(tái)儀器,其使用時(shí)間分別為1年,2年,3年,4年,5年?,F(xiàn)采用重復(fù)抽樣方法抽出2臺(tái)儀器構(gòu)成樣本,試給出其總體分布,樣本均數(shù)的抽樣分布及相應(yīng)的分布特征。該總體的概率分布如下表:表5.1 5臺(tái)儀器使用時(shí)間的概率分布使用時(shí)間Xi 12345臺(tái) 數(shù)fi 11111概 率Pifi /fi 該總體分布的特征: 的抽樣分布 =10.04+1.50.08+20.12+2.50.16+30.20+ 3.50.16+40.12+4.50.08+50.043(年) (1-3)20.04+(1.5-3)20.08+(2-3)20.12 +(2.5-3)20.16+(3-3)
9、20.20+(3.5-3)20.16 +(4-3)20.12+(4.5-3)20.08+(5-3)20.04l(年)樣本均值11.522.533.544.55次 數(shù) fi 123454321概 率 Pi 0.040.080.120.160.200.160.120.080.04這一結(jié)論具有普遍意義。樣本均值的抽樣分布,并描述了其分布特征。 當(dāng)總體容量較大時(shí),無(wú)法用上述方法描述統(tǒng)計(jì)量的抽樣分布,必須進(jìn)一步探討抽樣分布的理論方法。 3.2樣本均值 的抽樣分布作為隨機(jī)變量,樣本均值的變化規(guī)律,可以用 的所有可能取值及其所對(duì)應(yīng)的概率來描述,即為樣本均值 的抽樣分布。 3.2.1 2已知時(shí)樣本均值 的抽樣
10、分布當(dāng)總體X服從正態(tài)分布時(shí),設(shè)x1,x2,xn是從正態(tài)總體X N( )中重復(fù)抽取的一個(gè)簡(jiǎn)單隨機(jī)樣本,則其樣本均值 亦是服從正態(tài)分布的隨機(jī)變量,并且可以證明,即 N( )。 例如,某總體 XN (20,32);現(xiàn)從中隨機(jī) 抽取一個(gè) n3 的簡(jiǎn)單隨機(jī)樣本,則 N(20,323),即 N (20,3);如果將n由3增加到9, 則 N (20,1)??傮w分布與不同樣本容量的抽樣分布 由此可以說明:(1) 當(dāng)總體服從正態(tài)分布時(shí),不論樣本容量n有多大,樣本均值均服從以總體均值為中心的正態(tài)分布。(2) 從正態(tài)總體中隨機(jī)抽樣,樣本均值的數(shù)學(xué)期望等于總體均值;樣本均值的方差為總體方差 的1/n ,這意味著樣本均
11、值的各觀察值比總體各單位Xi更緊密地集中在總體均值的周圍,且樣本均值的集中程度與樣本容量 n 成正比。(3) 樣本均值的方差 ,進(jìn)而,有樣本均值的標(biāo)準(zhǔn)誤差 (簡(jiǎn)稱均值的標(biāo)準(zhǔn)誤)。(4) 對(duì) 作標(biāo)準(zhǔn)正態(tài)變量變換,令則 N (0,1)。當(dāng)總體X不服從正態(tài)分布時(shí),樣本均值的抽樣分布與樣本容量n 的大小有關(guān)。根據(jù)中心極限定理,隨著樣本容量n 的逐漸增加,樣本均值的抽樣分布趨近正態(tài)分布。因此,當(dāng)樣本容量n 充分大(一般認(rèn)為n50)時(shí),樣本均值的抽樣分布一般可按正態(tài)分布處理。t分布也是一種對(duì)稱分布,在樣本容量n不大的情況下,t分布與標(biāo)準(zhǔn)正態(tài)分布相差較大,但隨著樣本含量的逐漸增大(嚴(yán)格講是自由度n - l逐
12、漸增大)t 分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布,尤其是當(dāng)自由度大于40時(shí),t 分布與標(biāo)準(zhǔn)正態(tài)分布相差甚微,當(dāng)自由度時(shí),t分布就與標(biāo)準(zhǔn)正態(tài)分布完全一樣了。因此,當(dāng)自由度較大時(shí)的t 分布可以近似地按正態(tài)分布處理。 不同自由度下的t分布和正態(tài)分布一樣,t 分布曲線下的總面積也等于1,即 t 值落入?yún)^(qū)間(- ,+ )內(nèi)的概率為1。t 值落入任一區(qū)間(t1,t2)內(nèi)的概率等于該區(qū)間曲線和橫軸所夾的面積。如t值落于區(qū)間(-t0.05,+t0.05)內(nèi)的概率為0.95,t值落于區(qū)間(-t0.01,+t0.01)內(nèi)的概率為0.99。這里的t0.05、t0.01是概率分別為0.05,0.01時(shí)的 t 界值。例如,查自由度
13、9,概率0.05的t雙側(cè)分位數(shù),就要查概率為 /20.025時(shí)的單側(cè)分位數(shù)。從附表3中,可以查出t 0.025,9 2.262,由于曲線的對(duì)稱性,則另一尾區(qū) t 0.025,9 2.262。就是說, t 2.262 和 t 2.262 (相當(dāng)于t 2.262 )的兩個(gè)尾區(qū)的曲線下的面積之和為0.05。對(duì)于雙側(cè)分位數(shù)可以表示為:P (t t /2 , ) 以后我們均以“t , ”表示單側(cè)分位數(shù),“t /2 , ”表示雙側(cè)分位數(shù)。3.2.3 兩個(gè)樣本均值之差的抽樣分布當(dāng) 和 為已知時(shí), 當(dāng) 和 均 為未知時(shí),且當(dāng) 和 均 為未知時(shí),且當(dāng)X1和X2為非正態(tài)總體 , 和 均 為未知時(shí),且3.3樣本比率
14、(成數(shù))p的抽樣分布設(shè)容量為N的總體中具有某種性質(zhì)的總體單位數(shù)為M,則總體關(guān)于這種性質(zhì)的總體單位數(shù)的比率 。 如果從該總體抽取容量為n的簡(jiǎn)單隨機(jī)樣本,對(duì)樣本比率P,則有4抽樣誤差的估計(jì)4.1抽樣誤差的概念抽樣誤差是指統(tǒng)計(jì)量與相應(yīng)參數(shù)之差。如樣本均值與總體均值之差,樣本比率 p與總體比率P之差等。由于總體中各單位之間存在著變異,抽樣調(diào)查中抽取的樣本只包含總體一部分的單位,其結(jié)構(gòu)不可能和總體完全一致,因而樣本指標(biāo)不一定恰好等于相應(yīng)的總體指標(biāo)。抽樣誤差越小,用樣本估計(jì)總體的可靠性就越大,否則,抽樣誤差越大,用樣本估計(jì)總體的可靠性就越小。抽樣誤差雖然不可避免,但它具有一定的規(guī)律性,在抽樣調(diào)查中,掌握和
15、應(yīng)用這種規(guī)律性是非常重要的。4.2影響抽樣誤差的因素 (1) 樣本容量的大小。在其他因素完全相同的條件下,樣本容量越大,抽樣誤差就越小;而樣本容量越小,抽樣誤差就越大。 (2) 總體單位標(biāo)志變異度的大小。抽樣誤差與總體標(biāo)志變異度成正比。即總體標(biāo)志變異度越大,抽樣誤差也越大;總體的標(biāo)志變異度越小,則抽樣誤差也越小。 (3) 不同的抽樣組織形式。對(duì)同一總體進(jìn)行抽樣調(diào)查。在樣本容量一定的條件下,重復(fù)抽樣的誤差比不重復(fù)抽樣的誤差要大些。 4.3均值的抽樣誤差 從總體X 中隨機(jī)抽取一個(gè)容量n 的樣本x1,x2,xn,由于有多種抽選方法,可以抽取多個(gè)不同樣本,因而就有多個(gè)不同的樣本均值。 如果把樣本均值看
16、作變量,也可以用標(biāo)準(zhǔn)差說明各樣本均值間的變異程度,即樣本均值的標(biāo)準(zhǔn)誤差,簡(jiǎn)稱標(biāo)準(zhǔn)誤。均值的抽樣誤差的大小通常用標(biāo)準(zhǔn)誤來表示。 根據(jù)抽樣分布的原理,容量為n 的樣本均值分布的方差 等于總體方差2 的1/n,即 取兩端平方根,則為: 在實(shí)際應(yīng)用中,總體標(biāo)準(zhǔn)差 未知,通常是用標(biāo)準(zhǔn)誤的估計(jì)值來說明均值抽樣誤差大小的。 均值的標(biāo)準(zhǔn)誤估計(jì)值在隨機(jī)抽樣方式重復(fù)抽樣時(shí),其計(jì)算公式為: 不重復(fù)抽樣,其抽樣誤差總是小于重復(fù)抽樣誤差。從容量為N的總體中不重復(fù)抽樣,均值的標(biāo)準(zhǔn)誤計(jì)算公式為:當(dāng)總體單位數(shù) N 很大時(shí),式中的N -1可近似取N,則 通常稱為有限總體修正系數(shù)。當(dāng)nN 不大(一般不大于5% 時(shí),標(biāo)準(zhǔn)誤計(jì)算公式
17、中的修正系數(shù)可以省去。 例5.2 某縣利用原有的淺層水井進(jìn)行地下水污染狀況抽樣調(diào)查。從該縣的1000眼水井中隨機(jī)抽選10眼水井,測(cè)定井水中砷的濃度,測(cè)定結(jié)果,10眼井水中砷的平均濃度為0.58mgL,標(biāo)準(zhǔn)差為mgL。試求其均值的標(biāo)準(zhǔn)誤。 本例 0.58mgL,S0.1mgL,N 1000, n =10,由于n/ N 1%5%,因此按式(5.11)計(jì)算均值的標(biāo)準(zhǔn)誤4.4比率(成數(shù))的標(biāo)準(zhǔn)誤比率的標(biāo)準(zhǔn)誤計(jì)算與均值的標(biāo)準(zhǔn)誤計(jì)算原理基本相同。重復(fù)抽樣時(shí),比率的標(biāo)準(zhǔn)誤計(jì)算公式為: 當(dāng) P 未知時(shí),常以樣本比率 p 來估計(jì),則不重復(fù)抽樣時(shí)比率標(biāo)準(zhǔn)誤的計(jì)算公式為:例5.3某市監(jiān)測(cè)大氣中SO2濃度,在采集的2
18、00個(gè)空氣樣品中,經(jīng)測(cè)定有8個(gè)樣品SO2濃度超標(biāo)。求SO2超標(biāo)率的標(biāo)準(zhǔn)誤。本例SO2濃度超標(biāo)率 ,由于P未知, 而且是從無(wú)限總體中抽樣,可按式(5.15)計(jì)算: 例5.4 某河段有1000個(gè)污水排放口,用不重復(fù)抽樣方法從中抽檢100個(gè)污水排放口,結(jié)果有85個(gè)超標(biāo),求該超標(biāo)率的標(biāo)準(zhǔn)誤。排污口超標(biāo)率 按式(5.16) 計(jì)算: 該河段污水排放口超標(biāo)率的標(biāo)準(zhǔn)誤為3.39%。標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別: 標(biāo)準(zhǔn)差描述個(gè)體間的變異程度。凡同性質(zhì)的資料,標(biāo)準(zhǔn)差大表示個(gè)體變異大,標(biāo)準(zhǔn)差小表示個(gè)體變異小。 而標(biāo)準(zhǔn)誤是樣本指標(biāo)的標(biāo)準(zhǔn)差,反映樣本指標(biāo)的抽樣誤差,即樣本指標(biāo)與總體指標(biāo)的接近程度。凡同性質(zhì)的資料,標(biāo)準(zhǔn)誤大,表示
19、樣本指標(biāo)的抽樣誤差大,用樣本指標(biāo)代表總體指標(biāo)的可靠性小,而標(biāo)準(zhǔn)誤小,表示樣本指標(biāo)的抽樣誤差小,用樣本指標(biāo)代表總體指標(biāo)的可靠性大。4.5抽樣極限誤差抽樣極限誤差又稱抽樣允許誤差。把樣本指標(biāo)與總體指標(biāo)之間的抽樣誤差控制在一個(gè)允許的限度范圍內(nèi),這個(gè)可允許的最大抽樣誤差范圍稱為抽樣極限誤差。用絕對(duì)值表示 用不等式表示則為: p 5. 參數(shù)估計(jì) 5.1參數(shù)估計(jì)的優(yōu)良標(biāo)準(zhǔn) 評(píng)價(jià)統(tǒng)計(jì)量的優(yōu)劣一般應(yīng)遵從以下原則: 5.1.1無(wú)偏性 總體參數(shù)的估計(jì)量是一個(gè)隨機(jī)變量,對(duì)隨機(jī)樣本x1,x2,xn的不同觀察值,某估計(jì)量會(huì)取得不同的估計(jì)值。估計(jì)量的每一個(gè)估計(jì)值與相應(yīng)的總體參數(shù)的真值之間可能存在著一定的誤差,但如果某估計(jì)
20、量的所有可能估計(jì)值的平均值,即估計(jì)量的數(shù)學(xué)期望等于相應(yīng)的總體參數(shù)值,則該估計(jì)量就被稱為相應(yīng)總體參數(shù)的無(wú)偏估計(jì)量。 如果估計(jì)量的數(shù)學(xué)期望值不等于要估計(jì)的參數(shù),就稱為偏倚估計(jì)量,它可正可負(fù),等于零時(shí)即為無(wú)偏估計(jì)量。無(wú)偏估計(jì)實(shí)際上是在平均意義下較好的一個(gè)估計(jì)量。一個(gè)好的估計(jì)量是無(wú)偏的或至少是近于無(wú)偏的。對(duì)于樣本均值 有所以樣本均值是總體均值的無(wú)偏估計(jì)量。 無(wú)偏估計(jì)的實(shí)際意義: 無(wú)系統(tǒng)誤差.P( )BA無(wú)偏有偏證例1特別的:不論總體 X 服從什么分布,只要它的數(shù)學(xué)期望存在,對(duì)于樣本方差s2有樣本方差一般指 ,并簡(jiǎn)記為s2。證例2(這種方法稱為無(wú)偏化).5.1.2有效性 設(shè)1,2為參數(shù)的兩個(gè)無(wú)偏估計(jì)量,
21、如果對(duì)任一容量為n的樣本,有 D(1)D(2) 則稱1比2的估計(jì)值更有效。若固定樣本容量n,使取得極小值的無(wú)偏估計(jì)量就稱之為最有效的估計(jì)量,又稱最優(yōu)估計(jì)量。因此,估計(jì)量的方差越小,說明估計(jì)量取值越集中,它的有效性越高。 由于方差是隨機(jī)變量取值與其數(shù)學(xué)期望的偏離程度, 所以無(wú)偏估計(jì)以方差小者為好.AB 的抽樣分布 的抽樣分布P( )證明例4 (續(xù)例3)5.1.3 一致性 當(dāng)樣本容量逐漸增加時(shí),如果估計(jì)量的某估計(jì)值會(huì)愈來愈接近于相應(yīng)的參數(shù)值,則稱該估計(jì)量是參數(shù)的一致估計(jì)量。5.1.4充分性 如果一個(gè)估計(jì)量充分地利用了樣本中有關(guān)總體的所有可能信息,它就稱為充分估計(jì)量。即如果某估計(jì)量是某參數(shù)的充分估計(jì)
22、量,則不會(huì)有別的統(tǒng)計(jì)量能夠?yàn)樵搮?shù)提供更多的來自樣本的信息。5.2點(diǎn)估計(jì) 設(shè)總體 X 的分布函數(shù)形式已知, 但它的一個(gè)或多個(gè)參數(shù)為未知, 借助于總體 X 的一個(gè)樣本來估計(jì)總體未知參數(shù)的值的問題稱為點(diǎn)估計(jì)問題.例1解用樣本均值來估計(jì)總體的均值 E(X).點(diǎn)估計(jì)問題的一般提法1.估計(jì)量的求法 由于估計(jì)量是樣本的函數(shù), 是隨機(jī)變量, 故對(duì)不同的樣本值, 得到的參數(shù)值往往不同, 如何求估計(jì)量是關(guān)鍵問題.常用構(gòu)造估計(jì)量的方法: (兩種)矩估計(jì)法和最大似然估計(jì)法.(1). 矩估計(jì)法復(fù)習(xí)2. 樣本 k 階(原點(diǎn))矩(X為連續(xù)型)(X為離散型)矩估計(jì)法的定義 用樣本矩來估計(jì)總體矩,用樣本矩的連續(xù)函數(shù)來估計(jì)總體
23、矩的連續(xù)函數(shù),這種估計(jì)法稱為矩估計(jì)法.矩估計(jì)法的具體做法:矩估計(jì)量的觀察值稱為矩估計(jì)值.例2設(shè)總體X的概率密度為其中為待估參數(shù),設(shè)是來自X的一個(gè)樣本,求的矩估計(jì)量.解 總體X 的一階矩為以一階樣本矩代替上式中的一階總體矩 ,從中解出 , 得到的矩估計(jì)量為 例3設(shè)總體X的概率密度為其中為待估參數(shù),設(shè)是來自X的一個(gè)樣本,求的矩估計(jì)量.解 總體X 的一階、二階矩分別為分別以一階、二階樣本矩代替上兩式中的有從中解得即得到的矩估計(jì)量為解根據(jù)矩估計(jì)法,例4解例5解方程組得到a, b的矩估計(jì)量分別為解解方程組得到矩估計(jì)量分別為例6上例表明: 總體均值與方差的矩估計(jì)量的表達(dá)式不因不同的總體分布而異.一般地,(
24、2). 最大似然估計(jì)法似然函數(shù)的定義最大似然估計(jì)法似然函數(shù)的定義求最大似然估計(jì)量的步驟:最大似然估計(jì)法是由費(fèi)舍爾引進(jìn)的. 最大似然估計(jì)法也適用于分布中含有多個(gè)未知參數(shù)的情況. 此時(shí)只需令對(duì)數(shù)似然方程組對(duì)數(shù)似然方程解似然函數(shù)例7這一估計(jì)量與矩估計(jì)量是相同的.例8在例2中求參數(shù)的最大似然估計(jì)值,設(shè)是一個(gè)樣本值.解 似然函數(shù)為令 解得注意到故所求 的最大似然估計(jì)值為這與的矩估計(jì)值不一樣.解X 的似然函數(shù)為例9它們與相應(yīng)的矩估計(jì)量相同.解例10注:最大似然估計(jì)法也適用于分布中含多個(gè)未知參數(shù)的情形.兩種求點(diǎn)估計(jì)的方法:矩估計(jì)法最大似然估計(jì)法 在統(tǒng)計(jì)問題中往往先使用最大似然估計(jì)法, 在最大似然估計(jì)法使用不
25、方便時(shí), 再用矩估計(jì)法.5.2點(diǎn)估計(jì)和區(qū)間估計(jì) 點(diǎn)估計(jì)就是用某樣本指標(biāo)直接作為相應(yīng)總體指標(biāo)的估計(jì)值。 點(diǎn)估計(jì)方法雖然簡(jiǎn)單,但由于未考慮到樣本指標(biāo)與總體指標(biāo)之間客觀存在著的抽樣誤差,也沒有給出估計(jì)的概率保證程度,無(wú)法確定估計(jì)的可靠程度。因此,我們常用區(qū)間估計(jì),實(shí)踐中有許多區(qū)間估計(jì)的例子。 5.2.1置信概率和置信區(qū)間 按一定的概率估計(jì)總體參數(shù)在哪個(gè)范圍,這個(gè)范圍稱為總體參數(shù)的置信區(qū)間。 區(qū)間內(nèi)總體參數(shù)出現(xiàn)的概率稱為置信概率。 對(duì)總體參數(shù)估計(jì)其取值范圍,對(duì)于給定的小概率,有 (1,2)是參數(shù)的置信區(qū)間, 為顯著性水平,1 - 為區(qū)間估計(jì)的置信度或置信水平,即置信概率。它表明判斷總體參數(shù)落在置信區(qū)的
26、可信程度。1,2分別為參數(shù)的下置信限和上置信限。稱為舍棄域。 置信區(qū)間與置信概率的關(guān)系 對(duì)于特定總體,總體參數(shù)總是一個(gè)確定的值,統(tǒng)計(jì)量則是一個(gè)隨機(jī)變量。因此,由1,2所構(gòu)成的置信區(qū)間也是一個(gè)隨機(jī)區(qū)間。在所有可能樣本指標(biāo)所構(gòu)成的所有置信區(qū)間中,有的區(qū)間可能包括了總體指標(biāo),有的可能沒有包括。置信度1-的含義是,由全部樣本指示所確定的所有置信區(qū)間中,有100 (1-)%的估計(jì)區(qū)間包括了總體參數(shù),另外有100%的區(qū)間沒有包括總體指標(biāo)。而對(duì)由某一樣本指標(biāo)所確定的具體估計(jì)區(qū)間(1,2)來說,就是其包含的可能性(概率)為100(1-)%,不包含的可能性為 100%。 置信區(qū)間的寬窄與置信概率和樣本容量有關(guān),
27、它隨著不同的置信度和樣本容量而變化。置信區(qū)間若取得過大,估計(jì)精度就差,價(jià)值往往不大。而取得過小,需要大量增加樣本容量,費(fèi)力費(fèi)時(shí)。置信區(qū)間取多大才算合適,需要根據(jù)所研究對(duì)象的性質(zhì),結(jié)合實(shí)踐經(jīng)驗(yàn)與專業(yè)知識(shí)來決定。實(shí)際應(yīng)用中,一般取0.01或0.05,如無(wú)特別指出,一般取0.05。 96 求置信區(qū)間的一般步驟(共3步)5.2.2總體均值的區(qū)間估計(jì) (1)n30,總體方差已知時(shí),總體均值的區(qū)間估計(jì)。 對(duì)于給定的置信度1-,有 置信度為1-時(shí)總體均值的置信區(qū)間計(jì)算公式為: , 例5.5 根據(jù)以往資料,土壤中磷的含量服從正態(tài)分布,現(xiàn)對(duì)某地土壤進(jìn)行采樣調(diào)查,測(cè)得9個(gè)土壤樣品中磷的平均含量為364.3ppm,
28、已知該土壤中磷含量的總體標(biāo)準(zhǔn)差為99.8 ppm,試估計(jì)該地土壤中磷中平均含量的95%和99%置信區(qū)間。 時(shí),則 的95%置信區(qū)間為: , =(303.8,429.5)99%置信區(qū)間為: , =(278.5,450.1) 在報(bào)告結(jié)果時(shí),可將點(diǎn)估計(jì)和區(qū)間估計(jì)同時(shí)寫出,如本例95%和99%的置信區(qū)間可分別寫成364.3(303.8,429.5)ppm和364.3(278.5,450.1)ppm。 如果是非正態(tài)總體或總體分布形態(tài)未知,當(dāng)總體方差已知且樣本容量n充分大時(shí),總體均值的置信區(qū)間可按上式近似計(jì)算。(2)總體方差未知時(shí)總體均值的置信區(qū)間 從正態(tài)總體中隨機(jī)抽樣,當(dāng)樣本容量較小且總體方差未知時(shí),根
29、據(jù)t分布原理,對(duì)于給定的置信度1-,有總體均數(shù)值的1-置信區(qū)間為 對(duì)于非正態(tài)總體,只要樣本容量n足夠大,根據(jù)中心極限定理,仍可按上式估計(jì)總體均數(shù)值的置信區(qū)間。當(dāng)樣本容量n足夠大時(shí), 例5.6 某排污口經(jīng)100次測(cè)試,廢水中COD平均為100mg/L,標(biāo)準(zhǔn)差為20 mg/L,試估計(jì)該排污口廢水中COD值的95%置信區(qū)間。 =(96.1,103.9) 即該排污口廢水中COD值的95%置信區(qū)間為96.1103.9 mg/L。例 5.7 為檢查某湖水受汞污染情況,從該湖中隨機(jī)取9條魚齡相近的魚,測(cè)得魚胸肌中汞含量平均為2.01ppm,標(biāo)準(zhǔn)差為0.11ppm,試求該湖魚胸肌中汞含量的95%及99%置信區(qū)
30、間。 =(1.925,2.095) 5.2.3 兩個(gè)總體均值之差的區(qū)間估計(jì)1、兩總體方差12和22已知時(shí) 兩個(gè)總體均值之差的區(qū)間估計(jì)來自兩個(gè)正態(tài)總體的樣本均值分別為 x1和x2,其樣本容量分別為n1和n2 根據(jù)抽樣分布原理有 N(0,1)對(duì)給定的置信度1-則有1-2的置信區(qū)間為式中 是x1 x2的抽樣分布之標(biāo)準(zhǔn)差,用 表示 稱為兩均值之差的標(biāo)準(zhǔn)誤,表示由x1-x2估計(jì)1 2的抽樣誤差。如果兩總體方差未知,當(dāng)樣本n1和n2均足夠大時(shí)可近似的以樣本方差s1 s2代替式中總體方差,計(jì)算均值差的置信區(qū)間。2、兩總體方差12和22未知,但12=22時(shí),兩個(gè)總體之差的區(qū)間估計(jì)設(shè)從方差均為的兩正態(tài)總體中隨機(jī)
31、抽取容量為n1和n2的樣本 當(dāng)未知時(shí),則統(tǒng)計(jì)量給定置信概率為1- 則可得置信區(qū)間為式中t/2,v 為自由度為n1+n2-2時(shí)的t臨界值其中是x1-x2的抽樣分布之標(biāo)準(zhǔn)差。稱為兩均值之差的標(biāo)準(zhǔn)誤,表示由 x1-x2估計(jì)1-2的抽樣誤差3、兩總體方差12和22未知,但1222時(shí),兩個(gè)總體均值之差的區(qū)間估計(jì)由于1222 兩總體方差不具有齊性,根據(jù)抽樣分布原理統(tǒng)計(jì)量服從自由度為n的t分布。其中對(duì)給的的置信概率 1-可得其均值差的置信區(qū)間為例 甲乙兩地空氣中某元素的含量服從正態(tài)分布12=0.013,22=0.012,從兩地抽樣測(cè)試結(jié)果如下 n甲=30 x甲=0.03 n乙=28 X乙=0.016,求置信
32、概率我0.95時(shí)兩地均值之差的置信區(qū)間 -0.042甲-乙0.072已知某造紙廠廢水中懸浮物連續(xù)排放服從正態(tài)分布,一月份對(duì)該廠廢水抽樣8次,其廢水懸浮物含量平均為22.5mg/l,2月份抽樣8次測(cè)得廢水懸浮物平均含量17.8mg/l一月份和2月份測(cè)定結(jié)果的標(biāo)準(zhǔn)差分別為8.3 和7.6,求兩個(gè)月廢水中懸浮物平均差值的95%置信區(qū)間。根據(jù)題意 本例屬于總體方差1、2未知1=2式中 自由度v=8+8-2=14 =0.05 t0.05/2,14=2.415 -3.81-213.2某縣甲、乙兩污水渠酚含量屬于正態(tài)分布甲測(cè)定39次其平均含量0.58 標(biāo)準(zhǔn)差s1=0.10 乙 測(cè)定43次 平均含量0.18
33、標(biāo)準(zhǔn)差s2=0.08 求置信概率95%情況下兩污水渠酚平均含量的置信區(qū)間計(jì)算得 k=0.633 n=73 t0.05/2,73=1.991 0.361-20.445.2.4 配對(duì)數(shù)據(jù)平均數(shù)差的置信區(qū)間環(huán)境科學(xué)中 許多問題來自兩總體的數(shù)據(jù)匹配成對(duì)出現(xiàn)的。如不同方法或不同處理裝置對(duì)同一污染物處理效果的比較,同一生物體對(duì)不同污染物濃度的反應(yīng)等。對(duì)具有配對(duì)數(shù)據(jù)的兩正態(tài)總體平均數(shù)差的置信區(qū)間的求法可采用下述方法。 設(shè)來自兩正態(tài)總體的配對(duì)數(shù)據(jù)分別為x1k,x2k (k=1,2,3.n)它們的差值為dk=x1k-x2k , 統(tǒng)計(jì)量 其中它是自由度為n-1的t分布。置信概率1- 則配對(duì)數(shù)據(jù)差值d 的置信區(qū)間為
34、 兩種方法處理油污染的實(shí)驗(yàn)數(shù)據(jù)如下 甲 4.0、5.0、6.0、1.0、5.4、4.1 乙 3.3、7.0、4.4、2.2、3.5、0.7求配對(duì)數(shù)據(jù)差的置信區(qū)間 (=0.05)計(jì)算差值 dk 0.7、-2.0、1.6、-1.2、1.9、3.4 求n=6-1=5 t0.05/2,5=2.571 -1.35 d2.815.2.5總體比率(成數(shù))的區(qū)間估計(jì)(1)正態(tài)近似法。 根據(jù)抽樣分布原理,當(dāng)樣本容量n足夠大時(shí) (一般np5或n(1p) 5),樣本比率p近似服從正態(tài)分布。 因此可以利用正態(tài)分布進(jìn)行樣本比率(成數(shù))p的統(tǒng)計(jì)推斷。 P , 例 5.10 從某河流隨機(jī)抽取764份水樣,經(jīng)測(cè)定COD超標(biāo)者
35、162份,超標(biāo)率為21.2%,試估計(jì)該河水COD總體超標(biāo)率的95%置信區(qū)間。 本例n=764,p=21.2%,np5,可用正態(tài)近似法估計(jì)該河水COD總體超標(biāo)率的95%置信區(qū)間 總體合格率P的95%置信區(qū)間:( , ) =(0.183,0.241) (2) 查表法。當(dāng)樣本容量n較小,特別是P接近于0或1時(shí),按二項(xiàng)分布原理確定總體比率的置信區(qū)間,其計(jì)算過程較繁,附表8列出了二項(xiàng)分布的置信區(qū)間臨界值,在實(shí)際應(yīng)用中直接由表查出總體比率的置信區(qū)間甚為方便。例5.11 在某廢水處理廠出水口隨機(jī)檢測(cè)20次,其中有8次超標(biāo),試確定超標(biāo)率的置信區(qū)間。查附表8,在n=20橫行與X=8的縱列交叉處的數(shù)值為1964,
36、即該出水口COD超標(biāo)率的95%置信區(qū)間為(19%,64%)。5.3區(qū)間估計(jì)必要樣本單位數(shù)目的確定 抽樣調(diào)查工作中,抽取的樣本單位數(shù)越多,則得到的樣本資料對(duì)總體的代表性就越強(qiáng),抽樣估計(jì)的精度及可靠程度也就越高;如果抽樣單位數(shù)越少,所得到的樣本資料對(duì)總體的代表性就越差,抽樣估計(jì)的精度及可靠程度就會(huì)越低。 對(duì)于特定總體,在確定其必要抽樣數(shù)目時(shí),主要應(yīng)考慮允許誤差(精度要求),置信水平(可靠程度),人、財(cái)、物及時(shí)間等因素。 確定必要抽樣單位數(shù)目應(yīng)遵循的原則是:在保證抽樣推斷能達(dá)到所要求精度和可靠程度的情況下,抽取適當(dāng)?shù)臉颖締挝粩?shù)。 5.3.1估計(jì)總體均值時(shí),樣本容量的確定當(dāng)總體服從正態(tài)分布,總體標(biāo)準(zhǔn)差已知時(shí),在簡(jiǎn)單重復(fù)抽樣的情況下, 有限總體,在不重復(fù)抽樣情況下 當(dāng)總體服從正態(tài)分布,而總體標(biāo)準(zhǔn)差未知的情況下,區(qū)間估計(jì)常用樣本標(biāo)準(zhǔn)差s代替總體標(biāo)準(zhǔn)差,按t分布原理進(jìn)行。在簡(jiǎn)單隨機(jī)重復(fù)抽樣情況下 有限總體,在不重復(fù)抽樣情況下 由于各種抽樣組織形式下抽樣誤差的計(jì)算表示方法有所不同,故必要抽樣單位數(shù)目的計(jì)算公式也相應(yīng)有所不同。等比例分層抽樣時(shí) 整群抽樣(各群容量相等)等距抽樣視同為簡(jiǎn)單隨機(jī)不重復(fù)抽樣,故其必要抽樣單位數(shù)目按右
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年民政局婚姻解除協(xié)議規(guī)范格式
- 2024年家居裝修中介服務(wù)協(xié)議
- 2024專業(yè)外包工作人員勞動(dòng)協(xié)議
- 2024年紡織用紗線采購(gòu)協(xié)議
- 2024專業(yè)化成品油交易協(xié)議典范
- 2024個(gè)人貸款反擔(dān)保協(xié)議典范
- 2024年度房產(chǎn)銷售專屬代理協(xié)議
- 文書模板-《產(chǎn)業(yè)園咨詢服務(wù)合同》
- 定制化技術(shù)服務(wù)方案協(xié)議2024
- 2024年杭州勞務(wù)派遣服務(wù)協(xié)議樣本
- 人教版二年級(jí)上冊(cè)口算練習(xí)1000題及答案
- 2024年浙江建銀工程咨詢有限責(zé)任公司招聘筆試參考題庫(kù)含答案解析
- 水痘護(hù)理課件
- 設(shè)立招投標(biāo)代理公司可行性研究報(bào)告
- 四年級(jí)家長(zhǎng)會(huì)(-完整版)
- 黑龍江省哈爾濱市南崗區(qū)2023-2024學(xué)年九年級(jí)上學(xué)期期末語(yǔ)文試題
- PCBA工藝管制制程稽查表
- 臨床實(shí)踐教學(xué)設(shè)計(jì)臨床病例討論與分析
- 小學(xué)呼吸道傳染預(yù)防課件
- 幼兒園教職工消防培訓(xùn)課件
- 《朱蘭質(zhì)量手冊(cè)》課件
評(píng)論
0/150
提交評(píng)論