版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1、抽樣推斷的概念和特點抽樣推斷概念:從總體中隨機抽樣,利用樣本的實際資料計算樣本指標,并據(jù)以推算總體相應數(shù)量特征的一種統(tǒng)計方法。 從總體中抽樣進行調查叫抽樣調查。抽樣推斷特點:(1)按隨機原則從總體中抽樣抽樣調查的目的是推斷總體,抽樣時保證每個單位有同等的機會被選取,才能使所選樣本和總體有相同分布特征,樣本才有代表性。第四章 環(huán)境參數(shù)的抽樣估計(2)通過抽樣調查,取得部分單位的實際資料計算樣本的綜合指標,然后對總體的規(guī)模、水平、結構等數(shù)量指標做出估計和推斷。(3)用樣本指標估計總體指標,利用的是不確定的概率估計的方法。(4)抽樣誤差可以計算和控制。采取一定得組織措施來控制誤差的范圍,保證抽樣
2、推斷的結果達到一定的可取程度。有關抽樣調查的幾個基本概念 (1)總體和樣本。總體是指被研究對象的全體,它是由所研究范圍內具有某種共同性質的全體單位所組成的集合體??傮w的單位數(shù)用N表示;樣本是從總體中隨機抽取出來的那部分單位的集合體。樣本的單位數(shù)用n來表示。(2)抽樣框。劃定一個盡可能接近總體的便于操作的框架,作為抽樣總體,即抽樣框。抽樣框實際上是被抽單位的目錄。 (3)參數(shù)和統(tǒng)計量。根據(jù)總體各單位的標志值或標志屬性計算的,反映總體數(shù)量特征的綜合指標稱為總體指標,它是總體變量的函數(shù),其數(shù)值是由總體各單位的標志值或標志屬性決定的,一個總體指標是一個確定的、唯一的數(shù)值,也稱真值,因此稱為參數(shù)。根據(jù)樣
3、本各單位標志值或標志屬性計算的綜合指標稱為統(tǒng)計量,也可稱為樣本指標。(4)樣本容量和樣本個數(shù)。樣本容量又稱樣本含量,是指一個樣本包含的觀察單位數(shù)。樣本容量的大小直接影響著抽樣調查的效果。一般將n30的樣本稱之為小樣本,n30的樣本稱為大樣本。樣本個數(shù)又稱樣本可能數(shù)目,是指從一個總體中可能抽取的樣本個數(shù)。(5)重復抽樣與不重復抽樣。重復抽樣也稱回置抽樣,即從總體中每次抽取一個單位之后,再放回總體,保持總體單位數(shù)不變,再進行下一個單位的抽取,如此重復抽足一個樣本。重復抽樣每個單位中選的機會在各次都完全相等。從總體N個單位中,用重復抽樣的方法,隨機抽取n個單位構成一個樣本,則共可抽取Nn個樣本。 不
4、重復抽樣也稱不回置抽樣,即從總體中每抽取一個單位,就不再放回參加下次的抽選,這樣每抽出一個單位,總體中就少一個單位,因而每個單位只有一次被抽中的機會。從總體N個單位中,用不重復抽樣的方法抽取n個單位樣本,全部可能抽取的樣 本數(shù)目為 個。2.2分層抽樣 分層抽樣也稱類型抽樣或分類抽樣。它是先將總體各單位按主要標志進行分層,然后再按比例從各層中隨機抽取一定數(shù)目的單位構成樣本。 分層抽樣需要確定各層的樣本數(shù)目分配,樣本單位在各層中的數(shù)目分配,可以是等比例的分層抽樣,也可以是不等比例的分層抽樣。(1)等比例分層抽樣。就是按總體各層單位數(shù)的多少來分配每層應抽的樣本單位數(shù)。(2)不等比例抽樣。 2.3等距
5、抽樣等距抽樣又稱機械隨機抽樣或系統(tǒng)抽樣。它是先將總體各單位按某一標志順序排列,然后按固定的順序和間隔抽取一定數(shù)目的總體單位構成樣本。 在按無關標志排隊的等距抽樣中,可在第一個間隔內隨機抽取第一個樣本單位作為起點,然后每隔K個單位抽取一個樣本單位,直到抽夠所需要的樣本單位數(shù)。 在按有關標志排隊的等距抽樣中,第一個樣本單位通常按以下方法來確定。 (1)中點取樣法。 (2)平均取樣法。 (3)隨機起點,對稱等距取樣。 2.5階段抽樣 階段抽樣亦稱多階段抽樣。階段抽樣是將總體先分成若干大組,大組中再分小組,還可以往下細分。抽樣時先隨機抽取大組,再從抽中的大組中隨機抽取小組,最后根據(jù)最終抽取的所有單位組
6、成樣本,進行調查。階段抽樣方法多用簡單隨機抽樣方法,也可將幾種抽樣方法結合使用。 3抽樣分布3.1總體分布、樣本分布與抽樣分布從概率論角度看,總體各單位標志值Xi(i = 1,2,N )可以看作是隨機變量X的N種取值。 因此,統(tǒng) 計上 常將隨機變量 X 的 全 部 取 值 X1,X2, ,XN 的集合稱為變量總體 ( 簡稱總體,記為X ), X1,X2,XN 被稱為總體單位(個體),從總體中隨機抽取的 n 個個體 X1,X2,Xn ,稱為總體 X 的一個容量為 n 的樣本,其中 X1,X2,Xn 被稱為“樣本單位”。樣本單位 X1,X2,Xn 可以看作是 n 個相互獨立且與 X 具有相同概率分
7、布的隨機變量,從總體 X 中進行一次 具體抽樣,所獲得的具體數(shù)據(jù) x1,x2,xn 是 n 個隨機變量(樣本) X1,X2,Xn 的具體數(shù)值,常稱為樣本觀察值或樣本值。 設 X1,X2,Xn 為總體X的一個樣本, f(X1,X2,Xn) 為一個連續(xù)函數(shù), 若 f(X1,X2,Xn)中不含任何未知參數(shù), 則稱 f(X1,X2,Xn)為一個統(tǒng)計量。如果x1,x2,xn為樣本X1,X2,Xn的具體樣本觀察值,則 f(x1,x2,xn)是f(X1,X2,Xn)的一個觀察值。例如,樣本X1,X2,Xn 的均值 、方差S2都是統(tǒng)計量,對于從總體X中抽出的某一具體樣本x1,x2,xn,其均值、s2分別被稱為
8、統(tǒng)計量及 S2 的一個觀察值。例5.1 設有5臺儀器,其使用時間分別為1年,2年,3年,4年,5年?,F(xiàn)采用重復抽樣方法抽出2臺儀器構成樣本,試給出其總體分布,樣本均數(shù)的抽樣分布及相應的分布特征。該總體的概率分布如下表:表5.1 5臺儀器使用時間的概率分布使用時間Xi 12345臺 數(shù)fi 11111概 率Pifi /fi 該總體分布的特征: 的抽樣分布 =10.04+1.50.08+20.12+2.50.16+30.20+ 3.50.16+40.12+4.50.08+50.043(年) (1-3)20.04+(1.5-3)20.08+(2-3)20.12 +(2.5-3)20.16+(3-3)
9、20.20+(3.5-3)20.16 +(4-3)20.12+(4.5-3)20.08+(5-3)20.04l(年)樣本均值11.522.533.544.55次 數(shù) fi 123454321概 率 Pi 0.040.080.120.160.200.160.120.080.04這一結論具有普遍意義。樣本均值的抽樣分布,并描述了其分布特征。 當總體容量較大時,無法用上述方法描述統(tǒng)計量的抽樣分布,必須進一步探討抽樣分布的理論方法。 3.2樣本均值 的抽樣分布作為隨機變量,樣本均值的變化規(guī)律,可以用 的所有可能取值及其所對應的概率來描述,即為樣本均值 的抽樣分布。 3.2.1 2已知時樣本均值 的抽樣
10、分布當總體X服從正態(tài)分布時,設x1,x2,xn是從正態(tài)總體X N( )中重復抽取的一個簡單隨機樣本,則其樣本均值 亦是服從正態(tài)分布的隨機變量,并且可以證明,即 N( )。 例如,某總體 XN (20,32);現(xiàn)從中隨機 抽取一個 n3 的簡單隨機樣本,則 N(20,323),即 N (20,3);如果將n由3增加到9, 則 N (20,1)??傮w分布與不同樣本容量的抽樣分布 由此可以說明:(1) 當總體服從正態(tài)分布時,不論樣本容量n有多大,樣本均值均服從以總體均值為中心的正態(tài)分布。(2) 從正態(tài)總體中隨機抽樣,樣本均值的數(shù)學期望等于總體均值;樣本均值的方差為總體方差 的1/n ,這意味著樣本均
11、值的各觀察值比總體各單位Xi更緊密地集中在總體均值的周圍,且樣本均值的集中程度與樣本容量 n 成正比。(3) 樣本均值的方差 ,進而,有樣本均值的標準誤差 (簡稱均值的標準誤)。(4) 對 作標準正態(tài)變量變換,令則 N (0,1)。當總體X不服從正態(tài)分布時,樣本均值的抽樣分布與樣本容量n 的大小有關。根據(jù)中心極限定理,隨著樣本容量n 的逐漸增加,樣本均值的抽樣分布趨近正態(tài)分布。因此,當樣本容量n 充分大(一般認為n50)時,樣本均值的抽樣分布一般可按正態(tài)分布處理。t分布也是一種對稱分布,在樣本容量n不大的情況下,t分布與標準正態(tài)分布相差較大,但隨著樣本含量的逐漸增大(嚴格講是自由度n - l逐
12、漸增大)t 分布逐漸逼近標準正態(tài)分布,尤其是當自由度大于40時,t 分布與標準正態(tài)分布相差甚微,當自由度時,t分布就與標準正態(tài)分布完全一樣了。因此,當自由度較大時的t 分布可以近似地按正態(tài)分布處理。 不同自由度下的t分布和正態(tài)分布一樣,t 分布曲線下的總面積也等于1,即 t 值落入?yún)^(qū)間(- ,+ )內的概率為1。t 值落入任一區(qū)間(t1,t2)內的概率等于該區(qū)間曲線和橫軸所夾的面積。如t值落于區(qū)間(-t0.05,+t0.05)內的概率為0.95,t值落于區(qū)間(-t0.01,+t0.01)內的概率為0.99。這里的t0.05、t0.01是概率分別為0.05,0.01時的 t 界值。例如,查自由度
13、9,概率0.05的t雙側分位數(shù),就要查概率為 /20.025時的單側分位數(shù)。從附表3中,可以查出t 0.025,9 2.262,由于曲線的對稱性,則另一尾區(qū) t 0.025,9 2.262。就是說, t 2.262 和 t 2.262 (相當于t 2.262 )的兩個尾區(qū)的曲線下的面積之和為0.05。對于雙側分位數(shù)可以表示為:P (t t /2 , ) 以后我們均以“t , ”表示單側分位數(shù),“t /2 , ”表示雙側分位數(shù)。3.2.3 兩個樣本均值之差的抽樣分布當 和 為已知時, 當 和 均 為未知時,且當 和 均 為未知時,且當X1和X2為非正態(tài)總體 , 和 均 為未知時,且3.3樣本比率
14、(成數(shù))p的抽樣分布設容量為N的總體中具有某種性質的總體單位數(shù)為M,則總體關于這種性質的總體單位數(shù)的比率 。 如果從該總體抽取容量為n的簡單隨機樣本,對樣本比率P,則有4抽樣誤差的估計4.1抽樣誤差的概念抽樣誤差是指統(tǒng)計量與相應參數(shù)之差。如樣本均值與總體均值之差,樣本比率 p與總體比率P之差等。由于總體中各單位之間存在著變異,抽樣調查中抽取的樣本只包含總體一部分的單位,其結構不可能和總體完全一致,因而樣本指標不一定恰好等于相應的總體指標。抽樣誤差越小,用樣本估計總體的可靠性就越大,否則,抽樣誤差越大,用樣本估計總體的可靠性就越小。抽樣誤差雖然不可避免,但它具有一定的規(guī)律性,在抽樣調查中,掌握和
15、應用這種規(guī)律性是非常重要的。4.2影響抽樣誤差的因素 (1) 樣本容量的大小。在其他因素完全相同的條件下,樣本容量越大,抽樣誤差就越小;而樣本容量越小,抽樣誤差就越大。 (2) 總體單位標志變異度的大小。抽樣誤差與總體標志變異度成正比。即總體標志變異度越大,抽樣誤差也越大;總體的標志變異度越小,則抽樣誤差也越小。 (3) 不同的抽樣組織形式。對同一總體進行抽樣調查。在樣本容量一定的條件下,重復抽樣的誤差比不重復抽樣的誤差要大些。 4.3均值的抽樣誤差 從總體X 中隨機抽取一個容量n 的樣本x1,x2,xn,由于有多種抽選方法,可以抽取多個不同樣本,因而就有多個不同的樣本均值。 如果把樣本均值看
16、作變量,也可以用標準差說明各樣本均值間的變異程度,即樣本均值的標準誤差,簡稱標準誤。均值的抽樣誤差的大小通常用標準誤來表示。 根據(jù)抽樣分布的原理,容量為n 的樣本均值分布的方差 等于總體方差2 的1/n,即 取兩端平方根,則為: 在實際應用中,總體標準差 未知,通常是用標準誤的估計值來說明均值抽樣誤差大小的。 均值的標準誤估計值在隨機抽樣方式重復抽樣時,其計算公式為: 不重復抽樣,其抽樣誤差總是小于重復抽樣誤差。從容量為N的總體中不重復抽樣,均值的標準誤計算公式為:當總體單位數(shù) N 很大時,式中的N -1可近似取N,則 通常稱為有限總體修正系數(shù)。當nN 不大(一般不大于5% 時,標準誤計算公式
17、中的修正系數(shù)可以省去。 例5.2 某縣利用原有的淺層水井進行地下水污染狀況抽樣調查。從該縣的1000眼水井中隨機抽選10眼水井,測定井水中砷的濃度,測定結果,10眼井水中砷的平均濃度為0.58mgL,標準差為mgL。試求其均值的標準誤。 本例 0.58mgL,S0.1mgL,N 1000, n =10,由于n/ N 1%5%,因此按式(5.11)計算均值的標準誤4.4比率(成數(shù))的標準誤比率的標準誤計算與均值的標準誤計算原理基本相同。重復抽樣時,比率的標準誤計算公式為: 當 P 未知時,常以樣本比率 p 來估計,則不重復抽樣時比率標準誤的計算公式為:例5.3某市監(jiān)測大氣中SO2濃度,在采集的2
18、00個空氣樣品中,經測定有8個樣品SO2濃度超標。求SO2超標率的標準誤。本例SO2濃度超標率 ,由于P未知, 而且是從無限總體中抽樣,可按式(5.15)計算: 例5.4 某河段有1000個污水排放口,用不重復抽樣方法從中抽檢100個污水排放口,結果有85個超標,求該超標率的標準誤。排污口超標率 按式(5.16) 計算: 該河段污水排放口超標率的標準誤為3.39%。標準誤與標準差的區(qū)別: 標準差描述個體間的變異程度。凡同性質的資料,標準差大表示個體變異大,標準差小表示個體變異小。 而標準誤是樣本指標的標準差,反映樣本指標的抽樣誤差,即樣本指標與總體指標的接近程度。凡同性質的資料,標準誤大,表示
19、樣本指標的抽樣誤差大,用樣本指標代表總體指標的可靠性小,而標準誤小,表示樣本指標的抽樣誤差小,用樣本指標代表總體指標的可靠性大。4.5抽樣極限誤差抽樣極限誤差又稱抽樣允許誤差。把樣本指標與總體指標之間的抽樣誤差控制在一個允許的限度范圍內,這個可允許的最大抽樣誤差范圍稱為抽樣極限誤差。用絕對值表示 用不等式表示則為: p 5. 參數(shù)估計 5.1參數(shù)估計的優(yōu)良標準 評價統(tǒng)計量的優(yōu)劣一般應遵從以下原則: 5.1.1無偏性 總體參數(shù)的估計量是一個隨機變量,對隨機樣本x1,x2,xn的不同觀察值,某估計量會取得不同的估計值。估計量的每一個估計值與相應的總體參數(shù)的真值之間可能存在著一定的誤差,但如果某估計
20、量的所有可能估計值的平均值,即估計量的數(shù)學期望等于相應的總體參數(shù)值,則該估計量就被稱為相應總體參數(shù)的無偏估計量。 如果估計量的數(shù)學期望值不等于要估計的參數(shù),就稱為偏倚估計量,它可正可負,等于零時即為無偏估計量。無偏估計實際上是在平均意義下較好的一個估計量。一個好的估計量是無偏的或至少是近于無偏的。對于樣本均值 有所以樣本均值是總體均值的無偏估計量。 無偏估計的實際意義: 無系統(tǒng)誤差.P( )BA無偏有偏證例1特別的:不論總體 X 服從什么分布,只要它的數(shù)學期望存在,對于樣本方差s2有樣本方差一般指 ,并簡記為s2。證例2(這種方法稱為無偏化).5.1.2有效性 設1,2為參數(shù)的兩個無偏估計量,
21、如果對任一容量為n的樣本,有 D(1)D(2) 則稱1比2的估計值更有效。若固定樣本容量n,使取得極小值的無偏估計量就稱之為最有效的估計量,又稱最優(yōu)估計量。因此,估計量的方差越小,說明估計量取值越集中,它的有效性越高。 由于方差是隨機變量取值與其數(shù)學期望的偏離程度, 所以無偏估計以方差小者為好.AB 的抽樣分布 的抽樣分布P( )證明例4 (續(xù)例3)5.1.3 一致性 當樣本容量逐漸增加時,如果估計量的某估計值會愈來愈接近于相應的參數(shù)值,則稱該估計量是參數(shù)的一致估計量。5.1.4充分性 如果一個估計量充分地利用了樣本中有關總體的所有可能信息,它就稱為充分估計量。即如果某估計量是某參數(shù)的充分估計
22、量,則不會有別的統(tǒng)計量能夠為該參數(shù)提供更多的來自樣本的信息。5.2點估計 設總體 X 的分布函數(shù)形式已知, 但它的一個或多個參數(shù)為未知, 借助于總體 X 的一個樣本來估計總體未知參數(shù)的值的問題稱為點估計問題.例1解用樣本均值來估計總體的均值 E(X).點估計問題的一般提法1.估計量的求法 由于估計量是樣本的函數(shù), 是隨機變量, 故對不同的樣本值, 得到的參數(shù)值往往不同, 如何求估計量是關鍵問題.常用構造估計量的方法: (兩種)矩估計法和最大似然估計法.(1). 矩估計法復習2. 樣本 k 階(原點)矩(X為連續(xù)型)(X為離散型)矩估計法的定義 用樣本矩來估計總體矩,用樣本矩的連續(xù)函數(shù)來估計總體
23、矩的連續(xù)函數(shù),這種估計法稱為矩估計法.矩估計法的具體做法:矩估計量的觀察值稱為矩估計值.例2設總體X的概率密度為其中為待估參數(shù),設是來自X的一個樣本,求的矩估計量.解 總體X 的一階矩為以一階樣本矩代替上式中的一階總體矩 ,從中解出 , 得到的矩估計量為 例3設總體X的概率密度為其中為待估參數(shù),設是來自X的一個樣本,求的矩估計量.解 總體X 的一階、二階矩分別為分別以一階、二階樣本矩代替上兩式中的有從中解得即得到的矩估計量為解根據(jù)矩估計法,例4解例5解方程組得到a, b的矩估計量分別為解解方程組得到矩估計量分別為例6上例表明: 總體均值與方差的矩估計量的表達式不因不同的總體分布而異.一般地,(
24、2). 最大似然估計法似然函數(shù)的定義最大似然估計法似然函數(shù)的定義求最大似然估計量的步驟:最大似然估計法是由費舍爾引進的. 最大似然估計法也適用于分布中含有多個未知參數(shù)的情況. 此時只需令對數(shù)似然方程組對數(shù)似然方程解似然函數(shù)例7這一估計量與矩估計量是相同的.例8在例2中求參數(shù)的最大似然估計值,設是一個樣本值.解 似然函數(shù)為令 解得注意到故所求 的最大似然估計值為這與的矩估計值不一樣.解X 的似然函數(shù)為例9它們與相應的矩估計量相同.解例10注:最大似然估計法也適用于分布中含多個未知參數(shù)的情形.兩種求點估計的方法:矩估計法最大似然估計法 在統(tǒng)計問題中往往先使用最大似然估計法, 在最大似然估計法使用不
25、方便時, 再用矩估計法.5.2點估計和區(qū)間估計 點估計就是用某樣本指標直接作為相應總體指標的估計值。 點估計方法雖然簡單,但由于未考慮到樣本指標與總體指標之間客觀存在著的抽樣誤差,也沒有給出估計的概率保證程度,無法確定估計的可靠程度。因此,我們常用區(qū)間估計,實踐中有許多區(qū)間估計的例子。 5.2.1置信概率和置信區(qū)間 按一定的概率估計總體參數(shù)在哪個范圍,這個范圍稱為總體參數(shù)的置信區(qū)間。 區(qū)間內總體參數(shù)出現(xiàn)的概率稱為置信概率。 對總體參數(shù)估計其取值范圍,對于給定的小概率,有 (1,2)是參數(shù)的置信區(qū)間, 為顯著性水平,1 - 為區(qū)間估計的置信度或置信水平,即置信概率。它表明判斷總體參數(shù)落在置信區(qū)的
26、可信程度。1,2分別為參數(shù)的下置信限和上置信限。稱為舍棄域。 置信區(qū)間與置信概率的關系 對于特定總體,總體參數(shù)總是一個確定的值,統(tǒng)計量則是一個隨機變量。因此,由1,2所構成的置信區(qū)間也是一個隨機區(qū)間。在所有可能樣本指標所構成的所有置信區(qū)間中,有的區(qū)間可能包括了總體指標,有的可能沒有包括。置信度1-的含義是,由全部樣本指示所確定的所有置信區(qū)間中,有100 (1-)%的估計區(qū)間包括了總體參數(shù),另外有100%的區(qū)間沒有包括總體指標。而對由某一樣本指標所確定的具體估計區(qū)間(1,2)來說,就是其包含的可能性(概率)為100(1-)%,不包含的可能性為 100%。 置信區(qū)間的寬窄與置信概率和樣本容量有關,
27、它隨著不同的置信度和樣本容量而變化。置信區(qū)間若取得過大,估計精度就差,價值往往不大。而取得過小,需要大量增加樣本容量,費力費時。置信區(qū)間取多大才算合適,需要根據(jù)所研究對象的性質,結合實踐經驗與專業(yè)知識來決定。實際應用中,一般取0.01或0.05,如無特別指出,一般取0.05。 96 求置信區(qū)間的一般步驟(共3步)5.2.2總體均值的區(qū)間估計 (1)n30,總體方差已知時,總體均值的區(qū)間估計。 對于給定的置信度1-,有 置信度為1-時總體均值的置信區(qū)間計算公式為: , 例5.5 根據(jù)以往資料,土壤中磷的含量服從正態(tài)分布,現(xiàn)對某地土壤進行采樣調查,測得9個土壤樣品中磷的平均含量為364.3ppm,
28、已知該土壤中磷含量的總體標準差為99.8 ppm,試估計該地土壤中磷中平均含量的95%和99%置信區(qū)間。 時,則 的95%置信區(qū)間為: , =(303.8,429.5)99%置信區(qū)間為: , =(278.5,450.1) 在報告結果時,可將點估計和區(qū)間估計同時寫出,如本例95%和99%的置信區(qū)間可分別寫成364.3(303.8,429.5)ppm和364.3(278.5,450.1)ppm。 如果是非正態(tài)總體或總體分布形態(tài)未知,當總體方差已知且樣本容量n充分大時,總體均值的置信區(qū)間可按上式近似計算。(2)總體方差未知時總體均值的置信區(qū)間 從正態(tài)總體中隨機抽樣,當樣本容量較小且總體方差未知時,根
29、據(jù)t分布原理,對于給定的置信度1-,有總體均數(shù)值的1-置信區(qū)間為 對于非正態(tài)總體,只要樣本容量n足夠大,根據(jù)中心極限定理,仍可按上式估計總體均數(shù)值的置信區(qū)間。當樣本容量n足夠大時, 例5.6 某排污口經100次測試,廢水中COD平均為100mg/L,標準差為20 mg/L,試估計該排污口廢水中COD值的95%置信區(qū)間。 =(96.1,103.9) 即該排污口廢水中COD值的95%置信區(qū)間為96.1103.9 mg/L。例 5.7 為檢查某湖水受汞污染情況,從該湖中隨機取9條魚齡相近的魚,測得魚胸肌中汞含量平均為2.01ppm,標準差為0.11ppm,試求該湖魚胸肌中汞含量的95%及99%置信區(qū)
30、間。 =(1.925,2.095) 5.2.3 兩個總體均值之差的區(qū)間估計1、兩總體方差12和22已知時 兩個總體均值之差的區(qū)間估計來自兩個正態(tài)總體的樣本均值分別為 x1和x2,其樣本容量分別為n1和n2 根據(jù)抽樣分布原理有 N(0,1)對給定的置信度1-則有1-2的置信區(qū)間為式中 是x1 x2的抽樣分布之標準差,用 表示 稱為兩均值之差的標準誤,表示由x1-x2估計1 2的抽樣誤差。如果兩總體方差未知,當樣本n1和n2均足夠大時可近似的以樣本方差s1 s2代替式中總體方差,計算均值差的置信區(qū)間。2、兩總體方差12和22未知,但12=22時,兩個總體之差的區(qū)間估計設從方差均為的兩正態(tài)總體中隨機
31、抽取容量為n1和n2的樣本 當未知時,則統(tǒng)計量給定置信概率為1- 則可得置信區(qū)間為式中t/2,v 為自由度為n1+n2-2時的t臨界值其中是x1-x2的抽樣分布之標準差。稱為兩均值之差的標準誤,表示由 x1-x2估計1-2的抽樣誤差3、兩總體方差12和22未知,但1222時,兩個總體均值之差的區(qū)間估計由于1222 兩總體方差不具有齊性,根據(jù)抽樣分布原理統(tǒng)計量服從自由度為n的t分布。其中對給的的置信概率 1-可得其均值差的置信區(qū)間為例 甲乙兩地空氣中某元素的含量服從正態(tài)分布12=0.013,22=0.012,從兩地抽樣測試結果如下 n甲=30 x甲=0.03 n乙=28 X乙=0.016,求置信
32、概率我0.95時兩地均值之差的置信區(qū)間 -0.042甲-乙0.072已知某造紙廠廢水中懸浮物連續(xù)排放服從正態(tài)分布,一月份對該廠廢水抽樣8次,其廢水懸浮物含量平均為22.5mg/l,2月份抽樣8次測得廢水懸浮物平均含量17.8mg/l一月份和2月份測定結果的標準差分別為8.3 和7.6,求兩個月廢水中懸浮物平均差值的95%置信區(qū)間。根據(jù)題意 本例屬于總體方差1、2未知1=2式中 自由度v=8+8-2=14 =0.05 t0.05/2,14=2.415 -3.81-213.2某縣甲、乙兩污水渠酚含量屬于正態(tài)分布甲測定39次其平均含量0.58 標準差s1=0.10 乙 測定43次 平均含量0.18
33、標準差s2=0.08 求置信概率95%情況下兩污水渠酚平均含量的置信區(qū)間計算得 k=0.633 n=73 t0.05/2,73=1.991 0.361-20.445.2.4 配對數(shù)據(jù)平均數(shù)差的置信區(qū)間環(huán)境科學中 許多問題來自兩總體的數(shù)據(jù)匹配成對出現(xiàn)的。如不同方法或不同處理裝置對同一污染物處理效果的比較,同一生物體對不同污染物濃度的反應等。對具有配對數(shù)據(jù)的兩正態(tài)總體平均數(shù)差的置信區(qū)間的求法可采用下述方法。 設來自兩正態(tài)總體的配對數(shù)據(jù)分別為x1k,x2k (k=1,2,3.n)它們的差值為dk=x1k-x2k , 統(tǒng)計量 其中它是自由度為n-1的t分布。置信概率1- 則配對數(shù)據(jù)差值d 的置信區(qū)間為
34、 兩種方法處理油污染的實驗數(shù)據(jù)如下 甲 4.0、5.0、6.0、1.0、5.4、4.1 乙 3.3、7.0、4.4、2.2、3.5、0.7求配對數(shù)據(jù)差的置信區(qū)間 (=0.05)計算差值 dk 0.7、-2.0、1.6、-1.2、1.9、3.4 求n=6-1=5 t0.05/2,5=2.571 -1.35 d2.815.2.5總體比率(成數(shù))的區(qū)間估計(1)正態(tài)近似法。 根據(jù)抽樣分布原理,當樣本容量n足夠大時 (一般np5或n(1p) 5),樣本比率p近似服從正態(tài)分布。 因此可以利用正態(tài)分布進行樣本比率(成數(shù))p的統(tǒng)計推斷。 P , 例 5.10 從某河流隨機抽取764份水樣,經測定COD超標者
35、162份,超標率為21.2%,試估計該河水COD總體超標率的95%置信區(qū)間。 本例n=764,p=21.2%,np5,可用正態(tài)近似法估計該河水COD總體超標率的95%置信區(qū)間 總體合格率P的95%置信區(qū)間:( , ) =(0.183,0.241) (2) 查表法。當樣本容量n較小,特別是P接近于0或1時,按二項分布原理確定總體比率的置信區(qū)間,其計算過程較繁,附表8列出了二項分布的置信區(qū)間臨界值,在實際應用中直接由表查出總體比率的置信區(qū)間甚為方便。例5.11 在某廢水處理廠出水口隨機檢測20次,其中有8次超標,試確定超標率的置信區(qū)間。查附表8,在n=20橫行與X=8的縱列交叉處的數(shù)值為1964,
36、即該出水口COD超標率的95%置信區(qū)間為(19%,64%)。5.3區(qū)間估計必要樣本單位數(shù)目的確定 抽樣調查工作中,抽取的樣本單位數(shù)越多,則得到的樣本資料對總體的代表性就越強,抽樣估計的精度及可靠程度也就越高;如果抽樣單位數(shù)越少,所得到的樣本資料對總體的代表性就越差,抽樣估計的精度及可靠程度就會越低。 對于特定總體,在確定其必要抽樣數(shù)目時,主要應考慮允許誤差(精度要求),置信水平(可靠程度),人、財、物及時間等因素。 確定必要抽樣單位數(shù)目應遵循的原則是:在保證抽樣推斷能達到所要求精度和可靠程度的情況下,抽取適當?shù)臉颖締挝粩?shù)。 5.3.1估計總體均值時,樣本容量的確定當總體服從正態(tài)分布,總體標準差已知時,在簡單重復抽樣的情況下, 有限總體,在不重復抽樣情況下 當總體服從正態(tài)分布,而總體標準差未知的情況下,區(qū)間估計常用樣本標準差s代替總體標準差,按t分布原理進行。在簡單隨機重復抽樣情況下 有限總體,在不重復抽樣情況下 由于各種抽樣組織形式下抽樣誤差的計算表示方法有所不同,故必要抽樣單位數(shù)目的計算公式也相應有所不同。等比例分層抽樣時 整群抽樣(各群容量相等)等距抽樣視同為簡單隨機不重復抽樣,故其必要抽樣單位數(shù)目按右
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024八年級地理上冊第一章疆域和人口-從世界看中國學情評估晉教版
- 大學生心理健康教育(河南經貿職業(yè)學院版)學習通測試及答案
- 《金版學案》2022屆高考政治一輪復習課時作業(yè):必修2-4單元總結-
- 2025年人教版八年級數(shù)學寒假預習 第03講 二次根式的加減(3個知識點+7大考點舉一反三+過關測試)
- 2025年人教版七年級數(shù)學寒假復習 專題05 一元一次方程(4重點串講+13考點提升+過關檢測)
- 【狀元之路】2022高考地理總復習隨堂訓練1-2-4全球氣候變化和氣候類型的判讀-
- 【創(chuàng)新設計】2021高考化學(廣東專用)二輪-微題型專練17
- 四川省綿陽2024-2025學年高二上學期數(shù)學期末模擬試題(五)(含答案)
- 【原創(chuàng)】江蘇省2021屆高三上學期第三次周測數(shù)學試題
- 部編版語文二年級下冊第五單元綜合素養(yǎng)測評 A卷(含答案)
- 福建省泉州市晉江市2023屆九年級上學期期末考試數(shù)學試卷(含答案)
- 鉆孔灌注樁施工方案 (詳細)
- 新建南通至寧波高速鐵路站前Ⅲ標二分部出海棧橋及綜合碼頭(自用)工程海域使用論證報告表
- 東北扭秧歌活動方案
- 車身穩(wěn)定系統(tǒng)課件
- 2023-2024學年廣東省東莞市七年級上期末數(shù)學試卷附答案
- 檢察機關的體制與組織機構課件
- 山東省濰坊市濰城區(qū)2023-2024學年六年級上學期期末語文試題
- 2024年1月四川高中學業(yè)水平合格考物理試卷試題真題
- 雅詩蘭黛集團企業(yè)培訓方案
- 30題產業(yè)研究員崗位常見面試問題含HR問題考察點及參考回答
評論
0/150
提交評論