05抽樣估計(jì)資料_第1頁
05抽樣估計(jì)資料_第2頁
05抽樣估計(jì)資料_第3頁
05抽樣估計(jì)資料_第4頁
05抽樣估計(jì)資料_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

抽樣估計(jì)第一節(jié)抽樣估計(jì)的理論基礎(chǔ)抽樣估計(jì)的基本內(nèi)容就是研究如何根據(jù)總體的部分?jǐn)?shù)據(jù)信息(構(gòu)造樣本指標(biāo)也稱統(tǒng)計(jì)量)去估計(jì)未知總體指標(biāo)(也稱參數(shù))的理論和方法。念及基本原理→抽樣估計(jì)的理論和方法。一、大數(shù)定律大量的獨(dú)立重復(fù)測量值的算術(shù)平均值具有穩(wěn)定性。對于這種穩(wěn)定性的研究構(gòu)成了大數(shù)定那那么對任意給定的正數(shù)ε,有其等價形式是頻率m/n,依概率收斂于事件發(fā)生的概率p,這個定(二)辛欽大數(shù)定律12nk辛欽大數(shù)定律為我們用測量數(shù)據(jù)的算術(shù)平均數(shù)代替其真值的方法提供了理論依據(jù)。假定要測量某一物理量μ,在不變條件下測量n次,得到的結(jié)果X,X,…,X是不完全相同的,12n它們可以看作n個獨(dú)立隨機(jī)變量X,X,…,X(它們服從同一分布且數(shù)學(xué)期望均為μ)。12n這時出現(xiàn)較大偏差的可能性很小。一般說來,測定的次數(shù)越多,近似程度越好。二、中心極限定理當(dāng)處理大樣本問題時,將它作為一個非常重要的工具。下面介紹兩個常用的中心極限定理。定理1:林德貝格—勒維中心極限定理,也稱為獨(dú)立同分布中心極限定理。n充分大時,若隨機(jī)變量X~B(n,p),則近似地有X~N(np,np(1-p),于是我們可nn以利用正態(tài)分布近似地計(jì)算二項(xiàng)分布的概率。同時,這個定理還給離散型隨機(jī)變量與連續(xù)型隨機(jī)變量之間的轉(zhuǎn)換提供了一種有效途徑。P{1000X>120000}表示保險公司虧本的概率,(1)P{1000X>120000}=P{X>120}=1-φ(7.7693)=0(2)P{120000-1000x≥40000}=P{(X-10000×0.006)/(10000×0.006×0.994)1/2≤(80-60)/(59.64)1/2}=φ(2.5898)=0.9952第二節(jié)抽樣方法與抽樣分布一、抽樣方法(一)重復(fù)抽樣和不重復(fù)抽樣(識記二者概念。重點(diǎn))對于無限總體而言,抽樣總是可以認(rèn)為是重復(fù)抽樣(即重置抽樣或放回抽樣),因此,它沒有重復(fù)抽樣和不重復(fù)抽樣的區(qū)別。然而,對于有限總體而言,重復(fù)抽樣與不重復(fù)抽樣是不一樣的。下面我們只對有限總體的重復(fù)抽樣和不重復(fù)抽樣進(jìn)行分別介紹。首先,我們假設(shè)有限總體中所包含的個體數(shù)為N,重復(fù)抽樣可以認(rèn)為是有限總體條件下的簡單隨機(jī)抽樣。其特點(diǎn)是:如果我們做了n次獨(dú)立試驗(yàn)(也就是抽取n個個體的樣本),2.不重復(fù)抽樣不重復(fù)抽樣(即不重置抽樣或不放回抽樣)是指每次從有限總體中隨機(jī)抽取一個個體,登記結(jié)果后不放回原總體,下一個個體繼續(xù)從總體中余下的個體中隨機(jī)抽取。其特點(diǎn)是:第第二,每次抽取的結(jié)果不是獨(dú)立的。體被抽中的概率是不相同的。(二)其他抽樣方法二、抽樣分布(一)抽樣分布的概念(識記。重點(diǎn))對于給定的總體和抽樣方式以及樣本容量,樣本指標(biāo)取值的概率分布就稱為抽樣分布。樣本均值樣本均值867概概率為任(二)常用的抽樣分布樣本均值、樣本比例和樣本方差(領(lǐng)會)。1.樣本均值的抽樣分布不論所考察總體的概率分布如何,只要樣本容量n足夠大,其樣本均值的概率分布趨近于以總體均值μ為期望,以為標(biāo)準(zhǔn)誤差的正態(tài)分布,即有:在實(shí)踐中,總體的方差σ2總是未知的,通常需要用其估計(jì)量即樣本方差S2來代替。由于修正的無偏于修正的無偏樣本方差是總體方差的無偏估計(jì),所以實(shí)際應(yīng)用2.樣本比例的抽樣分布樣本比例是總體比例的估計(jì)量,只能給出大樣本條件下樣本比例的抽樣分布。3.樣本方差的抽樣分布主要是在正態(tài)分布總體中應(yīng)用。第三節(jié)點(diǎn)估計(jì)一、總體參數(shù)與其估計(jì)量在統(tǒng)計(jì)中需要使用一定的方法根據(jù)樣本數(shù)據(jù)來推斷總體的指標(biāo)數(shù)值,總體指標(biāo)又稱為參該估計(jì)量的數(shù)值就稱為該總體指標(biāo)的估計(jì)值。估計(jì)值就是其估計(jì)量在某個給定樣本上的取值。二、構(gòu)造估計(jì)量的方法——矩法估計(jì)(領(lǐng)會)所謂矩法估計(jì),是指用樣本矩作為總體同一矩的估計(jì)量或者用樣本矩的函數(shù)作為總體相常用代表該總體指標(biāo)的字母戴一個尖帽表示。三、判斷估計(jì)量優(yōu)劣的標(biāo)準(zhǔn)(領(lǐng)會)常用的標(biāo)準(zhǔn)主要有一致性、無偏性、有效性、充分性和穩(wěn)健性等。(一)一致性對于總體指標(biāo)θ,若其估計(jì)量的取值隨著樣本容量的增大越來越接近于總體指標(biāo)的真值,計(jì)量都是所要估計(jì)的總體指標(biāo)的一致估計(jì)量,即都具有相合性。如樣本均值是總體均值μ的一致估計(jì)量,樣本比例p是總體比例P的(二)無偏性計(jì)量。修正的無偏樣本方差的數(shù)學(xué)期望正好等于被估計(jì)的總體方差σ2。本方差和無偏樣本方差的值會有一定的差距,估計(jì)總體方差時應(yīng)采用無偏樣本方差作為其估計(jì)時,用哪一個作估計(jì)量都可以。(三)有效性計(jì)量優(yōu)劣的第三個標(biāo)準(zhǔn)。和,和1211來說小于估計(jì)量的估計(jì)誤差,則稱估計(jì)量比有效。212兩個無偏估計(jì)量比較,方差較小者較為有效。兩個估計(jì)量的方差之比:稱為二者的相對效率。若比率ω<1,則稱估計(jì)量比有效。12對于一個總體指標(biāo)來說,若在其所有無偏估計(jì)量中能夠找到一個估計(jì)量,其方差最小,則該估計(jì)量就稱為該總體指標(biāo)的最佳估計(jì)量??梢宰C明,樣本均值就是該總體指標(biāo)均值于有偏估計(jì)量之間或有偏估計(jì)量與無偏估計(jì)量之間的比較判斷??蓪⑴袛喙烙?jì)量是否優(yōu)良的指標(biāo)改為估計(jì)量的均方誤差,在待估總體指標(biāo)的所有估計(jì)量中,均方誤差最小的估計(jì)量可認(rèn)為是最好的估計(jì)量,該標(biāo)準(zhǔn)可稱為均方誤差最小標(biāo)準(zhǔn)。則均方誤差最小者較好,所以均方誤差最小標(biāo)準(zhǔn)也是無偏性標(biāo)準(zhǔn)和有效性標(biāo)準(zhǔn)的綜合。(四)充分性思想,可給出判斷估計(jì)量優(yōu)劣的第四個標(biāo)準(zhǔn)。計(jì)量就稱為總體指標(biāo)θ的充分估計(jì)量。判斷樣本指標(biāo)是否為某個總體指標(biāo)的充分估計(jì)量,一般比較麻煩,不過在多數(shù)情況下,(五)穩(wěn)健性的污染。顯然,被污染數(shù)據(jù)的干擾或受其干擾不大,那么該估計(jì)量就是總體指標(biāo)θ的一個穩(wěn)健統(tǒng)計(jì)量。均值有效性很高,但穩(wěn)健性卻較低,而樣本中位數(shù)穩(wěn)健性很高,但有效性卻較低。所以,可以將樣本均值和中位數(shù)的計(jì)算方法綜合折中構(gòu)造一種兼具二者特點(diǎn)的新估計(jì)量,這類估計(jì)量主要有切尾均值等。所謂切尾均值就是將樣本數(shù)據(jù)按大小順序排列以后,切掉序列兩端的部將樣本數(shù)據(jù)排序序列兩端各25%的數(shù)據(jù)切掉,只用中間一半數(shù)據(jù)計(jì)算的均值。唱歌比賽中,對歌手的評分就常采用評委打分的切尾均值。估計(jì)量往往很難同時具備所有這些優(yōu)良性質(zhì),這就需要我們根據(jù)研究的目的和樣本數(shù)據(jù)的特點(diǎn)性質(zhì)進(jìn)行權(quán)衡選擇或者進(jìn)行折中選擇?!径噙x題】下列關(guān)于穩(wěn)健性的說法正確的有()。A.由矩法估計(jì)所構(gòu)造出來的估計(jì)量都是所要估計(jì)的總體指標(biāo)的一致估計(jì)量B.樣本均值是總體均值的一個穩(wěn)健估計(jì)量C.常用的總體指標(biāo)的估計(jì)量均是充分的D.兩個無偏估計(jì)量比較,方差較大者較為有效E.對于小樣本來說,估計(jì)總體方差時應(yīng)采用無偏樣本方差作為其估計(jì)量『答案解析』選項(xiàng)B,樣本中位數(shù)是總體均值的一個穩(wěn)健估計(jì)量,樣本均值不是總體均值的一個穩(wěn)健估計(jì)量。選項(xiàng)D,兩個無偏估計(jì)量比較,方差較小者較為有效。四、估計(jì)量的標(biāo)準(zhǔn)誤樣本估計(jì)值與總體指標(biāo)真值之間總是存在著或大或小的抽樣估計(jì)誤差。估計(jì)誤差愈大,它控制到一個較小的范圍之內(nèi),確保抽樣估計(jì)的精度,減少決策的失誤。(一)標(biāo)準(zhǔn)誤的概念(識記)衡量抽樣估計(jì)誤差不能用抽樣誤差的直接平均,而應(yīng)該采用將其平方后再平均的方法,即用樣本估計(jì)量的方差或標(biāo)準(zhǔn)差。實(shí)踐中一般均采用樣本估計(jì)量的標(biāo)準(zhǔn)差作為衡量抽樣估計(jì)中列出,由此可計(jì)算出樣本均值無的方差和標(biāo)準(zhǔn)誤分別為:σ2=D()=E[-E()]2=E(-μ)2=(6-7)2×1/9+(6.5-7)2+(7-7)2×3/9+(7.5-7)2×2/9+(8-7)2×1/9=1/3(二)標(biāo)準(zhǔn)誤的計(jì)算(領(lǐng)會)指標(biāo)的關(guān)系用間接的方式求出。1.樣本均值的標(biāo)準(zhǔn)誤同的抽樣方式之下,樣本均值的方差是不相同的,因而其標(biāo)準(zhǔn)誤也就不相同。(1)若所得樣本是采用有放回簡單隨機(jī)抽樣方式抽取有放回簡單隨機(jī)抽樣所得的樣本就是由若干個相互獨(dú)立且與總體被觀測變量分布完全相同的隨機(jī)變量x,x,…,x所組成的一個集合。12n樣本均值的標(biāo)準(zhǔn)誤公式為:放回簡單隨機(jī)樣本,其樣本均值的標(biāo)準(zhǔn)誤為:σ=(2/3/2)=3/3可見,用該公式計(jì)算的結(jié)果與用樣本均值標(biāo)準(zhǔn)誤定義公式計(jì)算結(jié)果相同。(2)若所得樣本是采用不放回簡單隨機(jī)抽樣方式抽取則樣本的各次抽取不獨(dú)立,從而使樣本觀測變量x,x,…,x相互也不獨(dú)立,前面的12n值的方差那樣很容易地導(dǎo)出。不放回抽樣下樣本均值的方差為:σ=[2/3/2(3-2)/(3-1)]=6/6有放回抽樣和不放回抽樣各自樣本均值的方差的比較:(1)不放回抽樣下樣本均值的方差公式中比有放回抽樣下樣本均值的方差公式中多了一個因子(N-n)/(N-1),由于該因子小于1,即(N-n)/(N-1)<1,所以,不放回抽樣下樣本均值的標(biāo)準(zhǔn)誤比放回抽抽樣方式。(2)當(dāng)總體為無限總體時,不放回抽樣下樣本均值的標(biāo)準(zhǔn)誤公式就簡化為與有放回抽樣下樣本均值的標(biāo)準(zhǔn)誤公式相同,故因子(N-n)/(N-1)通常稱為有限總體校正因子。不過當(dāng)總體容量N較大而抽樣比n/N很小時,有限總體校正因子(N-n)/(N-l)或(1—n/N)通??珊雎圆挥?jì)。因此,實(shí)踐中一般只使用有放回抽樣的公式來計(jì)算其標(biāo)準(zhǔn)誤。方差可得有放回抽樣和不放回抽樣下樣本均值標(biāo)準(zhǔn)誤的估計(jì)量公式分別為:檢驗(yàn),測得各電子元件的使用壽命分別為1256、1307、1180、1450、1225、1198、1365、1420、1295、1304小時,試估計(jì)該批電子元件的平均使用壽命及其標(biāo)準(zhǔn)誤。解:由樣本觀測數(shù)據(jù)可計(jì)算出樣本均值和樣本方差分別為:=(1256+1307+…+1304)/10=13000/10=1300(小時)所以該批電子元件平均使用壽命的估計(jì)值為:而樣本均值的標(biāo)準(zhǔn)誤,若按放回抽樣計(jì)算,則其估計(jì)值為:放回抽樣計(jì)算,則其估計(jì)值為:相差很小,故為了計(jì)算簡便可只使用有放回抽樣的公式。2.樣本比例的標(biāo)準(zhǔn)誤總體比例P,即總體中具有某種特征的個體數(shù)與全部個體數(shù)的比例,是一個常用的總體pp的標(biāo)準(zhǔn)誤公式可仿照上述總體均值估計(jì)量即樣本均值的標(biāo)準(zhǔn)誤公式給出。:1標(biāo)準(zhǔn)誤公式代替不放回抽樣的標(biāo)準(zhǔn)誤公式進(jìn)行計(jì)算。(三)影響標(biāo)準(zhǔn)誤的因素(領(lǐng)會)準(zhǔn)抽樣方法和估計(jì)方法,以便控制抽樣估計(jì)誤差,具有十分重要的意義。影響估計(jì)量的標(biāo)準(zhǔn)誤數(shù)值大小的因素主要有以下三個方面:(1)總體中各個體之間的差異程度。對于所考察的變量來說,總體中各個體在該變量的取值之間的差異程度越大,即σ2越大,總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤的數(shù)值也就越大,抽樣估計(jì)誤差也就越大。反之,若σ2較小,則估計(jì)量的標(biāo)準(zhǔn)誤差也就越小。(2)樣本容量的大小。樣本容量越大,總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤就越小,抽樣估計(jì)誤差也就越??;反之,樣本容量越小,抽樣估計(jì)誤差及其標(biāo)準(zhǔn)誤也就越大。(3)抽樣的方式與方法。比較不同的抽樣方式下各總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤的計(jì)算公同,總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤就會不同,抽樣估計(jì)誤差的大小也就不同。由總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤的意義及上述因素分析可知:要提高抽樣估計(jì)的精確程度,以及增加樣本容量等。第四節(jié)區(qū)間估計(jì)一、區(qū)間估計(jì)的概念(識記)為了給出樣本估計(jì)值精度的估計(jì)(點(diǎn)估計(jì)做不到),就需要對未知總體指標(biāo)進(jìn)行區(qū)間估定義(識記):所謂區(qū)間估計(jì),就是在事先給定的概率保證程度下,根據(jù)樣本估計(jì)量的體參數(shù)的某個區(qū)間,作為對未知總體參數(shù)的估計(jì)。本估計(jì)量的概率分布可計(jì)算出一個區(qū)間本估計(jì)量的概率分布可計(jì)算出一個區(qū)間次一方面,對某一次抽樣來說,只有一個樣本,只能計(jì)算出未知總體參數(shù)θ的一個置信區(qū)間,該區(qū)間或者包含未知總體參數(shù)θ,或者不包含未知總體參數(shù)θ。其中該區(qū)間包含θ的可能性也稱把握程度或稱可靠程度為1-α,而該區(qū)間不包含θ的可能性則為α。率,即使估計(jì)的可靠程度符合要求,又不至于使估計(jì)的精度太低。下面學(xué)習(xí)常用的總體指標(biāo)置信區(qū)間的計(jì)算方法。二、總體均值的區(qū)間估計(jì)(領(lǐng)會)(一)大樣本情形下總體均值的區(qū)間估計(jì)大樣本情形下,樣本均值的概率分布可看作是正態(tài)分布。概率保證為1-α??傮w均值μ的置信區(qū)間為:用樣本均值估計(jì)總值均值μ所產(chǎn)生的抽樣估計(jì)誤差,記為:該市民工的月平均工資進(jìn)行區(qū)間估計(jì)。其標(biāo)準(zhǔn)誤的估計(jì)值為:的條件下,查標(biāo)準(zhǔn)正態(tài)分布概率表得上側(cè)分位數(shù)z=z=1.96。由此得估計(jì)的誤差限為:α/20.025故可得出該市農(nóng)民工月平均工資μ的置信區(qū)間為:(630-15.68)元<μ<(630+15.68)元(二)小樣本情形下,正態(tài)總體均值的區(qū)間估計(jì)只討論正態(tài)總體小樣本均值的區(qū)間估計(jì)。對于來自正態(tài)總體的一個小樣本,在給定的置信概率1-α之下,總體均值μ的置信區(qū)用樣本均值估計(jì)總值均值μ所產(chǎn)生的抽樣估計(jì)誤差-μ,記為:【例5—8】在【例5—5】所述某工廠收到供貨方發(fā)來的一批電子元件的例子中,樣本子元件使用壽命的概率分布可看作正態(tài)分布,試在95%的置信概率下,對該批電子元件的平均使用壽命進(jìn)行區(qū)間估計(jì)。0.95的條件下,查t分布表得自由度為n-1的t分布上側(cè)分位數(shù)t==t=2.26,于α/20.025是用樣本均值估計(jì)總體均值的估計(jì)誤差的誤差限為:該批電子元件平均使用壽命的置信區(qū)間為:(1300-64.62)小時<μ<(1300+64.62)小時三、總體比例的區(qū)間估計(jì)(領(lǐng)會)市居民家庭中由于物價上漲過快而使生活水平下降的家庭所占比例進(jìn)行區(qū)間估計(jì)。布概率表得z=1.96。若采用類似于均值置信區(qū)間的計(jì)算方法,可先計(jì)算出用樣本比例pσ/2由此得該市由于物價上漲而使生活水平下降的居民家庭所占比例P的置信區(qū)間為:25%-4.9%<P<25%+4.9%,即:20.1%<P<29.9%四、總體方差的區(qū)間估計(jì)10件電子元件進(jìn)行檢驗(yàn),使用樣本的方差為S2=8175.56(小時),試在95%的置信概率下區(qū)間估計(jì)。對該批電子元件使用壽命的方差和標(biāo)準(zhǔn)差進(jìn)行上述正態(tài)總體方差置信區(qū)間的公式,可得該批電子元件使用壽命的方差的置信區(qū)間為:兩邊開平方,就可得出該批電子元件使用壽命的標(biāo)準(zhǔn)差的置信區(qū)間為:五、單側(cè)置信區(qū)間(識記)在稱為單側(cè)則稱區(qū)間置信下限,而估計(jì)值稱為單側(cè)置信上限。戶,其中由于物價上漲過快使生活水平下降的家庭所占比重為25%,試在95%的置信概率下求該市居民家庭中生活水平下降的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論