第二章誤差理論_第1頁(yè)
第二章誤差理論_第2頁(yè)
第二章誤差理論_第3頁(yè)
第二章誤差理論_第4頁(yè)
第二章誤差理論_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章誤差理論第一頁(yè),共三十四頁(yè),編輯于2023年,星期四第二章要點(diǎn)提示誤差理論既是本課程的基礎(chǔ),又是本課程的難點(diǎn),學(xué)習(xí)時(shí)①要注意正態(tài)分布(理論分布)的特點(diǎn)及其與上一章二項(xiàng)分布的聯(lián)系;②要注意樣本統(tǒng)計(jì)量如、Σy、、的概率分布類型(抽樣分布)及其參數(shù)與母總體概型及其參數(shù)的聯(lián)系和區(qū)別(中心極限定理);③重點(diǎn)掌握誤差和抽樣誤差在某些取值區(qū)間如左尾、右尾或兩尾、中間概率的計(jì)算方法。涉及教材內(nèi)容:第三章,第四章第三、四節(jié)。作業(yè)布置:教材第四章P72~P73T3、T4、T5、T6、T7、T8、T9、T10。

第二頁(yè),共三十四頁(yè),編輯于2023年,星期四第一節(jié)誤差及其特征數(shù)一、誤差的概念總體指研究對(duì)象全體,即具有相同性質(zhì)和特征的個(gè)體(可供抽樣觀察的基本單位)所組成的集團(tuán)??傮w擁有的個(gè)體數(shù)目叫總體容量(N),統(tǒng)計(jì)學(xué)中的個(gè)體與生物個(gè)體不是一個(gè)概念。有時(shí)候總體“由一切可能的觀測(cè)結(jié)果組成”,此時(shí)的總體與個(gè)體只存在于特定的時(shí)空,可以想象,但既“看不見(jiàn),又摸不著”,如多次稱量同一物體的質(zhì)量。樣本:隨機(jī)從總體中抽出來(lái)用于研究總體的那一部分個(gè)體(抽樣單位)。樣本擁有的個(gè)體數(shù)叫樣本容量(n)。誤差的本義是指隨機(jī)變量的任意一個(gè)觀察值與其真值的差異,即Yi-μ。但統(tǒng)計(jì)學(xué)不是把誤差當(dāng)作常量來(lái)研究(因?yàn)閷?shí)際工作中真值往往是未知數(shù)或無(wú)法計(jì)算其具體數(shù)值),而是把它放在一定條件下作為隨機(jī)變量來(lái)對(duì)待,即利用概率分布理論來(lái)描述誤差在任一范圍取值的可能性大小,所以誤差實(shí)際被表述為“y–μ”。由于誤差的取值已不再局限于間斷性數(shù)據(jù),其概率分布研究必須從連續(xù)性變量的實(shí)例作為出發(fā)點(diǎn)。第三頁(yè),共三十四頁(yè),編輯于2023年,星期四第一節(jié)誤差及其特征數(shù)例2.1研究一10年生早熟無(wú)核蜜柑優(yōu)良單株(芽變新株系)的果實(shí)大小,將所結(jié)N=509個(gè)果實(shí)一個(gè)個(gè)地稱重,再將得到的數(shù)據(jù)進(jìn)行分組歸類并統(tǒng)計(jì)各組次數(shù)如右圖所示。利用次數(shù)分布表計(jì)算出反映果實(shí)平均大小和彼此懸殊程度(變異度)的指標(biāo),即總體平均數(shù)μ=147g和總體標(biāo)準(zhǔn)差σ=17g,它們也是“單果重”這一連續(xù)性變量的兩個(gè)最重要的參數(shù),實(shí)際決定其概率分布的特征。第四頁(yè),共三十四頁(yè),編輯于2023年,星期四第一節(jié)誤差及其特征數(shù)討論:如果說(shuō)用公式(μ=ΣYi/N)計(jì)算總體真值μ來(lái)反映果實(shí)大小的平均水平很自然的話,用σ2=Σ(y–μ)2/

N計(jì)算σ就顯得非常特別,因?yàn)榉从愁愃茊喂麘沂獬潭龋ê?jiǎn)稱變異度,反過(guò)來(lái)講就是整齊度)時(shí)也有人用所謂的“平均誤差”來(lái)表示過(guò),其算式(Σ|y–μ|/

N)雖然比計(jì)算標(biāo)準(zhǔn)差的公式還簡(jiǎn)單,但實(shí)際研究中已不再有人用它,原因是總體標(biāo)準(zhǔn)差不僅能從數(shù)值上顯示“變異度”的大小,更重要的它還是用作描述誤差概率分布的尺度。-51-34-170173451例2.1:μ=147gσ=17g第五頁(yè),共三十四頁(yè),編輯于2023年,星期四第一節(jié)誤差及其特征數(shù)二、關(guān)于“概率尺”該名詞是誤差理論應(yīng)用于實(shí)際研究工作的需要而產(chǎn)生的,在我院教改課題《正交表在試驗(yàn)統(tǒng)計(jì)中的新功用》的完成過(guò)程中提升為一個(gè)新的專業(yè)術(shù)語(yǔ)??蛇@樣定義:將誤差或抽樣誤差轉(zhuǎn)化為標(biāo)準(zhǔn)化隨機(jī)變量u、t或q、SSR的尺度(分母)。它是概率統(tǒng)計(jì)和試驗(yàn)研究的結(jié)合點(diǎn),是隨機(jī)變量最關(guān)鍵的變異特征數(shù),可以是標(biāo)準(zhǔn)差或標(biāo)準(zhǔn)誤,也可以是與之相近的統(tǒng)計(jì)量。試驗(yàn)統(tǒng)計(jì)中的核心問(wèn)題就在于找到概率尺的準(zhǔn)確數(shù)值。

(千分?jǐn)?shù))‰-51-34-170173451例2.1:μ=147gσ=17g0.74680.09430.1689第六頁(yè),共三十四頁(yè),編輯于2023年,星期四第二節(jié)數(shù)據(jù)整理*對(duì)樣本(或總體)的全部觀察值進(jìn)行分組(歸類)并統(tǒng)計(jì)各類次數(shù)的過(guò)程叫做數(shù)據(jù)整理,其結(jié)果通常都以次數(shù)分布表(或圖)的形式體現(xiàn)出來(lái)。當(dāng)樣本(或總體)的觀察值較多時(shí),進(jìn)行數(shù)據(jù)整理一方面可以更直觀地描述變量取值的分布規(guī)律,另一方面便于用加權(quán)法計(jì)算數(shù)據(jù)的特征數(shù)。數(shù)據(jù)的特征數(shù)包括(總體或樣本)平均數(shù)和(總體或樣本)標(biāo)準(zhǔn)差,還可以是標(biāo)準(zhǔn)誤,標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤(平均數(shù)的標(biāo)準(zhǔn)差)都是反映數(shù)據(jù)變異性的數(shù)量指標(biāo),各自蘊(yùn)藏著誤差和抽樣誤差(如樣本平均數(shù)和真值的差異)變異幅度的信息,但它們決非(抽樣)誤差本身。間斷性數(shù)據(jù)(含質(zhì)量性狀的指標(biāo))大多可依據(jù)其性狀自然歸組。連續(xù)性數(shù)據(jù)則需要人為地進(jìn)行分組,方法是先根據(jù)觀察值(也稱原始數(shù)據(jù))的個(gè)數(shù)確定大致的組數(shù),然后按數(shù)據(jù)的極差范圍計(jì)算組距、調(diào)整組數(shù),最后依最大的觀察值和最小的觀察值確定組限。第七頁(yè),共三十四頁(yè),編輯于2023年,星期四第二節(jié)數(shù)據(jù)整理繼續(xù)按貝努利概型分析五粒以上種子發(fā)芽的統(tǒng)計(jì)概率分布,繪成條形圖??梢钥闯?,服從二項(xiàng)分布的間斷性變量不論p是否等于q,只要n足夠大,則所得到的概率分布條形圖顯示的概率函數(shù)值總是以其中間的某一、兩項(xiàng)為最大,而后往兩邊依次遞減,當(dāng)n越來(lái)越大時(shí),概率分布圖也是愈趨對(duì)稱,和上一節(jié)連續(xù)性變量表現(xiàn)出來(lái)的頻率(或次數(shù))分布規(guī)律殊途同歸,呈現(xiàn)出兩頭低、中間高的變化模式。這正說(shuō)明間斷性變量和連續(xù)性變量存在著某種必然的聯(lián)系,正態(tài)分布本身及其發(fā)現(xiàn)和重新發(fā)現(xiàn)的過(guò)程就是這種聯(lián)系的最好證明。

第八頁(yè),共三十四頁(yè),編輯于2023年,星期四第二節(jié)數(shù)據(jù)整理第九頁(yè),共三十四頁(yè),編輯于2023年,星期四第二節(jié)數(shù)據(jù)整理例2.2是由一個(gè)樣本整理出的次數(shù)分布結(jié)果,為反映“行長(zhǎng)4尺的水稻產(chǎn)量”這種和例2.1“單果重”一樣的連續(xù)性變量取值的分布特征,將它繪制成頻率分布(面積)圖如右??梢钥闯?,該圖雖然是用面積表示頻率,但其特征顯然是概率分布的反映。由于類似這種通過(guò)樣本間接描述變量概率分布特征的大量事實(shí)都證明“兩頭低,中間高”的概率分布規(guī)律普遍存在,尋找這一分布的理論函數(shù)也就成了正態(tài)分布作為第一個(gè)發(fā)現(xiàn)的理論分布的契機(jī)?!耄ㄇХ?jǐn)?shù))例2.2n=140?=158gS=36g第十頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布fN(y)N(μ,σ2)μ-3σμ-2σμ-σμμ+σμ+2σμ+3σ-3σ-2σ-1σ01σ2σ3σyy-μ第十一頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布一、正態(tài)分布的概率函數(shù)二、正態(tài)分布概率函數(shù)曲線的特性⑴對(duì)稱性:絕對(duì)值相等的正負(fù)誤差出現(xiàn)的機(jī)會(huì)(概率)均等。

討論:這里提到誤差取某個(gè)“值”的概率問(wèn)題,也就是連續(xù)性變量取某個(gè)觀察值的概率究竟有沒(méi)有意義?高等數(shù)學(xué)論及連續(xù)性變量取某一個(gè)實(shí)數(shù)的概率時(shí),都認(rèn)定是在概率函數(shù)圖中用某個(gè)點(diǎn)上的垂線求面積,無(wú)疑應(yīng)該等于“0”。但應(yīng)用中獲得的觀察值不能簡(jiǎn)單地理解為“一個(gè)”實(shí)數(shù),而應(yīng)當(dāng)視為在精度有限的條件下,由最后一位有效數(shù)字按四舍五入規(guī)則決定的雖然小卻確實(shí)存在的區(qū)間。

N(0,σ2)fN(y-μ)-3σ-2σ–σ0σ2σ3σy-μ第十二頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布⑵鐘形:簡(jiǎn)稱“兩頭低,中間高”,即fN(y)從+∞和-∞兩個(gè)遠(yuǎn)端朝接近μ的方向遞增(并在“拐點(diǎn)”處曲線由“凹”轉(zhuǎn)“凸”),表明絕對(duì)值小的誤差出現(xiàn)的概率大,絕對(duì)值大的誤差出現(xiàn)的概率小。

⑶非負(fù)性:fN(y)≮0,即曲線總在橫坐標(biāo)軸上方,兩尾以橫軸為漸進(jìn)線,和橫軸圍成的總面積就是P(Ω)=1。⑷特異性:隨機(jī)變量的兩個(gè)參數(shù)μ和σ分別決定fN(y)曲線的位置和形狀,表明正態(tài)分布是一組曲線系統(tǒng)。N(μ,σ2)fN(y-μ)-3σ-2σ–σ0σ2σ3σy-μ第十三頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布0.50000.1586μ-2σμ-σμ

μ+σ

μ+2σy-2σ-σ0σ2σy-μφ(u)fN(y-μ)fN(y)-2-1012u第十四頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布0.68270.13590.02270.1586fN(y)(μ=0σ=1)N(0,1)φ(u)u第十五頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布μ=0μ=1μ=2標(biāo)準(zhǔn)差(σ=1)相同而平均數(shù)各不相同的三種情形fN(y)y第十六頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布σ=1σ=1.5σ=2平均數(shù)(μ=0)相同而標(biāo)準(zhǔn)差各不相同的三種情形fN(y)y第十七頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布三、標(biāo)準(zhǔn)分布的累積函數(shù)例2.3假定y~N(μ,σ2),μ=30,σ=5,試計(jì)算:P(y≤26)、P(y≤40)、P(26<y≤40)和P(y>40)。解:根據(jù)附表2查得的Φ(u)即標(biāo)準(zhǔn)分布曲線的左尾面積(概率)P(y≤26)=FN(26)=Φ[(26-30)÷5]=Φ(-0.8)=0.2119P(y≤40)=FN(40)=Φ[(40-30)÷5]=Φ(2.0)=0.9773P(26<y≤40)=FN(40)-FN(26)=0.7654P(y>40)=1-FN(40)=1-0.9773=0.0227由此例可得到正確使用附表2的口訣:小于某數(shù)直接查,大于某數(shù)1減它;區(qū)間概率大減小,兩邊臨界一反查。例2.4給定中間概率為0.90或0.95時(shí),u值應(yīng)等于多少?第十八頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布

26400.21190.76540.0227yfN(y)第十九頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布0.900.0250.0250.05fN(y)(μ=0σ=1)N(0,1)φ(u)u第二十頁(yè),共三十四頁(yè),編輯于2023年,星期四第三節(jié)正態(tài)分布

到此為止,本章內(nèi)容的講授已順著變量→連續(xù)性變量→誤差的路徑完成了知識(shí)結(jié)構(gòu)由概率論(正概率)→→統(tǒng)計(jì)學(xué)(逆概率)的轉(zhuǎn)變,其內(nèi)容也由“描述變量的概率分布”→→“推斷誤差變量(任一區(qū)間)取值的概率”。在學(xué)習(xí)下一節(jié)內(nèi)容之前,請(qǐng)一定先記牢三個(gè)要點(diǎn):㈠將第一章樹(shù)立的研究隨機(jī)變量的思想深化到研究連續(xù)性變量的層次,且不論用y(教材)還是用x(電算器)表示單個(gè)變量,都不可看成未知常數(shù);㈡描述連續(xù)性變量的概率分布的側(cè)重點(diǎn)與間斷性變量的方式不一樣,后者可用貝努利概型按牛頓二項(xiàng)展開(kāi)式的第y+1項(xiàng)計(jì)算其任一取值的概率,而前者實(shí)際需要了解的是其取值在某些連續(xù)的實(shí)數(shù)區(qū)間的概率;㈢參數(shù)μ和σ已分別用作總體平均數(shù)和總體標(biāo)準(zhǔn)差的通用符號(hào),也可以稱之為變量的平均數(shù)和變量的標(biāo)準(zhǔn)差,還可稱之為分布的平均數(shù)和分布的標(biāo)準(zhǔn)差。用正態(tài)分布描述誤差的概率分布時(shí)可以不知道μ的數(shù)值,但必須知道σ的準(zhǔn)確值,因?yàn)镾本身不能用作描述誤差概率分布的尺度。第二十一頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布例2.5給定一有限總體{2,4,6},即N=3,μ=4,σ2=8/3;現(xiàn)從中以n=2進(jìn)行復(fù)置抽樣,則所有可能的樣本數(shù)為Nn=9個(gè),計(jì)算各樣本的統(tǒng)計(jì)量并整理成右表。解視?為變量的衍生總體參數(shù):μ?=Σ?/Nn=36÷9=4σ2?=〔156–362÷9〕/9=4/3視Σy為變量的衍生總體參數(shù):μΣy=Σ(Σy)/Nn=72÷9=8σ2Σy=〔624–722÷9〕/9=16/3以上兩個(gè)衍生總體均由“一切可能的抽樣觀察結(jié)果組成”,可以想象得到,但“看不見(jiàn),也摸不著”,并且實(shí)際應(yīng)用中遇到的多為無(wú)限總體。

觀察值

?Σy

?2(Σy)222244162436

9362648

166442369364448166446510251006248166464510251006661236144Σ3672156624第二十二頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布復(fù)置抽樣時(shí)總體和隨機(jī)樣本的關(guān)系n=1n=2第二十三頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布前例可歸納出抽樣研究的部分結(jié)論:⑴由Nn個(gè)?構(gòu)成的衍生總體;?~N(μ?,σ2?)且有:μ?=μ,σ2?=σ2/n并有:u=(?-μ?)÷σ?⑵由Nn個(gè)Σy構(gòu)成的衍生總體;Σy~N(μΣy,σ2Σy)且有:μΣy=nμ,σ2Σy=nσ2又有:u=(Σy-μΣy)÷σΣy⑴和⑵表明抽樣分布的類型實(shí)質(zhì)上還是正態(tài)分布,只是其變量特殊罷了。⑶只有以自由度n–1算得的樣本方差S2

才是σ2的無(wú)偏估計(jì)值。(但S不是σ的無(wú)偏估計(jì)值)

觀察值 ?ΣyS2?2

(Σy)22224 041624 36293626 488166442 36293644 480166446 51022510062 488166464 510 22510066 612036144Σ 3672 24156624

ΣS2/Nn=24÷9=8/3=σ2)第二十四頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布例2.6調(diào)查336個(gè)平方米的小地老虎蟲(chóng)危害結(jié)果,μ=4.73頭,σ=2.63頭。求抽樣n=30時(shí)?≤4.37頭的概率。解由上述結(jié)論⑴知,須先求標(biāo)準(zhǔn)誤:σ?=σ/√n

=2.63÷√30=0.48頭

u=(?-μ)÷σ/√n=

-0.75

=(4.37-4.73)÷0.48

P(?≤4.37)=Φ(-0.75)=0.2266查附表2表明本例所求結(jié)果實(shí)際為獲得|-0.36|這種抽樣誤差的兩尾概率(之和)為2×0.2266=0.4532。?fN(?)

n=1n=4n=9第二十五頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布回眸例2.1求獲得抽樣誤差的概率:

μ=147g,σ=17g,N=509;?=148.84g,S=14.23g,n=25解按慣例所求兩尾概率即抽樣誤差的絕對(duì)值達(dá)到1.84的概率,因此有:σ?=σ/√n

=17÷√25=3.4gu=1.84÷σ/√n=

0.54反查附表3或順查附表2可得:P(|?–μ|≥1.84)=

P(|u|≥0.54)=2P(u≤-0.54)=2Φ(-0.54)=2×0.2946=0.5892≈0.59以上兩例已由總體標(biāo)準(zhǔn)差σ深化到總體標(biāo)準(zhǔn)誤σ?,使連續(xù)性變量的概率分布研究從誤差y–μ升華到抽樣誤差?-μ?,即?–μ。但這還不夠,歷史上也沒(méi)有因此避免正態(tài)分布在應(yīng)用上的危機(jī),因?yàn)橐@得σ的準(zhǔn)確數(shù)值,其難度比μ大得多。到1908年W.S.Gosset公開(kāi)發(fā)表一篇論文才使抽樣誤差的研究走出應(yīng)用上的困境。如例2.1中定義樣本標(biāo)準(zhǔn)誤S?=S/√n,則可將抽樣誤差轉(zhuǎn)換成另一個(gè)標(biāo)準(zhǔn)化變量t=(?-μ)÷S/√n=1.84÷2.85=0.65

查附表4可知獲得1.84的兩尾概率當(dāng)在0.5以上(n-1=24)。

第二十六頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布例2.7假定第一總體{2,4,6},N1=3,μ1=4,σ12=8/3;第二總體{3,6},N2=2,μ2=4.5,σ22=9/4。現(xiàn)從中分別以n1=2和n2=3進(jìn)行復(fù)置抽樣,試研究?1-?2抽樣分布。解來(lái)自兩個(gè)母總體的?之差數(shù)?1-?2構(gòu)成的衍生總體容量N1n1

×N2n2=9×8=72,其全部可能的取值及次數(shù)分布列表如右,按數(shù)據(jù)整理時(shí)用過(guò)的加權(quán)法計(jì)算其參數(shù)如下:μ?1-?2=Σf(?1-?2)÷Σf=-36/72=μ?1-μ?2=

μ1-μ2=-0.5σ2?1-?2=Σf(?1-?2+0.5)2

/Σf=150/72=σ2?1+

σ2?2=σ12

/n1

+σ22

/n2

=8/3÷2

+

9/4÷3=25/12?1-?2ff(?1-?2)

e2f·e2-41-412.2512.25-35-156.2531.25-212-242.2527.00-118-180.254.501800.254.5112122.2527.0025106.2531.2531312.2512.25Σ72-36——150e=(?1-?2)

–μ?1-?2=(?1-?2)

–(μ1-μ2)

第二十七頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布復(fù)置抽樣時(shí)總體和隨機(jī)樣本的關(guān)系n=1n=2n=3第二十八頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布復(fù)置抽樣后差數(shù)?1-?2構(gòu)造衍生總體示意圖第二十九頁(yè),共三十四頁(yè),編輯于2023年,星期四第四節(jié)抽樣分布由例2.7針對(duì)“平均數(shù)的差數(shù)”?1-?2進(jìn)行的抽樣研究結(jié)果,實(shí)際上也是中心極限定理內(nèi)容之一:?1-?2~N(μ?1-?2,σ2?1-?2),于是又有:u=〔(?1-?2)-μ?1-?2〕÷σ?1-?2=〔(?1-?2)-(μ1-μ2)〕/√(σ12/n1+σ22/n2)

可見(jiàn),來(lái)自兩個(gè)母總體的差數(shù)?1-?2與其真值μ?1-?2的抽樣誤差e取值的概率分布也可以用正態(tài)分布來(lái)描述,當(dāng)兩個(gè)母總體的參數(shù)已知時(shí),同樣可以轉(zhuǎn)化為用標(biāo)準(zhǔn)分布求算概率。只是因?yàn)閷?shí)際應(yīng)用中遇到的多為兩個(gè)母總體參數(shù)未知的情況,所以差數(shù)的抽樣誤差無(wú)法轉(zhuǎn)化成正態(tài)離差u而只能轉(zhuǎn)化成另一個(gè)標(biāo)準(zhǔn)化離差t,即:t=〔(?1-?2)-μ?1-?2〕÷S?1-?2,其中S?1-?2叫差數(shù)的樣本標(biāo)準(zhǔn)誤,由S12

、S22算出,并且計(jì)算公式和差數(shù)的總體標(biāo)準(zhǔn)誤相類似。

關(guān)于“差數(shù)的抽樣”還有不同于兩個(gè)獨(dú)立樣本的抽樣研究,也就是從一個(gè)參數(shù)μσ2既定的母總體中隨機(jī)抽取容量相同的兩個(gè)樣本,若將兩者的觀察值隨機(jī)配對(duì),則配對(duì)觀察值差數(shù)d將服從正態(tài)分布,即d~N(μd,σ2d),且μd=0,σ2d=2σ2;繼續(xù)研究“差數(shù)的平均數(shù)”,即Σd/n=?,根據(jù)例2.5所述中心極限定理結(jié)論⑴有:?~N(μ?,σ2?),且μ?=μd=0,σ2?=σ2d/n

=2σ2/n?!?/p>

u=(?-μ?)/σ?=?/√(2σ2/n)于是,當(dāng)參數(shù)σ2未知時(shí),同理應(yīng)有:t=(?-μ?)/S?=?/Sd/

√n第三十頁(yè),共三十四頁(yè),編輯于2023年,星期四第五節(jié)二項(xiàng)總體抽樣一、二項(xiàng)總體參數(shù)本節(jié)是針對(duì)一類特殊的母總體進(jìn)行抽樣研究,這類總體內(nèi)的個(gè)體不管有多少個(gè),都可按某種性狀出現(xiàn)與否分為兩組,故稱二項(xiàng)總體。將其中出現(xiàn)某種性狀的個(gè)體的觀察值定為“1”,否則定為“0”。若已知二項(xiàng)總體的個(gè)體有N個(gè),出現(xiàn)某種性狀的概率為p,則其參數(shù)計(jì)算如下:

μ=Σfy/N=Np/N=pσ2=Σf(y–μ)2/N=Np(1-p)/N=pq可見(jiàn)二項(xiàng)總體的兩個(gè)參數(shù)μ,σ2都由平均數(shù)p(即個(gè)體出現(xiàn)某種性狀的概率)唯一確定。二、衍生總體參數(shù)從二項(xiàng)總體中以樣本容量n進(jìn)行復(fù)置抽樣,根據(jù)前述中心極限定理的有關(guān)結(jié)論,同樣有:?或p~N(μ?,σ2?)且:μ?=μ=p,σ2?=σ2p=σ2/n=pq/nΣy或np~N(μΣy,σ2Σy)且:μΣy=nμ=np,σ2Σy=σ2np=nσ2=npq于是u=(?–μ?)/σ?=(p–p)/√pq/nu=(Σy–μΣy)/σΣy=(np–np)/√npqyff·yy-μf(y–μ)21NpNp1-pNp(1-p)20N(1-p)0-pN(1-p)p2ΣNNp—Np(1-p)第三十一頁(yè),共三十四頁(yè),編輯于2023年,星期四第五節(jié)二項(xiàng)總體抽樣例2.8假定調(diào)查某地全部棉株受盲椿危害的情況,發(fā)現(xiàn)704株受害,且N=2000,得μ=0.352,σ=0.4776;現(xiàn)從中以n=200抽取一個(gè)樣本,知受害株數(shù)np=74,受害率p=0.37,試計(jì)算獲此抽樣誤差的概率。解依題意應(yīng)求P(|p–p|≥0.018)

∵σp=σ/√n

=0.4776÷√200=0.034∴原式=P(|u|≥-0.53)=2P(u≤-0.53)=2Φ(-0.54)=2×0.2981=0.5962依題意也可求P(|np–np|≥3.6)

∵σnp=√n·σ

=√n

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論