版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第七章抽樣分配
1一般統(tǒng)計(jì)推論分成估計(jì)與檢定兩大領(lǐng)域,估計(jì)又分成點(diǎn)估計(jì)與信賴區(qū)間兩種,27.1
估計(jì)與誤差
生態(tài)學(xué)家認(rèn)為南極海域的藍(lán)鯨存量濱臨絕種邊緣,因此想知道現(xiàn)在的藍(lán)鯨存量有多少?在這個(gè)問題中,藍(lán)鯨存量就是我們感興趣的『參數(shù)』3參數(shù)(藍(lán)鯨存量)是多少?可能方法之一是將南極海域的水抽光后,數(shù)一數(shù)就可數(shù)出有多少尾藍(lán)鯨較可行的方式是透過統(tǒng)計(jì)的手法獲得資料再做推估
4例7.1、南極海域藍(lán)鯨存量的估計(jì)
南極海域藍(lán)鯨捕獲量愈來愈少捕鯨協(xié)會(huì)想研究南極的藍(lán)鯨存量有多少?
5方法1
捕獲量比較法如第一次捕捉到270尾,第二次捕捉到243尾,少了10%。則估計(jì)為原有270/0.1=2700尾,但現(xiàn)在則有2187尾。
6
7方法2記號(hào)法設(shè)第一次捕捉到鯨魚150尾,做記號(hào)后放回。第二次再捕100尾,其中有6尾有記號(hào)。則估計(jì)鯨魚存量為:89估計(jì)與誤差
10例男生比率某大學(xué)共有學(xué)生6672人,某教授想了解此大學(xué)中男生所占的比例。便在某角落觀察經(jīng)過的學(xué)生,看到100位中有40位女生、60位男生,因此他估計(jì)全校男生比率是0.6。11事實(shí)上,全校學(xué)生中有男生3091人、女生3581人,因此母體參數(shù)男生比例是
=3091/6672
0.46,而此教授估計(jì)男生的比例是0.6。12抽樣誤差其差距0.14有二種來源:一是由于抽樣誤差造成,如在同一角落多看幾次(每次都是100人),所得男女生比例也會(huì)有不同。這種由于樣本抽樣所造成的誤差,稱之為“抽樣誤差”,是“隨機(jī)性”,也是先天存在的。要獲得抽樣誤差的數(shù)據(jù),這要重覆做很多次(如幾千次、幾萬次才能得到)。13假設(shè)此教授后來又觀察了10天,每天都在同一角落觀察100位學(xué)生,如果看到10次的男生人數(shù)分別如下:58506261465055525351由此10次算出平均數(shù)是54人,所以估計(jì)男生比例是0.54它與我們?cè)裙烙?jì)的男生比例是0.60,兩者相差,
0.60-0.54=0.06即為抽樣誤差。14方法偏差
此教授在這個(gè)角落觀察過往的學(xué)生,這種抽查方式也有可能造成偏差,也許這個(gè)角落離男生宿舍較近,男生經(jīng)過的比例偏高,此為偏差的來源。如果每位學(xué)生(不論男女生)經(jīng)過此角落機(jī)會(huì)均等,則看到男生的比例應(yīng)是母體的比率0.46。事實(shí)上,因男生經(jīng)過此角落的機(jī)會(huì)較大故造成看到男生的比例為0.54。此兩者的差異0.54-0.46=0.08,即為方法偏差。150.60(估計(jì)值)=0.46(參數(shù))+0.08(方法偏差)+0.06(抽樣誤差)
167.2樣本平均數(shù)的分配
隨機(jī)抽樣得到一組資料x1,...,xn后,我們最常計(jì)算的兩個(gè)統(tǒng)計(jì)量是樣本平均數(shù)樣本標(biāo)準(zhǔn)差S雖然資料是從同一母體抽樣,但每次抽出的n個(gè)樣本會(huì)不同,因此算出的樣本平均數(shù)、標(biāo)準(zhǔn)差S也會(huì)不一樣,所以我們稱、S是“隨機(jī)變量”17既然每次抽樣算出的、S不同,我們有必要了解、S的抽樣分布長象是如何?18抽樣分配
19全國成年男人(約600萬人)的
平均身高是多少公分?
2021600萬人身高直方圖22第一組抽樣100位的身高資料
23樣本平均數(shù)=168.8,標(biāo)準(zhǔn)差s=6.3。如果以這樣的結(jié)果做母體平均數(shù)的估計(jì),則估計(jì)誤差是
-=169.5-168.8=0.7(公分)24第二組抽樣100位的身高資料
25樣本平均數(shù)=171.3,標(biāo)準(zhǔn)差s=6.8。如果以第二組抽樣的平均數(shù)=171.3,當(dāng)做所有全國成年人平均身高的估計(jì),則估計(jì)誤差為
-=169.5-171.3=-1.826隨機(jī)變量由上面兩次抽樣結(jié)果,我們知道每次抽樣的資料會(huì)變動(dòng)(故稱xi為“隨機(jī)變量”)而得到的樣本平均數(shù)也隨之變動(dòng)
(故也是隨機(jī)變量)因此估計(jì)誤差也是不確定的27抽樣分布
28圖7.3
全國成年男人抽樣100位平均身高X的分布
010020030040050060070080090010001100120013001400166.4166.8167.2167.6168.0168.4168.8169.2169.6170.0170.4170.8171.2171.6172.0172.4
次數(shù)
29(1)此直方圖應(yīng)像對(duì)稱的鐘形(即常態(tài)分配)。(2)此直方圖的中心點(diǎn)(也就是直方圖最高的部份)仍然是在169.5附近。(3)此直方圖比原先600萬位身高所畫直方圖更集中在中心點(diǎn)附近,即這些的標(biāo)準(zhǔn)差較原先母體Xi的標(biāo)準(zhǔn)差小。(4)這10,000個(gè)平均數(shù)的標(biāo)準(zhǔn)差是0.653比原先的母體(600萬人的身高)的標(biāo)準(zhǔn)差6.5小很,大約是原來的1/10。301.誤差在1公分之內(nèi)的機(jī)會(huì)
?抽樣誤差312.估計(jì)誤差在1.3公分之內(nèi)的機(jī)率?
抽樣誤差323.控制估計(jì)誤差在1公分之內(nèi)而對(duì)的機(jī)會(huì)有95%時(shí),那應(yīng)取多少樣本呢?
信賴度33全國成年女生610萬人其身高分布
010020030040050060070080090010001100136140144148152156160164168172176180184188192196200
次數(shù)(單位:千人次)
34圖7.5
全國成年人身高分布
01002003004005006007008009001000110012001300136140144148152156160164168172176180184188192196200
所有成年人的平均身高是
m=164.21,標(biāo)準(zhǔn)差
s=7.8831。
次數(shù)(單位:千人次)
35367.3
大數(shù)法則37中央極限定理常態(tài)分配在理論上有很多好的結(jié)果,統(tǒng)計(jì)學(xué)上常假設(shè)資料是常態(tài)分配,例如常聽到常態(tài)分班、常模、常態(tài)曲線等等這些假設(shè)的依據(jù)是什么呢?就是中央極限定理的功勞
38中央極限定理
39中央極限定理40(1)「不論原母體是什么分配」,不管母體資料是連續(xù)型或離散型、對(duì)稱或不對(duì)稱、右偏或左偏,甚至是單峰或多峰都無所謂,只要樣本數(shù)n“足夠大”,分配就會(huì)變成像鐘形的常態(tài)分配。41(2)抽樣樣本數(shù)不論是多少個(gè),代表資料“中心點(diǎn)”的樣本平均數(shù)的期望值與原母體分配的期望值都相同
4243(i)常態(tài)母體
44(ii)右偏母體
45(iii)均勻母體
46(iv)二項(xiàng)分配母體
47
7.4樣本數(shù)的決定
48誤差界限
所需抽樣樣本數(shù)n
49例95%信心水平e≤1
50例95%信心水平e≤0.5
51(1)誤差要求愈小,則所需樣本數(shù)就要愈大。如上例中誤差e=1,當(dāng)要求誤差降低到e=0.5,則樣本數(shù)需要增加到4162.3=650位。(2)信賴度愈大(即愈小),則樣本數(shù)也要愈多。(3)標(biāo)準(zhǔn)差
愈大,則要求的樣本數(shù)也愈多。52(4)實(shí)務(wù)上,通常是不知道的。因此需要用其他方式對(duì)做大約的估計(jì)。例如以主觀估計(jì)=7.2,或是由主觀認(rèn)為全國最高為200公分,最低150公分,全距是50公分,但全距大約是8,因此由8=50,得
=6.25。另外也可先抽幾個(gè)樣本(例如10個(gè)),算出樣本標(biāo)準(zhǔn)差S,以此做的估計(jì),然后再由(7.9)式,求出樣本數(shù)n
。537.5樣本變異數(shù)的分布與卡方分配
5455卡方分配
56卡方分配密度函數(shù)
57圖7.11
卡方分配密度函數(shù)圖
58如果不是標(biāo)準(zhǔn)常態(tài)
而是一般的常態(tài)平方和所組成是否也是卡方配呢?59答案
不是
60不是標(biāo)準(zhǔn)常態(tài)而是一般的常態(tài)平方和所組成
61樣本變異數(shù)的分布
62答案
:是
其自由度變成n
-1,這是因?yàn)閰?shù)被估計(jì)值取代,因此犧牲了一個(gè)自由度
6364樣本變異數(shù)的分布不是常態(tài)
而是右偏的卡方分布
6566例7.2、如果從標(biāo)準(zhǔn)常態(tài)母體中每次抽4個(gè),得x1,x2,x3,x4,再計(jì)算這樣重覆做10000次,得到10000筆數(shù)據(jù)試畫其直方圖
676869卡方分配查表
70圖7.13
之幾何意義
71查附表
72卡方分配的應(yīng)用
卡方分配主要用在檢定
(檢定定義在第八章)它可用來檢定資料是否適合某種分配
(適合度檢定)或是檢定一組常態(tài)分配資料其變異數(shù)是否等于某數(shù)。73另外當(dāng)母體標(biāo)準(zhǔn)差未知時(shí),如要對(duì)母體平均數(shù)m做統(tǒng)計(jì)推論,更需要用到樣本變異數(shù)的分配由卡方分配才導(dǎo)出7.6與7.7節(jié)所要討論的t分配與F分配。747.6t分配
75“自由度k的t分配定義
76自由度n
-1的t分配
77自由度k的t分配的密度函數(shù)
78圖7.14t分配密度函數(shù)圖
798081注
(i)t分配是對(duì)稱圖形,它的形狀與常態(tài)分配相似,不過往兩邊下降速度較常態(tài)分配緩慢。(ii)當(dāng)自由度k愈大時(shí),
t分配就愈接近標(biāo)準(zhǔn)常態(tài)分配。
82t分配查表
8384查t
附表
85注
867.7F分配
87F分配的密度函數(shù)
88圖7.17F分配圖
899091F分配查表
9293查F分配表
94第七章摘要951.欲估計(jì)母體的參數(shù)
需要抽樣(一般不做普查,原因費(fèi)時(shí)費(fèi)力),抽樣的估計(jì)值與母體參數(shù)不會(huì)相同會(huì)有誤差,其關(guān)系式為估計(jì)值=參數(shù)+方法偏差+抽樣誤差
962.方法偏差
方法偏差是人為的疏忽應(yīng)避免,例如方便的資料等所造成的偏差。抽樣誤差是自然的因素雖非人為的,但也可由對(duì)資料的認(rèn)知降低誤差,例如以分層隨機(jī)抽樣取代簡單隨機(jī)抽樣就能降低抽樣誤差
97抽樣樣本數(shù)的決定
984.了解中央極限定理的意義、應(yīng)用及其重要性
995.以身高資料說明的抽樣分布會(huì)接近常態(tài)
100標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的關(guān)系
1017.與常態(tài)分配相關(guān)之分配,包括卡方分配、分配、分配。了解各種分配定義及分配圖長像與用途,但初學(xué)者不用強(qiáng)記密度函數(shù)
1028.卡方卡方是標(biāo)準(zhǔn)常態(tài)分配的平方,其自由度為平方和的個(gè)數(shù),但每個(gè)標(biāo)準(zhǔn)常態(tài)間必須獨(dú)立
1039.分配與分配間的關(guān)系:
10410.t分配
是用在母體標(biāo)準(zhǔn)差未知時(shí),的分布(7.20式)
105(第14講)考場(chǎng)作文開拓文路能力?分解層次(網(wǎng)友來稿)江蘇省鎮(zhèn)江中學(xué)陳乃香說明:本系列稿共24講,20XX年1月6日開始在資源上連載【要義解說】文章主旨確立以后,就應(yīng)該恰當(dāng)?shù)胤纸鈱哟?,使幾個(gè)層次構(gòu)成一個(gè)有機(jī)的整體,形成一篇完整的文章。如何分解層次主要取決于表現(xiàn)主旨的需要。【策略解讀】一般說來,記人敘事的文章常按時(shí)間順序分解層次,寫景狀物的文章常按時(shí)間順序、空間順序分解層次;說明文根據(jù)說明對(duì)象的特點(diǎn),可按時(shí)間順序、空間順序或邏輯順序分解層次;議論文主要根據(jù)“提出問題-—分析問題——解決問題”順序來分解層次。當(dāng)然,分解層次不是一層不變的固定模式,而應(yīng)該富于變化。文章的層次,也常常有些外在的形式:1.小標(biāo)題式。即圍繞話題把一篇文章劃分為幾個(gè)相對(duì)獨(dú)立的部分,再給它們加上一個(gè)簡潔、恰當(dāng)?shù)男?biāo)題。如《世界改變了模樣》四個(gè)小標(biāo)題:壽命變“長”了、世界變“小”了、勞動(dòng)變“輕”了、文明變“綠”了。2.序號(hào)式。序號(hào)式作文與小標(biāo)題作文有相同的特點(diǎn)。序號(hào)可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”……從全文看,序號(hào)式干凈、明快;但從題目上看,卻看不出文章內(nèi)容,只是標(biāo)明了層次與部分。有時(shí)序號(hào)式作文,也適用于敘述性文章,為故事情節(jié)的展開,提供了明晰的層次。3.總分式。如高考佳作《人生也是一張答卷》。開頭:“人生就是一張答卷。它上面有選擇題、填空題、判斷題和問答題,但它又不同于一般的答卷。一般的答卷用手來書寫,人生的答卷卻要用行動(dòng)來書寫。”主體部分每段首句分別為:選擇題是對(duì)人生進(jìn)行正確的取舍,填空題是充實(shí)自己的人生,判斷題是表明自己的人生態(tài)度,問答題是考驗(yàn)自己解決問題的能力。這份“試卷”設(shè)計(jì)得合理而且實(shí)在,每個(gè)人的人生都是不同的,這就意味著這份人生試卷的“答案是豐富多彩的”。分解層次,應(yīng)追求作文美學(xué)的三個(gè)價(jià)值取向:一要?jiǎng)蚍Q美。什么材料在前,什么材料在后,要合理安排;什么材料詳寫,什么材料略寫,要通盤考慮。自然段是構(gòu)成文章的基本單位,恰當(dāng)劃分自然段,自然就成為分解層次的基本要求。該分段處就分段,不要老是開頭、正文、結(jié)尾“三段式”,這種老套的層次顯得呆板。二要波瀾美。文章內(nèi)容應(yīng)該有張有弛,有起有伏,如波如瀾。只有這樣才能使文章起伏錯(cuò)落,一波三折,吸引讀者。三要圓合美。文章的開頭與結(jié)尾要遙相照應(yīng),把開頭描寫的事物或提出的問題,在結(jié)尾處用各種方式加以深化或回答,給人首尾圓合的感覺?!纠慕馄省吭掝}:忙忙,不亦樂乎忙,是人生中一個(gè)個(gè)步驟,每個(gè)人所忙的事務(wù)不同,但是不能是碌碌無為地白忙,要忙就忙得精彩,忙得不亦樂乎。忙是問號(hào)。忙看似簡單,但其中卻大有學(xué)問。忙是人生中不可缺少的一部分,但是怎么才能忙出精彩,忙得不亦樂乎,卻并不簡單。人生如同一張地圖,我們一直在自己的地圖上行走,時(shí)不時(shí)我們眼前就出現(xiàn)一個(gè)十字路口,我們?cè)撓蚰膬海鎸?duì)那縱軸橫軸相交的十字路口,我們?cè)撛鯓舆x擇?不急,靜下心來分析一下,選擇適合自己的坐標(biāo)軸才是最重要的。忙就是如此,選擇自己該忙的才能忙得有意義。忙是問號(hào),這個(gè)問號(hào)一直提醒我們要忙得有意義,忙得不亦樂乎。忙是省略號(hào)。四季在有規(guī)律地進(jìn)行著冷暖交替,大自然就一直按照這樣的規(guī)律不停地忙,人們亦如此。為自己找一個(gè)目標(biāo),為目標(biāo)而不停地忙,讓這種忙一直忙下去。當(dāng)目標(biāo)已達(dá)成,那么再找一個(gè)目標(biāo),繼續(xù)這樣忙,就像省略號(hào)一樣,毫無休止地忙下去,翻開歷史的長卷,我們看到牛頓在忙著他的實(shí)驗(yàn);愛迪生在忙著思考;徐霞客在忙著記載游玩;李時(shí)珍在忙著編寫《本草綱目》。再看那位以筆為刀槍的充滿著朝氣與力量的文學(xué)泰斗魯迅,他正忙著用他獨(dú)有的刀和槍在不停地奮斗。忙是省略號(hào),確定了一個(gè)目標(biāo)那么就一直忙下去吧!這樣的忙一定會(huì)忙出生命靈動(dòng)的色彩。忙是驚嘆號(hào)。世界上的人都在忙著自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜為回報(bào)。那么人呢?居里夫人的忙,以放射性元素的發(fā)現(xiàn)而得到了圓滿的休止符;愛因斯坦在忙,以相對(duì)論的問世而畫上了驚嘆號(hào);李白的忙,以那豪放的詩歌而有了很大的成功;張衡的忙,因?yàn)槟堑貏?dòng)儀的問世而讓世人仰慕。每個(gè)人都應(yīng)該有效率的忙,而不是整天碌碌無為地白忙。人生是有限的、短暫的,因此,每個(gè)人都應(yīng)該在有限的生命里忙出屬于他的驚嘆號(hào);都應(yīng)在有限的生命里忙出他的人生精彩篇章。忙是萬物、世界、人生中都不可缺少的一部分。作為這世上最高級(jí)動(dòng)物的我們,我們?cè)诿κ裁茨?我們要忙得有意義,有價(jià)值,我們要忙出屬于我們的精彩。我們的忙不能永遠(yuǎn)是問號(hào),而應(yīng)是省略號(hào)和感嘆號(hào)。忙就要忙得精彩,忙得不亦樂乎。解剖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年重慶考客運(yùn)資格證
- 2024成品采購合同范文
- 2024技術(shù)開發(fā)合同模板
- 2024物業(yè)保潔員工用工合同
- 2024工程裝飾合同范文
- 垃圾分類培訓(xùn)會(huì)議記錄三篇
- 2024標(biāo)準(zhǔn)產(chǎn)品買賣合同書
- 2024建行外匯借款合同范本
- 深圳大學(xué)《油料與谷物科學(xué)原理》2022-2023學(xué)年第一學(xué)期期末試卷
- 艾草委托代工合同范本(2篇)
- 污水處理常用藥劑簡介知識(shí)講解課件
- 五年級(jí)上冊(cè)英語課件-Unit 1《My future》第1課時(shí)牛津上海版(三起) (共28張PPT)
- 光交接箱施工規(guī)范方案
- 氣溫和降水學(xué)案
- 普及人民代表大會(huì)制度知識(shí)競(jìng)賽試題庫(1000題和答案)
- 國家電網(wǎng)公司施工項(xiàng)目部標(biāo)準(zhǔn)化管理手冊(cè)(2021年版)線路工程分冊(cè)
- 《汽車低壓線束設(shè)計(jì)規(guī)范》
- 工程項(xiàng)目增加簽證單
- 被一部電影感動(dòng)記韓國電影《鳴梁海戰(zhàn)》觀后感
- 六年級(jí)數(shù)學(xué)上冊(cè)教案-《百分?jǐn)?shù)》青島版
- 消防演練方案腳本
評(píng)論
0/150
提交評(píng)論