抽樣分布和估計講義(-)課件_第1頁
抽樣分布和估計講義(-)課件_第2頁
抽樣分布和估計講義(-)課件_第3頁
抽樣分布和估計講義(-)課件_第4頁
抽樣分布和估計講義(-)課件_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1

統(tǒng)計學家視數(shù)據(jù)為資源,并且試圖從數(shù)據(jù)中看出平常人所看不到的景致來。

2第一講內容復習統(tǒng)計學的定義、分類;認識數(shù)據(jù)的第一步:你得到的是什么類型的數(shù)據(jù)?利用圖表展示數(shù)據(jù)中的信息;運用指標刻畫數(shù)據(jù)的某些特征和程度;使用EXCEL來描述數(shù)據(jù);3第一講作業(yè)以及案例討論

4第二講

抽樣分布和估計2001年9月22日5統(tǒng)計推斷的基本概念總體:有限總體、無限總體;樣本;統(tǒng)計推斷的任務:通過樣本的統(tǒng)計量來了解總體的參數(shù)。為什么需要抽樣:

1)總體無法得到;

2)時間成本不允許;

3)實驗具有破壞性。6統(tǒng)計推斷的基本思想1)選用一個概率模型來刻畫總體,使用樣本對模型做出推斷;2)樣本的獲取的可能性依賴于你選用的模型;根據(jù)這種可能性來分析我們由部分來認識總體所可能犯的錯誤(風險)。7統(tǒng)計推斷的內容之一估計參數(shù)點估計和區(qū)間估計點估計的例子居民家庭年收入

8統(tǒng)計推斷內容之二

假設檢驗:是否可以選用這個模型?例子:是否可以使用模型N(570,306)來刻畫所有居民的家庭年收入?思想:如果該模型是好的,那么和570相差很多的可能性不能太大。9簡單隨機抽樣有限總體的簡單隨機抽樣:等概率抽樣;有放回抽樣:獨立性無放回抽樣:非獨立性抽樣方法:利用隨即數(shù)表利用Excel

10隨機數(shù)表的使用77191258605520473417839206948676298266788933433938955672938057099105280992589773413359624415987469626734277592576519550853122160258429953310673808424937203645165153037069402166137411

無限總體的簡單隨機抽樣:獨立性;例子:擲硬幣12樣本和總體分布例子:薯片一個箱子中有10000包薯片,其中50%標價5元,30%標價10元,10%標價15元,10%標價30元。13點估計的方法估計量(統(tǒng)計量);估計值?;谝欢ǖ臏蕜t求最好的估計量。

極大似然法則;矩估計;最小二乘估計等14抽樣分布樣本不同,值也不同。那么取不同值的可能性分別是什么?的概率分布稱作它的抽樣分布。抽樣分布在統(tǒng)計推斷中的中心地位。抽樣分布取決于總體的分布(模型)以及抽樣的方式。

抽樣方式總體分布=====抽樣分布15

樣本均值的抽樣分布

(無限總體)如果總體服從,那么簡單隨機樣本的均值服從正態(tài)分布如果樣本容量n非常大,而且總體的期望是,方差是2〈+,那么簡單隨機樣本的均值近似服從正態(tài)分布(中心極限定理)16樣本比率的抽樣分布

(無限總體)小樣本情況

x服從二項式分布B(n,p).大樣本情況,按照中心極限定理,近似地

17正態(tài)分布的圖形18有限總體的修正系數(shù)設N是總體中個體的個數(shù),n是樣本容量,那么樣本均值的方差是:樣本比率的方差是:注:如果N相比n大很多,比如n/N5%,可以視為無限總體。

19樣本方差的抽樣分布如果是來自正態(tài)總體的一個隨機樣本,定義樣本方差為:

20認識卡方分布21方差未知時樣本均值的抽樣分布正態(tài)總體,2未知,使用樣本方差s2來替代2,則樣本均值滿足:n>30時,可以用標準正態(tài)分布近似。22正態(tài)分布和t分布的比較23估計的誤差不能以個別估計值作為評價準則;估計的誤差:

24對估計量的評價無偏性:偏差是零;有效性:方差最?。灰恢滦裕簶颖救萘吭黾訒档凸烙嬚`差。樣本均值(比率)是對總體均值(比率)的一個無偏的、有效的、一致的估計量。25

將概率模型引入統(tǒng)計推斷中來刻畫總體,可以使得我們能夠測量和控制由部分(樣本)來推斷總體時所犯的錯誤。

26EstimatePopulationParameter...withSampleStatisticMeanProportionpVariances2PopulationParametersEstimated2Difference-12x-x12___27

的抽樣分布:

1)正態(tài)總體時,282)非正態(tài)總體時,大樣本情況(n30)29

S2的抽樣分布:當總體是正態(tài)分布時,30

的抽樣分布:

31

有限總體時樣本均值和樣本比率的標準誤差,有限總體修正系數(shù)。32聯(lián)合食品公司的案例針對“聯(lián)合食品公司”的案例(P.44案例2-1),我們假設調查的100個客戶組成一個簡單隨機樣本。嘗試回答下面的問題:1)所有客戶一次購買金額的平均值是多少?2)所有使用信用卡的客戶一次購買金額的平均值是多少?3)使用信用卡的客戶占的比例是多少?333435

1)所有客戶一次購買金額的平均值是多少?(29.4449)2)所有使用信用卡的客戶一次購買金額的平均值是多少?(40.8768)3)使用信用卡的客戶占的比例是多少?(0.22)36我們的估計值離真值有多遠?我們希望通過樣本的信息給出一個范圍,使這個范圍按足夠大的概率包含我們所感興趣的參數(shù)。如何尋找K和L,使得以95%的概率成立:37

抽樣誤差:無偏點估計值與總體參數(shù)之差的絕對值。38樣本均值的抽樣分布z-z1-39大樣本且已知的情況

40理解置信區(qū)間的含義

抽取100個樣本,計算出100個平均值和100個區(qū)間,它們當中至少有(1-)*100個包含了未知的總體均值。因此,可以以(1-)的程度確信落在每一個區(qū)間里面。邊際誤差:

41ConfidenceIntervalsIntervalsExtendfrom(1-)%ofIntervalsContain.%DoNot.1-/2/2X_x_Intervals&LevelofConfidenceSamplingDistributionoftheMeanto42聯(lián)合食品公司的例子如果已知所有消費者一次購買金額的標準差是22,那么一次購買平均金額的一個95%的置信區(qū)間是:

29.44491.96*(22/10)或者(25.1329,33.7569),其中邊際誤差=4.312.問題:對這個區(qū)間的含義你知道了什么?

怎么可能知道標準差?43大樣本且未知的情形44聯(lián)合食品公司的例子所有顧客一次購買金額的平均值的95%的置信區(qū)間:

29.44491.96*(20.4162/10)或者

(25.44333,33.44506)問題:對使用信用卡的顧客一次購買金額的平均值能否類似進行區(qū)間估計?45小樣本且未知的情形

46聯(lián)合食品公司的例子所有持信用卡的顧客一次購買金額的平均值的95%的置信區(qū)間是:問題:1)你獲得上述結論時對總體作了什么假定?是否合理?

2)如何使用EXCEL解決該問題?47小樣本且已知的情形

你自己可以解決這一問題嗎?48大樣本下總體比率p的區(qū)間估計

49聯(lián)合食品公司的例子使用信用卡支付的顧客的比率的95%的置信區(qū)間是多少?問題:是否符合大樣本的條件?進一步的問題:如果嫌精度不夠怎麼辦?50DataVariation

SampleSizenLevelofConfidence

(1-)IntervalsExtend

?1984-1994T/MakerCo.影響區(qū)間長度的因素

5190%Samples95%Samplesx_ConfidenceIntervals99%SamplesX_52樣本容量的確定(1)給定邊際誤差E和置信系數(shù)1-,問題是:確定樣本容量n使得總體均值(比率)的1-水平的置信區(qū)間長度不超過2E?(該問題有什么實際意義?)

53樣本容量的確定(2)怎么獲得?

1)用以前相同或類似的樣本的樣本標準差代替;

2)用試驗調查的方法選擇初始樣本,用該樣本的樣本標準差代替;

3)對進行判斷或者猜測:比如全距的1/4作為估計。為什么用正態(tài)分布的/2分位數(shù)而不用t分布?54樣本容量的確定(3)對于總體比率來說:如何確定p?

1)類似對的確定方法;

2)使用p=0.5,此時p(1-p)最大,從而高估樣本容量。

55聯(lián)合食品公司的例子為使得所有顧客一次購買金額的平均值的95%的置信區(qū)間長度不超出6美圓,需至少采用多大的樣本?

E=?

=?(全距=77.07)

n=(1.96*77.07/4)^2/9=158.4615956聯(lián)合食品公司的例子為了使得對持信用卡購買的顧客比率p的95%的置信區(qū)間長度不超過0.2,樣本至少多大?E=?P=?N=(1.96)^2*0.5*0.5/0.1^2=96.049757區(qū)間估計內容小結置信區(qū)間的含義;從抽樣分布求置信區(qū)間;給定精度,確定樣本大小。58Mean,,isunknownPopulationRandomSampleIam95%confidentthat

isbetween40&60.Mean=50EstimationProcessSample59對總體模型的推斷另一種方式:假設檢驗參數(shù)估計的思路:選擇一個合適的模型;假設檢驗的思路:檢驗一個給定的模型。60PopulationAssumethepopulationmeanageis50.(NullHypothesis)REJECTTheSampleMeanIs

20SampleNullHypothesisHypothesisTestingProcessNo,notlikely!61從一個例子看假設檢驗的思路摸球試驗:有放回地在一個袋子中連續(xù)摸6次,都是紅球,你能否接受“袋子中一半是紅球一半是白球”的說法?為什么?如果我接受你的說法(假設),那么我看到的現(xiàn)象(樣本)出現(xiàn)的可能性是多少?如果這種可能性太小,會是什么情況?62假設檢驗的基本概念H0:一半紅球一半白球。(或者p=0.5);H1:紅球白球不是各一半。(或者p不是0.5)。原假設;備擇假設;選擇的態(tài)度:拒絕?接受?

(Tobeornottobe,……)更多的例子,簡單假設和復合假設:63拒絕域拒絕域:哪些樣本出現(xiàn)后,你會拒絕原假設?你建立你的拒絕域的根據(jù)是什么?抽樣分布。所謂檢驗就是選擇一個拒絕域。為什么這是一個問題?64你會犯什么錯誤?65H0:InnocentJuryTrialHypothesis

TestActualSituationActualSituationVerdictInnocentGuiltyDecisionH0TrueH0FalseInnocentCorrectErrorDoNotRejectH01-aTypeIIError(b)GuiltyErrorCorrectRejectH0TypeIError(a)Power(1-b)ResultPossibilities66abReduceprobabilityof

oneerror

andthe

otherone

goesup.a&

b

HaveanInverseRelationship67Neymann-Pearson原則找一個不犯錯誤的檢驗!?N-P原則:控制犯第一類錯誤的概率。顯著水平:犯第一類錯誤的最大概率。啟示:拒絕原假設、接受原假設?設置原假設和備擇假設的學問:一種藥品中含某元素超過0.01克為不合格。如何設置原假設?

H0:該藥品合格;H0:該藥品不合格。68一個例子所有聯(lián)合食品公司的顧客一次購買金額的平均值是35美圓?H0:=35.H1:?對容量為100的樣本,給定顯著水平=0.05,選擇拒絕域為滿足下列條件的樣本組成:

69一個例子(續(xù))計算樣本均值得到29.4449,落入拒絕域,所以拒絕原假設。該檢驗犯第一類錯誤的概率是多少?如果H0是正確的,一個樣本落在該拒絕域里面的概率是多少?如何確定?

70本講總結統(tǒng)計推斷的任務、基本思想和內容;簡單隨機抽樣;抽樣分布及其在統(tǒng)計推斷中的作用;點估計及其評價71本講總結區(qū)間估計是重點;區(qū)間估計需要掌握的東西;假設檢驗的概念和思路;選擇檢驗的原則;后面的話題。72作業(yè)教材211頁補充練習

59、60、64、66

教材第233頁,補充練習45、54、59。案例8-2,小組討論。(第14講)考場作文開拓文路能力?分解層次(網(wǎng)友來稿)江蘇省鎮(zhèn)江中學陳乃香說明:本系列稿共24講,20XX年1月6日開始在資源上連載【要義解說】文章主旨確立以后,就應該恰當?shù)胤纸鈱哟危箮讉€層次構成一個有機的整體,形成一篇完整的文章。如何分解層次主要取決于表現(xiàn)主旨的需要?!静呗越庾x】一般說來,記人敘事的文章常按時間順序分解層次,寫景狀物的文章常按時間順序、空間順序分解層次;說明文根據(jù)說明對象的特點,可按時間順序、空間順序或邏輯順序分解層次;議論文主要根據(jù)“提出問題-—分析問題——解決問題”順序來分解層次。當然,分解層次不是一層不變的固定模式,而應該富于變化。文章的層次,也常常有些外在的形式:1.小標題式。即圍繞話題把一篇文章劃分為幾個相對獨立的部分,再給它們加上一個簡潔、恰當?shù)男祟}。如《世界改變了模樣》四個小標題:壽命變“長”了、世界變“小”了、勞動變“輕”了、文明變“綠”了。2.序號式。序號式作文與小標題作文有相同的特點。序號可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”……從全文看,序號式干凈、明快;但從題目上看,卻看不出文章內容,只是標明了層次與部分。有時序號式作文,也適用于敘述性文章,為故事情節(jié)的展開,提供了明晰的層次。3.總分式。如高考佳作《人生也是一張答卷》。開頭:“人生就是一張答卷。它上面有選擇題、填空題、判斷題和問答題,但它又不同于一般的答卷。一般的答卷用手來書寫,人生的答卷卻要用行動來書寫?!敝黧w部分每段首句分別為:選擇題是對人生進行正確的取舍,填空題是充實自己的人生,判斷題是表明自己的人生態(tài)度,問答題是考驗自己解決問題的能力。這份“試卷”設計得合理而且實在,每個人的人生都是不同的,這就意味著這份人生試卷的“答案是豐富多彩的”。分解層次,應追求作文美學的三個價值取向:一要勻稱美。什么材料在前,什么材料在后,要合理安排;什么材料詳寫,什么材料略寫,要通盤考慮。自然段是構成文章的基本單位,恰當劃分自然段,自然就成為分解層次的基本要求。該分段處就分段,不要老是開頭、正文、結尾“三段式”,這種老套的層次顯得呆板。二要波瀾美。文章內容應該有張有弛,有起有伏,如波如瀾。只有這樣才能使文章起伏錯落,一波三折,吸引讀者。三要圓合美。文章的開頭與結尾要遙相照應,把開頭描寫的事物或提出的問題,在結尾處用各種方式加以深化或回答,給人首尾圓合的感覺?!纠慕馄省吭掝}:忙忙,不亦樂乎忙,是人生中一個個步驟,每個人所忙的事務不同,但是不能是碌碌無為地白忙,要忙就忙得精彩,忙得不亦樂乎。忙是問號。忙看似簡單,但其中卻大有學問。忙是人生中不可缺少的一部分,但是怎么才能忙出精彩,忙得不亦樂乎,卻并不簡單。人生如同一張地圖,我們一直在自己的地圖上行走,時不時我們眼前就出現(xiàn)一個十字路口,我們該向哪兒,面對那縱軸橫軸相交的十字路口,我們該怎樣選擇?不急,靜下心來分析一下,選擇適合自己的坐標軸才是最重要的。忙就是如此,選擇自己該忙的才能忙得有意義。忙是問號,這個問號一直提醒我們要忙得有意義,忙得不亦樂乎。忙是省略號。四季在有規(guī)律地進行著冷暖交替,大自然就一直按照這樣的規(guī)律不停地忙,人們亦如此。為自己找一個目標,為目標而不停地忙,讓這種忙一直忙下去。當目標已達成,那么再找一個目標,繼續(xù)這樣忙,就像省略號一樣,毫無休止地忙下去,翻開歷史的長卷,我們看到牛頓在忙著他的實驗;愛迪生在忙著思考;徐霞客在忙著記載游玩;李時珍在忙著編寫《本草綱目》。再看那位以筆為刀槍的充滿著朝氣與力量的文學泰斗魯迅,他正忙著用他獨有的刀和槍在不停地奮斗。忙是省略號,確定了一個目標那么就一直忙下去吧!這樣的忙一定會忙出生命靈動的色彩。忙是驚嘆號。世界上的人都在忙著自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜為回報。那么人呢?居里夫人的忙,以放射性元素的發(fā)現(xiàn)而得到了圓滿的休止符;愛因斯坦在忙,以相對論的問世而畫上了驚嘆號;李白的忙,以那豪放的詩歌而有了很大的成功;張衡的忙,因為那地動儀的問世而讓世人仰慕。每個人都應該有效率的忙,而不是整天碌碌無為地白忙。人生是有限的、短暫的,因此,每個人都應該在有限的生命里忙出屬于他的驚嘆號;都應在有限的生命里忙出他的人生精彩篇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論