第二講抽樣分布和估計(jì)(3)ppt課件_第1頁
第二講抽樣分布和估計(jì)(3)ppt課件_第2頁
第二講抽樣分布和估計(jì)(3)ppt課件_第3頁
第二講抽樣分布和估計(jì)(3)ppt課件_第4頁
第二講抽樣分布和估計(jì)(3)ppt課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 統(tǒng)計(jì)學(xué)家視數(shù)據(jù)為資源,并且試圖從數(shù)據(jù)中看出平常人所看不到的景致來。 .第一講內(nèi)容復(fù)習(xí)統(tǒng)計(jì)學(xué)的定義、分類;認(rèn)識數(shù)據(jù)的第一步:他得到的是什么類型的數(shù)據(jù)?利用圖表展現(xiàn)數(shù)據(jù)中的信息;運(yùn)用目的描寫數(shù)據(jù)的某些特征和程度;運(yùn)用EXCEL來描畫數(shù)據(jù);.第一講作業(yè)以及案例討論 .第二講抽樣分布和估計(jì)2001年9月22日.統(tǒng)計(jì)推斷的根本概念總體:有限總體、無限總體;樣本;統(tǒng)計(jì)推斷的義務(wù):經(jīng)過樣本的統(tǒng)計(jì)量來了解總體的參數(shù)。為什么需求抽樣: 1 總體無法得到; 2 時(shí)間本錢不允許; 3 實(shí)驗(yàn)具有破壞性。.統(tǒng)計(jì)推斷的根本思想1選用一個(gè)概率模型來描寫總體,運(yùn)用樣本對模型做出推斷;2樣本的獲取的能夠性依賴于他選用的模型;

2、根據(jù)這種能夠性來分析我們由部分來認(rèn)識總體所能夠犯的錯(cuò)誤風(fēng)險(xiǎn)。.統(tǒng)計(jì)推斷的內(nèi)容之一估計(jì)參數(shù)點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì)的例子 居民家庭年收入 .統(tǒng)計(jì)推斷內(nèi)容之二 假設(shè)檢驗(yàn):能否可以選用這個(gè)模型?例子: 能否可以運(yùn)用模型N(570,306)來描寫一切居民的家庭年收入?思想: 假設(shè)該模型是好的,那么 和570相差很多的能夠性不能太大。.簡單隨機(jī)抽樣有限總體的簡單隨機(jī)抽樣:等概率抽樣; 有放回抽樣:獨(dú)立性 無放回抽樣:非獨(dú)立性抽樣方法:利用隨即數(shù)表 利用 Excel .隨機(jī)數(shù)表的運(yùn)用77191 25860 55204 73417 83920 6948676298 26678 89334 33938 9556

3、7 2938057099 10528 09925 89773 41335 9624415987 46962 67342 77592 57651 9550853122 16025 84299 53310 67380 8424937203 64516 51530 37069 40216 64. 無限總體的簡單隨機(jī)抽樣:獨(dú)立性;例子:擲硬幣.樣本和總體分布例子:薯片一個(gè)箱子中有10000包薯片,其中50%標(biāo)價(jià)5元, 30%標(biāo)價(jià)10元, 10%標(biāo)價(jià)15元, 10%標(biāo)價(jià)30元。.點(diǎn)估計(jì)的方法估計(jì)量統(tǒng)計(jì)量;估計(jì)值?;谝欢ǖ臏?zhǔn)那么求最好的估計(jì)量。 極大似然法那么; 矩估計(jì); 最小二乘估計(jì)等.抽樣分布樣本不

4、同, 值也不同。那么 取不同值的能夠性分別是什么? 的概率分布稱作它的抽樣分布。抽樣分布在統(tǒng)計(jì)推斷中的中心位置。抽樣分布取決于總體的分布模型以及抽樣的方式。 抽樣方式 總體分布= 抽樣分布. 樣本均值的抽樣分布無限總體假設(shè)總體服從 , 那么簡單隨機(jī)樣本的均值服從正態(tài)分布假設(shè)樣本容量n非常大,而且總體的期望是,方差是2+,那么簡單隨機(jī)樣本的均值 近似服從正態(tài)分布 中心極限定理.樣本比率的抽樣分布 無限總體小樣本情況 x服從二項(xiàng)式分布B(n,p).大樣本情況,按照中心極限定理,近似地 .正態(tài)分布的圖形.有限總體的修正系數(shù)設(shè)N是總體中個(gè)體的個(gè)數(shù),n是樣本容量,那么樣本均值的方差是:樣本比率的方差是:

5、注:假設(shè)N相比n大很多,比如n/N5%,可以視為無限總體。 .樣本方差的抽樣分布假設(shè) 是來自正態(tài)總體 的一個(gè)隨機(jī)樣本,定義樣本方差為: .認(rèn)識卡方分布.方差未知時(shí)樣本均值的抽樣分布正態(tài)總體,2未知,運(yùn)用樣本方差s2來替代2,那么樣本均值滿足:n30時(shí),可以用規(guī)范正態(tài)分布近似。.正態(tài)分布和t 分布的比較.估計(jì)的誤差不能以個(gè)別估計(jì)值作為評價(jià)準(zhǔn)那么;估計(jì)的誤差: .對估計(jì)量的評價(jià)無偏性:偏向是零;有效性:方差最?。灰恢滦裕簶颖救萘刻砑訒?huì)降低估計(jì)誤差。樣本均值比率是對總體均值比率的一個(gè)無偏的、有效的、一致的估計(jì)量。. 將概率模型引入統(tǒng)計(jì)推斷中來描寫總體,可以使得我們可以丈量和控制由部分樣本來推斷總體時(shí)

6、所犯的錯(cuò)誤。 .Estimate PopulationParameter.with SampleStatisticMeanProportionpVariances2Population Parameters Estimated2Difference - 12 x - x 12_. 的抽樣分布: 1正態(tài)總體 時(shí),. 2非正態(tài)總體時(shí),大樣本情況n30). S2的抽樣分布: 當(dāng)總體是正態(tài)分布時(shí),. 的抽樣分布: . 有限總體時(shí)樣本均值和樣本比率的規(guī)范誤差,有限總體修正系數(shù)。.結(jié)合食品公司的案例針對“結(jié)合食品公司的案例P.44 案例2-1,我們假設(shè)調(diào)查的100個(gè)客戶組成一個(gè)簡單隨機(jī)樣本。嘗試回答下面的

7、問題:1一切客戶一次購買金額的平均值是多少?2一切運(yùn)用信譽(yù)卡的客戶一次購買金額的平均值是多少?3運(yùn)用信譽(yù)卡的客戶占的比例是多少?. 1一切客戶一次購買金額的平均值是多少?29.4449)2一切運(yùn)用信譽(yù)卡的客戶一次購買金額的平均值是多少?40.8768)3運(yùn)用信譽(yù)卡的客戶占的比例是多少?0.22).我們的估計(jì)值離真值有多遠(yuǎn)?我們希望經(jīng)過樣本的信息給出一個(gè)范圍,使這個(gè)范圍按足夠大的概率包含我們所感興趣的參數(shù)。如何尋覓K和L ,使得以95%的概率成立: . 抽樣誤差:無偏點(diǎn)估計(jì)值與總體參數(shù)之差的絕對值。.樣本均值的抽樣分布z-z1-.大樣本且知的情況 .了解置信區(qū)間的含義 抽取100個(gè)樣本,計(jì)算出1

8、00個(gè)平均值和100個(gè)區(qū)間,它們當(dāng)中至少有1-*100個(gè)包含了未知的總體均值。 因此,可以以(1-)的程度確信落在每一個(gè)區(qū)間里面。 邊沿誤差: . Confidence Intervals Intervals Extend from(1 - ) % of Intervals Contain . % Do Not.1 -/2/2X_x_Intervals & Level of ConfidenceSampling Distribution of the Meanto.結(jié)合食品公司的例子假設(shè)知一切消費(fèi)者一次購買金額的規(guī)范差是22,那么一次購買平均金額的一個(gè)95%的置信區(qū)間是: 29.44491.9

9、6*(22/10)或者25.1329, 33.7569),其中邊沿誤差=4.312.問題:對這個(gè)區(qū)間的含義他知道了什么? 怎樣能夠知道 規(guī)范差?.大樣本且未知的情形.結(jié)合食品公司的例子一切顧客一次購買金額的平均值的95%的置信區(qū)間: 29.44491.96*(20.4162/10)或者 (25.44333, 33.44506)問題:對運(yùn)用信譽(yù)卡的顧客一次購買金額的平均值能否類似進(jìn)展區(qū)間估計(jì)?.小樣本且未知的情形 .結(jié)合食品公司的例子一切持信譽(yù)卡的顧客一次購買金額的平均值的95%的置信區(qū)間是:問題:1他獲得上述結(jié)論時(shí)對總體作了什么假定?能否合理? 2如何運(yùn)用EXCEL處理該問題?.小樣本且知的情

10、形 他本人可以處理這一問題嗎?.大樣本下總體比率p的區(qū)間估計(jì) .結(jié)合食品公司的例子運(yùn)用信譽(yù)卡支付的顧客的比率的95%的置信區(qū)間是多少?問題:能否符合大樣本的條件?進(jìn)一步的問題:假設(shè)嫌精度不夠怎麼辦?.Data Variation Sample Size nLevel of Confidence (1 - ) Intervals Extend ?1984-1994 T/Maker Co.影響區(qū)間長度的要素 .90% Samples95% Samplesx_Confidence Intervals99% SamplesX_.樣本容量確實(shí)定1給定邊沿誤差E和置信系數(shù)1-,問題是:確定樣本容量n使得總

11、體均值比率的1- 程度的置信區(qū)間長度不超越2E?該問題有什么實(shí)踐意義? .樣本容量確實(shí)定2怎樣獲得? 1用以前一樣或類似的樣本的樣本規(guī)范差替代; 2用實(shí)驗(yàn)調(diào)查的方法選擇初始樣本,用該樣本的樣本規(guī)范差替代; 3對進(jìn)展判別或者猜測:比如全距的1/4作為估計(jì)。為什么用正態(tài)分布的/2分位數(shù)而不用t分布?.樣本容量確實(shí)定3對于總體比率來說:如何確定p? 1類似對確實(shí)定方法; 2運(yùn)用p=0.5,此時(shí)p(1-p)最大,從而高估樣本容量。 .結(jié)合食品公司的例子為使得一切顧客一次購買金額的平均值的95%的置信區(qū)間長度不超出6美圓,需至少采用多大的樣本? E=? =? (全距=77.07) n=(1.96*77.

12、07/4)2/9=158.46159.結(jié)合食品公司的例子為了使得對持信譽(yù)卡購買的顧客比率p的95%的置信區(qū)間長度不超越0.2,樣本至少多大?E=?P=? N=(1.96)2*0.5*0.5/0.12=96.0497.區(qū)間估計(jì)內(nèi)容小結(jié)置信區(qū)間的含義;從抽樣分布求置信區(qū)間;給定精度,確定樣本大小。.Mean, , is unknownPopulationRandom SampleI am 95% confident that is between 40 & 60.Mean = 50Estimation ProcessSample.對總體模型的推斷另一種方式:假設(shè)檢驗(yàn)參數(shù)估計(jì)的思緒:選擇一個(gè)適宜的模

13、型;假設(shè)檢驗(yàn)的思緒:檢驗(yàn)一個(gè)給定的模型。.PopulationAssume thepopulationmean age is 50.(Null Hypothesis)REJECTThe SampleMean Is 20SampleNull HypothesisHypothesis Testing ProcessNo, not likely!.從一個(gè)例子看假設(shè)檢驗(yàn)的思緒摸球?qū)嶒?yàn):有放回地在一個(gè)袋子中延續(xù)摸6次,都是紅球,他能否接受“袋子中一半是紅球一半是白球的說法?為什么?假設(shè)我接受他的說法假設(shè),那么我看到的景象樣本出現(xiàn)的能夠性是多少?假設(shè)這種能夠性太小,會(huì)是什么情況?.假設(shè)檢驗(yàn)的根本概念H0:

14、 一半紅球一半白球。 或者p=0.5);H1:紅球白球不是各一半?;蛘遬不是0.5。原假設(shè);備擇假設(shè);選擇的態(tài)度:回絕?接受? (To be or not to be,)更多的例子,簡單假設(shè)和復(fù)合假設(shè):.回絕域回絕域:哪些樣本出現(xiàn)后,他會(huì)回絕原假設(shè)?他建立他的回絕域的根據(jù)是什么?抽樣分布。所謂檢驗(yàn)就是選擇一個(gè)回絕域。為什么這是一個(gè)問題?.他會(huì)犯什么錯(cuò)誤?.H0: InnocentJury TrialHypothesis TestActual SituationActual SituationVerdictInnocentGuiltyDecisionH0 TrueH0 FalseInnocent

15、CorrectErrorDo NotRejectH01 - aType IIError (b)GuiltyErrorCorrectRejectH0Type IError(a)Power(1 - b)Result Possibilities.abReduce probability of one error and the other one goes up.a & b Have an Inverse Relationship.Neymann-Pearson原那么找一個(gè)不犯錯(cuò)誤的檢驗(yàn)???N-P原那么:控制犯第一類錯(cuò)誤的概率。顯著程度:犯第一類錯(cuò)誤的最大約率。啟示:回絕原假設(shè)、接受原假設(shè)?設(shè)置原假設(shè)和備擇假設(shè)的學(xué)問:一種藥品中含某元素超越0.01克為不合格。如何設(shè)置原假設(shè)? H0: 該藥品合格; H0:該藥品不合格。.一個(gè)例子一切結(jié)合食品公司的顧客一次購買金額的平均值是35美圓?H0: =35. H1: ?對容量為100的樣本,給定顯著程度=0.05, 選擇回絕域?yàn)闈M足以下條件的樣本組成: .一個(gè)例子續(xù)計(jì)算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論