版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 統(tǒng)計學家視數(shù)據(jù)為資源,并且試圖從數(shù)據(jù)中看出平常人所看不到的景致來。 .第一講內(nèi)容復習統(tǒng)計學的定義、分類;認識數(shù)據(jù)的第一步:他得到的是什么類型的數(shù)據(jù)?利用圖表展現(xiàn)數(shù)據(jù)中的信息;運用目的描寫數(shù)據(jù)的某些特征和程度;運用EXCEL來描畫數(shù)據(jù);.第一講作業(yè)以及案例討論 .第二講抽樣分布和估計2001年9月22日.統(tǒng)計推斷的根本概念總體:有限總體、無限總體;樣本;統(tǒng)計推斷的義務:經(jīng)過樣本的統(tǒng)計量來了解總體的參數(shù)。為什么需求抽樣: 1 總體無法得到; 2 時間本錢不允許; 3 實驗具有破壞性。.統(tǒng)計推斷的根本思想1選用一個概率模型來描寫總體,運用樣本對模型做出推斷;2樣本的獲取的能夠性依賴于他選用的模型;
2、根據(jù)這種能夠性來分析我們由部分來認識總體所能夠犯的錯誤風險。.統(tǒng)計推斷的內(nèi)容之一估計參數(shù)點估計和區(qū)間估計點估計的例子 居民家庭年收入 .統(tǒng)計推斷內(nèi)容之二 假設檢驗:能否可以選用這個模型?例子: 能否可以運用模型N(570,306)來描寫一切居民的家庭年收入?思想: 假設該模型是好的,那么 和570相差很多的能夠性不能太大。.簡單隨機抽樣有限總體的簡單隨機抽樣:等概率抽樣; 有放回抽樣:獨立性 無放回抽樣:非獨立性抽樣方法:利用隨即數(shù)表 利用 Excel .隨機數(shù)表的運用77191 25860 55204 73417 83920 6948676298 26678 89334 33938 9556
3、7 2938057099 10528 09925 89773 41335 9624415987 46962 67342 77592 57651 9550853122 16025 84299 53310 67380 8424937203 64516 51530 37069 40216 64. 無限總體的簡單隨機抽樣:獨立性;例子:擲硬幣.樣本和總體分布例子:薯片一個箱子中有10000包薯片,其中50%標價5元, 30%標價10元, 10%標價15元, 10%標價30元。.點估計的方法估計量統(tǒng)計量;估計值?;谝欢ǖ臏誓敲辞笞詈玫墓烙嬃?。 極大似然法那么; 矩估計; 最小二乘估計等.抽樣分布樣本不
4、同, 值也不同。那么 取不同值的能夠性分別是什么? 的概率分布稱作它的抽樣分布。抽樣分布在統(tǒng)計推斷中的中心位置。抽樣分布取決于總體的分布模型以及抽樣的方式。 抽樣方式 總體分布= 抽樣分布. 樣本均值的抽樣分布無限總體假設總體服從 , 那么簡單隨機樣本的均值服從正態(tài)分布假設樣本容量n非常大,而且總體的期望是,方差是2+,那么簡單隨機樣本的均值 近似服從正態(tài)分布 中心極限定理.樣本比率的抽樣分布 無限總體小樣本情況 x服從二項式分布B(n,p).大樣本情況,按照中心極限定理,近似地 .正態(tài)分布的圖形.有限總體的修正系數(shù)設N是總體中個體的個數(shù),n是樣本容量,那么樣本均值的方差是:樣本比率的方差是:
5、注:假設N相比n大很多,比如n/N5%,可以視為無限總體。 .樣本方差的抽樣分布假設 是來自正態(tài)總體 的一個隨機樣本,定義樣本方差為: .認識卡方分布.方差未知時樣本均值的抽樣分布正態(tài)總體,2未知,運用樣本方差s2來替代2,那么樣本均值滿足:n30時,可以用規(guī)范正態(tài)分布近似。.正態(tài)分布和t 分布的比較.估計的誤差不能以個別估計值作為評價準那么;估計的誤差: .對估計量的評價無偏性:偏向是零;有效性:方差最??;一致性:樣本容量添加會降低估計誤差。樣本均值比率是對總體均值比率的一個無偏的、有效的、一致的估計量。. 將概率模型引入統(tǒng)計推斷中來描寫總體,可以使得我們可以丈量和控制由部分樣本來推斷總體時
6、所犯的錯誤。 .Estimate PopulationParameter.with SampleStatisticMeanProportionpVariances2Population Parameters Estimated2Difference - 12 x - x 12_. 的抽樣分布: 1正態(tài)總體 時,. 2非正態(tài)總體時,大樣本情況n30). S2的抽樣分布: 當總體是正態(tài)分布時,. 的抽樣分布: . 有限總體時樣本均值和樣本比率的規(guī)范誤差,有限總體修正系數(shù)。.結合食品公司的案例針對“結合食品公司的案例P.44 案例2-1,我們假設調(diào)查的100個客戶組成一個簡單隨機樣本。嘗試回答下面的
7、問題:1一切客戶一次購買金額的平均值是多少?2一切運用信譽卡的客戶一次購買金額的平均值是多少?3運用信譽卡的客戶占的比例是多少?. 1一切客戶一次購買金額的平均值是多少?29.4449)2一切運用信譽卡的客戶一次購買金額的平均值是多少?40.8768)3運用信譽卡的客戶占的比例是多少?0.22).我們的估計值離真值有多遠?我們希望經(jīng)過樣本的信息給出一個范圍,使這個范圍按足夠大的概率包含我們所感興趣的參數(shù)。如何尋覓K和L ,使得以95%的概率成立: . 抽樣誤差:無偏點估計值與總體參數(shù)之差的絕對值。.樣本均值的抽樣分布z-z1-.大樣本且知的情況 .了解置信區(qū)間的含義 抽取100個樣本,計算出1
8、00個平均值和100個區(qū)間,它們當中至少有1-*100個包含了未知的總體均值。 因此,可以以(1-)的程度確信落在每一個區(qū)間里面。 邊沿誤差: . Confidence Intervals Intervals Extend from(1 - ) % of Intervals Contain . % Do Not.1 -/2/2X_x_Intervals & Level of ConfidenceSampling Distribution of the Meanto.結合食品公司的例子假設知一切消費者一次購買金額的規(guī)范差是22,那么一次購買平均金額的一個95%的置信區(qū)間是: 29.44491.9
9、6*(22/10)或者25.1329, 33.7569),其中邊沿誤差=4.312.問題:對這個區(qū)間的含義他知道了什么? 怎樣能夠知道 規(guī)范差?.大樣本且未知的情形.結合食品公司的例子一切顧客一次購買金額的平均值的95%的置信區(qū)間: 29.44491.96*(20.4162/10)或者 (25.44333, 33.44506)問題:對運用信譽卡的顧客一次購買金額的平均值能否類似進展區(qū)間估計?.小樣本且未知的情形 .結合食品公司的例子一切持信譽卡的顧客一次購買金額的平均值的95%的置信區(qū)間是:問題:1他獲得上述結論時對總體作了什么假定?能否合理? 2如何運用EXCEL處理該問題?.小樣本且知的情
10、形 他本人可以處理這一問題嗎?.大樣本下總體比率p的區(qū)間估計 .結合食品公司的例子運用信譽卡支付的顧客的比率的95%的置信區(qū)間是多少?問題:能否符合大樣本的條件?進一步的問題:假設嫌精度不夠怎麼辦?.Data Variation Sample Size nLevel of Confidence (1 - ) Intervals Extend ?1984-1994 T/Maker Co.影響區(qū)間長度的要素 .90% Samples95% Samplesx_Confidence Intervals99% SamplesX_.樣本容量確實定1給定邊沿誤差E和置信系數(shù)1-,問題是:確定樣本容量n使得總
11、體均值比率的1- 程度的置信區(qū)間長度不超越2E?該問題有什么實踐意義? .樣本容量確實定2怎樣獲得? 1用以前一樣或類似的樣本的樣本規(guī)范差替代; 2用實驗調(diào)查的方法選擇初始樣本,用該樣本的樣本規(guī)范差替代; 3對進展判別或者猜測:比如全距的1/4作為估計。為什么用正態(tài)分布的/2分位數(shù)而不用t分布?.樣本容量確實定3對于總體比率來說:如何確定p? 1類似對確實定方法; 2運用p=0.5,此時p(1-p)最大,從而高估樣本容量。 .結合食品公司的例子為使得一切顧客一次購買金額的平均值的95%的置信區(qū)間長度不超出6美圓,需至少采用多大的樣本? E=? =? (全距=77.07) n=(1.96*77.
12、07/4)2/9=158.46159.結合食品公司的例子為了使得對持信譽卡購買的顧客比率p的95%的置信區(qū)間長度不超越0.2,樣本至少多大?E=?P=? N=(1.96)2*0.5*0.5/0.12=96.0497.區(qū)間估計內(nèi)容小結置信區(qū)間的含義;從抽樣分布求置信區(qū)間;給定精度,確定樣本大小。.Mean, , is unknownPopulationRandom SampleI am 95% confident that is between 40 & 60.Mean = 50Estimation ProcessSample.對總體模型的推斷另一種方式:假設檢驗參數(shù)估計的思緒:選擇一個適宜的模
13、型;假設檢驗的思緒:檢驗一個給定的模型。.PopulationAssume thepopulationmean age is 50.(Null Hypothesis)REJECTThe SampleMean Is 20SampleNull HypothesisHypothesis Testing ProcessNo, not likely!.從一個例子看假設檢驗的思緒摸球實驗:有放回地在一個袋子中延續(xù)摸6次,都是紅球,他能否接受“袋子中一半是紅球一半是白球的說法?為什么?假設我接受他的說法假設,那么我看到的景象樣本出現(xiàn)的能夠性是多少?假設這種能夠性太小,會是什么情況?.假設檢驗的根本概念H0:
14、 一半紅球一半白球。 或者p=0.5);H1:紅球白球不是各一半?;蛘遬不是0.5。原假設;備擇假設;選擇的態(tài)度:回絕?接受? (To be or not to be,)更多的例子,簡單假設和復合假設:.回絕域回絕域:哪些樣本出現(xiàn)后,他會回絕原假設?他建立他的回絕域的根據(jù)是什么?抽樣分布。所謂檢驗就是選擇一個回絕域。為什么這是一個問題?.他會犯什么錯誤?.H0: InnocentJury TrialHypothesis TestActual SituationActual SituationVerdictInnocentGuiltyDecisionH0 TrueH0 FalseInnocent
15、CorrectErrorDo NotRejectH01 - aType IIError (b)GuiltyErrorCorrectRejectH0Type IError(a)Power(1 - b)Result Possibilities.abReduce probability of one error and the other one goes up.a & b Have an Inverse Relationship.Neymann-Pearson原那么找一個不犯錯誤的檢驗???N-P原那么:控制犯第一類錯誤的概率。顯著程度:犯第一類錯誤的最大約率。啟示:回絕原假設、接受原假設?設置原假設和備擇假設的學問:一種藥品中含某元素超越0.01克為不合格。如何設置原假設? H0: 該藥品合格; H0:該藥品不合格。.一個例子一切結合食品公司的顧客一次購買金額的平均值是35美圓?H0: =35. H1: ?對容量為100的樣本,給定顯著程度=0.05, 選擇回絕域為滿足以下條件的樣本組成: .一個例子續(xù)計算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年校車租賃與駕駛員健康管理合同3篇
- 2025年度個人教育培訓貸款合同及課程安排4篇
- 鉆井工程課程設計英文
- 2024年學校人事檔案管理制度
- 2025年度鐵路職工住宅產(chǎn)權互換合同3篇
- 2025年度水電安裝與古村落保護與修復合同范本3篇
- 部編版南京某校七年級語文上冊第三單元第6課《課外古詩詞誦讀》教學設計(含2課時)
- 2003年北京市中考滿分作文《喝彩》9
- 年度硅-鋁絲材競爭策略分析報告
- 二零二五年車抵押貸款再融資合同模板3篇
- 割接方案的要點、難點及采取的相應措施
- 2025年副護士長競聘演講稿(3篇)
- 2025至2031年中國臺式燃氣灶行業(yè)投資前景及策略咨詢研究報告
- 原發(fā)性腎病綜合征護理
- (一模)株洲市2025屆高三教學質(zhì)量統(tǒng)一檢測 英語試卷
- 第三章第一節(jié)《多變的天氣》說課稿2023-2024學年人教版地理七年級上冊
- 2025年中國電科集團春季招聘高頻重點提升(共500題)附帶答案詳解
- 2025年度建筑施工現(xiàn)場安全管理合同2篇
- 建筑垃圾回收利用標準方案
- 2024年考研英語一閱讀理解80篇解析
- 樣板間合作協(xié)議
評論
0/150
提交評論