版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章做出結(jié)論:估計(jì)數(shù)學(xué)與信息科學(xué)學(xué)院王坤TELellowang@163.統(tǒng)計(jì)學(xué)概念和方法統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第1頁(yè)!總體是由總體分布來(lái)刻畫(huà)的。在實(shí)際問(wèn)題中,我們需要通過(guò)樣本來(lái)估計(jì)總體分布的類型和參數(shù)。這就是所謂統(tǒng)計(jì)推斷研究的問(wèn)題。統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。例如,假設(shè)某城市人均年收入服從正態(tài)分布N(μ,σ2),但參數(shù)μ,σ2的具體取值并不知道,需要通過(guò)樣本來(lái)估計(jì)。根據(jù)樣本來(lái)估計(jì)總體分布所包含的未知參數(shù),稱為參數(shù)估計(jì)。參數(shù)估計(jì)的兩種形式:點(diǎn)估計(jì)和區(qū)間估計(jì)。統(tǒng)計(jì)推斷統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第2頁(yè)!6.1樣本統(tǒng)計(jì)量和總體參數(shù)在統(tǒng)計(jì)中,我們把所研究對(duì)象的全體元素組成的集合稱為母體或總體。母體中每一個(gè)元素稱為個(gè)體??傮w依其包含的個(gè)體總數(shù)分為有限總體和無(wú)限總體??傮w中抽取出來(lái)的一部分個(gè)體的集合稱為子樣或者樣本。統(tǒng)計(jì)量就是根據(jù)分布或數(shù)據(jù)計(jì)算出來(lái)的一個(gè)量。常用的樣本統(tǒng)計(jì)量是樣本均值、樣本百分比P和樣本標(biāo)準(zhǔn)差s。通常用英文字母標(biāo)記樣本統(tǒng)計(jì)量??傮w參數(shù)通常包括總體均值μ、總體百分比Π和總體標(biāo)準(zhǔn)差σ。通常用希臘字母標(biāo)記總體樣本量。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第3頁(yè)!6.2點(diǎn)估計(jì)點(diǎn)估計(jì)是一個(gè)用來(lái)估計(jì)總體參數(shù)的數(shù)。例如假設(shè)你要研究平均一個(gè)大學(xué)生月消費(fèi)情況,得到的結(jié)果有以下兩種:“700元”或者“620元到800元之間”。這兩種結(jié)果代表了估計(jì)總體參數(shù)的兩種不同方式。最簡(jiǎn)單的是點(diǎn)估計(jì),像“700元”這個(gè)結(jié)果就是一個(gè)點(diǎn)估計(jì)了?!?20元到800元之間”是一個(gè)區(qū)間估計(jì)。常用的點(diǎn)估計(jì)方法有矩估計(jì)、極大似然估計(jì)等。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第4頁(yè)!例德軍有多少坦克?第二次世界大戰(zhàn)期間,盟軍非常想知道德軍總共制造了多少輛坦克。德軍制造坦克時(shí)是墨守成規(guī)的,他們把坦克從1開(kāi)始進(jìn)行了連續(xù)的編號(hào)。戰(zhàn)爭(zhēng)中,盟軍繳獲了一些敵軍坦克,并記錄了它們的生產(chǎn)編號(hào)。那么,怎樣用這些坦克編號(hào)來(lái)估計(jì)坦克總數(shù)呢?這里,總體參數(shù)是未知的生產(chǎn)出的坦克總數(shù)N,而繳獲的坦克編號(hào)是樣本。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第5頁(yè)!6.3區(qū)間估計(jì)由于無(wú)法把握點(diǎn)估計(jì)與總體參數(shù)實(shí)際值之間的差距,為了解決這個(gè)問(wèn)題,統(tǒng)計(jì)學(xué)家提出了區(qū)間估計(jì)。區(qū)間估計(jì)又稱置信區(qū)間,是用來(lái)估計(jì)參數(shù)的取值范圍的。一個(gè)總體參數(shù)的置信區(qū)間是用一個(gè)樣本統(tǒng)計(jì)量加、減抽樣誤差得到的:統(tǒng)計(jì)量-抽樣誤差到統(tǒng)計(jì)量+抽樣誤差例如假設(shè)在一群人中,相信中國(guó)產(chǎn)品質(zhì)量好的人占58%,抽樣誤差為±3%。則總體百分點(diǎn)的置信區(qū)間為:58-3到58+3如果在一次大選中某人的支持率為55%,而置信水平0.95上的置信區(qū)間是(50%,60%),那么他的真實(shí)支持率有百分之九十五的機(jī)率落在百分之五十和百分之六十之間,因此他的真實(shí)支持率不足一半的可能性小于百分之五。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第6頁(yè)!置信區(qū)間,它由奈曼(Neymann)于1934年提出的。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第7頁(yè)!總體均值μ的置信區(qū)間由n個(gè)獨(dú)立的、服從正態(tài)分布的觀測(cè)組成的一個(gè)樣本,樣本均值記為,樣本標(biāo)準(zhǔn)差記為s。則總體均值的置信區(qū)間為:這里t*=t(1-a)/2是t變量的一個(gè)值,a為置信水平。t*=t(1-a)/2可以從自由度為n-1的t分布的統(tǒng)計(jì)表中查到。若總體的標(biāo)準(zhǔn)差σ是已知的,那么可以用σ去代替上述公式中的樣本標(biāo)準(zhǔn)差s,同時(shí)用來(lái)自正態(tài)分布的z*代替t分布中的t*。于是置信區(qū)間為:當(dāng)z*=1.96時(shí),它是一個(gè)95%的置信區(qū)間。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第8頁(yè)!統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第9頁(yè)!小結(jié)樣本統(tǒng)計(jì)量和總體參數(shù)點(diǎn)估計(jì)區(qū)間估計(jì)統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第10頁(yè)!由于一個(gè)來(lái)自樣本的特別的估計(jì)量絕不會(huì)精確地等于總體參數(shù)的真值,所以問(wèn)某一個(gè)值是否為好的估計(jì)值是沒(méi)有意義的,而可以問(wèn)的是計(jì)算估計(jì)值的方法是不是一個(gè)好方法。一個(gè)好的估計(jì)方法可以這樣被定義:如果在無(wú)數(shù)個(gè)樣本上應(yīng)用該估計(jì)方法,得到的樣本統(tǒng)計(jì)量估計(jì)值的均值等于總體參數(shù)的均值(無(wú)偏估計(jì))。一般說(shuō)來(lái),樣本均值是總體均值的一個(gè)好的估計(jì)(無(wú)偏估計(jì)),比用樣本中位數(shù)估計(jì)總體均值要好。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第11頁(yè)!方法1:先找到被繳獲坦克編號(hào)的平均值,并認(rèn)為這個(gè)值是全部編號(hào)的重點(diǎn)。因此樣本均值乘以2就是總數(shù)的一個(gè)估計(jì)。這種估計(jì)N的缺點(diǎn)是不能保證均值的2倍一定大于記錄中的最大編號(hào)。方法2:用觀測(cè)到的最大編號(hào)乘以因子1+1/n,其中n是被繳獲坦克個(gè)數(shù)。例如,假設(shè)俘獲了10輛坦克,其中最大編號(hào)是50,那么坦克總數(shù)的一個(gè)估計(jì)是(1+1/10)×50=55。這種方法的確用于二戰(zhàn)中。從戰(zhàn)后發(fā)現(xiàn)的德軍記錄看,盟軍的估計(jì)值非常接近所生產(chǎn)的坦克的真實(shí)值。想一想,這個(gè)例子中,對(duì)戰(zhàn)爭(zhēng)、坦克的部署及俘獲作了哪些假設(shè)?這些坦克必須隨機(jī)地分布于各個(gè)戰(zhàn)場(chǎng)并隨機(jī)地被俘獲。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第12頁(yè)!因?yàn)榻y(tǒng)計(jì)學(xué)家有某種程度的信心認(rèn)為這個(gè)區(qū)間會(huì)包含真正的固定的參數(shù)值,所以給它取名為置信區(qū)間。如果我們收集了許多不同的樣本,并對(duì)每個(gè)樣本都構(gòu)造了一個(gè)置信區(qū)間。這些置信區(qū)間有足夠的寬度使他們中的95%包含了總體百分點(diǎn)的真值,而5%沒(méi)包含,則95%這個(gè)值就稱為置信水平。如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含真值,5%的區(qū)間不包含真值,那么這些用該方法構(gòu)造的區(qū)間都叫做置信水平為95%的置信區(qū)間。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第13頁(yè)!總體百分比的置信區(qū)間從一個(gè)大的總體抽取一個(gè)由n個(gè)觀測(cè)值組成的隨機(jī)樣本,并用P來(lái)標(biāo)記樣本百分比,那么總體百分比π的一個(gè)95%置信區(qū)間為:到一個(gè)快速計(jì)算95%置信區(qū)間的近似方法是令P=50,同時(shí)四舍五入1.96到2,得到置信區(qū)間:到如果要把誤差控制在3左右,那么要求樣本含有1111個(gè)觀測(cè)值。這就是為什么大多數(shù)問(wèn)卷調(diào)查中樣本要求1200個(gè)響應(yīng)者的原因。
統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第14頁(yè)!例在一個(gè)大公司里的49名雇員的樣本中,這些雇員一年中平均有7.0天在生病,其標(biāo)準(zhǔn)差為2.5天。根據(jù)上述公式,我們可以得到雇員一年中平均生病天數(shù)的95%置信區(qū)間為:這里t*=t0.025(48)=2.01
統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第15頁(yè)!影響置信區(qū)間的因素樣本的觀測(cè)值個(gè)數(shù)影響著置信區(qū)間的長(zhǎng)度。大的樣本產(chǎn)生較短的置信區(qū)間,小的樣本產(chǎn)生較長(zhǎng)的置信區(qū)間。置信區(qū)間的長(zhǎng)度還受置信水平的影響。低的置信水平(如90%)產(chǎn)生較短的區(qū)間,高的置信水平(如99%)產(chǎn)生較長(zhǎng)的區(qū)間。短的置信區(qū)間能比長(zhǎng)的置信區(qū)間提供更多的有關(guān)總體參數(shù)的信息。統(tǒng)計(jì)學(xué)概念和方法-第6章共17頁(yè),您現(xiàn)在瀏覽的是第16頁(yè)!思考與問(wèn)題統(tǒng)計(jì)推斷的目的是什么?通過(guò)樣本來(lái)估計(jì)總體分布的類型和參數(shù)。由樣本計(jì)算出來(lái)的均值稱為什么?有一個(gè)無(wú)偏統(tǒng)計(jì)估計(jì)是什么意思?對(duì)來(lái)自同一總體的許多不
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年工程筒燈項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模稿
- 2025年海洋油氣開(kāi)采模塊項(xiàng)目提案報(bào)告模稿
- 2024-2025學(xué)年邢臺(tái)市柏鄉(xiāng)縣數(shù)學(xué)三上期末復(fù)習(xí)檢測(cè)模擬試題含解析
- 2025年檢測(cè)設(shè)備項(xiàng)目申請(qǐng)報(bào)告
- 2025年商業(yè)專用設(shè)備:條碼設(shè)備項(xiàng)目申請(qǐng)報(bào)告模板
- 專業(yè)求職信九篇
- 2024-2025學(xué)年突泉縣三上數(shù)學(xué)期末考試模擬試題含解析
- 中學(xué)教師辭職報(bào)告15篇
- 2025年衛(wèi)浴樹(shù)脂項(xiàng)目提案報(bào)告
- 大一新生軍訓(xùn)動(dòng)員大會(huì)心得10篇
- (八省聯(lián)考)2025年高考綜合改革適應(yīng)性演練 語(yǔ)文試卷(含答案解析)
- GB/T 45002-2024水泥膠砂保水率測(cè)定方法
- 茶園管理服務(wù)合同范例
- 藥劑科工作人員的專業(yè)提升計(jì)劃
- 貸款用設(shè)備購(gòu)銷合同范例
- 公務(wù)員行測(cè)真題題庫(kù)及答案
- 部隊(duì)保密安全課件
- 園林施工技術(shù)創(chuàng)新-洞察分析
- 湖北省黃岡市2023-2024學(xué)年高二上學(xué)期期末調(diào)研考試 地理 含解析
- 醫(yī)院窗簾、隔簾采購(gòu) 投標(biāo)方案(技術(shù)方案)
- 期末檢測(cè)卷(試題)-2024-2025學(xué)年三年級(jí)上冊(cè)數(shù)學(xué)人教版
評(píng)論
0/150
提交評(píng)論