




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第五章 抽樣與參數(shù)估計學習內(nèi)容一、抽樣推斷概述二、抽樣分布及其應用三、常見的抽樣分布四、參數(shù)估計五、區(qū)間估計的計算學習目標1. 了解抽樣和抽樣分布的基本概念。2. 理解抽樣分布與總體分布的關(guān)系。3. 了解點估計的概念和估計量的優(yōu)良標準。4. 掌握總體均值、總體比例和總體方差的區(qū)間估計。一、抽樣推斷概述推斷統(tǒng)計的內(nèi)容抽樣推斷的過程統(tǒng)計推斷的基本假定a) 總體看作是一個隨機變量X,其概率分布為f(x)。b) 樣本看作是n個獨立的隨機變量(X1, X2, , Xn),每個都具有與總體X相同的分布。c) 樣本中每個個體必須取自同一總體, X1, X2, , Xn相互獨立。統(tǒng)計推斷涉及的概念參數(shù)與統(tǒng)計量
2、 參數(shù):描述總體分布特征的量,如平均數(shù),標準差。 統(tǒng)計量:由樣本觀察值算出的量,如 ,S2,S。 統(tǒng)計量是隨機變量。抽樣分布及其形成過程抽樣分布(概念要點)所有樣本指標(如均值、比例、方差等)所形成的分布稱為抽樣分布。抽樣分布是一種理論概率的分布。抽樣分布的結(jié)果來自容量相同的所有可能樣本。單選題樣本平均數(shù)和總體平均數(shù)( ) A、前者是一個確定值,后者是隨機變量 B、前者是隨機變量,后者是一個確定值 C、兩者都是隨機變量 D、兩者都是確定值抽樣推斷的理論基礎(chǔ)(1)大數(shù)定律a) 大數(shù)定律在統(tǒng)計中是指一切關(guān)于大量隨機現(xiàn)象之平均結(jié)果穩(wěn)定性的定理。 盡管單個隨機現(xiàn)象的具體表現(xiàn)不可避免地引起隨機偏差,然而
3、在大量隨機現(xiàn)象共同作用時,由于這些隨機偏差互相抵消、補償和拉平,致使總的平均結(jié)果趨于穩(wěn)定。 b) 為整個推斷統(tǒng)計提供了最基本的理論依據(jù)。猜硬幣賭局賭局1: 擲10次硬幣,賭正面朝上的頻率為0.4到0.6次。賭局2: 擲100次硬幣,賭正面朝上的頻率0.4到0.6次。賭局3: 擲1000次硬幣,賭正面朝上的頻率0.4到0.6次。貝努利大數(shù)定律設(shè)nA是n次獨立試驗中事件A發(fā)生的頻數(shù); p表示事件A 在每次試驗中發(fā)生的概率,則對于任意正數(shù)有:切比雪夫大數(shù)定律(2)中心極限定理 設(shè)從均值為,方差為 2的一個任意總體中抽取容量為n的樣本,當n充分大時,多次抽樣得到的樣本均值近似服從均值為、方差為2/n的
4、正態(tài)分布。(一) 大數(shù)定律揭示了大量隨機變量的平均結(jié)果,但并沒有涉及到隨機變量的分布規(guī)律。(二) 中心極限定理是指在一定的條件下,大量相互獨立的隨機現(xiàn)象的概率分布是以正態(tài)分布為極限的定理。(三) 中心極限定理則說明了許多隨機變量的分布是正態(tài)或近似正態(tài)的。棣莫弗-拉普拉斯定理a) 隨機變量取的概率為、取非的概率為q=1-p時,抽取個單位組成樣本。b) 出現(xiàn)的次數(shù)組成的隨機變量叫做服從二項分布的隨機變量。二、抽樣分布及其應用1. 樣本均值的抽樣分布現(xiàn)從總體中抽取n2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果如下表:所有樣本均值的均值和方差:式中:M為樣本數(shù)目。比較及結(jié)論
5、:1. 樣本均值的均值(數(shù)學期望)等于總體均值。2. 樣本均值的方差等于總體方差的1/n。樣本均值的分布與總體分布的比較在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布。一種理論概率分布。推斷總體均值的理論基礎(chǔ)。樣本均值的抽樣分布與中心極限定理當總體服從正態(tài)分布N (,2 )時,來自該總體的所有容量為n的樣本的均值 也服從正態(tài)分布, 的數(shù)學期望為,方差為2/n,即 N(,2/n)。核心結(jié)論:樣本均值的數(shù)學期望;樣本均值的方差樣本均值 的分布形式。 與總體分布有關(guān) 總體為正態(tài)分布,抽樣分布也為正態(tài),與樣本容量無關(guān)。b) 與樣本量有關(guān) 總體不是正態(tài)分布,樣本量越大(n30),
6、抽樣分布越接近正態(tài)分布。抽樣分布與總體分布的關(guān)系2. 樣本比例的抽樣分布比例:總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比。 不同性別的人與全部人數(shù)之比。 合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比。1) 容量相同的所有可能樣本的樣本比例的概率分布。2) 當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似。3) 是一種理論概率分布。4) 推斷總體比例的理論基礎(chǔ)。核心結(jié)論樣本比例的數(shù)學期望:;樣本比例的方差:重復抽樣3. 樣本方差的抽樣分布正態(tài)總體樣本方差的抽樣分布設(shè)總體服從正態(tài)分布N (,2 ), X1,X2, Xn為來自該正態(tài)總體的樣本,則樣本方差 s2 的分布為:將2(n 1)稱為
7、自由度為(n-1)的卡方分布。樣本方差抽樣分布(2分布)的形成過程4. 抽樣分布的應用例1 BTL商店的經(jīng)理想知道供貨商給他的電視質(zhì)量是否低于平均水平。他的研究表明電視機置換時間的均值為8.2年,標準差為1.1年。然后他隨機抽取50臺過去售出的電視機,發(fā)現(xiàn)這些電視機平均置換時間為7.8年。計算這50個隨機抽取的電視機的平均置換時間為7.8年或更短的概率。例2娛樂報道雜志發(fā)起了一項旨在增加訂閱的有獎活動。在過去,收到有獎活動參與材料的人中有26%最終參與了競賽,訂閱了雜志。當有獎活動的參與材料發(fā)放給500個隨機挑選的住戶時,估計新增訂閱結(jié)果的數(shù)量在125150(包括120和150)的概率。抽樣分
8、布應用練習某高校學生的入學考試成績均值為550分,標準差為250分,若從中隨機抽取100名,求: 樣本平均成績的數(shù)學期望和標準差值 分析樣本均值的抽樣分布 樣本平均成績在520分到580分之間的概率有多大? 樣本平均成績小于580分的概率有多大?三、常見的抽樣分布1. 正態(tài)分布a) 正態(tài)分布的數(shù)理統(tǒng)計學概念。如果隨機變量(X)的概率密度函數(shù)為:,則該隨機變量服從正態(tài)分布。b) 式中為總體標準差;為總體均數(shù);為圓周率,即3.14159···;e為自然對數(shù)的底,即2.71828···。密度函數(shù)的特性對稱性非負性2. 卡方分布設(shè)隨機變量相互
9、獨立,且都服從標準正態(tài)分布,則隨機變量:卡方分布的性質(zhì)a) 恒為正值 。b) 卡方分布的期望值是自由度n,方差為2n。c) 卡方分布具有可加性。卡方分布與正態(tài)分布的關(guān)系3. T分布T分布的性質(zhì)a) 不同的樣本容量, t分布有所不同。b) 大致對稱的鐘型形狀,但對于小樣本,它顯示出更大的方差(n/(n-2))。c) 分布的均值為 =0。d) 分布的標準差隨著樣本容量的變化而變化,但它是大于1的。e) 隨著樣本容的增大,趨近于標準正態(tài)分布。當n30時,二者之間的差異就很小了。正態(tài)分布、卡方分布與T分布的關(guān)系多選題T分布具有以下特征( ) A、均值取決于自由度,方差等于1 B、均值為零,方差小于1
10、C、均值為零,方差大于1 D、方差隨自由度的增加而降低 E、方差隨自由度的增加而增加4. F分布F分布的性質(zhì)a) 不對稱性。b) 和卡方分布一樣, 分布的值也是非負的。c) 分布的準確形狀取決于兩個不同的自由度。四、參數(shù)估計參數(shù)估計的方法被估計的總體參數(shù) 1. 點估計(概念要點)a) 從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計。 例如: 用樣本均值作為總體未知均值的估計值就是一個點估計。b) 點估計沒有給出估計值接近總體未知參數(shù)程度的信息。c) 點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等。2. 區(qū)間估計(概念要點)a) 根據(jù)一個樣本的觀察值
11、給出總體參數(shù)的估計范圍。b) 給出總體參數(shù)落在這一區(qū)間的概率。 例如: 總體均值落在5070之間,置信度為 95%。3. 置信區(qū)間 (confidence interval)a) 統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間。b) 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。c) 我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個。4. 置信水平a) 總體未知參數(shù)落在區(qū)間內(nèi)的概率。b) 表示為 (1 - ) % 為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的
12、概率。c) 常用的置信水平值有 99%、95%、90%。相應的 為0.01、0.05、0.10。置信區(qū)間與置信水平回顧:經(jīng)驗法則(落在總體均值某一區(qū)間內(nèi)的樣本)5. 影響區(qū)間寬度的因素a) 數(shù)據(jù)的離散程度,用 來測度。b) 樣本容量c) 置信水平 (1 - ),影響 Z 的大小。判斷題1) 有95%的樣本均值會落在總體真值的1.96個標準差的范圍之內(nèi)。2) 有95%的樣本均值所構(gòu)造的1.96個標準差的區(qū)間會包括總體真值。3) 某個樣本均值所構(gòu)造的1.96個標準差的區(qū)間包含總體真值的概率約為95%。6. 評價估計量的標準1)估計量用于估計總體某一參數(shù)的隨機變量。 如樣本均值,樣本比例、樣本中位數(shù)
13、等。 例如: 樣本均值就是總體均值的一個估計量。 如果樣本均值 x = 3 ,則 3 就是 的估計值。2)理論基礎(chǔ)是抽樣分布。無偏性:估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)。有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的估計量更有效。 一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)。 單選題無偏性是指( ) A、抽樣指標的平均數(shù)等于被估計的總體指標 B、當樣本容量n充分大時,樣本指標充分靠近總體指標 C、隨著n的無限增大,樣本指標與未知的總體指標之間的離差任意小的可能性趨于實際必然性 D、作為估計量的方差比其他估計量的方差小若甲估計量的方差小于乙估計量的方差,
14、則稱( ) A、甲是無偏估計量 B、乙是一致估計量 C、乙比甲有效 D、甲比乙有效五、區(qū)間估計的計算² 區(qū)間估計的內(nèi)容² 區(qū)間估計的計算a) 總體均值的區(qū)間估計b) 總體比率的區(qū)間估計c) 樣本容量的確定1. 總體均值的區(qū)間估計(正態(tài)總體,方差已知)a) 假定條件總體服從正態(tài)分布,且總體方差()已知。不是正態(tài)分布,可以由正態(tài)分布來近似 (n 30)。b) 使用正態(tài)分布統(tǒng)計量:c) 總體均值 在1-置信水平下的置信區(qū)間為:例 某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機抽取件,測得其平長度為2 1 . 4mm。已知總體標準差 =0.15mm,試建立該種零件平均長度的置信區(qū)間,給
15、定置信水平為0.95。2. 總體均值的區(qū)間估計(正態(tài)分布,方差未知,小樣本)a) 假定條件: 總體方差()未知??傮w必須服從正態(tài)分布。小樣本 (n < 30)。b) 使用 t 分布統(tǒng)計量:c) 總體均值 在1-置信水平下的置信區(qū)間為:例從一個正態(tài)總體中抽取一個隨機樣本, n=25,其均值x = 50 ,標準差 s =8。 建立總體均值m 的95 %的置信區(qū)間。例 已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間。(16只燈泡使用壽命的數(shù)據(jù):1510、1520、1480、1500、1450、1480、1510
16、、1520、1480、1490、1530、1510、1460、1460、1470、1470)3. 總體均值的區(qū)間估計(大樣本,方差未知)a) 假定條件總體方差() 未知。大樣本(n 30)。b) 使用正態(tài)分布統(tǒng)計量 z:c) 總體均值 在1- 置信水平下的置信區(qū)間為:【例】某大學從該校學生中隨機抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95的置信水平估計該大學全體學生平均每天參加體育鍛煉的時間(已知總體方差為36分鐘)。【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間。計算題假設(shè)已知某品牌電視
17、機顯像管壽命的標準差是500,但是其壽命均值是未知的。不過,顯像管壽命可以假設(shè)為近似服從正態(tài)分布。一個n15的樣本的壽命均值8 900小時。計算總體均值的:(a)95%置信區(qū)間;(b)90%置信區(qū)間。假設(shè)你希望估計去年某種消費品在每家零售店里的平均銷售額。零售店數(shù)量很多。如果總體是正態(tài)分布的且已知: $3425,s=$200,n =25;試計算其95%置信區(qū)間。4. 總體比率的區(qū)間估計a) 假定條件總體服從二項分布。大樣本(nP>=5,n(1- P)>=5)。b) 使用正態(tài)分布統(tǒng)計量:c) 總體比例的置信區(qū)間為:【例】某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機
18、選取了200人組成一個樣本。在對其進行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間。【例】某城市想要估計下崗職工中女性所占的比率,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比率的置信區(qū)間。5. 樣本容量的確定a) 確定樣本容量的公式根據(jù)“允許誤差”的公式推導而來。b) 抽樣平均誤差即樣本均值的標準差樣本容量越大,抽樣平均誤差越小。c) 允許誤差:d) 估計總體均值時樣本容量n為:e) 樣本容量n與總體方差 2、允許誤差E、可靠性系數(shù)z或t之間的關(guān)系為: 與總體方差成正比。 與允許誤差成反比。 與可靠性系數(shù)成正比。單選題在其他條件不變情況下,要使樣本均值的抽樣平均誤差為原來的1/3,則樣本單位數(shù)必須() A、增大到原來的3倍 B、增大到原來的9倍 C、增大到原來的6倍 D、也是原來的1/3【例】擁有工商管理學
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 地基買賣合同
- 委托咨詢服務協(xié)議書
- 競賽保密協(xié)議
- 北京物聯(lián)網(wǎng)技術(shù)合同
- 2024公司股東合作合同(32篇)
- 旅行社勞動用工合同
- 私人養(yǎng)殖場租賃合同
- 工作解決方案探討
- 離婚財產(chǎn)協(xié)議書覽
- 合作協(xié)議醫(yī)療器械
- DB1509T 0025-2024 肉牛舍設(shè)計與建筑技術(shù)規(guī)范
- 上海室內(nèi)裝飾施工合同示范文本2024年
- 2024年山東日照初中學業(yè)水平考試地理卷試題真題(精校打印版)
- 房地產(chǎn) -中建科工五大類型項目成本指標庫
- DB63T 2357-2024 危化品常壓儲罐安全管理規(guī)范
- 2024-2025學年初中信息技術(shù)(信息科技)七年級上冊蘇科版(2023)教學設(shè)計合集
- 合同工期延期補充協(xié)議書
- 2024小紅書保健品行業(yè)營銷通案
- 未來網(wǎng)絡(luò)支撐下的數(shù)字身份體系:產(chǎn)業(yè)和技術(shù)發(fā)展趨勢(2024年)定稿版本
- 新《卷煙營銷》理論知識考試題庫(附答案)
- 中考英語688高頻詞大綱詞頻表
評論
0/150
提交評論