




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、任課老師:禤宇明任課老師:禤宇明p基本概念基本概念n總體、個體、總體容量、樣本、樣本容量、抽樣、參總體、個體、總體容量、樣本、樣本容量、抽樣、參數(shù)、統(tǒng)計量數(shù)、統(tǒng)計量p抽樣方法抽樣方法n隨機、等距、分層隨機、等距、分層p抽樣分布抽樣分布n樣本平均數(shù):樣本平均數(shù):Z分布、分布、t分布分布n樣本方差:卡方分布、樣本方差:卡方分布、F分布分布p參數(shù)估計參數(shù)估計n點估計:充分性、無偏性、有效性、一致性點估計:充分性、無偏性、有效性、一致性n區(qū)間估計:顯著性水平、置信度、置信區(qū)間區(qū)間估計:顯著性水平、置信度、置信區(qū)間p總體總體(population):要研究的事物或現(xiàn)象的總體:要研究的事物或現(xiàn)象的總體p個
2、體個體(unit):組成總體的每個元素:組成總體的每個元素(成員成員)p總體容量總體容量(population size):一個總體中所含個體的數(shù)量:一個總體中所含個體的數(shù)量p樣本樣本(sample):從總體中抽取的部分個體:從總體中抽取的部分個體p樣本容量樣本容量(sample size):樣本中所含個體的數(shù)量:樣本中所含個體的數(shù)量p抽樣抽樣(sampling):為推斷總體的某些重要特征,需要從總:為推斷總體的某些重要特征,需要從總體中按一定抽樣技術抽取若干個體的過程體中按一定抽樣技術抽取若干個體的過程p參數(shù)參數(shù)(parameter):反映總體數(shù)據(jù)特征的量數(shù):反映總體數(shù)據(jù)特征的量數(shù)p統(tǒng)計量統(tǒng)
3、計量(statistic):反映樣本數(shù)據(jù)特征的量數(shù):反映樣本數(shù)據(jù)特征的量數(shù)n統(tǒng)計量是樣本的函數(shù),只依賴于樣本;樣本均值、樣本方差等都統(tǒng)計量是樣本的函數(shù),只依賴于樣本;樣本均值、樣本方差等都是統(tǒng)計量是統(tǒng)計量總體總體樣本樣本X參數(shù)統(tǒng)計量統(tǒng)計量參數(shù)估計參數(shù)估計差異檢驗差異檢驗p完全隨機地選取樣本,要求有總體中每一個個體完全隨機地選取樣本,要求有總體中每一個個體的詳盡名單,給總體的詳盡名單,給總體N個元素編號個元素編號n抽簽抽簽n隨機數(shù)字表隨機數(shù)字表p又稱系統(tǒng)抽樣又稱系統(tǒng)抽樣 (systematic sampling) n給總體給總體N個元素編號個元素編號n抽樣間距抽樣間距 kN/nn隨機確定起點隨機
4、確定起點 a (1a k)na, a+k, a+2k, , a+(n-1)kp受總體數(shù)據(jù)的受總體數(shù)據(jù)的周期性周期性的影響的影響p例:從例:從N800的總體中抽取的總體中抽取50個樣本個樣本p先將總體分成不同的先將總體分成不同的“層層”,然后在每一,然后在每一“層層”內(nèi)進行簡單隨機抽樣內(nèi)進行簡單隨機抽樣n分層原則:層內(nèi)變異要小,層間的變異要大分層原則:層內(nèi)變異要小,層間的變異要大n可防止簡單隨機抽樣造成的樣本構成與總體構成不成可防止簡單隨機抽樣造成的樣本構成與總體構成不成比例的現(xiàn)象。比例的現(xiàn)象。3.1 樣本平均數(shù)的分布樣本平均數(shù)的分布 sampling distribution of the m
5、eanp采用隨機抽樣的方法,從總體中抽取大小為采用隨機抽樣的方法,從總體中抽取大小為n的的樣本,計算出它的平均數(shù)樣本,計算出它的平均數(shù)X1,然后將這些個體放,然后將這些個體放回總體去,再次取回總體去,再次取n個個體,又可以計算出個個體,又可以計算出X2, 再將再將n個個體放回去,再抽取個個體放回去,再抽取n個個體,可以計算個個體,可以計算出無限個出無限個X,這些樣本平均數(shù),這些樣本平均數(shù)X所有可能值的概率所有可能值的概率分布叫平均數(shù)分布叫平均數(shù)X的抽樣分布的抽樣分布n總體方差已知總體方差已知n總體方差未知總體方差未知1 ,0,22212NnXnXZnNXxxxNXn即,則樣本平均數(shù)隨機抽取樣本
6、如果總體 nnnnxDxDxDnxDnnxDXDnnnxExExEnxxxEnxnEXEnniiniinnnii222222221212121211).(1)(.)()(1)(1)().(1)(.)()(1.11證:p中心極限定理中心極限定理Central Limit Theoremn設從均值為設從均值為 ,方差為方差為 2(有限)的任意一個總體中抽(有限)的任意一個總體中抽取大小為的樣本,當充分大時,樣本均值取大小為的樣本,當充分大時,樣本均值X的抽樣的抽樣分布近似服從均值為分布近似服從均值為 ,方差為方差為 2/的正態(tài)分布。的正態(tài)分布。p注:什么叫充分大呢?注:什么叫充分大呢?n總體偏離正
7、態(tài)越遠,則要求就越大。在實際應用中總體偏離正態(tài)越遠,則要求就越大。在實際應用中常要求常要求 30 或者或者 50 p樣本平均數(shù)的標準差稱為標準誤樣本平均數(shù)的標準差稱為標準誤nnSEnNXNXX222,,6maxmax221056. 6)()(,359. 4882. 360923.76,923.76131000,882. 360),882. 3 ,60()1314,60(131460maxmaxXXXXZZPXXPZXXZNNXn,解:0094. 0)35. 2()85. 05452()52()2(),85. 0 ,54() 1 (,85. 072. 0,72. 0506222ZPZPXPNXX
8、X解:p當總體方差當總體方差 2未知時,用未知時,用S2作為作為 2的估計值的估計值11)(11,122221ntnSXttntXXnStnSXtNXxxxniin分布,即的服從自由度為且其中,統(tǒng)計量為定義,為來自正態(tài)總體設樣本 ntttnnYXtYXnYNX1 , 02分布,記做的服從自由度為則隨機變量相互獨立,與,且,設p可以自由取值的變量的個數(shù)可以自由取值的變量的個數(shù)n任意說出三個整數(shù)任意說出三個整數(shù) n任意說出三個和為任意說出三個和為100的整數(shù)的整數(shù)p對稱:左側為負,右側為正,均值為對稱:左側為負,右側為正,均值為0p- t 30時時, t分布為接近正態(tài)分布,方差分布為接近正態(tài)分布,
9、方差1,nn45時時, t分布與正態(tài)分布沒有多大差異分布與正態(tài)分布沒有多大差異n在小樣本在小樣本n 2)p連續(xù)型分布連續(xù)型分布p例例4-4 P108df = 5,求,求 = 0.05和和 = 0.01時的單側臨界值時的單側臨界值p解:解: nPn2222臨界值變量在不同自由度下的列出了09.15)5(07.11)5(201. 0205. 0 2121212212,nnFFFnnnYnXFYXnYnX分布,記做的,第二自由度為服從第一自由度為則稱隨機變量相互獨立,與,且設1, 11, 1111111111111,212221222121222221211222222212111222212221
10、212222222221221211212222221212112121nnFSSFnnFSSnSnnSnnnnnFnSnnSnSNYyyySNXxxxnn時,當,方差為來自總體樣本,方差為來自總體設樣本pF(n1,n2)分布形態(tài)是正偏態(tài)分布,形式隨分布形態(tài)是正偏態(tài)分布,形式隨n1,n2不同而不同,隨不同而不同,隨n1,n2的增加而漸趨正態(tài)分布的增加而漸趨正態(tài)分布pF為兩個方差比率,所以為正值為兩個方差比率,所以為正值pn1=1,n2任意時,任意時,F(xiàn)值與自由度為值與自由度為n2的的t值的平方值的平方相等,即相等,即F(1,n2) = t2(n2)pF (n1,n2)=1/F1- (n2,n1
11、)pF分布是統(tǒng)計學家費歇爾分布是統(tǒng)計學家費歇爾(R. A. Fisher)于于1924年首年首先發(fā)現(xiàn)的先發(fā)現(xiàn)的n假設檢驗假設檢驗n區(qū)間估計區(qū)間估計n方差分析方差分析n回歸分析回歸分析p根據(jù)最大允許誤差確定樣本容量根據(jù)最大允許誤差確定樣本容量2222222212dppzndStndznzndXdznX或同理有,最大允許誤差由樣本平均數(shù)分布p樣本容量樣本容量n,總體方差,總體方差 2,允許誤差,允許誤差d,可靠性系,可靠性系數(shù)數(shù)Z /2的關系的關系n總體方差越大,需要的樣本容量越大;總體方差越大,需要的樣本容量越大;n允許誤差越大,需要的樣本容量越?。辉试S誤差越大,需要的樣本容量越??;n可靠性系數(shù)
12、越大,需要的樣本容量越大;可靠性系數(shù)越大,需要的樣本容量越大;p例:要使例:要使95%置信區(qū)間的允許誤差為置信區(qū)間的允許誤差為5,應選取多,應選取多大的樣本容量?假定總體的標準差為大的樣本容量?假定總體的標準差為25。p例:例: 一家廣告公司想估計某類商店去年所花的平一家廣告公司想估計某類商店去年所花的平均廣告費有多少。檢驗表明,總體方差約為均廣告費有多少。檢驗表明,總體方差約為1800000。如置信度取。如置信度取95,并要使估計值處在總,并要使估計值處在總體平均值附近體平均值附近500元的范圍內(nèi),這家廣告公司應取元的范圍內(nèi),這家廣告公司應取多大的樣本?多大的樣本?p例:一家市場調研公司想估
13、計某地區(qū)有彩色電視例:一家市場調研公司想估計某地區(qū)有彩色電視機的家庭所占的比例。該公司希望對機的家庭所占的比例。該公司希望對p的估計誤的估計誤差不超過差不超過0.05,要求的可靠程度為,要求的可靠程度為95%,應取多,應取多大容量的樣本大容量的樣本?p例:例: 一項調查中,總體比率的計劃值為一項調查中,總體比率的計劃值為0.35,則,則當允許的最大絕對誤差為當允許的最大絕對誤差為0.05時,在求其時,在求其95%置置信區(qū)間時應采用多大的樣本容量?信區(qū)間時應采用多大的樣本容量?設總體有待估參數(shù)設總體有待估參數(shù) ,自總體中抽取樣本,自總體中抽取樣本x1,x2,xnp點估計點估計 point est
14、imaten用樣本的某一統(tǒng)計量估計用樣本的某一統(tǒng)計量估計 如用樣本均值估計總體均值如用樣本均值估計總體均值p區(qū)間估計區(qū)間估計 interval estimaten求出一定概率下求出一定概率下 的取值范圍的取值范圍統(tǒng)計量作為估計量統(tǒng)計量作為估計量 estimatorp充分性充分性 sufficiencyn用到樣本的所有數(shù)據(jù)用到樣本的所有數(shù)據(jù)p無偏性無偏性 unbiasednessn估計值的平均值與真值一致估計值的平均值與真值一致p有效性有效性 efficiencyn當總體參數(shù)的無偏估計量有不止一個統(tǒng)計量時,無偏當總體參數(shù)的無偏估計量有不止一個統(tǒng)計量時,無偏估計變異性最小者有效性高,變異大者有效性
15、低估計變異性最小者有效性高,變異大者有效性低p一致性一致性 consistencyn當樣本容量無限增大時,估計值越來越接近所估計的當樣本容量無限增大時,估計值越來越接近所估計的總體參數(shù)總體參數(shù)p哪個是更好的估計量?哪個是更好的估計量?n算術平均數(shù)算術平均數(shù) vs. 中數(shù)中數(shù) nnnxExExEnxxxEnxnEXESXxxxNXnnniin).(1)(.)()(1.11,2121122212證:的無偏估計量是總體方差而樣本方差的無偏估計量,是總體均值則樣本平均數(shù),隨機抽取樣本如果總體p區(qū)間估計的原理區(qū)間估計的原理n樣本統(tǒng)計量的分布規(guī)律樣本統(tǒng)計量的分布規(guī)律p顯著性水平顯著性水平 signific
16、ance leveln也叫置信系數(shù),指估計總體參數(shù)可能落入某區(qū)間時犯也叫置信系數(shù),指估計總體參數(shù)可能落入某區(qū)間時犯錯誤的概率錯誤的概率n 通常有三個標準:通常有三個標準: :0.05, 0.01, 0.001 1- :0.95, 0.99, 0.999p置信水平、置信度置信水平、置信度 confidence leveln1- p置信區(qū)間置信區(qū)間 confidence intervaln指在某一置信水平時,總體參數(shù)所在的區(qū)域距離或區(qū)指在某一置信水平時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度域長度),(1,1,1,1,22222222222nZXnZXnZXnZXPZnXZPZZZPnXZnNXNX的置
17、信區(qū)間為置信水平為的已知時,總體均值方差因此,總體正態(tài)分布且對給定顯著性水平已知77.8332 .7299.38.8226 .7395.1018. 13607. 724. 21007. 799.95.7978361007. 7121212121置信區(qū)間置信區(qū)間的樣本估計總體參數(shù)用解:求標準誤置信區(qū)間。和的求總體參數(shù),兩個樣本,和隨機抽取。從這個總體中布,例:已知總體為正態(tài)分nnnXXnnXXnZXnZX22,54.9146.6899.77.8823.7195.80588709483659995887094836551002置信區(qū)間置信區(qū)間解:的置信區(qū)間。和的求全體考生成績均值,名考生的成績?yōu)椋?/p>
18、從中抽得差試全體考生成績總體方例:已知某校的一次考XnZXnZX22,nStXnStXntnSXtxxxn2221,1,為置信區(qū)間來自正態(tài)總體,則設樣本83.81,17.62,306. 2)8(, 9,79.12,72856570687450629183922205. 0nStXnStXtnSX解:成績均值做區(qū)間估計。試對全年級該次測驗的,個考生的成績?yōu)闇y試后從中抽取的,學生進行英語水平測試例:某校對高中一年級nSZXnSZXtZnStXnStXn222222,30置信區(qū)間為,即代替上式中的也可以用近似正態(tài)分布,因為此時樣本均值服從時,置信區(qū)間仍為當2121221222212122212221222212121222221,111111111 , 0,nnnnnnnSnSnSnSnPSnPSnXZNXZNX的置信區(qū)間為的置信水平為因此,對給定顯著性水平而那么已知總體)差的范圍(取試確定語文成績的標準。,份,其成績?yōu)榭荚囍?,隨機抽取例:某校高中語文畢業(yè)05. 08277859088837
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 屋面水泥瓦施工方案
- 耐腐蝕泵項目風險識別與評估綜合報告
- 青少年心理健康與行為發(fā)展教育實踐
- 浙江華遠:盈利預測報告及審核報告
- 金浦鈦業(yè):上海東邑酒店管理有限公司2024年1-9月財務報表審計報告
- 山東石雕六角亭施工方案
- 埋地涂塑鋼管安裝施工方案
- 項目監(jiān)理實施方案
- 黃土邊坡錨桿施工方案
- 電氣設備二次搬運施工方案
- MOOC 高等數(shù)學(上)-西北工業(yè)大學 中國大學慕課答案
- 部編版小學語文四年級下冊第二單元教材分析
- 等差數(shù)列公開課課件
- 小學生學習習慣養(yǎng)成知識講座(定)
- 2024年OTC焊接機器人基本操作培訓
- 合肥通用職業(yè)技術學院單招《職業(yè)技能測試》參考試題庫(含答案)
- 小學五年級《美術》上冊知識點匯總
- 生物工程設備課件
- 提高團隊協(xié)作與溝通技巧
- 2022版高中生物必修二第一章測試題及答案解析
- 《商標基礎知識》課件
評論
0/150
提交評論