版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
抽樣推斷概述第1頁,課件共61頁,創(chuàng)作于2023年2月第一節(jié)抽樣推斷概述
指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會一、抽樣推斷按照隨機原則從總體中抽取一部分單位進行觀察,并依據所獲得數據的處理結果,對總體的數量特征做出具有一定可靠程度的估計和判斷,從而達到對總體的分布狀況及其數量特征認識的目的。第2頁,課件共61頁,創(chuàng)作于2023年2月統(tǒng)計推斷全及總體指標:參數(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣推斷第3頁,課件共61頁,創(chuàng)作于2023年2月按隨機原則抽取樣本單位以樣本的數量特征推斷總體的數量特征抽樣推斷產生抽樣誤差,但抽樣誤差可以事先計算并控制抽樣推斷的特點第4頁,課件共61頁,創(chuàng)作于2023年2月(1)用于無法采用或不必采用全面調查的現象;(2)對全面調查的結果進行復核;(3)生產過程的質量控制;(4)對總體的假設進行檢驗。抽樣推斷的應用第5頁,課件共61頁,創(chuàng)作于2023年2月設計抽樣方案抽取樣本單位收集樣本數據計算樣本統(tǒng)計量推斷總體參數抽樣推斷的一般步驟第6頁,課件共61頁,創(chuàng)作于2023年2月二、抽樣推斷的基本概念全及總體抽樣總體又稱總體或母體,是所要認識研究對象的全體,它由具有某種共同性質或特征的單位所組成。常用N表示全及總體的單位數目。又稱樣本或子樣,是指從全及總體中按照隨機原則抽取的那部分個體的組合。抽樣總體的單位數稱為樣本容量,通常用n表示。1<n<N
。例如:在100萬戶居民中,隨機抽取1000戶居民進行家庭收支情況調查,其中的100萬戶居
民就是全及總體,而被抽中的1000戶居民則構成抽樣總體。n≥30稱為大樣本,n
<30稱為小樣本.n/N稱為抽樣比.第7頁,課件共61頁,創(chuàng)作于2023年2月設總體中個總體單位某項標志的標志值分別為,其中具有某種屬性的有個單位,不具有某種屬性的有個單位,則⒈總體平均數(又叫總體均值):根據全及總體各個單位的標志值或標志特征所計算的反映總體某種屬性的綜合指標,又稱總體參數。全及指標第8頁,課件共61頁,創(chuàng)作于2023年2月⒉總體單位標志值的標準差:⒊總體單位標志值的方差:第9頁,課件共61頁,創(chuàng)作于2023年2月⒋總體成數:⒌總體是非標志的標準差:⒍總體是非標志的方差:第10頁,課件共61頁,創(chuàng)作于2023年2月設樣本中個樣本單位某項標志的標志值分別為,其中具有和不具有某種屬性的樣本單位數目分別為和個,則⒈樣本平均數(又叫樣本均值):指根據抽樣總體各個單位的標志值或標志特征計算的綜合指標,又被稱為統(tǒng)計量,它是隨機變量。抽樣指標第11頁,課件共61頁,創(chuàng)作于2023年2月⒉樣本單位標志值的標準差:⒊樣本單位標志值的方差:為自由度為的無偏估計為的無偏估計第12頁,課件共61頁,創(chuàng)作于2023年2月⒋樣本成數:⒌樣本單位是非標志的標準差:⒍樣本單位是非標志的方差:為的無偏估計為的無偏估計第13頁,課件共61頁,創(chuàng)作于2023年2月抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣不重復抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數N不變,同一單位可能多次被抽中??傮w單位數減少n,同一單位只可能被抽中一次。根據取樣方式不同,可分為:第14頁,課件共61頁,創(chuàng)作于2023年2月三、抽樣誤差
1、統(tǒng)計誤差的種類統(tǒng)計誤差是指統(tǒng)計數據與客觀實際數量之間的差距。有兩種情況:(1)登記性誤差。指在調查、整理過程中,由于各種主觀原因引起的誤差。(2)代表性誤差。指由于樣本單位的結構情況不足以代表總體所產生的誤差。又分兩種:第15頁,課件共61頁,創(chuàng)作于2023年2月①系統(tǒng)性誤差。由于違反了抽樣調查的隨機原則而產生的誤差。②隨機性誤差。由于遵守抽樣的隨機原則,但可能抽到不同的樣本而產生的誤差。又分兩種:實際誤差:某一樣本指標與總體指標之間的差異;平均誤差:所有可能出現的樣本指標與總體指標的平均離差。第16頁,課件共61頁,創(chuàng)作于2023年2月舉例計算抽樣平均誤差設有4個工人,每人的日產量分別為40、50、70、80,現隨機抽選2人,求平均日產量,用以代表4人總體的平均日產量??傮w平均日產量總體標準差第17頁,課件共61頁,創(chuàng)作于2023年2月序號樣本變量樣本平均數平均數離差離差平方和1234567891011121314151640,4040,5040,7040,8050,4050,5050,7050,8070,4070,5070,7070,8080,4080,5080,7080,8040455560455060655560707560657580-20-15-50-15-1005-501015051520400225250225100025250100225025225400和-960-2000第18頁,課件共61頁,創(chuàng)作于2023年2月重復抽樣條件下:樣本平均數的平均數樣本平均誤差第19頁,課件共61頁,創(chuàng)作于2023年2月序號樣本變量樣本平均數平均數離差離差平方和1234567891011121314151640,5040,7040,8050,4050,7050,8070,4070,5070,8080,4080,5080,70455560456065556075606575-15-50-1505-50150515225250225025250225025225和-720-1000第20頁,課件共61頁,創(chuàng)作于2023年2月不重復抽樣條件下:樣本平均數的平均數樣本平均誤差第21頁,課件共61頁,創(chuàng)作于2023年2月四、抽樣平均誤差的計算⒈樣本平均數的抽樣平均誤差當N≥500時,有重復抽樣時:不重復抽樣時:第22頁,課件共61頁,創(chuàng)作于2023年2月⒉樣本成數的抽樣平均誤差重復抽樣時:不重復抽樣時:當N≥500時,有抽樣平均誤差的計算公式第23頁,課件共61頁,創(chuàng)作于2023年2月以上例驗證抽樣誤差的公式:重復抽樣條件下不重復抽樣條件下第24頁,課件共61頁,創(chuàng)作于2023年2月關于總體方差的估計方法用過去同類問題全面調查或抽樣調查的經驗數據代替;用樣本標準差代替總體標準差,用代替。抽樣平均誤差的計算公式第25頁,課件共61頁,創(chuàng)作于2023年2月影響抽樣誤差的因素總體各單位標志值的差異程度(即標準差的大?。?/p>
越大,抽樣誤差越大;樣本單位數的多少:
越大,抽樣誤差越?。怀闃臃椒ǎ翰恢貜统闃拥某闃诱`差比重復抽樣的抽樣誤差?。怀闃咏M織方式:簡單隨機抽樣的誤差最大。第26頁,課件共61頁,創(chuàng)作于2023年2月例1:已知某一總體的平均數未知,總體方差為0.09,現簡單隨機抽取4個單位,其樣本單位的標志值為15.7、16.3、15.9、16.1,試求其抽樣誤差。第27頁,課件共61頁,創(chuàng)作于2023年2月例2:從一批產品中隨機抽取100件,測得一級品為95件,試求一級品率的抽樣誤差。第28頁,課件共61頁,創(chuàng)作于2023年2月抽樣極限誤差指在一定的概率保證程度下,抽樣指標與總體指標之間抽樣誤差的最大可能范圍,也稱作抽樣允許誤差。常用△表示。上式表明,樣本平均數(成數)是以總體平均數(成數)為中心,,在相應的區(qū)間內變動。第29頁,課件共61頁,創(chuàng)作于2023年2月由于總體成數和總體平均數是未知的,它要求靠實測的抽樣平均數和抽樣成數來估計,因而抽樣誤差的實際意義是希望總體平均數(成數)落在某個已知的范圍內。抽樣極限誤差所以前面的不等式應變換為:在一個特定的全及總體中,當抽樣方法和樣本容量固定時,抽樣平均誤差是一個定值,因此,抽樣極限誤差通常以抽樣平均誤差為標準單位來衡量。即抽樣極限誤差通常表示為抽樣平均誤差的多少倍。
由于t值與樣本估計值落入允許誤差范圍內的概率有關,因此,t
也稱為概率度。第30頁,課件共61頁,創(chuàng)作于2023年2月抽樣估計的置信度抽樣指標和總體指標的誤差不超過一定范圍的概率大小,我們將它稱之為概率保證程度,也叫抽樣估計的置信度,一般用F(t)表示。即:置信度t值與相應的概率保證程度存在一一對應關,常用t值及相應的概率保證程度為:
t值概率保證程度
1.000.68271.960.95002.000.95453.000.9973在大樣本下第31頁,課件共61頁,創(chuàng)作于2023年2月68.27%95.45%99.73%抽樣極限誤差與置信度第32頁,課件共61頁,創(chuàng)作于2023年2月第二節(jié)參數估計
也叫抽樣估計,就是根據樣本指標數值對總體指標數值作出估計或推斷。
參數估計通常,把用來估計總體特征的樣本指標叫估計量或統(tǒng)計量,待估計的總體指標叫總體參數。方法
點估計區(qū)間估計第33頁,課件共61頁,創(chuàng)作于2023年2月點估計量的優(yōu)良標準
無偏性、有效性、一致性第34頁,課件共61頁,創(chuàng)作于2023年2月區(qū)間估計給出一個區(qū)間(置信區(qū)間)并推斷真正的參數以一定的概率存在于這個區(qū)間的方法。第35頁,課件共61頁,創(chuàng)作于2023年2月以樣本統(tǒng)計量為中心,以抽樣平均誤差為距離單位,可以構造一個區(qū)間,并可以一定的概率保證待估計的總體參數落在這個區(qū)間之中。區(qū)間越大,則概率保證程度越高。區(qū)間估計原理第36頁,課件共61頁,創(chuàng)作于2023年2月總體平均數的區(qū)間估計表達式其中,為極限誤差第37頁,課件共61頁,創(chuàng)作于2023年2月步驟⒈計算樣本平均數;⒉搜集總體方差的經驗數據;或計算樣本標準差,即總體平均數的區(qū)間估計第38頁,課件共61頁,創(chuàng)作于2023年2月步驟⒊計算抽樣平均誤差:重復抽樣時:
不重復抽樣時:總體平均數的區(qū)間估計第39頁,課件共61頁,創(chuàng)作于2023年2月步驟⒋計算抽樣極限誤差:⒌確定總體平均數的置信區(qū)間:總體平均數的區(qū)間估計第40頁,課件共61頁,創(chuàng)作于2023年2月【例A】某企業(yè)生產某種產品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調查他們的當日產量,要求在95﹪的概率保證程度下,估計該廠全部工人的日平均產量和日總產量??傮w平均數的區(qū)間估計第41頁,課件共61頁,創(chuàng)作于2023年2月按日產量分組(件)組中值(件)工人數(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計—100126004144100名工人的日產量分組資料第42頁,課件共61頁,創(chuàng)作于2023年2月解:第43頁,課件共61頁,創(chuàng)作于2023年2月則該企業(yè)工人人均產量及日總產量的置信區(qū)間為:即該企業(yè)工人人均產量在124.8024至127.1976件之間,其日總產量在124802至127198件之間,估計的可靠程度為95﹪第44頁,課件共61頁,創(chuàng)作于2023年2月總體成數的區(qū)間估計表達式其中,為極限誤差第45頁,課件共61頁,創(chuàng)作于2023年2月步驟⒈計算樣本成數;⒉
搜集總體方差的經驗數據;⒊計算抽樣平均誤差:重復抽樣條件下不重復抽樣條件下總體成數的區(qū)間估計第46頁,課件共61頁,創(chuàng)作于2023年2月步驟⒋計算抽樣極限誤差:⒌確定總體成數的置信區(qū)間:總體成數的區(qū)間估計第47頁,課件共61頁,創(chuàng)作于2023年2月【例B】若例A中工人日產量在118件以上者為完成生產定額任務,要求在95﹪的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數??傮w成數的區(qū)間估計第48頁,課件共61頁,創(chuàng)作于2023年2月按日產量分組(件)組中值(件)工人數(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100100名工人的日產量分組資料完成定額的人數第49頁,課件共61頁,創(chuàng)作于2023年2月解:第50頁,課件共61頁,創(chuàng)作于2023年2月則該企業(yè)全部工人中完成定額的工人比重及完成定額的工人總數的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8441至0.9559之間,完成定額的工人總數在844.1至955.9人之間,估計的可靠程度為95﹪。第51頁,課件共61頁,創(chuàng)作于2023年2月樣本容量的確定影響樣本容量的因素總體各單位標志值的差異程度(即標準差的大?。?/p>
越大,所需樣本容量越多允許的極限誤差△的大?。骸?/p>
越大,所需樣本容量越??;推斷的可靠程度,即置信度:對可靠程度要求越高,所需樣本容量越大;抽樣方法和抽樣組織方式:重復抽樣比不重復抽樣所需樣本容量要多;類型抽樣比簡單隨機抽樣所需樣本容量多。第52頁,課件共61頁,創(chuàng)作于2023年2月確定方法推斷總體平均數所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計值:①過去的經驗數據;②試驗調查樣本的S。計算結果通常向上進位第53頁,課件共61頁,創(chuàng)作于2023年2月⑵不重復
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版房屋代持業(yè)務合同范本3篇
- 二零二五版電機維修智能化改造合同范本3篇
- 二零二五年度房地產經紀服務合同7篇
- 二零二五版購房借款及房地產開發(fā)商風險控制擔保服務合同3篇
- 二零二五版商業(yè)地產買賣合同模板下載3篇
- 二零二五年度高等教育機構外國專家項目合作合同參考書3篇
- 二零二五版家用空調安裝與室內環(huán)境改善合同3篇
- 二零二五年度成都上灶師父招聘與餐飲業(yè)人才服務合同2篇
- 展會創(chuàng)意展示合同(2篇)
- 2025年度油氣田2#配電房土建安裝與防爆電氣設備合同3篇
- 下肢皮牽引護理PPT課件(19頁PPT)
- 臺資企業(yè)A股上市相關資料
- 電 梯 工 程 預 算 書
- 參會嘉賓簽到表
- 機械車間員工績效考核表
- 形式發(fā)票格式2 INVOICE
- 2.48低危胸痛患者后繼治療評估流程圖
- 人力資源管理之績效考核 一、什么是績效 所謂績效簡單的講就是對
- 山東省醫(yī)院目錄
- 云南地方本科高校部分基礎研究
- 廢品管理流程圖
評論
0/150
提交評論