




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
樣本容量的確定第1頁(yè),共38頁(yè),2023年,2月20日,星期五學(xué)習(xí)目標(biāo)1.學(xué)習(xí)確定樣本容量的財(cái)務(wù)和統(tǒng)計(jì)知識(shí)2.確定樣本容量的方法3.熟悉正態(tài)分布4.理解總體、樣本及樣本分部5.區(qū)分點(diǎn)估計(jì)及區(qū)間估計(jì)6.識(shí)別抽樣方式和比例方面存在的問(wèn)題第2頁(yè),共38頁(yè),2023年,2月20日,星期五1.概率抽樣中樣本容量的確定樣本容量含義:樣本容量又稱“樣本數(shù)”。指一個(gè)樣本的必要抽樣單位數(shù)目。在組織抽樣調(diào)查時(shí),抽樣誤差的大小直接影響樣本指標(biāo)代表性的大小,而必要的樣本單位數(shù)目是保證抽樣誤差不超過(guò)某一給定范圍的重要因素之一。因此,在抽樣設(shè)計(jì)時(shí),必須決定樣本單位數(shù)目,因?yàn)檫m當(dāng)?shù)臉颖締挝粩?shù)目是保證樣本指標(biāo)具有充分代表性的基本前提。第3頁(yè),共38頁(yè),2023年,2月20日,星期五1.可支配預(yù)算例如:一個(gè)品牌經(jīng)理如果有40000美元預(yù)算可用于某項(xiàng)市場(chǎng)研究,那么除去其他項(xiàng)目成本(如調(diào)查方案和問(wèn)卷的設(shè)計(jì)數(shù)據(jù)的處理分析等)后,余下的那部分預(yù)算才決定著被調(diào)查的樣本容量的大小。如果可支配資金太少,可以確定的樣本量太小,管理者就必須做出決策是補(bǔ)充更多的資金還是放棄這一項(xiàng)目。第4頁(yè),共38頁(yè),2023年,2月20日,星期五2.經(jīng)驗(yàn)法則“一種強(qiáng)烈的感覺(jué)”,認(rèn)為某一特定的樣本容量是必要的或合適的。以“經(jīng)驗(yàn)性”為幌子,認(rèn)為樣本容量應(yīng)該是“為保證精度,一般至少應(yīng)該是總體的5%”例如關(guān)于鞋子的調(diào)查:1萬(wàn)名鐵人三項(xiàng)運(yùn)動(dòng)員;耐克對(duì)“飛人喬丹”進(jìn)行調(diào)查,200萬(wàn)名潛在的籃球鞋購(gòu)買者簡(jiǎn)單易行,但不是一種高效率、經(jīng)濟(jì)的方法,經(jīng)驗(yàn)法則方法忽略了抽樣的精確度問(wèn)題。第5頁(yè),共38頁(yè),2023年,2月20日,星期五3.擬分析的“子群數(shù)”子群數(shù):總體樣本的各個(gè)子群體的數(shù)目在其他條件相同的情況下,所要分析的子群數(shù)目越大,所需的總樣本容量也就越大,一般認(rèn)為樣本量要足夠大,以便每個(gè)子群的容量至少為100而每個(gè)次子群的容量至少也有20-50。第6頁(yè),共38頁(yè),2023年,2月20日,星期五例如:從整體上看樣本容量為400很符合要求,但若要分別分析男性和女性被調(diào)查者,并且要求男性與女性的樣本各占一半,那么每個(gè)子群的容量?jī)H為200。這個(gè)數(shù)字是否符合要求,能使分析人員對(duì)兩組的特征做出預(yù)期的統(tǒng)計(jì)推斷嗎?再如,要按年齡和性別分析調(diào)研結(jié)果,問(wèn)題就變得更復(fù)雜了。假設(shè)要按以下方式將總體樣本劃分為四組:35歲以下男性35歲以上男性35歲以下女性35歲以上女性如果預(yù)計(jì)每組約占樣本的25%,那么子群容量?jī)H有100。隨著樣本容量的縮小,抽樣誤差增加,會(huì)出現(xiàn)這樣一個(gè)問(wèn)題,那就是調(diào)研人員很難辨別依據(jù)現(xiàn)象所得到的兩組間的差別是真正意義上的差別還是由于抽樣誤差引起的差別。第7頁(yè),共38頁(yè),2023年,2月20日,星期五4.傳統(tǒng)的統(tǒng)計(jì)方法總體標(biāo)準(zhǔn)差的估計(jì)值抽樣的允許誤差范圍抽樣結(jié)果在實(shí)際總體值的特定范圍(抽樣結(jié)果+(-)抽樣誤差)內(nèi)的置信水平第8頁(yè),共38頁(yè),2023年,2月20日,星期五正態(tài)分布重要的原因許多變量的概率分布趨于正態(tài)分布。愛吃快餐的人平均每月吃快餐的次數(shù),每星期看電視的小時(shí)數(shù),男性身高的分布等。中心極限定理——對(duì)于任何總體,不論其分布如何,隨著樣本容量的增加,抽樣平均數(shù)的分布趨近于正態(tài)分布2.正態(tài)分布第9頁(yè),共38頁(yè),2023年,2月20日,星期五如果多數(shù)回答都接近于同一個(gè)數(shù)字,而且大多數(shù)的回答者都集中在某一小范圍內(nèi),則差異性小;反之,則差異性就大第10頁(yè),共38頁(yè),2023年,2月20日,星期五第11頁(yè),共38頁(yè),2023年,2月20日,星期五差異性差異性的基本概念就是指回答的相似程度。差異性小意味著回答相當(dāng)相似,差異性大表示回答很不相似。如果答案曲線圖顯示十分集中或呈“尖峰”狀態(tài),則差異性小。如果曲線圖顯示受訪者在各種可能的答案選項(xiàng)間平均分布,則差異性大。測(cè)量差異性的指標(biāo)——標(biāo)準(zhǔn)差第12頁(yè),共38頁(yè),2023年,2月20日,星期五將兩個(gè)樣本的標(biāo)準(zhǔn)差進(jìn)行比較,以判定相關(guān)的差異性。第13頁(yè),共38頁(yè),2023年,2月20日,星期五比較兩個(gè)圖形,可以得出結(jié)論:在1955年汽車擁有者的駕駛里程較少(平均),而且差異性也不大(標(biāo)淮差),但現(xiàn)在的車主們年平均駕駛里程較多,差異性也較大。第14頁(yè),共38頁(yè),2023年,2月20日,星期五正態(tài)分布的特征(根據(jù)以上圖形)正態(tài)分布呈鐘形且只有一個(gè)眾數(shù)關(guān)于均值對(duì)稱,集中趨勢(shì)的三個(gè)衡量標(biāo)準(zhǔn)(平均數(shù)、眾數(shù)、中位數(shù))相等一個(gè)正態(tài)分布的特殊性由其均值和標(biāo)準(zhǔn)差決定正態(tài)曲線下方的面積等于1,它包括了所有觀測(cè)值第15頁(yè),共38頁(yè),2023年,2月20日,星期五5.正態(tài)曲線下方任意兩個(gè)變量值之間的面積,等于在這一范圍內(nèi)隨機(jī)抽取一個(gè)觀察對(duì)象的概率6.在均值的給定比例標(biāo)準(zhǔn)差范圍內(nèi)的概率為固定值。即所有的正態(tài)分布在平均數(shù)+-1個(gè)標(biāo)準(zhǔn)差之間的面積相同,都占曲線下方面積的68.26%,或者說(shuō)占全部調(diào)查總體結(jié)果的68.26%。這叫正態(tài)分布的比例性。第16頁(yè),共38頁(yè),2023年,2月20日,星期五xf(x)f(x)=隨機(jī)變量X的頻數(shù)=正態(tài)隨機(jī)變量X的均值=正態(tài)隨機(jī)變量X的方差
=3.1415926;e=2.71828x=隨機(jī)變量的取值(-<x<)正態(tài)分布第17頁(yè),共38頁(yè),2023年,2月20日,星期五標(biāo)準(zhǔn)正態(tài)分布任何正態(tài)分布都可以轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布均值等于0標(biāo)準(zhǔn)差等于1第18頁(yè),共38頁(yè),2023年,2月20日,星期五正態(tài)分布的任一變量值X通過(guò)一個(gè)簡(jiǎn)單的轉(zhuǎn)化公式就能變成相應(yīng)的標(biāo)準(zhǔn)正態(tài)分布中的Z值其中X是變量值,μ是變量平均值,σ是變量標(biāo)準(zhǔn)差第19頁(yè),共38頁(yè),2023年,2月20日,星期五總體分布:是總體中全部單位的頻率分布,這一頻率分布的平均數(shù),通常用希臘字母μ表示,標(biāo)準(zhǔn)差用希臘字母σ表示樣本分布:是單個(gè)樣本中所有單位的頻率分布,樣本分布的平均數(shù)常用表示,標(biāo)準(zhǔn)差用S表示3.總體分布、樣本分布第20頁(yè),共38頁(yè),2023年,2月20日,星期五樣本平均數(shù)的抽樣分布:是指從一個(gè)總體中抽取一定數(shù)量的樣本,由樣本平均數(shù)構(gòu)成的概率分布。首先,要從特定的總體中抽取一定的樣本,計(jì)算各樣本的平均數(shù),并排列出頻率分布每個(gè)樣本由樣本單位數(shù)不同的子集構(gòu)成,因此,樣本平均數(shù)不會(huì)完全相同4.抽樣分布第21頁(yè),共38頁(yè),2023年,2月20日,星期五如果樣本是隨機(jī)的且容量足夠大,則樣本均值的分布近似于正態(tài)分布理論基礎(chǔ)是中心極限定理:隨著樣本容量的增加,從任一總體中抽取的大量隨機(jī)樣本平均數(shù)的分布接近服從正態(tài)分布。其均值為,且標(biāo)準(zhǔn)差等于:n為樣本容量,為總體的標(biāo)準(zhǔn)差第22頁(yè),共38頁(yè),2023年,2月20日,星期五平均數(shù)的標(biāo)準(zhǔn)誤差:實(shí)際總體值與所預(yù)期的典型樣本結(jié)果的差距。平均數(shù)標(biāo)準(zhǔn)誤差,即樣本均值的標(biāo)準(zhǔn)差(抽樣誤差)。由于總體標(biāo)準(zhǔn)差是未知的,一般由樣本標(biāo)準(zhǔn)差s代替。例如:駕駛里程調(diào)查中,樣本容量n是100名駕駛者,標(biāo)準(zhǔn)差是3000公里,則平均數(shù)標(biāo)準(zhǔn)誤差=300。第23頁(yè),共38頁(yè),2023年,2月20日,星期五第24頁(yè),共38頁(yè),2023年,2月20日,星期五第25頁(yè),共38頁(yè),2023年,2月20日,星期五基本概念一位調(diào)查人員以在最近30天內(nèi)至少吃過(guò)一次快餐的所有顧客為總體,從中抽取了1000組容量為200的簡(jiǎn)單隨機(jī)樣本,調(diào)查目的是要估計(jì)平均一個(gè)月內(nèi),這些人吃快餐的平均次數(shù),計(jì)算出每一組的平均數(shù),按相關(guān)值確定區(qū)間,整理后便得到表中的頻率分布圖,而圖以直方圖的形式表示這些頻率,直方圖上方還可見到一條正態(tài)曲線,直方圖十分接近正態(tài)曲線的形狀,如果選取足夠的容量為200的樣本,計(jì)算每組的平均數(shù),整理排列后所得的分布就是正態(tài)分布。圖正態(tài)曲線就是這項(xiàng)調(diào)查中平均數(shù)的抽樣分布第26頁(yè),共38頁(yè),2023年,2月20日,星期五第27頁(yè),共38頁(yè),2023年,2月20日,星期五平均數(shù)的實(shí)際抽樣分布第28頁(yè),共38頁(yè),2023年,2月20日,星期五大樣本平均數(shù)的抽樣分布有以下特征:是正態(tài)分布分布的平均數(shù)等于總體平均數(shù)分布有標(biāo)準(zhǔn)差,稱為平均數(shù)的標(biāo)準(zhǔn)誤差,它等于總體標(biāo)準(zhǔn)差除以樣本容量的平方根:第29頁(yè),共38頁(yè),2023年,2月20日,星期五根據(jù)單個(gè)樣本做出推斷通過(guò)任一簡(jiǎn)單的隨機(jī)樣本對(duì)總體均數(shù)進(jìn)行的估計(jì),其估計(jì)值在總體平均值1個(gè)標(biāo)準(zhǔn)誤差內(nèi)的概率究竟為多大?根據(jù)表14-1可知,概率為68%,因?yàn)樗袠颖酒骄鶖?shù)有68%都在此范圍內(nèi),而通過(guò)簡(jiǎn)單隨機(jī)樣本對(duì)總體做的估計(jì)為實(shí)際總體平均值2倍標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為95%,在實(shí)際總體平均值3倍標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為99.7。第30頁(yè),共38頁(yè),2023年,2月20日,星期五點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì):把樣本平均值作為總體平均數(shù)的估計(jì)值沒(méi)有給出估計(jì)值接近總體參數(shù)程度的信息,沒(méi)有給出可信程度第31頁(yè),共38頁(yè),2023年,2月20日,星期五區(qū)間估計(jì):在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%
樣本統(tǒng)計(jì)量
(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限第32頁(yè),共38頁(yè),2023年,2月20日,星期五第33頁(yè),共38頁(yè),2023年,2月20日,星期五置信區(qū)間與置信水平在給定置信度下,總體參數(shù)可能落入的區(qū)域的大小是置信區(qū)間;而置信度則是置信區(qū)間包含總體參數(shù)的概率。平均數(shù)的區(qū)間估計(jì):從總體中抽出一定量的隨機(jī)樣本,計(jì)算出樣本平均數(shù),可知這個(gè)樣本平均數(shù)存在于所有樣本平均數(shù)的抽樣分布中,但是確切位置不知道。這個(gè)樣本平均數(shù)在實(shí)際總體平均值+-一個(gè)標(biāo)準(zhǔn)誤差范圍內(nèi)的概率是68.26%。所以實(shí)際值減去或加上1個(gè)標(biāo)準(zhǔn)誤差的置信度為68.26%。即:第34頁(yè),共38頁(yè),2023年,2月20日,星期五第35頁(yè),共38頁(yè),2023年,2月20日,星期五比例的抽樣分布特征:近似于正態(tài)分布所有比率抽樣的平均值等于總體比率比率抽樣分布的標(biāo)準(zhǔn)誤差計(jì)算公式:Sp表示抽樣比率分布的標(biāo)準(zhǔn)誤差,p表示總體比率的估計(jì)值,n表示樣本單位數(shù)第36頁(yè),共38頁(yè),2023年,2月20日,星期五例如:如果需要估計(jì)一下最近90天內(nèi)曾在網(wǎng)上購(gòu)物的所有成年人的百分比,那么就想要得到平均數(shù)的抽樣分布一樣,要從成年人總體中選出1000組容量為200的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北電線電纜橋架施工方案
- 臨床護(hù)理不良事件案例分享
- 曲陽(yáng)路面鵝卵石施工方案
- 上海日播至勝實(shí)業(yè)有限公司股權(quán)估值項(xiàng)目估值報(bào)告
- 北方古建筑屋頂施工方案
- 陜西節(jié)日彩燈設(shè)計(jì)施工方案
- 地面混凝土施工方案圖例
- 2025年乳味飲品項(xiàng)目發(fā)展計(jì)劃
- 公眾參與與環(huán)保意識(shí)的提升分析
- 低空經(jīng)濟(jì)公司技術(shù)開發(fā)與創(chuàng)新策略
- 2023年10月自考試題00840第二外語(yǔ)(日語(yǔ))
- 農(nóng)產(chǎn)品市場(chǎng)營(yíng)銷中的市場(chǎng)競(jìng)爭(zhēng)分析
- 了解滑雪:滑雪器材與滑雪的技巧
- 也是冬天也是春天:升級(jí)彩插版
- 報(bào)價(jià)單模板完
- 【某醫(yī)療美容機(jī)構(gòu)營(yíng)銷策略現(xiàn)狀、問(wèn)題及優(yōu)化建議分析6300字】
- 關(guān)于tiktok的英語(yǔ)新聞
- 圖形的放大與縮小說(shuō)課稿
- 技術(shù)核定單(示范文本)
- 關(guān)于外委單位工作情況的報(bào)告
- 吉林大學(xué)汽車設(shè)計(jì)期末考試復(fù)習(xí)資料高等教育
評(píng)論
0/150
提交評(píng)論