抽樣及樣本容量概論_第1頁
抽樣及樣本容量概論_第2頁
抽樣及樣本容量概論_第3頁
抽樣及樣本容量概論_第4頁
抽樣及樣本容量概論_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、樣本容量樣本容量-1抽樣及樣本容量抽樣及樣本容量(Sampling & Sample Size)樣本容量樣本容量-2什么是抽樣及為何要進(jìn)行抽樣?什么是抽樣及為何要進(jìn)行抽樣? 抽樣是抽樣是 收集收集所有所有數(shù)據(jù)的一部分。數(shù)據(jù)的一部分。 使用該部分?jǐn)?shù)據(jù)得出結(jié)論(進(jìn)行推論)。使用該部分?jǐn)?shù)據(jù)得出結(jié)論(進(jìn)行推論)。 為什么要進(jìn)行抽樣?因?yàn)椴榭礊槭裁匆M(jìn)行抽樣?因?yàn)椴榭此兴袛?shù)據(jù)可能數(shù)據(jù)可能 成本太高。成本太高。 費(fèi)時(shí)太長。費(fèi)時(shí)太長。 造成破壞(例如、品嘗測試)。造成破壞(例如、品嘗測試)。 一般可從比較少量的數(shù)據(jù)得出可靠的結(jié)論。一般可從比較少量的數(shù)據(jù)得出可靠的結(jié)論。樣本容量樣本容量-3總體總體

2、 情況:在操作上您可以定義現(xiàn)存的總體的邊界、以便可以認(rèn)出情況:在操作上您可以定義現(xiàn)存的總體的邊界、以便可以認(rèn)出 總體的每個(gè)個(gè)體、在理論上還可以進(jìn)行編號??傮w的每個(gè)個(gè)體、在理論上還可以進(jìn)行編號。 抽樣目的:抽樣目的: 描述該總體的特征。描述該總體的特征。 示例:抽樣調(diào)查(示例:抽樣調(diào)查(8 月月 31 日以前畢業(yè)的)大學(xué)校友、以確定日以前畢業(yè)的)大學(xué)校友、以確定 在今后兩年中他們至少將一個(gè)小孩送進(jìn)大學(xué)的百分比。在今后兩年中他們至少將一個(gè)小孩送進(jìn)大學(xué)的百分比??傮w和過程總體和過程樣本使用樣本對總體進(jìn)行推論:例如。平均值 = X、比例 = p樣本容量樣本容量-4過程過程 情況:過程是動態(tài)的且不斷變化

3、的;過程中的個(gè)體并不是全可以鑒定的、情況:過程是動態(tài)的且不斷變化的;過程中的個(gè)體并不是全可以鑒定的、 因?yàn)槟承﹤€(gè)體尚不存在(如明天制造的那些個(gè)體)。因?yàn)槟承﹤€(gè)體尚不存在(如明天制造的那些個(gè)體)。 目的:了解過程、以便采取行動改進(jìn)或預(yù)測過程未來的行為。目的:了解過程、以便采取行動改進(jìn)或預(yù)測過程未來的行為。 示例:我們估計(jì)下月發(fā)票中有示例:我們估計(jì)下月發(fā)票中有 5% 至至 20% 有錯誤(除非更改該過程)。有錯誤(除非更改該過程)??傮w和過程(續(xù))總體和過程(續(xù))使用樣本對過程未來的行為進(jìn)行推論昨天保存時(shí)間順序!今天明天?20%5%10%15%抽樣數(shù)據(jù)的時(shí)間曲線圖抽樣數(shù)據(jù)的時(shí)間曲線圖?以時(shí)間順序排

4、列的過程輸出以時(shí)間順序排列的過程輸出樣本容量樣本容量-5抽樣和改進(jìn)項(xiàng)目抽樣和改進(jìn)項(xiàng)目v 確定過程周期和缺陷比率的基準(zhǔn)性能;確定過程周期和缺陷比率的基準(zhǔn)性能; (例如:(例如:在控制圖上繪出樣本數(shù)據(jù)在控制圖上繪出樣本數(shù)據(jù))v 估計(jì)過程能力;估計(jì)過程能力; (例如:(例如:計(jì)算一件樣本中的缺陷計(jì)算一件樣本中的缺陷)v 確定造成性能低下或數(shù)據(jù)變動的因素確定造成性能低下或數(shù)據(jù)變動的因素 (X); (利用樣本數(shù)據(jù)繪制圖表、進(jìn)行假設(shè)測試或回歸分析利用樣本數(shù)據(jù)繪制圖表、進(jìn)行假設(shè)測試或回歸分析)v 驗(yàn)證建議的改進(jìn)工作;驗(yàn)證建議的改進(jìn)工作; (比較從過程中抽取的新數(shù)據(jù)與從該過程抽取的舊數(shù)據(jù)比較從過程中抽取的新數(shù)

5、據(jù)與從該過程抽取的舊數(shù)據(jù))v 監(jiān)視過程性能、必要時(shí)采取補(bǔ)救措施、并預(yù)測未來的性能;監(jiān)視過程性能、必要時(shí)采取補(bǔ)救措施、并預(yù)測未來的性能; (在控制圖上繪出新過程的樣本數(shù)據(jù)在控制圖上繪出新過程的樣本數(shù)據(jù))改進(jìn)項(xiàng)目一般是對過程情況進(jìn)行抽樣:改進(jìn)項(xiàng)目一般是對過程情況進(jìn)行抽樣:樣本容量樣本容量-6為什么要區(qū)別總體抽樣和過程抽樣?為什么要區(qū)別總體抽樣和過程抽樣? 樣本容量公式是為定義明確的靜態(tài)(而且常常是理論上的)樣本容量公式是為定義明確的靜態(tài)(而且常常是理論上的) 總體情況設(shè)計(jì)的。總體情況設(shè)計(jì)的。 但是大多數(shù)抽樣應(yīng)用是針對動態(tài)的、尚未知的過程情況。但是大多數(shù)抽樣應(yīng)用是針對動態(tài)的、尚未知的過程情況。 將樣

6、本容量公式應(yīng)用于過程抽樣情況可能得出錯誤的結(jié)論、將樣本容量公式應(yīng)用于過程抽樣情況可能得出錯誤的結(jié)論、 除非滿足一定的條件。除非滿足一定的條件。 要使推論有效、樣本必須真實(shí)地代表總體或過程。要使推論有效、樣本必須真實(shí)地代表總體或過程。 總體所需的抽樣策略不同于過程所需的抽樣策略、總體所需的抽樣策略不同于過程所需的抽樣策略、 以確保樣本具有代表性(在下一節(jié)中討論)。以確保樣本具有代表性(在下一節(jié)中討論)。樣本容量樣本容量-7從穩(wěn)定的過程中抽樣從穩(wěn)定的過程中抽樣如果如果過程是穩(wěn)定的、樣本容量公式可應(yīng)用于過程情況。過程是穩(wěn)定的、樣本容量公式可應(yīng)用于過程情況。 可獲得具有特定精度的可靠估計(jì)值。可獲得具有

7、特定精度的可靠估計(jì)值。 當(dāng)進(jìn)行比較時(shí)、如果存在的差異具有一定功效、便可找出它們。當(dāng)進(jìn)行比較時(shí)、如果存在的差異具有一定功效、便可找出它們。(穩(wěn)定的、可預(yù)測的過程)4045505560651357911131517192123252729313335373941樣本容量樣本容量-8從不穩(wěn)定的過程中抽樣從不穩(wěn)定的過程中抽樣然而許多過程是不穩(wěn)定的。然而許多過程是不穩(wěn)定的。無論如何總要收集數(shù)據(jù)、并繪制控制圖或時(shí)間曲線圖。無論如何總要收集數(shù)據(jù)、并繪制控制圖或時(shí)間曲線圖。 識別特殊原因并清除之。識別特殊原因并清除之。使用樣本容量公式求出的值是您應(yīng)認(rèn)為最小的數(shù)字;使用樣本容量公式求出的值是您應(yīng)認(rèn)為最小的數(shù)字;

8、 可能的話,需要收集更多的數(shù)據(jù)??赡艿脑?,需要收集更多的數(shù)據(jù)。 存在特殊原因時(shí),需要更大的樣本容量,因?yàn)殚L期變動大于短期變異。存在特殊原因時(shí),需要更大的樣本容量,因?yàn)殚L期變動大于短期變異。 使用公式時(shí),您必須估計(jì)使用公式時(shí),您必須估計(jì)s(或或 p););您必須判斷特殊原因如何您必須判斷特殊原因如何 影響該估計(jì)值,并根據(jù)您認(rèn)為過程將會是什么情況來調(diào)整它影響該估計(jì)值,并根據(jù)您認(rèn)為過程將會是什么情況來調(diào)整它。樣本容量樣本容量-9從不穩(wěn)定的過程中抽樣(續(xù))從不穩(wěn)定的過程中抽樣(續(xù)) 當(dāng)進(jìn)行組之間的比較時(shí):當(dāng)進(jìn)行組之間的比較時(shí): 盡量在相同時(shí)間內(nèi)獲取每組的樣本。盡量在相同時(shí)間內(nèi)獲取每組的樣本。 當(dāng)作結(jié)論

9、或報(bào)告結(jié)論時(shí)、會存在這樣一個(gè)風(fēng)險(xiǎn)、即這些結(jié)論可能當(dāng)作結(jié)論或報(bào)告結(jié)論時(shí)、會存在這樣一個(gè)風(fēng)險(xiǎn)、即這些結(jié)論可能 不適用于將來。不適用于將來。 如果過程是不穩(wěn)定的,可能的話,將一段如果過程是不穩(wěn)定的,可能的話,將一段很長的時(shí)間里得到的數(shù)據(jù)的時(shí)間里得到的數(shù)據(jù) 繪制于一張控制圖上,并圈出或特別標(biāo)示您的樣本所代表的數(shù)據(jù)點(diǎn)繪制于一張控制圖上,并圈出或特別標(biāo)示您的樣本所代表的數(shù)據(jù)點(diǎn) 或時(shí)間區(qū)間。或時(shí)間區(qū)間。 允許您和他人可直接從曲線觀察過程的行為。允許您和他人可直接從曲線觀察過程的行為。 幫助您判斷這些結(jié)論在未來的可靠性。幫助您判斷這些結(jié)論在未來的可靠性。樣本容量樣本容量-10從過程中抽樣從過程中抽樣對于過程情

10、況,我們希望確保能夠理解過程的行為。因此我們:對于過程情況,我們希望確保能夠理解過程的行為。因此我們:在一段時(shí)間內(nèi)進(jìn)行系統(tǒng)或整群(非隨機(jī))抽樣。在一段時(shí)間內(nèi)進(jìn)行系統(tǒng)或整群(非隨機(jī))抽樣。 即使隨機(jī)抽樣能適用于穩(wěn)定過程,我們?nèi)圆捎孟到y(tǒng)或整群抽樣,并保持時(shí)間順序即使隨機(jī)抽樣能適用于穩(wěn)定過程,我們?nèi)圆捎孟到y(tǒng)或整群抽樣,并保持時(shí)間順序 以便能更好地表示過程行為。以便能更好地表示過程行為。盡量從足夠長的時(shí)間段中進(jìn)行抽樣,以便真實(shí)地表示過程中的變化源。盡量從足夠長的時(shí)間段中進(jìn)行抽樣,以便真實(shí)地表示過程中的變化源。 運(yùn)用您自己的判斷和有關(guān)變化源的過程知識來確定多長時(shí)間進(jìn)行一次抽樣運(yùn)用您自己的判斷和有關(guān)變化源

11、的過程知識來確定多長時(shí)間進(jìn)行一次抽樣 (每隔(每隔 10 個(gè)個(gè)體、每隔個(gè)個(gè)體、每隔 7 個(gè)個(gè)體、每天、每月等)。個(gè)個(gè)體、每天、每月等)。一般情況下、更加頻繁地收集小樣本、可確保隨著時(shí)間的過去能真實(shí)地表示過程行為。一般情況下、更加頻繁地收集小樣本、可確保隨著時(shí)間的過去能真實(shí)地表示過程行為。繪制控制圖或時(shí)間曲線圖,以確定該過程是穩(wěn)定的還是不穩(wěn)定的(尋找非正常值、偏移、繪制控制圖或時(shí)間曲線圖,以確定該過程是穩(wěn)定的還是不穩(wěn)定的(尋找非正常值、偏移、趨勢或其它模式)。趨勢或其它模式)。樣本容量樣本容量-11抽樣方法抽樣方法樣本容量樣本容量-12代表性樣本代表性樣本要使結(jié)論有效,樣本必須具有代表性。要使結(jié)

12、論有效,樣本必須具有代表性。 數(shù)據(jù)應(yīng)真實(shí)地表示總體或過程數(shù)據(jù)應(yīng)真實(shí)地表示總體或過程 收集的數(shù)據(jù)與未收集的數(shù)據(jù)之間不應(yīng)存在有系統(tǒng)性的差異。收集的數(shù)據(jù)與未收集的數(shù)據(jù)之間不應(yīng)存在有系統(tǒng)性的差異。樣本容量樣本容量-13每個(gè)單元具有相同被選中的機(jī)會每個(gè)單元具有相同被選中的機(jī)會從每個(gè)組隨機(jī)抽樣一個(gè)成比例的數(shù)字從每個(gè)組隨機(jī)抽樣一個(gè)成比例的數(shù)字隨機(jī)隨機(jī) 抽樣抽樣分層分層隨機(jī)隨機(jī)抽樣抽樣樣本樣本總體總體樣本樣本總體總體AABBBBCDDDAAAABB BBBBBCCD D DD D DB概率抽樣概率抽樣樣本容量樣本容量-14每隔每隔 n 個(gè)抽樣(如每隔三個(gè)抽樣)個(gè)抽樣(如每隔三個(gè)抽樣)每經(jīng)過時(shí)間每經(jīng)過時(shí)間 t

13、抽樣抽樣 n 個(gè)單元(例如,個(gè)單元(例如,每小時(shí)抽樣三個(gè)單元)每小時(shí)抽樣三個(gè)單元);然后計(jì)算每然后計(jì)算每個(gè)小組的平均值個(gè)小組的平均值 (比例)(比例)系統(tǒng)系統(tǒng) 抽樣抽樣整群整群 抽樣抽樣樣本總體或過程保持時(shí)間順序樣本過程9:009:3010:3010:00保持時(shí)間順序樣本容量樣本容量-15 統(tǒng)計(jì)調(diào)查的誤差(抽樣誤差):是指調(diào)查所得結(jié)果與總體真實(shí)數(shù)值之間的差異。 可分 1、登記性誤差:指在調(diào)查和匯總過程中,由于觀察、測量、登記、計(jì)算等 方面的差錯或被調(diào)查者提供虛假資料而造成的誤差。 (不是抽樣調(diào)查獨(dú)有的)盡量避免 2、代表性誤差:指用樣本指標(biāo)推斷總體指標(biāo)時(shí),由于樣本結(jié)構(gòu)與總體結(jié)構(gòu) 不一致、樣本不

14、能完全代表總體而產(chǎn)生的誤差。它又分 -2-1、系統(tǒng)誤差:指由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差, 表現(xiàn)為樣本估計(jì)量的值系統(tǒng)性偏高或偏低,故也稱偏差,盡量避免 如抽樣框與目標(biāo)總體不一致、有意多選較好或較差的單位等; -2-2、隨機(jī)誤差:又稱偶然性誤差,指遵循隨機(jī)抽樣原則,由于隨機(jī)因素 (偶然性因素)引起的代表性誤差。不可避免,但需加以計(jì)算與控制 抽樣估計(jì)中所謂的抽樣誤差,就是指這種隨機(jī)誤差, 即由于抽樣的隨機(jī)性而產(chǎn)生的樣本估計(jì)量與總體參數(shù)之間的代表性誤差。抽樣誤差抽樣誤差樣本容量樣本容量-16抽樣誤差的抽樣誤差的3個(gè)概念個(gè)概念 1 1、實(shí)際抽樣誤差:、實(shí)際抽樣誤差:-實(shí)際上總體參數(shù)實(shí)際

15、上總體參數(shù)是未知數(shù),不可計(jì)算是未知數(shù),不可計(jì)算 2 2、抽樣平均誤差:、抽樣平均誤差:3 3、抽樣極限誤差:是指在一定的概率下抽樣誤差的可能范圍,、抽樣極限誤差:是指在一定的概率下抽樣誤差的可能范圍, 也稱為允許誤差。用表示抽樣極限誤差,即在一定概率下,也稱為允許誤差。用表示抽樣極限誤差,即在一定概率下, 抽樣誤差率抽樣誤差率= =(抽樣極限誤差(抽樣極限誤差/ /估計(jì)量)估計(jì)量)* *100%100% 抽樣估計(jì)精度抽樣估計(jì)精度=100%-=100%-抽樣誤差率抽樣誤差率可能樣本個(gè)數(shù)2如如|xxbar-X|xbar樣本容量樣本容量-17抽樣總結(jié)抽樣總結(jié)本單元包括:本單元包括: 抽樣是查看所有數(shù)

16、據(jù)的一種有效率和效果的方法。抽樣是查看所有數(shù)據(jù)的一種有效率和效果的方法。 總體抽樣與過程抽樣有不同的目的和方法??傮w抽樣與過程抽樣有不同的目的和方法。 代表性是抽樣最重要的一方面。代表性是抽樣最重要的一方面。 正確抽樣使您對結(jié)論有信心。正確抽樣使您對結(jié)論有信心。 總體抽樣的樣本容量公式可適用于穩(wěn)定過程。總體抽樣的樣本容量公式可適用于穩(wěn)定過程。樣本容量樣本容量-18樣本容量樣本容量(Sample Size)樣本容量樣本容量-19樣本容量介紹樣本容量介紹人們常問的第一個(gè)問題是人們常問的第一個(gè)問題是“我需要多少個(gè)樣本?我需要多少個(gè)樣本?”該問題的答案由下列四個(gè)因素確定:該問題的答案由下列四個(gè)因素確定

17、:1. 數(shù)據(jù)類型數(shù)據(jù)類型 離散數(shù)據(jù)和連續(xù)數(shù)據(jù)離散數(shù)據(jù)和連續(xù)數(shù)據(jù)2. 您想做什么您想做什么 描述整組的某個(gè)特征(平均值或比例)描述整組的某個(gè)特征(平均值或比例) 在特定的精度內(nèi)(在特定的精度內(nèi)( _ 單位)單位) 比較組的特征(找出組平均值或比例之間的差異)比較組的特征(找出組平均值或比例之間的差異) 以什么功效:希望檢測到特定差異的概率以什么功效:希望檢測到特定差異的概率3. 您估計(jì)的標(biāo)準(zhǔn)偏差(或比例)為多大您估計(jì)的標(biāo)準(zhǔn)偏差(或比例)為多大4. 您希望的置信度為多高(通常為您希望的置信度為多高(通常為 95%)樣本容量樣本容量-20當(dāng)樣本容量太小當(dāng)樣本容量太小 不能檢驗(yàn)出差異不能檢驗(yàn)出差異n

18、= 1n = 5 過程過程A過程過程A過程過程 B過程過程 BAxBxfromaway2thanlessisxAxBxfromaway3thanmoreisx樣本容量樣本容量-21當(dāng)樣本容量太大當(dāng)樣本容量太大對平均值的漂移過于敏感對平均值的漂移過于敏感 資源浪費(fèi)資源浪費(fèi)樣本容量樣本容量-22第一步第一步: 明確研究過程中的響應(yīng)變量明確研究過程中的響應(yīng)變量第二步第二步: 選擇合適的統(tǒng)計(jì)檢驗(yàn)選擇合適的統(tǒng)計(jì)檢驗(yàn)第三步第三步: 決定可接受的風(fēng)險(xiǎn)決定可接受的風(fēng)險(xiǎn) 和和 第四步第四步: 定出漂移敏感度定出漂移敏感度 第五步第五步: 建立或估計(jì)當(dāng)前過程中的參數(shù)建立或估計(jì)當(dāng)前過程中的參數(shù) 第六步第六步: 決定

19、合適的樣本容量決定合適的樣本容量樣本容量樣本容量-23 是是 H0 成立成立, 但結(jié)果卻否定它的風(fēng)險(xiǎn)但結(jié)果卻否定它的風(fēng)險(xiǎn). 1- 是是 H0 的置信系數(shù)的置信系數(shù). 觀察值 1樣本容量樣本容量-24 是是H0不成立不成立, 但結(jié)果卻肯定它的風(fēng)險(xiǎn)但結(jié)果卻肯定它的風(fēng)險(xiǎn). (1- ) 稱為檢驗(yàn)的稱為檢驗(yàn)的功效功效, 它表示它表示H0 不成立不成立, 而結(jié)果也否定它的概率而結(jié)果也否定它的概率, 即當(dāng)即當(dāng)H0不成立不成立時(shí)時(shí),作出正確結(jié)論的概率作出正確結(jié)論的概率.觀 察 值 1 2漂移 樣本容量樣本容量-25樣本容量樣本容量-26 H0 :無差異無差異 H1 :有明顯差異有明顯差異零假設(shè)零假設(shè)成立不成立

20、決策決策接受 H0拒絕 H0正確正確1 正確正確1 樣本容量樣本容量-27 實(shí)驗(yàn)之前需要預(yù)先指定反映明顯差異的量實(shí)驗(yàn)之前需要預(yù)先指定反映明顯差異的量 . 與標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)差 之比之比 / 稱為漂移敏感度稱為漂移敏感度(drift sensitivity ). 樣本容量樣本容量-28單樣本檢驗(yàn)單樣本檢驗(yàn)(1-Sample Tests)Stat Power and Sample Size 1-Sample ZStat Power and Sample Size 1-Sample t雙樣本檢驗(yàn)雙樣本檢驗(yàn)(2-Sample Tests)Stat Power and Sample Size 2-Sampl

21、e t樣本容量樣本容量-29樣本容量公式取決于您的目的樣本容量公式取決于您的目的抽樣目的抽樣目的公式公式*Minitab 命令命令估計(jì)平均值估計(jì)平均值(例如、確定基準(zhǔn)周期)(其中 d = 精度: _ 單位)估計(jì)比例估計(jì)比例(例如、確定缺陷基準(zhǔn)百分比)(其中 d = 精度: _ 單位)2d2sn p1pd2n2樣本容量樣本容量-30精度精度 (d) 精度是允許某個(gè)特征的估計(jì)值波動的范圍。精度是允許某個(gè)特征的估計(jì)值波動的范圍。 估計(jì)上下不超過兩天的周期。估計(jì)上下不超過兩天的周期。 估計(jì)上下不超過估計(jì)上下不超過 3% 的缺陷百分比。的缺陷百分比。 使用符號使用符號 d 表示精度。表示精度。 傳統(tǒng)的統(tǒng)

22、計(jì)學(xué)稱它為傳統(tǒng)的統(tǒng)計(jì)學(xué)稱它為 “delta”、因此以因此以d 表示表示。 精度等于置信區(qū)間精度等于置信區(qū)間 (CI) 的一半。的一半。 周期(單位為天)為周期(單位為天)為 95% 時(shí)時(shí) CI = (48、 52) 意味著我們有意味著我們有 95% 的的確信平均周期在確信平均周期在 48 天至天至 52 天之間。天之間。 CI 的寬度的寬度 = 4 天。天。 精度精度 = d = 2 天天(= 估計(jì)值上下不超過估計(jì)值上下不超過 2 天)。天)。樣本容量樣本容量-31精度精度 (d)(續(xù))續(xù)) 決定您需要多大的精度。決定您需要多大的精度。 精度與樣本容量的平方根成反比。精度與樣本容量的平方根成反

23、比。n1樣本容量樣本容量-32精度和樣本容量精度和樣本容量 要提高精度、必須增加樣本容量(但會增加成本)。要提高精度、必須增加樣本容量(但會增加成本)。 對于需要多大的精度沒有明確的答案;對于需要多大的精度沒有明確的答案; 該答案取決于使用該估計(jì)值對業(yè)務(wù)產(chǎn)生多大的影響。該答案取決于使用該估計(jì)值對業(yè)務(wù)產(chǎn)生多大的影響。 每種情況都是獨(dú)特的;不要效仿別人的決定。每種情況都是獨(dú)特的;不要效仿別人的決定。樣本容量樣本容量-33估計(jì)平均值所需的樣本容量估計(jì)平均值所需的樣本容量95% 的置信度*意味著因子為 2 標(biāo)準(zhǔn)偏差的估計(jì)您希望的精度2d2sn2222/xznNzznx222/2222/不重復(fù)抽樣不重復(fù)

24、抽樣重復(fù)抽樣重復(fù)抽樣樣本容量樣本容量-34目的:練習(xí)使用樣本容量公式估計(jì)平均值。目的:練習(xí)使用樣本容量公式估計(jì)平均值。時(shí)間:時(shí)間:3 分鐘。分鐘。要求:要求: 使用樣本容量公式計(jì)算平均值,使用樣本容量公式計(jì)算平均值, 以便回答下列問題。以便回答下列問題。 1. 假設(shè)您想估計(jì)假設(shè)您想估計(jì) 呼入電話的平均通話時(shí)間呼入電話的平均通話時(shí)間 1 分鐘。您需要多少樣本?分鐘。您需要多少樣本? (歷史數(shù)據(jù)顯示典型的標(biāo)準(zhǔn)偏差歷史數(shù)據(jù)顯示典型的標(biāo)準(zhǔn)偏差 = 3 分鐘。)分鐘。) 2. 您需要對多少次呼入抽樣、以獲得您需要對多少次呼入抽樣、以獲得 1/8 分鐘的精度?分鐘的精度?練習(xí)練習(xí):估計(jì)平均值所需的樣本容量

25、:估計(jì)平均值所需的樣本容量2d2sn樣本容量樣本容量-35練習(xí):答案練習(xí):答案問題 1.問題 2.3042848132 n22)(3661(2)(3) n22樣本容量樣本容量-36如何估計(jì)標(biāo)準(zhǔn)偏差如何估計(jì)標(biāo)準(zhǔn)偏差困難的選擇:困難的選擇: 要估計(jì)樣本容量,您需要知道標(biāo)準(zhǔn)偏差。要估計(jì)樣本容量,您需要知道標(biāo)準(zhǔn)偏差。 您需對數(shù)據(jù)的變化量有一定了解,因?yàn)閿?shù)據(jù)可變性加大,您需對數(shù)據(jù)的變化量有一定了解,因?yàn)閿?shù)據(jù)可變性加大, 需要的樣本容量也要相應(yīng)增加。需要的樣本容量也要相應(yīng)增加。 但是,如果您還沒有進(jìn)行抽樣,如何知道偏差呢?但是,如果您還沒有進(jìn)行抽樣,如何知道偏差呢?樣本容量樣本容量-37如何估計(jì)標(biāo)準(zhǔn)偏差(

26、續(xù))如何估計(jì)標(biāo)準(zhǔn)偏差(續(xù))估計(jì)標(biāo)準(zhǔn)偏差的選擇估計(jì)標(biāo)準(zhǔn)偏差的選擇 查找現(xiàn)存的數(shù)據(jù)并計(jì)算查找現(xiàn)存的數(shù)據(jù)并計(jì)算 s。 使用類似過程的控制圖(針對個(gè)體的)。使用類似過程的控制圖(針對個(gè)體的)。 采集一個(gè)小的樣本并計(jì)算采集一個(gè)小的樣本并計(jì)算 s。 根據(jù)您對過程的認(rèn)識和記得的類似數(shù)據(jù)猜一猜根據(jù)您對過程的認(rèn)識和記得的類似數(shù)據(jù)猜一猜(大多數(shù)人不擅長這樣做)。大多數(shù)人不擅長這樣做)。3AverageUCL s or 6LCLUCL s樣本容量樣本容量-38估計(jì)比例所需的樣本容量估計(jì)比例所需的樣本容量95% 的置信度意味著因子為 2猜 p 的值(樣本大小隨 P 變動較大、從 P=0.1 到 0.5,變化甚?。┠?/p>

27、望的精度 p1pd2n2樣本容量樣本容量-39使用精度調(diào)整樣本容量使用精度調(diào)整樣本容量您可使用確定樣本容量的公式,來確定是否需要花更多的資金收集更多的您可使用確定樣本容量的公式,來確定是否需要花更多的資金收集更多的樣本來得到更高的精度。在收集數(shù)據(jù)之前這樣做可以幫助您決定多少樣本樣本來得到更高的精度。在收集數(shù)據(jù)之前這樣做可以幫助您決定多少樣本可以符合您的項(xiàng)目和預(yù)算??梢苑夏捻?xiàng)目和預(yù)算。1.確定您可以提供多少個(gè)樣本確定您可以提供多少個(gè)樣本 (n)。2.然后問:然后問: 該樣本提供多高的精度?該樣本提供多高的精度? 即、精度的平均值在即、精度的平均值在 d 單位之內(nèi)單位之內(nèi) 還是精度的比例在還是

28、精度的比例在 d% 之內(nèi)之內(nèi)np)(p)(12 dn2s d樣本容量樣本容量-40使用精度調(diào)整樣本容量(續(xù))使用精度調(diào)整樣本容量(續(xù))3.該精度足夠精確嗎?該精度足夠精確嗎?4.如果不夠精確:如果不夠精確: 為各種樣本容量繪制一個(gè)精度和成本表,以確定在樣本上每為各種樣本容量繪制一個(gè)精度和成本表,以確定在樣本上每花一美元在精度上提高了多少?;ㄒ幻涝诰壬咸岣吡硕嗌?。 然后選擇一個(gè)樣本容量,再根據(jù)所提高的精度或您需要的精然后選擇一個(gè)樣本容量,再根據(jù)所提高的精度或您需要的精度來證明這是正確的選擇。度來證明這是正確的選擇。樣本容量樣本容量-41從有限的總體中進(jìn)行抽樣從有限的總體中進(jìn)行抽樣樣本容量公式

29、假設(shè)樣本容量樣本容量公式假設(shè)樣本容量 (n) 小于總體小于總體 (N)。 如果如果 .05 您抽取的樣本占總體的您抽取的樣本占總體的 5% 以上以上 您可以使用您可以使用“有限總體有限總體”公式調(diào)整樣本容量:公式調(diào)整樣本容量:Nn 1n nfiniteNn樣本容量樣本容量-42使用樣本容量公式使用樣本容量公式使用樣本容量公式:使用樣本容量公式: 在置信度為在置信度為 95% 的情況下,根據(jù)給定的期望精度以及的情況下,根據(jù)給定的期望精度以及 S 或或 P 的的估計(jì)值,估計(jì)值, 確定估計(jì)整組的某個(gè)特征(平均值或比例)所需的樣本容量。確定估計(jì)整組的某個(gè)特征(平均值或比例)所需的樣本容量。 在收集數(shù)據(jù)

30、在收集數(shù)據(jù)之前之前,確定各種樣本容量其估計(jì)值的精度。確定各種樣本容量其估計(jì)值的精度。 確定確定估計(jì)值的精度估計(jì)值的精度與與增加樣本容量的成本增加樣本容量的成本之間的得失。之間的得失。 在收集數(shù)據(jù)在收集數(shù)據(jù)之后之后,確定估計(jì)值的精度。確定估計(jì)值的精度。樣本容量樣本容量-43狀態(tài):樣本容量命令和公式狀態(tài):樣本容量命令和公式抽樣目的抽樣目的公式公式*/ Minitab 命令命令估計(jì)平均值估計(jì)平均值(例如、確定基準(zhǔn)周期)(其中 d = 精度: _ 單位)估計(jì)比例估計(jì)比例(例如、確定缺陷基準(zhǔn)百分比)(其中 d = 精度: _ 單位)比較兩組平均值、找出差異比較兩組平均值、找出差異(2 個(gè)樣本的 t 測試

31、)統(tǒng)計(jì) 功效和樣本容量 2 個(gè)樣本的 t比較兩個(gè)以上的組的平均值、比較兩個(gè)以上的組的平均值、找出差異找出差異(ANOVA)統(tǒng)計(jì) 功效和樣本容量 單向 ANOVA比較兩個(gè)(或更多)組的比比較兩個(gè)(或更多)組的比例、找出差異例、找出差異(卡方測試)統(tǒng)計(jì) 功效和樣本容量 2 個(gè)比例2d2sn p1pd2n2樣本容量樣本容量-44樣本容量大經(jīng)驗(yàn)法則樣本容量大經(jīng)驗(yàn)法則統(tǒng)計(jì)值統(tǒng)計(jì)值 或圖表或圖表 建議應(yīng)采用的最建議應(yīng)采用的最小樣本容量小樣本容量 (n) 平均值比例頻率分布圖(直方圖) Pareto 排列圖散布圖控制圖505024242d2sn p1pd2n2樣本容量樣本容量-455 5個(gè)變量個(gè)變量、和和

32、N N之間的關(guān)系可寫出下面是公式:之間的關(guān)系可寫出下面是公式: 注意如果我們知道了注意如果我們知道了5 5個(gè)變量中的任意個(gè)變量中的任意4 4個(gè)變量,就可以通過上式個(gè)變量,就可以通過上式計(jì)算出第計(jì)算出第5 5個(gè)變量個(gè)變量 利用利用Minitab, Minitab, 我們現(xiàn)在將說明如何計(jì)算樣本容量和檢驗(yàn)功效:我們現(xiàn)在將說明如何計(jì)算樣本容量和檢驗(yàn)功效: v樣本容量樣本容量 = = N Nv檢驗(yàn)功效檢驗(yàn)功效 = 1- = 1- )(2222/ZZn計(jì)算樣本容量計(jì)算樣本容量樣本容量樣本容量-46u一種新型的焊接機(jī)已經(jīng)研制出來,出于對經(jīng)濟(jì)價(jià)值的考慮,新型一種新型的焊接機(jī)已經(jīng)研制出來,出于對經(jīng)濟(jì)價(jià)值的考慮,

33、新型焊接機(jī)的焊接機(jī)的合格率合格率必必須要須要比現(xiàn)有類型的焊接機(jī)大比現(xiàn)有類型的焊接機(jī)大5 5個(gè)百分點(diǎn),現(xiàn)有個(gè)百分點(diǎn),現(xiàn)有設(shè)備的設(shè)備的合格率合格率約為約為80% 80% u為了比較這兩種設(shè)備,要使用日常的數(shù)據(jù),現(xiàn)有設(shè)備的歷史日合為了比較這兩種設(shè)備,要使用日常的數(shù)據(jù),現(xiàn)有設(shè)備的歷史日合格率的標(biāo)準(zhǔn)差為格率的標(biāo)準(zhǔn)差為3%3%,要求新的焊接機(jī)有相同的日合格率散布。,要求新的焊接機(jī)有相同的日合格率散布。 u我們可接受的我們可接受的風(fēng)險(xiǎn)是風(fēng)險(xiǎn)是0.010.01(指兩臺設(shè)備有差異而實(shí)際上并沒有指兩臺設(shè)備有差異而實(shí)際上并沒有差異的機(jī)會)差異的機(jī)會) u我們可接受的我們可接受的風(fēng)險(xiǎn)是風(fēng)險(xiǎn)是0.200.20(說兩臺設(shè)

34、備合格率相同而實(shí)際上并說兩臺設(shè)備合格率相同而實(shí)際上并不同的機(jī)會不同的機(jī)會) 例題例題1 1 : : 1-1-樣本樣本 t- t-檢驗(yàn)時(shí)檢驗(yàn)時(shí)的的樣本容量的計(jì)算樣本容量的計(jì)算樣本容量樣本容量-47零假設(shè)零假設(shè) (Ho): 新設(shè)備的合格率新設(shè)備的合格率并不比并不比現(xiàn)有的設(shè)備現(xiàn)有的設(shè)備好好 備擇假設(shè)備擇假設(shè) (Ha): 新設(shè)備的日合格率新設(shè)備的日合格率比比現(xiàn)有的設(shè)備現(xiàn)有的設(shè)備高高 焊接機(jī)焊接機(jī): 假設(shè)假設(shè)樣本容量樣本容量-48v 在在這兩個(gè)假設(shè)之間需要選擇多大的樣本容量呢?這兩個(gè)假設(shè)之間需要選擇多大的樣本容量呢? v 從所給的信息,我們得到從所給的信息,我們得到 顯著水平顯著水平, = 0.01 檢

35、驗(yàn)功效檢驗(yàn)功效 = 1 = 0.80. 平均值間的差異平均值間的差異, = 85 80 = 5.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差, = 3備擇假設(shè)備擇假設(shè) (Ha)為新設(shè)備的日合格率比現(xiàn)有的設(shè)備高為新設(shè)備的日合格率比現(xiàn)有的設(shè)備高 焊接機(jī)焊接機(jī): 需要的樣本容量需要的樣本容量 樣本容量樣本容量-49選擇選擇 Stat Power and Sample Size 1-Sample t. 5. 輸入 alpha, 2. 輸入檢驗(yàn)功效, 1 1. 輸入delta, 4. 選擇備擇假設(shè) 3. 輸入 sigma, 填選項(xiàng)1- 3;然后點(diǎn)“Options” 再填選項(xiàng)4 和 5;最后, 在所有打開的窗口中點(diǎn) OK 焊接機(jī)焊接機(jī):

36、 利用利用Minitab樣本容量樣本容量-50Minitab 告訴我們,至少要抽取7個(gè)樣本,才能保證在我們的檢驗(yàn)功效為0.80的情況下,把新焊接機(jī)是否比現(xiàn)有的設(shè)備高5個(gè)百分點(diǎn)準(zhǔn)確檢測出來 (注:N=7時(shí),實(shí)際的檢驗(yàn)功效為 0.8512)焊接機(jī)焊接機(jī): Minitab 輸出輸出Power and Sample Size 1-Sample t TestTesting mean = null (versus null)Calculating power for mean = null + differenceAlpha = 0.01 Assumed standard deviation = 3 Sa

37、mple TargetDifference Size Power Actual Power 5 7 0.8 0.851212樣本容量樣本容量-51F某工程師想通過實(shí)施一個(gè)全階乘某工程師想通過實(shí)施一個(gè)全階乘DOE (3DOE (3因子,因子,8 8運(yùn)行運(yùn)行) ),來研究恒,來研究恒溫箱對溫度、流體密度和液罐變化的動作靈敏度;溫箱對溫度、流體密度和液罐變化的動作靈敏度; F0.0010.001英寸的動作就影響功能表現(xiàn)。設(shè)計(jì)隊(duì)想探測這樣或更高幅英寸的動作就影響功能表現(xiàn)。設(shè)計(jì)隊(duì)想探測這樣或更高幅度的影響;度的影響; F必須考慮恒溫箱動作中的工程散布,必須考慮恒溫箱動作中的工程散布,SPCSPC數(shù)據(jù)顯示

38、標(biāo)準(zhǔn)偏差約為數(shù)據(jù)顯示標(biāo)準(zhǔn)偏差約為0.0010.001英寸;英寸; F可以接受的可以接受的風(fēng)險(xiǎn)(說一個(gè)因子的兩個(gè)水平不同,而實(shí)際上相同風(fēng)險(xiǎn)(說一個(gè)因子的兩個(gè)水平不同,而實(shí)際上相同的風(fēng)險(xiǎn))是的風(fēng)險(xiǎn))是0.030.03; F由于時(shí)間的限制,只能作兩次再現(xiàn)(共由于時(shí)間的限制,只能作兩次再現(xiàn)(共1616次運(yùn)行),次運(yùn)行), 有關(guān)該有關(guān)該DOEDOE計(jì)劃的報(bào)告必須上報(bào)給工程主管。計(jì)劃的報(bào)告必須上報(bào)給工程主管。 例題例題2-檢驗(yàn)功效計(jì)算:恒溫箱檢驗(yàn)功效計(jì)算:恒溫箱 DOE706080D A Y&NI GH T樣本容量樣本容量-52零假設(shè)零假設(shè) (Ho): 實(shí)驗(yàn)因子對恒溫箱動作實(shí)驗(yàn)因子對恒溫箱動作沒有

39、影響沒有影響 備擇假設(shè)備擇假設(shè) (Ha):實(shí)驗(yàn)因子對恒溫箱動作實(shí)驗(yàn)因子對恒溫箱動作有影響有影響 恒溫箱恒溫箱 DOE: 假設(shè)假設(shè)樣本容量樣本容量-53觀察到觀察到0.001英寸尺度影響(當(dāng)此影響存在時(shí))的概率是多少?英寸尺度影響(當(dāng)此影響存在時(shí))的概率是多少?(即此計(jì)劃完的(即此計(jì)劃完的DOE 的檢驗(yàn)功效是多少?)的檢驗(yàn)功效是多少?) 從所給的信息,我們知道從所給的信息,我們知道 顯著水平顯著水平, = 0.03再現(xiàn)數(shù)再現(xiàn)數(shù) = 2.影響差異影響差異, = 0.001 英寸英寸標(biāo)準(zhǔn)偏差標(biāo)準(zhǔn)偏差, = 0.001 英寸英寸備擇假設(shè)備擇假設(shè) (Ha) 是,因子對恒溫箱的動作有影響是,因子對恒溫箱的

40、動作有影響 恒溫箱恒溫箱 DOE: 檢驗(yàn)功效檢驗(yàn)功效 樣本容量樣本容量-54選擇選擇 Stat Power and Sample Size 2 Level Factorial Design6. 輸入alpha, 2. 輸入循環(huán)數(shù) 填寫選項(xiàng)1-5。然后點(diǎn) “Options” 并填選項(xiàng)6。最后,在所有打開的窗口中點(diǎn) OK 1. 輸入因子數(shù)4. 輸入影響尺度, 5. 輸入 sigma, 3. 輸入再現(xiàn)數(shù)恒溫箱恒溫箱 DOE: 利用利用 Minitab樣本容量樣本容量-55Minitab 告訴我們,兩次再現(xiàn)時(shí)的檢驗(yàn)功效只有 0.3234,這意味著我們很可能不能看到0.001英寸尺度的影響,顯然需要更多

41、的再現(xiàn)數(shù). 恒溫箱恒溫箱 DOE: Minitab 輸出輸出Power and Sample Size 2-Level Factorial DesignAlpha = 0.03 Assumed standard deviation = 0.001Factors: 3 Base Design: 3, 8Blocks: noneCenter TotalPoints Effect Reps Runs Power 0 0.001 2 16 0.323375樣本容量樣本容量-56i某公司正在考慮決定是否變更供應(yīng)商;某公司正在考慮決定是否變更供應(yīng)商; i供應(yīng)商供應(yīng)商X X是當(dāng)前的供應(yīng)商,其不良率約為是當(dāng)前

42、的供應(yīng)商,其不良率約為10%10%;而;而供應(yīng)商供應(yīng)商Y Y是一個(gè)是一個(gè)新供應(yīng)商,其許諾提供部品的不良率將小于新供應(yīng)商,其許諾提供部品的不良率將小于10%10%; i顧客認(rèn)為如果供應(yīng)商顧客認(rèn)為如果供應(yīng)商Y Y比供應(yīng)商比供應(yīng)商X X的不良率小的不良率小1 1個(gè)百分點(diǎn),則更換個(gè)百分點(diǎn),則更換供應(yīng)商就有經(jīng)濟(jì)利益;供應(yīng)商就有經(jīng)濟(jì)利益; i用來決定是否值得采用供應(yīng)商用來決定是否值得采用供應(yīng)商Y Y的樣本容量是多少?的樣本容量是多少? i為了比較,分別計(jì)算獲得檢驗(yàn)功效為為了比較,分別計(jì)算獲得檢驗(yàn)功效為0.60.6、0.70.7、0.80.8和和0.90.9 所需所需要的樣本容量;要的樣本容量;i假設(shè)假設(shè)a

43、 = 0.05 = 0.05 例題例題3-樣本容量計(jì)算樣本容量計(jì)算 : 拒絕部品比例拒絕部品比例 樣本容量樣本容量-57零假設(shè)零假設(shè) (Ho): 供應(yīng)商之間部品的不供應(yīng)商之間部品的不良率沒有差異良率沒有差異 備擇假設(shè)備擇假設(shè) (Ha):供應(yīng)商供應(yīng)商X的部品不的部品不良率要大于供應(yīng)商良率要大于供應(yīng)商Y的的拒絕部件的比例:假設(shè)拒絕部件的比例:假設(shè) 樣本容量樣本容量-58在檢驗(yàn)功效分別為在檢驗(yàn)功效分別為0.6、0.7、0.8和和0.9時(shí),能計(jì)算并比較兩個(gè)觀察時(shí),能計(jì)算并比較兩個(gè)觀察 的不良率所需樣本容量是多少?的不良率所需樣本容量是多少? 從所給的信息,我們知道從所給的信息,我們知道 顯著水平顯著水

44、平, = 0.05如果供應(yīng)商如果供應(yīng)商Y的部品不良率要比供應(yīng)商的部品不良率要比供應(yīng)商X低一個(gè)百分點(diǎn),低一個(gè)百分點(diǎn), 顧客將選擇供應(yīng)商顧客將選擇供應(yīng)商Y 比例的差異比例的差異 , d = 0.01備擇假設(shè)備擇假設(shè) (Ha) 是供應(yīng)商是供應(yīng)商X的不良率大于供應(yīng)商的不良率大于供應(yīng)商Y的不良率的不良率 拒絕部品比例拒絕部品比例: 樣本容量樣本容量樣本容量樣本容量-59選擇選擇 Stat Power and Sample Size 2 Proportions5. 輸入 alpha, 4. 指定供應(yīng)商 X大于供應(yīng)商 Y先填選項(xiàng) 1-3;然后點(diǎn)“Options” 并填選項(xiàng) 4和5;最后,在所有打開的窗口中點(diǎn) OK 2. 輸入檢驗(yàn)功效3.輸入供應(yīng)商 Y 的比例 拒絕部品比例拒絕部品比例: 利用利用 Minitab1. 輸入供應(yīng)商 X 的不良率樣本容量樣本容量-60Power and Sample Size Test for Two ProportionsTesting p

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論