海爾4.4_六西格瑪之分析階段_假設(shè)檢驗_第1頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、假設(shè)檢驗 ( Hypothesis Testing )DefineMeasureAnalyzeImproveControlStep 8- Data 分析Step 9- Vital Few X的選定 多變量研究 中心極限定理 假設(shè)檢驗 置信區(qū)間 方差分析,均值檢驗 卡方檢驗 相關(guān)/回歸分析Step 7- Data 收集路徑位置目 錄假設(shè)檢驗概要假設(shè)檢驗的核心用語假設(shè)檢驗的定義假設(shè)檢驗的階段假設(shè)檢驗的應(yīng)用?親愛的 Abby:你在你的專欄里說婦女懷孕期是266天。這是誰說的?我懷我的孩子用了10個月零5天,這是確信無疑的,因為我精確地知道孩子懷上的那一天。我的丈夫在海軍服役,這個孩子不可能在其他任何

2、時間懷上,因為我見到他只一次,只有一個小時,而且在孩子出生之前我再也沒有和他見面。我不飲酒,也不東奔西跑,而且這個孩子不可能不是他的。所以請在報紙上聲明收回關(guān)于 266 天懷孕的時間。因為否則我將面臨許多的麻煩! - 圣地亞哥讀者你將對她說些什么?對他的丈夫說些什么?假設(shè)檢驗概要一則有趣的故事250 260 240 230 270 280 290 300 220 平均圣地亞哥的讀者平均懷孕時間是266天如果她說懷孕260天,你對她懷疑嗎?如果她說懷孕400天,你對她懷疑嗎?從哪點起你開始懷疑呢?作一個記號假設(shè)檢驗概要醫(yī)生很早就知道孩子自然出生有以下特征 正態(tài)分布 平均懷孕時間 = 天 標(biāo)準(zhǔn)偏差

3、 = 天假設(shè)檢驗概要產(chǎn)科醫(yī)生早就知道: 正態(tài)分布平均 = 266 天 標(biāo)準(zhǔn)偏差 = 16 天假設(shè)檢驗概要平均 = _266_標(biāo)準(zhǔn)偏差 = _16_ 臨產(chǎn)期間分布圣地亞哥的讀者,究竟如何呢?假設(shè)檢驗概要 在工業(yè)生產(chǎn)中,我們經(jīng)常希望能夠確定某個分布的參數(shù)是否就是某個具體數(shù)值或是否與其有什么關(guān)系。也就是說,我們可能希望要檢驗這樣一個假設(shè),即:某個分布的均值或標(biāo)準(zhǔn)差是否是某些數(shù)值,或者兩個均值之差是否是零。這些檢驗就需要使用假設(shè)檢驗方法。實際工作中的例子有: 1、制造商希望引進(jìn)一種新產(chǎn)品。為了能夠?qū)崿F(xiàn)利潤,它們需要在今后5周的200小時內(nèi)生產(chǎn)1200件產(chǎn)品。如果生產(chǎn)一件產(chǎn)品的平均時間不超過6小時,那么

4、目標(biāo)就會實現(xiàn)。生產(chǎn)者可以通過檢驗平均生產(chǎn)時間等于6小時這一假設(shè)來評估其是否具備所需要的生產(chǎn)能力。 2、這個制造商還打算修改工藝流程以減少另一種產(chǎn)品所需要的平均時間。它通過檢驗在工藝流程改變前后的平均生產(chǎn)時間是否相同這一假設(shè)來評估流程的修改是否有效。這兩種情況都涉及到對總體均值的檢驗。假設(shè)也可以檢驗標(biāo)準(zhǔn)差或其他參數(shù)。工業(yè)案例的啟示假設(shè)檢驗概要假設(shè)檢驗是抽樣推斷的一個重要內(nèi)容。所謂假設(shè)檢驗,就是事先對總體參數(shù)或總體分布形式的作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定應(yīng)接受或否定原假設(shè)。所以,假設(shè)檢驗也稱為顯著性檢驗。 假設(shè)檢驗可分為兩類: 一

5、是參數(shù)假設(shè)檢驗,簡稱參數(shù)檢驗; 二是非參數(shù)檢驗或自由分布檢驗妥善處理不確定 使主觀最小化問題假設(shè)預(yù)防重要信息的遺漏控制判斷錯誤的風(fēng)險假設(shè)檢驗概要:目的是處理實際問題的方法,把實際問題變成統(tǒng)計問題因為我們用(相對小的)樣本來估計總體的參數(shù),因而總有可能為我們的實驗選擇一個“怪異” 的樣本,它可能不能代表一子群“典型”的觀測.因此,推論統(tǒng)計學(xué)可利用一些假設(shè), 允許我們估計純粹由于偶然原因?qū)е碌牡玫揭粋€“怪異”結(jié)果的概率.比如,如果我們要知道一個硬幣是否“公平”, 我們可以拋它數(shù)次,記錄我們看到它出現(xiàn)正面的次數(shù). 根據(jù)隨機(jī)我們期望大約看到50%正面.如果我們拋了10次硬幣,得到10次正面, 我們將清

6、楚的確信這個硬幣不“公平”. 用一個公平的硬幣1000次只有一次機(jī)會獲得10個正面.因此我們可以說我們對于“不公平”的硬幣的判斷將有0.1%的錯誤機(jī)會.即只有1000分之1 (概率性的) 很難得發(fā)生的事件卻在一次實驗中發(fā)生了,則我們這時判斷為硬幣是非正常的。)假設(shè)檢驗概要在不好的一天我們可以得到一個好的工程而在一個好天里我們可以得到一個壞工程無論哪一種情況,我們都可能作出錯誤的結(jié)論良品率研究 1研究 2我們聲明我們在工程中取得了改善,而這個改善結(jié)果可能只是抽樣的函數(shù)假設(shè)檢驗概要假設(shè)是關(guān)于某事是對的描述.如果我們拋10次硬幣得到了8次正面,我們將說這個硬幣是不公平的.在此我們有錯誤的概率(約5%

7、),但我們愿意承擔(dān)這個風(fēng)險.在工廠里我們用同樣的方法驗證假設(shè)我們將把原因歸結(jié)于非常的事件,而不是純粹偶然.問題:我們?nèi)绾舞b別非常事件?我們?nèi)绾卫媒y(tǒng)計學(xué)來幫助我們作出判斷?我們知道樣本數(shù)據(jù)服從自然散布。當(dāng)某事“真的發(fā)生”時我們怎樣知道是真實發(fā)生還是偶然發(fā)生?讓我們開始研究這個程序。假設(shè)檢驗概要為何使用假設(shè)檢驗?當(dāng)無法確定是否存在真實差異時使用假設(shè)檢驗。例如,分層點圖顯示子群平均值之間沒有明顯差異:您想知道平均值的微小差異是由于隨機(jī)變化還是反映了真實差異。假設(shè)檢驗比分層點圖提供更明確的結(jié)果(如果假設(shè)滿足的話)。Reactor 1 Reactor 289 8481 8684 8384 9187 8

8、679 7985 8281 8983 8384 88Reactor.mtw讓我們看一個制造示例。假設(shè)我們改造了兩臺反應(yīng)器中的一臺反應(yīng)器。在我們改造所有反應(yīng)器之前我們想知道這些改善是否“顯著地”提高了工程良品率。 讓我們看一下結(jié)果數(shù)據(jù)。在這個示例中,反應(yīng)器B是新改造的反應(yīng)器。 假設(shè)檢驗概要實際問題: 與代表現(xiàn)有工藝的反應(yīng)器1相比,對反應(yīng)器2的改造能提高良品率嗎? 統(tǒng)計問題:反應(yīng)器2的平均值(85.54)和反應(yīng)器1的平均值(84.24)的差異是否足以被認(rèn)為是顯著的? 或者說這兩個平均值是否足夠接近,可被認(rèn)為是由于偶然因素或日與日之間的散布呢? 差異 = 1.3%假設(shè)檢驗概要Variable N M

9、ean StDev MedianReactor1 10 84.24 2.902 84.500Reactor2 10 85.54 3.65 85.40 . . . . . : :. . . . . . . .-+-+-+-+-+-+- 80.0 82.5 85.0 87.5 90.0 92.5B B B B B BB B B B80.0 82.5 85.0 87.5 90.0 92.5A AA AAAA A A反應(yīng)器 2反應(yīng)器 1這兩個反應(yīng)器代表兩個不同的工藝嗎? 這兩個反應(yīng)器代表一個基本的工藝嗎?假設(shè)檢驗概要假設(shè)檢驗的前提假設(shè)如果數(shù)據(jù)是連續(xù)的,我們假設(shè)基本分布是正態(tài)。您可能需要轉(zhuǎn)換非正態(tài)數(shù)據(jù)(

10、如周期)。當(dāng)比較不同總體的子群時,我們假設(shè):獨立樣本。通過隨機(jī)抽樣實現(xiàn)。樣本是總體的代表(沒有偏差)。當(dāng)比較不同過程的子群時,我們假設(shè):每個過程都是穩(wěn)定的。沒有特殊原因或隨時間的變化(沒有與時間相關(guān)的差異)。樣本是過程的代表(沒有偏差)。主要核心術(shù)語1、實際推斷原理: 概率小的事件幾乎不會發(fā)生2、零假設(shè)(Null Hypothesis- Ho)又名原假設(shè) 它是關(guān)于“沒有差異”或者“根本沒有效果”或“是相同的”陳述的假設(shè), 它直到有充分的證據(jù)說明其是錯誤時為止總被認(rèn)為是真實的。3、備擇假設(shè)(Alternative Hypothesis- Ha)又名替代假設(shè) 它是關(guān)于“有差異”或“有效果”,或“不

11、同的”陳述的假設(shè) 它在零假設(shè)被推翻時生效的另一個假設(shè),根據(jù)具體事件有不同的假設(shè);4、類錯誤: 又名“棄真錯誤”,是指零假設(shè)是真的時候而拒絕它5、值:又稱顯著性水平,是指犯一類錯誤的概率,值越大,則越有可能 拒絕真實的零假設(shè),該值一般沒有統(tǒng)一的基準(zhǔn),通常設(shè)定為0.05, 如果犯一類錯誤將會造成嚴(yán)重性的后果,則要求它設(shè)定小些。6、P值: 顯示了犯一類錯誤的可能性,用來判斷是拒絕或接受零假設(shè)的。 P值越小,犯拒絕零假設(shè)錯誤的可能性越小。 一般情況下,如果P0.05,則零假設(shè)成立, 如果P0.05,則推翻零假設(shè)。7、類錯誤: 又名”取偽錯誤”,是指零假設(shè)是假的時候而接受它.8、值:是指犯二類錯誤的概率

12、,越大,則越有可能接受不真實的零假設(shè) 顯著差異 (Significant Difference) - 用于描述統(tǒng)計性假設(shè)檢驗的結(jié)果 的術(shù)語,在此差異大的不能合理的隨機(jī)發(fā)生。那里很可能在發(fā)生什么特殊事9、檢驗功效(Power) - 統(tǒng)計檢驗的能力,探測出某事很重要時,實際上 某事確實很重要。常被用來決定在處置中樣本的大小是否足以探測到存在差異。 零假設(shè)不真實時推翻錯誤零假設(shè)的概率, 即能夠檢出假的零假設(shè)的概率。(1-)11.檢驗統(tǒng)計量(Test Statistic) -一個標(biāo)準(zhǔn)化的數(shù)值(z、t、F等),代表錯誤 確認(rèn)的可能性,分布于一個已知的方式,以便可以決定這個觀察到的數(shù)值的概率 通常錯誤確認(rèn)

13、越可行,檢驗統(tǒng)計量的絕對值就越小, 而且在其分布內(nèi)觀察到 這個數(shù)值的概率就越大。主要核心術(shù)語實際的假設(shè)是:新改造的機(jī)器將減少不良. 這個假設(shè)叫做備擇假設(shè) (Ha)統(tǒng)計假設(shè): 舊機(jī)器和改善的機(jī)器之間沒有差異. 這個假設(shè)叫做零假設(shè) (Ho)我們必須證明我們觀察到的數(shù)值極不可能出自相同的工藝,所以 Ho 肯定錯了. 假設(shè)檢驗定義陳述一個 “零假設(shè)” (Ho)收集證據(jù) (一個實際樣本)判定:這個證據(jù)支持什么? 推翻 Ho? 或者 不推翻 Ho?假設(shè)檢驗程序關(guān)于零假設(shè).零假設(shè)(Ho) 被假定是對的這就象被告被假定“無罪”一樣。 記住: 美國的司法系統(tǒng)不是“被證明清白之前有罪” 我們不在我們的實驗 “無影

14、響”的概率小到不能相信之前假設(shè)實驗有影響。你就是被告的辯護(hù)律師。你必須提供證據(jù)來消除“合理的懷疑” “沒有罪” “無罪” 記住:假設(shè)檢驗定義一般假設(shè)檢驗 與Y=f(x1,x2.xn)有相同的樣式。這式中X對Y有顯著影響假設(shè)是真實還是假,實施檢驗。假設(shè)檢驗的基本假設(shè)和意識決定的風(fēng)險我們調(diào)查之前對意識決定的風(fēng)險度(作錯誤判定的程度, , 失誤)與敏感度(效果的大小和標(biāo)準(zhǔn)偏差的比)具體的制定, 異常的樣本規(guī)格 作決定。然后考慮為合理性的抽樣計劃所具備的費用、時間、可利用的資源等實質(zhì)性的界限。 假設(shè)檢驗定義假設(shè)檢驗中的兩種錯誤(實際真相)子群相同子群不同接受 H0:子群相同結(jié)論或決定拒絕 H0:子群不

15、同沒有錯誤類錯誤 類錯誤沒有錯誤我們基于假設(shè)檢驗所做的任何決定都有四種可能結(jié)果:我們可決定這些子群是相同還是不同,以及我們可能是對或錯。在決定推翻與否時,我們可能會犯兩類判斷錯誤中的一個: 你的判定接受 Ho真理Ho 對Ho 錯I類錯誤 (-風(fēng)險)II類錯誤 (-風(fēng)險)正確正確推翻 Ho假設(shè)檢驗定義陪審團(tuán)的判決他無罪真實實際清白實際有罪I類錯誤 (-風(fēng)險) II 類錯誤 (-風(fēng)險)正確正確他有罪后果: 罪犯獲得自由后果:清白的人進(jìn)監(jiān)獄假設(shè)檢驗定義示例: 機(jī)場安檢假設(shè)檢驗定義報警機(jī)的判斷包里沒問題真實包里沒問題包里有危險品 I類錯誤 (-風(fēng)險) II 類錯誤 (-風(fēng)險)正確正確包里有危險品后果:

16、 _后果: _類錯誤和類錯誤的實際含義兩種類型的錯誤都重要。過于防范一個錯誤將增大另一個錯誤發(fā)生的風(fēng)險。增大樣本大?。航档皖愬e誤的風(fēng)險。允許您檢測到更小的差異。重要差異與顯著差異顯著但不重要的差異有時,您檢測到一個統(tǒng)計上顯著的差異但它小到 對您的企業(yè)沒有實際的重要性。示例:安裝機(jī)器的兩種方法新方法明顯要比標(biāo)準(zhǔn)方法快大約 10 分鐘。要證明實施新方法的成本是適當(dāng)?shù)?,有必要減少 30 分鐘。重要差異與顯著差異(續(xù))重要但不顯著的差異有時,一個差異在統(tǒng)計上不能說是顯著的,但該觀測差異對于 您的企業(yè)而言卻很重要。示例:密封容器的兩種方法在實驗時觀測到每班增加 1000 個容器。增加 1000 個對企業(yè)

17、很重要。新技術(shù)有更高的平均值,但在統(tǒng)計上卻不能宣稱有顯著的差異 (因為 P .05)。觀測差異由于隨機(jī)變化而產(chǎn)生且不存在真正的差異,或者變化太大(或樣本大小太?。┎荒軝z測到差異。企業(yè)領(lǐng)導(dǎo)者需要決定是否值得冒險實施新方法。如果存在真正的差異,您最好實施新方法。但是如果新方法產(chǎn)生相同的結(jié)果,則只會徒勞無功。假設(shè)檢驗 : 怎樣進(jìn)行? 收集數(shù)據(jù)后,我們計算以下兩種參數(shù): 檢驗統(tǒng)計量 (形如信噪比SNR,如Z- 或 T-值), 和 “P-值”.“P-值” 是 “Ho 正確” 發(fā)生的概率。 P-值基于假設(shè)的或?qū)嶋H參考的分布(正態(tài)分布, T-分布, Chi-平方分布, F-分布, 等.)小的 “P-值”大的

18、 “Z” 或 “T”, 等Ho 被推翻大的 “P-值”小的 “Z” 或 “T”, 等Ho 不被推翻P 值定義假設(shè)檢驗比較觀測到的各子群之間的差異。假設(shè)真實差異為 0(= 零假設(shè)),P 值等于獲得觀測差異的概率。P 值范圍從 0.0 到 1.0(0% 可能性到 100% 可能性)。按照慣例,通常將 P .05 視作是差異明顯的象征。如果 P .05,則可推斷真實差異為 0 的概率很小。討論:解釋 P 值有多種方法來陳述根據(jù) P 值得到的結(jié)論。您認(rèn)為下面哪些最容易理解?P 值用于判斷觀測到的各子群之間差異是否明顯大于普通原因(隨機(jī))變化(如果 P .05,結(jié)論是肯定的)。如果 P .05,則拒絕

19、H0 而決定使用 Ha。P .05 意味著子群來自相同分布的概率小于 5%。P 值確定觀測到的差異是否在統(tǒng)計上看較顯著(如果 P .05,結(jié)論是肯定的)。假設(shè)真實差異為 0,P 值等于獲得觀測差異的概率。如果 P 值很小 ( .05),我們說觀測差異必須顯著,因為如果沒有真實差異,我們從樣本中觀測到這類差異的概率就較小。P 值用于判斷拋棄零假設(shè)是否有足夠的統(tǒng)計證據(jù)(如果 P .05,結(jié)論是肯定的)。1.71.20.795% Confidence Intervals for SigmasP-Value : 0.341Test Statistic: 0.925Levenes TestP-Value

20、 : 0.315Test Statistic: 1.009Bartletts TestFactor Levels21Homogeneity of Variance Test for ComboP值到處都存在!P-Value: 0.020A-Squared: 0.889Anderson-Darling Normality TestN: 25StDev: 0.943184Average: 10.07991211109.999.99.95.80.50.20.05.01.001ProbabilityMach 1Normal Probability PlotOne-Way Analysis of Var

21、ianceAnalysis of VarianceSource DF SS MS F PFactor 1 0.12 0.12 0.11 0.740Error 48 53.71 1.12Total 49 53.83 Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev -+-+-+-+-Mach 1 25 10.080 0.943 (-*-) Mach 2 25 9.980 1.161 (-*-) -+-+-+-+-Pooled StDev = 1.058 9.60 9.90 10.20 10.50P-value要

22、多小根據(jù)狀況有所不同. 通常我們使用 0.05。 我們希望這些觀察結(jié)果隨機(jī)發(fā)生的機(jī)會小于10% (= 0.10).5% 會更好一些 (= 0.05).1% 感覺非常好 ( = 0.01).的水平取決于我們的假設(shè)“沒有差別”和所參考的散布類型。但 顯著水平根據(jù)我們的關(guān)心與結(jié)果的置信度有所不同. (飛機(jī)部品的1%和木筷1%能一樣嗎.) 假設(shè)檢驗的類型假設(shè)檢驗?zāi)康膖 檢驗成對 t 檢驗ANOVA(F 檢驗)(變異數(shù)的分析) 檢驗比較兩子群平均值當(dāng)數(shù)據(jù)匹配時比較兩子群平均值比較兩子群或多子群平均值比較兩子群或多子群變異數(shù)比較兩子群或多子群比例Y(輸出) X(輸入) 連續(xù)離散(比例)離散 (“子群”)連

23、續(xù)檢驗t 檢驗成對 t 檢驗ANOVA 邏輯回歸回歸不同數(shù)據(jù)類型的適當(dāng)分析方法當(dāng)輸入 (X) 變量是離散變量時,使用假設(shè)檢驗。將離散 X 當(dāng)作“分子群”或由分層變量來看 X。示例:如果您希望按產(chǎn)品比較周期,那么不同產(chǎn)品類型就是離散 X。如果 X 數(shù)據(jù)是連續(xù)的,則使用回歸分析判斷它們是否與輸出 (Y) 變量相關(guān)。假設(shè)檢驗回歸分析我使用哪種分析方法? 否,X 是連續(xù)的回歸主題檢驗ANOVAt 檢驗否,Y 是離散的(比例)否,比較更多的子群(平均值或變異數(shù))是是是是成對 t 檢驗 否,比較兩個獨立的子群平均值將兩子群平均值與匹配的數(shù)據(jù)相比較X 是否是離散的? (子群)Y 是否 是連續(xù)的?僅比較 2子群嗎?Y1是否與Y2 匹配在假設(shè)檢驗中處理非正態(tài)連續(xù)數(shù)據(jù)方法找到一種使數(shù)據(jù)近似為正態(tài)的轉(zhuǎn)換方法。對轉(zhuǎn)換的數(shù)據(jù)進(jìn)行“假設(shè)檢驗”。1.定義實際問題 2.陳述目標(biāo)(產(chǎn)生統(tǒng)計問題) 3.建立假設(shè)-陳述零假設(shè) (Ho) -陳述備擇假設(shè) (Ha).4.決定合適的統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論