六西格瑪分析之中心極限定理_第1頁
六西格瑪分析之中心極限定理_第2頁
六西格瑪分析之中心極限定理_第3頁
六西格瑪分析之中心極限定理_第4頁
六西格瑪分析之中心極限定理_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、中心極限定理中心極限定理 -1-中心極限定理中心極限定理 -2-中心極限定理中心極限定理 -3-Step 8- Data 分析分析Step 9- Vital Few X的選定的選定q 多多變變量量研研究究q 中心中心極極限定理限定理q 假假設(shè)檢驗設(shè)檢驗q 置信置信區(qū)間區(qū)間q 方差分析,均方差分析,均值檢驗值檢驗q 卡方卡方檢驗檢驗q 相相關(guān)關(guān)/回回歸歸分析分析Step 7- Data 收集收集路徑位置路徑位置理論課理論課中心極限定理中心極限定理 -4-q 定義定義 q 中心極限定理的應用中心極限定理的應用 1. 正態(tài)分布的例子 2. Chi-Square分布的例子q 標準誤差與樣本大小的關(guān)系標

2、準誤差與樣本大小的關(guān)系目目 錄錄中心極限定理中心極限定理 -5-定義定義q 中心極限定理是闡述大量隨機變量之和的極限分布是正態(tài)分布的一系中心極限定理是闡述大量隨機變量之和的極限分布是正態(tài)分布的一系列定理的總稱。最常用的有:列定理的總稱。最常用的有:q 獨立同分布中心極限定理獨立同分布中心極限定理: “隨機變量隨機變量x1,x2,獨立,且服從同一分布,獨立,且服從同一分布, 若存在有限的數(shù)學期望若存在有限的數(shù)學期望E(xi)=u和方差和方差D(xi)=2, 當當n時,隨機變量的總和時,隨機變量的總和xi趨于均值為趨于均值為nu,方差為,方差為n 2的正態(tài)分布。的正態(tài)分布。 (即算術(shù)平均數(shù)(即算術(shù)

3、平均數(shù)1/n xi=xbar趨于均值為趨于均值為u,方差為,方差為2/n的正態(tài)分布)的正態(tài)分布)” 不論總體服從何種分布,只要它的數(shù)學期望和方差存在,不論總體服從何種分布,只要它的數(shù)學期望和方差存在, 從中抽取容量為從中抽取容量為n的樣本,則這個樣本的總和或平均數(shù)是隨機變量,的樣本,則這個樣本的總和或平均數(shù)是隨機變量, 當當n充分大時,充分大時, xi或或 xbar趨于正態(tài)分布。趨于正態(tài)分布。中心極限定理中心極限定理 -6-定義定義q 德莫佛德莫佛- -拉普拉斯中心極限定理拉普拉斯中心極限定理: “如果用如果用X表示表示n次獨立試驗中事件次獨立試驗中事件A發(fā)生發(fā)生(“成功成功”)的次數(shù),的次數(shù)

4、,P是事件是事件A在每在每次試驗中發(fā)生的概率次試驗中發(fā)生的概率,則則X服從二項分布服從二項分布,B(n,p), 當當n時,時,X趨于均值為趨于均值為np,方差為,方差為npq的正態(tài)分布。的正態(tài)分布。 ” 正態(tài)分布和泊松分布都是二項分布的極限分布正態(tài)分布和泊松分布都是二項分布的極限分布 當n足夠大時, 可用正態(tài)分布近似計算; 當n足夠大且p小時,可用泊松分布近似計算。q 中心極限定理是一種十分重要的現(xiàn)象中心極限定理是一種十分重要的現(xiàn)象,它是統(tǒng)計學中應用的許多方法它是統(tǒng)計學中應用的許多方法的理論基礎(chǔ)的組成部分的理論基礎(chǔ)的組成部分(如如:計算樣本均值的置信區(qū)間計算樣本均值的置信區(qū)間) 中心極限定理中

5、心極限定理 -7-利用同樣的數(shù)據(jù)畫出兩種不同的控制圖利用同樣的數(shù)據(jù)畫出兩種不同的控制圖, ,并仔細比較它們的差異并仔細比較它們的差異: : 打開文件CENLIMIT.MTW .分別用下面的兩個路徑畫出個體圖和子群大小為5的均值圖 個體圖路徑 均值圖路徑應用應用中心極限定理中心極限定理 -8-圖形輸出圖形輸出樣本平均樣本平均 仔細比較兩個圖上的控制上下線仔細比較兩個圖上的控制上下線(UCL(UCL和和LCL),LCL),有什么不同有什么不同? ?應用應用1361211069176614631161100908070605040觀觀測測值值單單獨獨值值_X =68.28UCL=96.59LCL=3

6、9.97O Ou ut tp pu ut t 的的單單值值控控制制圖圖28252219161310741807570656055樣樣本本樣樣本本均均值值_X =68.28UCL=80.70LCL=55.861O Ou ut tp pu ut t 的的 X Xb ba ar r 控控制制圖圖中心極限定理中心極限定理 -9-個體控制圖和個體控制圖和 X barX bar控制圖的差異控制圖的差異UCLX3LCLX3UCLnX3LCLnX315100102030405060應用應用中心極限定理中心極限定理 -10-E平均值分布的標準偏差叫做平均值分布的標準偏差叫做 E這個公式表明平均值比個體數(shù)據(jù)更穩(wěn)定

7、,穩(wěn)定因子是樣本數(shù)的平這個公式表明平均值比個體數(shù)據(jù)更穩(wěn)定,穩(wěn)定因子是樣本數(shù)的平方根。方根。xxn x 均值標準誤差均值標準誤差個體值的標準差個體值的標準差n =平均值的樣本數(shù)平均值的樣本數(shù)x均值的標準誤差(均值的標準誤差(Standard Error of the MeanStandard Error of the Mean)其中其中中心極限定理中心極限定理 -11-MS meanMSn() 我們經(jīng)常依靠從測量系統(tǒng)中得到的一個數(shù)值來估計我們經(jīng)常依靠從測量系統(tǒng)中得到的一個數(shù)值來估計輸入輸入或或輸輸出出變量的值變量的值。減小測量系統(tǒng)誤差的簡易方法就是把兩個或更多的。減小測量系統(tǒng)誤差的簡易方法就是把

8、兩個或更多的讀數(shù)平均。讀數(shù)平均。 我們的測量系統(tǒng)的精密度自動增加,增加因子是平均值樣本我們的測量系統(tǒng)的精密度自動增加,增加因子是平均值樣本數(shù)的平方根數(shù)的平方根, ,如果我們要想使測量系統(tǒng)的誤差減小一半,我們就如果我們要想使測量系統(tǒng)的誤差減小一半,我們就需要把需要把4 4次的測量值平均才可以。次的測量值平均才可以。實際應用實際應用測量系統(tǒng)的改善測量系統(tǒng)的改善中心極限定理中心極限定理 -12-l當總體數(shù)據(jù)具備正態(tài)分布時當總體數(shù)據(jù)具備正態(tài)分布時中心極限定理理解例題模擬中心極限定理理解例題模擬-1-1l 假設(shè)你面前有一個大桶假設(shè)你面前有一個大桶, ,桶里面裝有相當多數(shù)量的白色紙條桶里面裝有相當多數(shù)量的

9、白色紙條, ,每張紙條上都寫每張紙條上都寫 有數(shù)字,且假定這些數(shù)字都來自一個具有特定平均值和標準偏差的正態(tài)分布有數(shù)字,且假定這些數(shù)字都來自一個具有特定平均值和標準偏差的正態(tài)分布. . 1)1)從中隨機抽出從中隨機抽出9 9張白色紙條張白色紙條, ,并把其上面的并把其上面的9 9個數(shù)字求平均個數(shù)字求平均, , 2)2)然后把這個平均值寫在一張綠色紙條上然后把這個平均值寫在一張綠色紙條上, , 3)3)把這把這9 9張白色紙條放回原來的桶里張白色紙條放回原來的桶里, , 4)4)把這張綠色紙條放入另外一個桶里把這張綠色紙條放入另外一個桶里, , 如此重復上面的步驟,直到盛有綠色紙條的桶放滿為止。如

10、此重復上面的步驟,直到盛有綠色紙條的桶放滿為止。l白色紙條代表總體的數(shù)據(jù);白色紙條代表總體的數(shù)據(jù);l綠色紙條代表平均值的樣本;綠色紙條代表平均值的樣本;l我們用我們用MINITABMINITAB來模擬做這個練習。來模擬做這個練習。中心極限定理中心極限定理 -13-:讓我們用讓我們用MINITABMINITAB產(chǎn)生一些模擬的數(shù)據(jù)來驗證我們的理論。產(chǎn)生一些模擬的數(shù)據(jù)來驗證我們的理論。:首先用首先用MINITABMINITAB產(chǎn)生產(chǎn)生9 9列各列各250250個數(shù)據(jù),假設(shè)這些數(shù)據(jù)來自一個個數(shù)據(jù),假設(shè)這些數(shù)據(jù)來自一個 平均值平均值=70=70、標準偏差標準偏差=9=9的正態(tài)分布的正態(tài)分布: :則列則列

11、C1-C9 C1-C9 代表白色紙條代表白色紙條:然后求出各行然后求出各行9 9個數(shù)據(jù)的平均值,其結(jié)果放在列個數(shù)據(jù)的平均值,其結(jié)果放在列C10C10,則,則:C10C10代表綠色紙條。代表綠色紙條。:我們用描述統(tǒng)計的方法求出各列數(shù)據(jù)的平均和標準偏差。我們用描述統(tǒng)計的方法求出各列數(shù)據(jù)的平均和標準偏差。:仔細比較仔細比較C1-C9C1-C9列與列與C10C10列有什么差別?列有什么差別? 例題例題1 1 中心極限定理應用模擬中心極限定理應用模擬中心極限定理中心極限定理 -14-1 1、用、用MINITABMINITAB隨機產(chǎn)生樣本數(shù)據(jù)隨機產(chǎn)生樣本數(shù)據(jù)分別輸入下列信息分別輸入下列信息中心極限定理中心

12、極限定理 -15-2 2、樣本平均數(shù)計算、樣本平均數(shù)計算中心極限定理中心極限定理 -16-3 3、輸出:產(chǎn)生、輸出:產(chǎn)生1010列數(shù)據(jù)列數(shù)據(jù)注意:每次每個人操作產(chǎn)生的數(shù)據(jù)都不一樣注意:每次每個人操作產(chǎn)生的數(shù)據(jù)都不一樣中心極限定理中心極限定理 -17-4 4、描述統(tǒng)計路徑、描述統(tǒng)計路徑中心極限定理中心極限定理 -18-5 5、描述統(tǒng)計結(jié)果比較、描述統(tǒng)計結(jié)果比較描述性描述性統(tǒng)計統(tǒng)計: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 平均平均值值變變量量 N N* 平均平均值值 標標準準誤誤 標標準差準差 最小最小值值 下四分位下四分位數(shù)數(shù) 中位中位數(shù)數(shù) 上四分位上四

13、分位數(shù)數(shù)C1 250 0 70.605 0.534 8.439 43.537 64.924 70.895 76.690C2 250 0 69.633 0.623 9.847 43.521 63.094 70.174 76.382C3 250 0 69.643 0.591 9.341 47.785 62.617 69.063 76.286C4 250 0 70.293 0.559 8.846 49.313 64.745 69.702 75.834C5 250 0 70.705 0.603 9.542 45.849 64.118 70.673 77.782C6 250 0 69.385 0.587

14、 9.288 41.398 63.237 69.285 76.174C7 250 0 70.228 0.543 8.585 48.888 64.444 70.587 75.767C8 250 0 69.852 0.592 9.357 41.977 63.096 69.826 77.060C9 250 0 70.126 0.568 8.988 48.100 64.023 69.871 75.867C10 250 0 70.052 0.185 2.930 61.501 68.167 70.479 72.180 xxxn99933中心極限定理中心極限定理 -19-5 5、描述統(tǒng)計結(jié)果比較(續(xù))、描述

15、統(tǒng)計結(jié)果比較(續(xù))描述性描述性統(tǒng)計統(tǒng)計: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 平均平均值值變變量量 N N* 平均平均值值 標標準準誤誤 標標準差準差 最小最小值值 下四分位下四分位數(shù)數(shù) 中位中位數(shù)數(shù) 上四分位上四分位數(shù)數(shù)C1 250 0 70.605 0.534 8.439 43.537 64.924 70.895 76.690C2 250 0 69.633 0.623 9.847 43.521 63.094 70.174 76.382C3 250 0 69.643 0.591 9.341 47.785 62.617 69.063 76.286C4

16、 250 0 70.293 0.559 8.846 49.313 64.745 69.702 75.834C5 250 0 70.705 0.603 9.542 45.849 64.118 70.673 77.782C6 250 0 69.385 0.587 9.288 41.398 63.237 69.285 76.174C7 250 0 70.228 0.543 8.585 48.888 64.444 70.587 75.767C8 250 0 69.852 0.592 9.357 41.977 63.096 69.826 77.060C9 250 0 70.126 0.568 8.988

17、 48.100 64.023 69.871 75.867C10 250 0 70.052 0.185 2.930 61.501 68.167 70.479 72.180現(xiàn)在開始比較?,F(xiàn)在開始比較。中心極限定理中心極限定理 -20-7674727068666462403020100C C1 10 0頻頻率率均值70.05標準差 2.930N250C C1 10 0 的的直直方方圖圖正態(tài) 90.082.575.067.560.052.5403020100C C9 9頻頻率率均值70.13標準差 8.988N250C C9 9 的的直直方方圖圖正態(tài) l樣本的散布樣本的散布( (C C9)9)和樣本平

18、均的散布和樣本平均的散布( (C10)C10)進行比較。進行比較。散布散布減少了很多減少了很多. = = 8.988 = = 2.9306 6、直方圖直方圖結(jié)果比較結(jié)果比較中心極限定理中心極限定理 -21-l用點圖比較頻度數(shù)用點圖比較頻度數(shù)則則能夠更明確的了解能夠更明確的了解散布散布。7 7、點圖點圖結(jié)果比較結(jié)果比較91847770635649C9C10數(shù)數(shù) 據(jù)據(jù)C C 9 9 , , C C 1 1 0 0 的的 點點 圖圖每個符號最多表示 2 個觀測值。中心極限定理中心極限定理 -22-F樣本平均值分布的樣本平均值分布的平均值平均值和總體的平均值十分接近和總體的平均值十分接近;F樣本平均值

19、分布的樣本平均值分布的標準偏差標準偏差等于總體的標準偏差除以等于總體的標準偏差除以樣本數(shù)的平方根樣本數(shù)的平方根;F樣本平均值的分布十分接近正態(tài)分布。樣本平均值的分布十分接近正態(tài)分布。8 8、結(jié)論結(jié)論中心極限定理中心極限定理 -23-q 當總體數(shù)據(jù)是非正態(tài)分布時,若從中隨機抽樣當總體數(shù)據(jù)是非正態(tài)分布時,若從中隨機抽樣n n個并計算其平均,個并計算其平均, 同樣如此反復若干次,然后比較這些平均的散布與這些個體值的同樣如此反復若干次,然后比較這些平均的散布與這些個體值的 散布,你會發(fā)現(xiàn),當散布,你會發(fā)現(xiàn),當n n時,時,x-barx-bar的散布也具有正態(tài)分布。的散布也具有正態(tài)分布。q 為了驗證為了

20、驗證, ,我們在非正態(tài)分布中隨機選擇一個偏移較大的分布我們在非正態(tài)分布中隨機選擇一個偏移較大的分布- - “Chi-SquareChi-Square分布分布”,求其,求其x-barx-bar來體會一下中心極限定理。來體會一下中心極限定理。 l當總體數(shù)據(jù)不具備正態(tài)分布時當總體數(shù)據(jù)不具備正態(tài)分布時中心極限定理理解例題模擬中心極限定理理解例題模擬-2-2中心極限定理中心極限定理 -24-1 1、用卡方分布隨機產(chǎn)生、用卡方分布隨機產(chǎn)生9 9列,每列各有列,每列各有250250個數(shù)據(jù)個數(shù)據(jù)中心極限定理中心極限定理 -25-1 5 . 01 2 . 51 0 . 07 . 55 . 02 . 50 . 0

21、C C 9 9C C 9 9 的的 點點 圖圖每 個 符 號 最 多 表 示 2 個 觀 測 值 。2 2、用產(chǎn)生的數(shù)據(jù)進行、用產(chǎn)生的數(shù)據(jù)進行點圖點圖描繪和描繪和正態(tài)檢驗正態(tài)檢驗 在這里看到,這是一個很偏移的分布,在這里看到,這是一個很偏移的分布,我們用它來驗證中心極限定理我們用它來驗證中心極限定理151050-599.99995908070605040302010510.1C C9 9百百分分比比均值2.008標準差2.149N250AD15.427P 值0.005C C9 9 的的概概率率圖圖正態(tài) - 95% 置信區(qū)間中心極限定理中心極限定理 -26-C10 C10 項是對項是對 C1C9

22、 C1C9 的平均值的數(shù)據(jù)統(tǒng)計,的平均值的數(shù)據(jù)統(tǒng)計,同樣樣本大小為同樣樣本大小為 9 9,其散布明顯變得小多了。,其散布明顯變得小多了。描述性描述性統(tǒng)計統(tǒng)計: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 平均平均值值變變量量 N N* 平均平均值值 標標準準誤誤 標標準差準差 最小最小值值 下四分位下四分位數(shù)數(shù) 中位中位數(shù)數(shù) 上四分位上四分位數(shù)數(shù)C1 250 0 1.917 0.122 1.932 0.002 0.543 1.252 2.602C2 250 0 2.038 0.112 1.768 0.003 0.602 1.453 3.068C3 250 0 2.072 0.130 2.050 0.009 0.558 1.402 2.853C4 250 0 2.005 0.139 2.204 0.002 0.551 1.327 2.875C5 250 0 1.854 0.109 1.726 0.009 0.534 1.283 2.595C6 250 0 1.954 0.129 2.039 0.003 0.477 1.347

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論