六西格瑪之分析階段 S8 49 相關(guān)回歸 p50.ppt_第1頁(yè)
六西格瑪之分析階段 S8 49 相關(guān)回歸 p50.ppt_第2頁(yè)
六西格瑪之分析階段 S8 49 相關(guān)回歸 p50.ppt_第3頁(yè)
六西格瑪之分析階段 S8 49 相關(guān)回歸 p50.ppt_第4頁(yè)
六西格瑪之分析階段 S8 49 相關(guān)回歸 p50.ppt_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、相關(guān)回歸( Correlation & Regression ),Define,Measure,Analyze,Improve,Control,Step 8- Data 分析,Step 9- Vital Few X的選定,Multi Vari Central limit Hypothesis testing Confidence interval ANOVA, T-test Chi-square Correlation,regression,Step 7- Data 收集,路徑位置,目的,定義并計(jì)算相關(guān)系數(shù) 討論相關(guān)性及因果關(guān)系 繪制并分析擬合直線圖 介紹回歸分析的基本知識(shí) 使用回歸分析技術(shù)建

2、立數(shù)學(xué)預(yù)測(cè)模型,X和Y數(shù)據(jù)類型研究,Y 是什么? _ 數(shù)據(jù)類型? _,X 是什么? _ 數(shù)據(jù)類型?_,你將使用哪種工具? _,設(shè)計(jì)小組想了解引擎壽命與車輛重量有無(wú)關(guān)系,分析路線圖(單一 X :?jiǎn)我?Y),X Data,離散,連續(xù),Y Data,離散,連續(xù),Chi-Square,Logistic Regression,T test/ANOVA Means / Medians Tests,Regression,相關(guān)(Correlation):是什么?,“相關(guān)”為什么如此重要 ? 你是否經(jīng)歷過(guò)測(cè)量某些產(chǎn)品合格后送給顧客,但他們 告訴你你的產(chǎn)品不符合規(guī)格? 在奧運(yùn)會(huì)滑冰比賽上,你認(rèn)為兩個(gè)裁判成績(jī)的相關(guān)

3、性 有多高?,這兩張圖有何不同?,“+” 相關(guān)的強(qiáng)度與趨向,“-” 負(fù)相關(guān)的強(qiáng)度與趨向,相關(guān)系數(shù)(r) 的確認(rèn),有幾種方法可以決定 r 值 相關(guān)研究 擬合直線圖 回歸分析 讓我們一一探討各個(gè)方法,打開(kāi)文件 Correlation.MPJ 中的工作表 Correlation Example 依據(jù)產(chǎn)品特性,確定 Customer 與 Supplier 之間的相關(guān)性,相關(guān)性分析,既然我們使用統(tǒng)計(jì)檢驗(yàn)方法,則 “假設(shè)” 需被檢驗(yàn)! Ho: 沒(méi)有相關(guān)存在 Ha: 有相關(guān)存在 若p值大于 0.05,即接受 Ho ,亦即 X 與Y 之間沒(méi)有相關(guān)存在; 若p值小于0.05,則 Ho 被拒絕且 Ha 將被接受,

4、亦即有相關(guān)存在,相關(guān)性分析,結(jié)果: Correlation Example 相關(guān): Supplier, Customer Supplier 和 Customer 的 Pearson 相關(guān)系數(shù) = 0.834 P值 = 0.000,結(jié)果顯示在對(duì)話窗中 注意,我們得到相關(guān)系數(shù)及P值 你對(duì) Supplier 和 Customer 之間的關(guān)系有何見(jiàn)解?,相關(guān)性分析,r 應(yīng)該多大?,依樣本大小,若所得的相關(guān)系數(shù)比表中的值大,則可視為 “重要” 或統(tǒng)計(jì)顯著,r 應(yīng)該多大?,勿需擔(dān)心此表,Minitab 可以幫助我們 在 “相關(guān)” 程序中選取 顯示 p 值 選項(xiàng), Minitab 將會(huì)顯示是否顯著 尋找比

5、0.05 小的 p-值,在1930 1936 年間,曾有人跟蹤德國(guó)城鎮(zhèn) Oldenburg 的人口與鸛鳥(niǎo)數(shù)量之間的關(guān)系 結(jié)果如下(人口以千為單位),顯然,鸛鳥(niǎo)送來(lái)了嬰兒 ?。?相關(guān)舉例,相關(guān)(Correlation) 直線傾向 (正或負(fù)) 斜率:直線角度 其測(cè)量值為 r,回歸(Regression) 回歸預(yù)測(cè)方程 其測(cè)量值為 R2 殘差分析 線性,二次或三次擬合,最佳擬合直線,相關(guān)與回歸,回歸的定義/術(shù)語(yǔ),回歸分析 是一種用于分析變量間相關(guān)性的統(tǒng)計(jì)工具。在統(tǒng)計(jì)課程中通常被稱為:“計(jì)算最佳擬合直線” 本課程將討論簡(jiǎn)單回歸分析,其探討對(duì)象為單一連續(xù)Y 與單一連續(xù)X的關(guān)系 下列術(shù)語(yǔ)可經(jīng)常交換使用:回

6、歸方程式* 回歸線 預(yù)測(cè)方程式 預(yù)測(cè)線 模型,回歸,分析路線圖,規(guī)劃分析內(nèi)容,收集數(shù)據(jù),利用 Minitab 繪制 擬合直線圖,評(píng)估 R2和 P 值的顯著性,評(píng)估殘差,制訂決策,分析路線圖,范例:brake.mtw,進(jìn)行21次速度測(cè)試,你對(duì)此數(shù)據(jù)有何看法?,擬合直線圖,我也想對(duì)相關(guān)性進(jìn)行檢驗(yàn),并觀察線性關(guān)系和數(shù)據(jù)點(diǎn)的之間的擬合性 使用 Fitted Line Plot 選項(xiàng)來(lái)看此關(guān)系,提供視覺(jué)化圖表和方程式,擬合直線圖,Minitab :輸出結(jié)果,Y = 182.807 + .476288x 該線性方程為 Y = m(x) + b m = 直線斜率 b = 截距 該方程給我們一個(gè)對(duì)能力的估計(jì)值

7、 注意 R2 = .695 稍后將作詳細(xì)討論,一些基礎(chǔ)知識(shí)回顧,Y 截距,斜率,(,),Y,m,X,b,=,+,中學(xué)代數(shù)所學(xué)的方程式,在回歸中,以 b0 和 b1 表示,使用回歸方程:內(nèi)推法與外推法,Y = 182.807 + .476288 x,例: 若速度測(cè)量值為 400,我們對(duì)剎車距離的合理估計(jì)值應(yīng)該是多少? 例: 若速度測(cè)量值為 1000,我們對(duì)距離的合理估計(jì)值應(yīng)該是多少? 例: 若速度測(cè)量值為 0,我們對(duì)距離的合理估計(jì)值應(yīng)該是多少?,此擬合直線從何而來(lái)?,Minitab 將找出一條直線,使各點(diǎn)至該直線的距離為最小.,* * * * * * * * * * *,擬合線,實(shí)際數(shù)據(jù)點(diǎn),實(shí)際

8、點(diǎn)與直線的距離,輸入變量 (X),輸出變量 (Y),擬合直線圖:預(yù)測(cè)帶,置信區(qū)間 Confidence Interval: 代表基于系數(shù) b0 及 b1 的置信區(qū)間 預(yù)測(cè)區(qū)間 Prediction Interval: 給定X,在單一測(cè)試中Y有95% 的可能性會(huì)落在預(yù)測(cè)帶內(nèi),擬合直線圖:預(yù)測(cè)帶,R2 :其意義是什么?,R2 與P 值,有助于我們基于統(tǒng)計(jì)作決策。R2 被稱為決定系數(shù) (coefficient of determination ) R2 值代表“多少”輸出變異總量可由回歸模型所解釋,其值介于 0 到 1 (0% 到 100%)之間。此值越高表示該模型的可信度越高,R2,100%,0%

9、,R2 :值大小應(yīng)為多少 ?,視分析對(duì)象而定 就像安全系統(tǒng)或文件夾 例如,排放廢氣系統(tǒng)實(shí)驗(yàn)的結(jié)果將送交交通部審查,你的數(shù)值應(yīng)該“好”到什么程度? 不同的課題決定不同的決策標(biāo)準(zhǔn) (通常為 +60%)。我們必須認(rèn)識(shí)到 R2 越高相關(guān)性就越強(qiáng)。,還記得 ANOVA 及我們對(duì) X 顯著性的看法嗎?,區(qū)分變異的來(lái)源,生產(chǎn)周期的所有變異,周間的變異,周內(nèi)的變異,=,+,對(duì)CycleTim的方差分析 來(lái)源 自由度 SS MS F P Week 3 1032.48 344.16 299.38 0.000 Error 96 110.36 1.15 Total 99 1142.84,SS 或 Sum of the

10、 Squares 將數(shù)據(jù)的變異量化 通過(guò)計(jì)算 Epsilon2 值,來(lái)檢驗(yàn)X 實(shí)際的顯著性 此值告訴我們有多少總變異可被 X 所解釋 Epsilon 2 = = = 90.34%,SS for X1032.48 SS Total1142.84,還記得 ANOVA 及我們對(duì) X 顯著性的看法嗎?,ANOVA 與回歸有什么關(guān)系?,SSE ( Sum of Squares due to the Error ) 目標(biāo):最小化此值,SST ( Sum of Squares Total ),SSR (Sum of Squares due to the Regression),總變異 = 群內(nèi)變異 + 群間

11、變異,解釋時(shí),請(qǐng)使用可靠的判斷,理解R2,R-Squared .80 相關(guān)可能顯著 R-Squared .50 且 .80 需要判斷 R-Squared .50 相關(guān)可能不顯著,0,1,相關(guān)可能不顯著,0.8,0.5,相關(guān)可能顯著,需要判斷,即:有多少比率的 Y 變異可歸因于與 X 的關(guān)系,SpeedDistanceRESI1FITS1 336325-17.8392342.839,殘差與擬合值: 它們是什么?,擬合線,336,325,實(shí)際數(shù)據(jù)點(diǎn),殘留距離 (-17.8392),理論點(diǎn),SpeedDistanceRESI1FITS1 336325-17.8392342.839 418375-6.

12、8948381.895 35536715.1113351.889 445385-9.7546394.755 36537518.3484356.652 455395-4.5175399.517 39539524.0598370.940 405365-10.7031375.703 3463557.3979347.60 . . . . . . . . .,Minitab:更多的輸出結(jié)果,殘差與擬合值,數(shù)據(jù)應(yīng)該通過(guò)“Fat Pencil Test” (粗鉛筆檢測(cè)),殘差分析,數(shù)據(jù)分布應(yīng)趨近于正態(tài)曲線,數(shù)據(jù)應(yīng)該受控, 探討異常點(diǎn),數(shù)據(jù)應(yīng)呈現(xiàn)無(wú)規(guī)則狀,殘差分析,為什么進(jìn)行殘差分析?,關(guān)鍵的回歸假設(shè)基于殘差

13、(而不是原始數(shù)據(jù))的屬性。 我們假設(shè)殘差: 與 X 無(wú)關(guān) 穩(wěn)定而且獨(dú)立, 不隨時(shí)間變化 是常量,不隨預(yù)測(cè)的 Y 增加 而增大 是正態(tài)的(鐘形的), 平均值為 0,是否總是線性關(guān)系?,打開(kāi)工作表 Multiwet.mtw 執(zhí)行 Fitted Line Plot 并假定 Y=WetPU 且 X=ol_ph,R2 = 27.2% 是該關(guān)系的正確評(píng)估嗎?,你可利用二次或三次方程,得到較合適的擬合線 中學(xué)代數(shù) y = 3 + 4x + 2x2 在討論溫度或壓力數(shù)據(jù)值時(shí),??吹酱岁P(guān)系,R2 值由 27% 增加到 79%,多項(xiàng)式回歸分析:wet_pu 與 ol_ph 回歸方程為 wet_pu = - 11.

14、42 + 8.405 ol_ph - 1.113 ol_ph*2 S = 0.0911530 R-Sq = 79.5% R-Sq(調(diào)整) = 78.7% 方差分析 來(lái)源 自由度 SS MS F P 回歸 2 1.54843 0.774213 93.18 0.000 誤差 48 0.39883 0.008309 合計(jì) 50 1.94725 方差的序貫分析 來(lái)源 自由度 SS F P 線性 1 0.53021 18.33 0.000 二次 1 1.01822 122.55 0.000,注意,在此我們檢驗(yàn)多個(gè)假設(shè) 我們?nèi)绾斡?jì)算 Epsilon2值?,小測(cè)驗(yàn),1) 下列哪組數(shù)據(jù)適于應(yīng)用相關(guān)和回歸分析?

15、 顧客類型與銷售量 顧客大小與利潤(rùn) 月與庫(kù)存 2) 解釋下頁(yè)圖表的意義 A) Wet_pu 與sl_vi 之間有無(wú)關(guān)系 B) 其關(guān)系為正向還是負(fù)向? C) 若sl_vi 為 47.3 ,預(yù)測(cè) Wet_pu 的值為多少? 3) 是/非:若能確立 X 與 Y間的相關(guān)性,我就可以認(rèn)為 Y 的變化是由 X 所引起的?,陳述因果關(guān)系應(yīng)該小心,即使我們建立了 y 與 x 的相關(guān)性,但并不能代表 x 的變異將一定導(dǎo)致 y 的變異。 其他潛在的變量,可能造成 x 與 y 的改變。,研究指出,醫(yī)院規(guī)模增加,病人死亡率亦顯著提升。這么說(shuō)來(lái),我們應(yīng)該避免去大型醫(yī)院就診嗎?,回歸問(wèn)題探討:X 丟失,回歸問(wèn)題探討:研究范圍過(guò)于狹窄,0 1 2 4 5 X= 車齡,Y =

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論