相關及回歸分析.ppt_第1頁
相關及回歸分析.ppt_第2頁
相關及回歸分析.ppt_第3頁
相關及回歸分析.ppt_第4頁
相關及回歸分析.ppt_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

相關及回歸分析,方法論,Analyze 概要 DATA 收集計劃 Graph 分析 假設檢定概要 平均的檢定,分散的檢定 比率的檢定 相關及回歸分析,相關及回歸分析,學習目標 理解相關、回歸分析的概念及用語。 理解相關、回歸分析的使用目的。 理解利用Minitab的相關分析方法。 理解利用Minitab的回歸分析方法。,定義,相關分析(Correlation Analysis) : 是把計量型輸出變量和計量型輸入變量之間相關程度, 利用相關常數(r)“數量化”的技法。 回歸分析(Regression Analysis) : 導出輸入變量X和輸出變量Y的函數關系,預測輸出變量的 統(tǒng)計性分析技法。 回歸式(Regression Equation) : 為預測對應的輸出值,利用輸入值的預測方程式。,為什么使用這樣的工具?,不防礙工程進行,對工程有意義的 DATA收集可能。 進行DOE時跟加人為的變化比較 相關關系是提供Graph分析,輸入變量和輸出變量的相關性計量化而確認。 回歸分析使用于為了管理輸入變量的預測式導出。 回歸分析能顯示輸入變量和輸出變量之間的因果關系,所以能決定潛在Xs是否為Vital Few Xs., 散點圖 (Scatter Diagram), 相關分析 (Correlation Analysis),在統(tǒng)計學中最有興趣的問題中的一個變量間相關性分析的方法 , 通過散點圖和相關常數能分析。,例) 智能指數和學業(yè)成績、吸咽量和肺癌的發(fā)生率、身高和體重、工程溫度和 制品強度、運動量和肺活量間的關系、所得和消費支出。,相關分析的第一階段,把相互對應的資料 用作表平面上的點來表示的Graph, 能大概確認兩個變量之間的關系。,相關分析, 相關常數 (Correlation Coefficient),定量表示兩個變量之間線形關系的指標,并不表示函數關系。 一般用 表示,其范圍是 1 1. 一般不可知道的正確值, 因此使用從Sample中推定的值 r 。, 相關常數 (Correlation Coefficient)的性質,r 值,(+) 時 陽的相關關系 () 時 陰的相關關系 接近于0時,沒有相關關系。 接近于-1 或1時有強的相關關系。,相關分析, 散點圖和相關關系,強的陽的相關關系,弱的陽的相關關系,中間程度的陽的相關關系,強的陰的相關關系,弱的陰的相關關系,中間程度的陰的相關關系,相關分析,相關常數的亂用和誤用,檢定兩個變量之間存在相關關系,并不是一個變量成為 另一個變量的原因。 可能會藏在對兩個變量都有影響的第三變量。 即,兩個變量之間存在相關關系的結論,并不是一個變量 成為另一個變量的原因。,相關關系并不一定意味著因果關系!,通過下例觀察散點圖和相關分析。,廣告費 (10萬) 銷售額 (100萬) 廣告費 (10萬) 銷售額 (100萬),4 9 12 23 8 20 6 18 9 22 10 25 8 15 6 10 7 17 9 20,下面是表示某公司的廣告費用和銷售額之間關系的資料。 求這公司的廣告費和銷售額的相關常數。,例題1,相關分析,Step 1,Work sheet 里輸入DATA,(Correlation.mtw),Step 2,Graph Plot,通過Plot 作成散點圖的結果, 預測是陽的相關關系。,( Y 欄里C2, X欄里 輸入C1),相關分析,Step 3,Stat Basic Statistics Correlation,Step 4,Session 結果確認,選擇兩個 變量列,相關常數是 0.853有陽的相關關系, p 值為 0.002小于 留意水準 0.05,所以廣告費和銷售額的相關關系是有影響的。,相關常數,p 值,相關分析, 回歸分析 (Regression Analysis),為了查明變量之間函數的相關性而假定某數學Model,從已測定變量的Data中 推定其Model的統(tǒng)計性分析方法。根據這樣的函數Model,從一個變量的變化 能預測另一個變量的變化,例) 父親和兒子的身高關系 工程溫度影響的制品強度,輸出變量 : 欲預測的變量,受輸入變量影響的變量。 輸入變量 : 影響輸出變量的變量。, 輸入變量和輸出變量(反應變量),父親的身高和工程溫度是獨立變量, 兒子的身高和制品的強度是從屬變量!,回歸分析,R-Sq值叫決定系數用 R2表示。 在0 R2 1范圍,總變動中被回歸線說明的變動所占的比率。 R2 值越接近1時,回歸線越高,判斷有意義。 合理的值是多少? 根據情況不同?;瘜W者要求的是 0.99程度的R2 值, 但根據工程和產業(yè)不同。一般值為0.7以上是可以認為輸出變量和 輸入變量的關系大。 如果R2是0.679(67.9%) ,用回歸方程式能說明散布的67.9%, 剩下的 32.1%是別的原因造成的。,決定系數(Coefficient of Determination ),回歸分析,通過下例觀察回歸分析和決定系數。,例題2,為了知道機械的使用年度和 整備費用之間有什么關系,得到了有關對相同機械 整備記錄的如下DATA。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整備費用(千元),1) 對這個DATA求說明 x與 y之間關系的單純回歸方程式。 2) 使用年度為10年時,整備費用是多少?,回歸分析,Step 1,Work sheet里 DATA 輸入,Step 2,Stat Regression Regression,選擇輸出變量列,選擇輸入變量列,(Regression.mtw),回歸分析,選擇顯示在殘差Graph的 殘差形態(tài),Regression - Graphs : 選擇為幫助最佳回歸模型分析的殘差 Plot 的形態(tài),Histogram of residuals : 殘差Histogram 作成 Normal plot of residuals : 為殘差的正規(guī)性檢定而作成Graph Residuals versus fits : 作成殘差和被適合值的圖 Residuals versus order : 作成殘差對觀測順序的圖 Residuals versus the variables : 作成殘差對指定變量的圖,回歸分析,Residual Plots,輸入所需的x 值,通過得出的回歸式 可以求 值和信賴區(qū)間。 輸入10,能計算出10年后的整備 費用(預測值)。,Regression - Options : 可以選擇加重值列,預測新的觀測值確認信賴區(qū)間。,回歸分析,Storage : 選擇從Work sheet 的輸入變量和輸出變量列的下一個列開始被Check的項目。,Results :調整對顯示在Window Section的回歸模型的分析結果范圍。,回歸分析,Step 3,Session結果確認,關于整備費用和使用年度的回歸式是,決定系數R-Sq 值為61%,在全體變動中按回歸直線 說明的變動是61%.,使用年度10年的機械的整備費用 期待值是165.48,對其的95% 信賴區(qū)間是(123.66, 207.29).,回歸分析,p 值為0.001小于留意水準0.05, 所以認為上面的回歸式有意。,R-Sq(adj)是在回歸式上每追加變量R-Sq 值就增加的調整值。 輸入變量兩個以上時,此值有意義, 所以一般分析 R-Sq(adj).,Step 1,Stat Regression Fitted Line Plot,選擇輸出變量列,選擇輸入變量列,回歸模型的類型決定 (1次, 2次, 3次),回歸分析,Fitted Line Plot : 欲用Graph分析時活用。,Step 2,Graph 結果確認,回歸分析, 殘差分析,從實際值中減掉被回歸模型適合的值叫殘差,通過殘差分析我們要確認模型的適合性。,殘差分析,殘差越小,推定的回歸式越準確 說明實際觀測結果。 殘差是誤差最好的推定值。 殘差按獨立變量的大小順序或者 資料的輸入順序排列時,確認他 們對0對稱 ,不顯示特別的傾向。,殘差,實際值,回歸模型,殘差 :,例題3,為了知道機械的使用年度和整備費用之間有什么關系,得到了對相同機械的 整備記錄有關的如下 Data。得出適合值和殘差后執(zhí)行殘差分析。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整備費用(千元),殘差分析,Step 1,Work sheet 里輸入DATA,(Residuals.mtw),Step 2,Stat Regression Regression,選擇從屬變量列,選擇獨立變量列,殘差分析,Storage,Fits(適合值) Check,Residuals(殘差) Check,Step 3,Work sheet 結果確認,殘差和 適合值被儲存。,Step 4,Stat Regression Residual Plots,選擇適合值列,選擇殘差列,殘差分析,Step 5,確認Graph,殘差分析, 結果分析,通過Normal Plot of Residuals 數據分布接近于對角線,所以可以說殘差的分布 接近于正態(tài)分布。 ( 通過Stat Basic Statistics Normality Test 更仔細地做到正規(guī)性檢定。) 在I Chart of Residuals中不離開管理限界線,因不具有任何Perform, 所以可以說殘差的分布是穩(wěn)定的。 Histogram of Residuals 是表示殘差形態(tài)的Graph。 Residuals vs. Fits 是殘差對適合值的Graph,在0近處任意地分布。 因此,可以說回歸模型是適合的。,殘差分析,實習,按下面方法做紙飛機的實習。 1) 機翼長度為 6 14cm 2) 機翼長度按每次5mm差剪掉。 3) 測定2.5m高度的降落時間。 得到回歸方程式后,求降落時間成為2秒及2.5秒時的翅膀的長度。,90 分鐘,練習問題,1. 下表是檢查人的記憶力x 和判斷力 y 的 。,記憶力 x 11 10 14 18 10 6 12 8 15 16 判斷力 y 6 4 6 9 2 3 3 9 6 7,按以下順序分析。,1) 記述X變量和Y變量之間的關系。(例: X減少時,Y增加) 2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論