6西格瑪回歸分析課件_第1頁
6西格瑪回歸分析課件_第2頁
6西格瑪回歸分析課件_第3頁
6西格瑪回歸分析課件_第4頁
6西格瑪回歸分析課件_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

回歸分析RegressionAnalysis目的Objectives介紹相關(guān)性及回歸的基本概念I(lǐng)ntroduceTheBasicConceptsofCorrelationandRegression把回歸與六西格瑪路線圖結(jié)合起來LinkRegressionToTheSixSigmaRoadmap學習多元回歸的使用ReviewtheuseofMultipleRegression介紹相關(guān)性及回歸的基本概念I(lǐng)ntroduceTheBasicConceptsofCorrelationandRegression把回歸與六西格瑪路線圖結(jié)合起來LinkRegressionToTheSixSigmaRoadmap學習多元回歸的使用ReviewtheuseofMultipleRegression介紹相關(guān)性及回歸的基本概念I(lǐng)ntroduceTheBasicConceptsofCorrelationandRegression把回歸與六西格瑪路線圖結(jié)合起來

LinkRegressionToTheSixSigmaRoadmap學習多元回歸的使用ReviewtheuseofMultipleRegression2精選2021版課件項目跟蹤圖

第五版項目開始日期21/01/2004項目類別“Y”變量數(shù)據(jù)采集計劃制定項目日程啟動項目書DMAIC改善定義確定”Y”變量和起草項目書項目書得以批準流程圖C&E矩陣或故障樹分析FTA第三十天MBB審閱FMEA或故障樹分析FTA測量系統(tǒng)分析MSA關(guān)鍵”X”變量數(shù)據(jù)采集計劃MBB審閱測量21/01/200404/02/200411/02/200425/02/200409/03/200409/03/200409/03/2004初始能力研究多元變量流程分析MBB審閱合同批準分析22/03/200415/04/200415/04/200415/04/200415/04/2004單因子或多因子測試實驗設計(DOE)MBB審閱改善31/05/200431/05/200431/05/2004控制計劃最終能力研究控制階段FMEA回顧重新修訂RPNMBB審閱項目最終匯報及報告項目審核及項目收尾控制21/06/200429/06/200429/06/200405/07/200409/07/200409/07/200419/07/2004(根據(jù)需要使用)客戶心聲/業(yè)務之聲調(diào)查VOC/VOB需求分析流程再造解決方案設計流程再造在這里輸入開始日期

確定改善方案由項目發(fā)起人在備選項目數(shù)據(jù)庫中完成在6西格瑪數(shù)據(jù)庫查找相似項目實施改善移交培訓/流程所有人簽準再造路線圖的日程是獨立計算的與以上DMAIC的日期不相關(guān)實際完成日期計劃完成日期圖例2/1/020022/3/02完成畫鉤3精選2021版課件分析路線圖

AnalyzeRoadmap

單一因子X-單一因子Y

SingleX-SingleY輸入變量

X

XData離散Discrete

連續(xù)Continuous

輸出變量Y

YData離散Discrete

連續(xù)Continuous

卡方相關(guān)性分析Chi-Square邏輯回歸LogisticRegression方差分析,均值/中位數(shù)測試ANOVAMeans/MediansTests回歸Regression4精選2021版課件什么是Y?_____________數(shù)據(jù)類型?______________什么是X?_____________數(shù)據(jù)類型?______________應該使用何種工具?________________________案例

#1Scenario#1管理者想知道接線員的經(jīng)驗(以月為單位衡量)是否會對接聽顧客熱線電話需要的時間有影響5精選2021版課件相關(guān)性

Correlation什么是相關(guān)性

?

Whatiscorrelation?你是否有過如此經(jīng)驗:測量某些產(chǎn)品并送至顧客處,但他們回來告訴你的產(chǎn)品不符規(guī)格?

Haveyouevermeasuredsomethingandthenshippedtoyourcustomeronlyforthemtotellyouitdoesn’tmeetspec?在奧林匹克溜冰比賽上,你認為兩個裁判成績之相關(guān)性有多高?

HowwellcorrelateddoyouthinktwoiceskatingjudgesareattheOlympics?6精選2021版課件相關(guān)性Correlation路線分析圖AnalyzeRoadmap

畫出點陣圖ProduceScatterPlot計算相關(guān)性CalculateCorrelation評估r和P值

Evaluater

andPvalue7精選2021版課件相關(guān)系數(shù)

CorrelationCoefficients什么是相關(guān)系數(shù)?

SowhatistheCorrelationCoefficientsupposedtobeanyway?相關(guān)系數(shù)(r)介于-1和1之間

TheCorrelationCoefficient(r)liesbetween-1and1一般規(guī)則:GeneralRules相關(guān)系數(shù)(r)>.80或<-0.8為顯著CorrelationCoefficient(r)>.80or<-.80isSignificant相關(guān)系數(shù)(r)介于-.80與0.8之間為不顯著CorrelationCoefficient(r)between-.80and.80isNotSignificant8精選2021版課件“+”相關(guān)性的強度及趨向

StrengthandDirectionof“+”Correlation9精選2021版課件“-”相關(guān)性的強度及趨向

StrengthandDirectionof“-”Correlation10精選2021版課件r應該多大?

HowBigShouldrBe?依你的樣本大小,若所得的相關(guān)性比表中的值大,則可視為“重要”或統(tǒng)計顯著。BygoingtotheSampleSizeofyoursample,anycorrelationthatisgreaterthanthetablevalueisconsideredtobe“important”orstatisticallysignificant.11精選2021版課件r應該多大?

HowBigShouldrBe?勿需擔心此表,Minitab可以幫助我們!

Butdon’tworryaboutthetables,Minitabcanhelpusout!在相關(guān)性程序中選取“Displayp-values”選項,Minitab將會顯示出是否顯著

Ifyouidentifythe‘Displayp-values’optionintheCorrelationprocedure,Min\itabwillgiveyoutheindicationifitissignificant找尋比0.05小的p-值

Lookforap-valuelessthan0.0512精選2021版課件

回歸的定義

RegressionDefinition回歸分析是一種用以分析變量間相關(guān)性的統(tǒng)計工具。統(tǒng)計課程中通常稱其為“最佳擬合線”

Regressionanalysisisastatisticaltechniqueusedtoanalyzethecorrelationbetweenvariables.Thisissometimestaughtinstatisticalcoursesascomputingthe“l(fā)ineofbestfit”.本周課程將討論一元回歸分析,其探討對象為一連續(xù)Y與一連續(xù)X之關(guān)系,之后,我們還將討論多元回歸分析-對象為單一Y與多個連續(xù)X之間的關(guān)系.

Inthis

modulewewilllookatbothSimpleRegressionwhichcomparesonecontinuousYtoonecontinuousXandMultipleRegression-thecomparisonofonecontinuousYwithmorethanonecontinuousX13精選2021版課件01245

X=發(fā)動機重量Y=MPG15105例子:X=發(fā)動機重量Y=每加侖公里數(shù)回歸案例RegressionExample你認為兩變量間是什么關(guān)系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?14精選2021版課件01245

X=司機的經(jīng)驗Y=MPG15105例子:X=司機的經(jīng)驗Y=每加侖公里數(shù)回歸案例RegressionExample你認為兩變量間是什么關(guān)系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?15精選2021版課件01245

X=燃料添加劑量Y=MPG15105例子:X=燃料添加劑量Y=每加侖公里數(shù)回歸案例RegressionExample你認為兩變量間是什么關(guān)系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?16精選2021版課件回歸的定義RegressionDefinitions

01245

X=燃料添加劑量Y=MPG1510501245

X=司機的經(jīng)驗Y=MPG1510501245

X=發(fā)動機重量Y=MPG15105正相關(guān)性PositiveCorrelation負相關(guān)性NegativeCorrelation無相關(guān)性

NoCorrelation17精選2021版課件回歸Regression路線分析圖AnalyzeRoadmap規(guī)劃分析內(nèi)容收集數(shù)據(jù)在Minitab里繪制擬合線圖評估R^2及P值的顯著性評估殘差制定決策18精選2021版課件路線分析圖AnalyzeRoadmap

需要評估的案例:

Project:032REGRESSION011404.mpj,worksheet:Brake.mtw

336 325418 375355 367445 385365 375455 395395 395... ...速度剎車距離進行了對21種速度的測試.

你認為數(shù)據(jù)表明了什么?19精選2021版課件Minitab–回歸Regression20精選2021版課件Minitab–輸出你會做何決策?21精選2021版課件擬合線從何而來WhereDoesThisFittedLineComeFrom?Minitab找到一條線,使各點至線段之距離為最小…

Minitabfindsalinewhichwillminimizethedistancesfromtheplottedpointstotheline.... * * * * * * * * ** * 擬合線FittedLine實際數(shù)據(jù)點ActualDataPoint實際數(shù)據(jù)點與擬合線間的距離DistanceBetweenActualPointandLineInputVariable(X)OutputVariable(Y)22精選2021版課件任何擬合線的一般等式如下…Thegeneralequationofanylineisasfollows...YinterceptSlopeoftheline()YmXb=+高中代數(shù)

所提之方程式在回歸中,等式以b0andb123精選2021版課件輸入變量InputVariable(X)響應變量ResponseVariable(Y)

}b0Y-截距b0是當X=0時,Y的高.換句話說,是擬合線與Y軸的交點.X=024精選2021版課件輸入變量InputVariable(X)響應變量ResponseVariable(Y)

斜率是指:Slopeofthelinemeans

“Y的變化”

“changeinY”

b1

=

“X里1個單位的變化”

“1unitchangeinX”

b125精選2021版課件Minitab–輸出Y=182.8+.4763速度這個等式給我們一個對流程行為的估計Thisequationgivesusanestimationofprocessbehavior.注意R2=69.5%,我們一會兒回將講到.26精選2021版課件Minitab–輸出Y=182.8+.4763xEx: 如果速度為400,剎車大概需要多大的距離?Ifthespeedmeasures400,whatapproximatevalueshouldweexpectindistance?Ex: 如果速度為1000,剎車大概需要多大的距離?

Ifthespeedmeasures1000,whatapproximatevalueshouldweexpectindistance?27精選2021版課件回歸的等式為Theregressionequationis剎車距離BrakingDistance

=182.8+0.4763速度SpeedS=13.5571R-Sq=69.5%R-Sq(adj)=67.9%方差分析AnalysisofVarianceSource DFSSMS FPRegression 17955.97955.9143.290.000Error 193492.1183.79Total 2011448.0Minitab–更多輸出R2

(Sameoneasbefore)28精選2021版課件R2-有何意義?R2與P值,有助我們以統(tǒng)計做決策。R2被稱為判斷系數(shù)R2andP,helpusputsomestatisticalbackingbehindourdecisions.TheR2iscalledthecoefficientofdeterminationR2

值代表“多少”輸出變異總量可由回歸模式所解釋,其值介于0到1(0%到100%)。此值越高代表對該模式的可信度越高.R2isameasureoftheamountofvariationintheoutputthatisexplainedbytheregressionmodel.Itwillalwaysbeavaluebetween0and1(0%to100%).Thehigherthisamount,thegreaterconfidencewehaveinthemodelitself.

R2100%0%29精選2021版課件R2-有何意義?TheR2=69.5%這表明有69.5%的Y(剎車距離)的變差可以由X(速度)來解釋.Thismeans69.5%ofthevariationinY(BrakingDistance)canbeexplainedbytheX(Speed).30.5%是由其他因素引起的.30.5%isduetosomethingelse.你的決策是什么?30精選2021版課件R2-該為多大值?

HowBigShouldItBe?視分析對象而定…如對安全系統(tǒng)或回紋針

Thatanswer“depends”onwhatyouarestudying,e.g.safetysystemsorpaperclips.如果你在實驗一個新的安全保障系統(tǒng),你的數(shù)據(jù)將由交通部審查.你的數(shù)值該需要有多“好”?

Ifyouareexperimentingwithanewsafetyrestraintsystem,yournumberswillprobablybereviewedbytheDepartmentofTransportation.How“good”shouldyoube?不同的課題會有不同的決策標準(通常為+80%)。重要的是我們必須認識到

R2越高,統(tǒng)計模式越好。

Differenttextssuggestdifferentdecisioncriteria(usually+80%).TheimportantthingtorealizeisthatthehighertheR2thebetterthemodel.31精選2021版課件回歸分析:剎車距離v.速度RegressionAnalysis:BrakingDistversusSpeed回歸的等式為Theregressionequationis剎車距離BrakingDistance=182.8+0.4763速度SpeedS=13.5571R-Sq=69.5%R-Sq(adj)=67.9%方差分析AnalysisofVarianceSource DF SS MS F PRegression 1 7955.9 7955.9143.29 0.000Error 19 3492.1 183.79Total 20 11448.0P值–里怎么了?

WhatIsGoingOnHere?AnotherPValue!32精選2021版課件零假設:線段斜率=0 (無相關(guān)性)Ho: SlopeofTheLine=0 (Nocorrelation)備擇假設:線段斜率=0 (有相關(guān)性)Ha: SlopeofTheLine10 (Thereiscorrelation)

記住…P要小,Ho要倒WhenPislow,Homustgo!P

值–另一個假設檢定

AnotherHypothesisTest33精選2021版課件Minitab–回歸-殘差&擬合數(shù)Regression-Residuals&Fits34精選2021版課件Speed Distance RESI1 FITS1336 325 -17.8392 342.839418 375 -6.8948 381.895355 367 15.1113 351.889445 385 -9.7546 394.755365 375 18.3484 356.652455 395 -4.5175 399.517395 395 24.0598 370.940405 365 -10.7031 375.703346 355 7.3979 347.60... ... ... ...Minitab–更多輸出MoreOutput35精選2021版課件速度Speed

距離Distance

殘差1RESI1

擬合數(shù)1FITS1336 325 -17.8392 342.839殘差&擬合數(shù)-它們是什么?

Residual&Fit-WhatAreThey?擬和線FittedLine336325實際點ActualPoint]殘差距離ResidualDistance

(-17.8392)理論擬合點TheoreticalFit

34236精選2021版課件速度Speed

距離Distance

殘差1

RESI1

擬合數(shù)1

FITS1336 325 -17.8392 342.839殘差-點到擬合線的垂直距離

在線下方為負,在線上方為正.Residual-TheverticaldistancetothefittedlineNegativeisbelow,positiveisabove擬合數(shù)-Y值在擬合線上的理論值Fits-Thetheoreticalyvalueonthefittedline殘差&擬合數(shù)-它們是什么?

Residual&Fit-WhatAreThey?37精選2021版課件回歸-殘差&擬合數(shù)-圖表總結(jié)Regression-Residuals&Fits–GraphicalSummary38精選2021版課件數(shù)據(jù)應該通過“胖鉛筆測試”“FatPencilTest”殘差分析ResidualAnalysis數(shù)據(jù)應該像鐘型分布DataShouldFitABellShapedCurve比較P值與殘差正態(tài)分布測試的結(jié)果CheckPvaluewithNormalitytestonResiduals39精選2021版課件數(shù)據(jù)應在控制線內(nèi),調(diào)查異常點DataShouldBeInControlInvestigateOutliers殘差分析ResidualAnalysis數(shù)據(jù)應無任何規(guī)律DataShouldExhibitNoPatterns40精選2021版課件其他案例OtherExamples使用MinitabProject:032regression011404.mpj練習#1: AnalyzeworksheetPaint.mtwY=油漆厚度PaintThicknessX1=氣壓AirPressureX2=黏度Viscosity練習#2:AnalyzeworksheetCust.mtwY=客戶回應時間CustomerResponseTimeX1=代理人有經(jīng)驗程度ExperienceLevelofAgentX2=與客戶的距離DistanceFromCustomerSite練習#3:AnalyzeMysteryData.mtw41精選2021版課件注意陳述中的因果關(guān)系

BewareofStatingCausality

即使我們建立了Y與X之相關(guān)性,但并不能確定X之變異將一定導致Y之變異。

IfweestablishacorrelationbetweenYandaX,thatdoesn’tnecessarilymeanvariationinXcausedvariationinY.

其它潛藏的變量,可能造成X與Y之改變。

Othervariablesmaybe‘lurking’thatcausebothXandYtovary.42精選2021版課件研究指出當醫(yī)院規(guī)模增加,病人死亡率亦顯著提升。

這么說來,我們應該避免去大型醫(yī)院就診嗎?Researchhasconsistentlyshownthatasthehospitalsizeincreases,thedeathrateofpatientsdramaticallyincreases.So,shouldweavoidlargehospitals?回歸問題探討:Xs缺失RegressionIssues-MissingXs01245

X=醫(yī)院規(guī)模Y=死亡率1510543精選2021版課件有關(guān)一個城市的數(shù)據(jù)顯示,當城市里鸛的數(shù)量增加時,城市人口也增加.鸛真的影響城市人口嗎?Dataonacityshowedthataspopulationdensityofstorksincreased,sodidthetown’spopulation.Didstorksinfluencethepopulation?01245

X=鸛的數(shù)量Y=城市人口15105回歸問題探討:Xs缺失RegressionIssues-MissingXs44精選2021版課件回歸問題探討RegressionIssues

研究范圍太狹窄RangeOfStudyTooSmall01245

X=車齡AgeofCarY=車值SalesValue1510545精選2021版課件$車值ValueofCar車齡AgeofCar現(xiàn)在的數(shù)據(jù)看來如何?WhatWouldThisLookLikeNow?01 5101520253035404550回歸問題探討RegressionIssues

研究范圍太狹窄RangeOfStudyTooSmall46精選2021版課件分析路線圖AnalyzeRoadmap

輸入變量XXData單一因子XSingleX多因子

XsMultipleXs輸出變量YYData單一輸出Y

SingleY

多元輸出

Y

MultipleYs

多變量分析MultivariateAnalysis(注意:這與多元變量分析不同)(Note:ThisIsNotTheSameAsMulti-VariAnalysis)輸入變量X

XData離散

Discrete

連續(xù)Continuous

輸出變量Y

YData卡方相關(guān)性分析Chi-Square邏輯回歸LogisticRegressionT測試,方差分析,均值/中位數(shù)測試T-test,ANOVAMeans/MediansTests回歸Regression多元回歸MultipleRegressionMediansTests2,3,4way...ANOVAMultipleLogisticRegression多元邏輯回歸離散

Discrete連續(xù)Continuous離散Discrete連續(xù)Continuous

離散Discrete

連續(xù)Continuous

2,3,4因子方差分析中位數(shù)測試多元邏輯回歸MultipleLogisticRegression輸入變量

X

XData輸出變量Y

YData47精選2021版課件多元回歸分析

MultipleRegressionAnalysis兩個或多個流程變量(X’s)可能對流程表現(xiàn)產(chǎn)生影響(Y).

Twoormoreprocessvariables(X’s)mayhaveaninfluenceuponprocessperformance(Y).多元回歸應用于有兩個或多個可能的預測變量的情況Multipleregressionisusedwhenevertherearetwoormorepossiblepredictorvariables.多元回歸的一般等式為ThegeneralformofthemultipleregressionequationisnnXbXbXbbY++++=...2211048精選2021版課件案例:剎車板銷售量

Example:BrakeSales例中對剎車板銷售量進行20次的觀察.已知有五個流程變量和一個表現(xiàn)變量,Y:TwentyobservationsregardingBrakeSalesaregiven.ThereareFiveknownprocessvariablesandoneperformancevariable,Y:X1=

年度YearX2=市場營銷費用$Mktg$X3=今年銷售人員數(shù)SalesRepX4=去年(銷售人員)數(shù)LY(SalesRep)X5=產(chǎn)品ProductY=銷售Sales利用數(shù)據(jù)找出可能影響”銷售量”的”重要的幾個”流程變量.Usethedatatomineforthe“vitalfew”processvariablesthatmayinfluence“Sales”.49精選2021版課件剎車板銷售量數(shù)據(jù)Year Mktg$ SalesRepLY(SalesRep) Product Sales1 9.6 30 20 18 1302 10.3 20 30 17 1573 10.2 15 20 19 1294 10.4 25 15 22 1295 10.6 30 25 24 1626 10.7 15 30 18 1547 10.5 25 15 17 1328 10.9 35 25 16 1729 11.0 40 35 14 20710 11.1 20 40 18 20411 11.2 25 20 22 14412 11.2 35 25 25 17513 11.4 5 35 27 16714 11.2 12 5 28 9715 11.6 16 12 18 12216 11.7 21 16 16 13917 11.8 22 21 15 15318 11.8 24 22 16 15619 11.8 26 24 10 17220 12.1 28 26 18 178032regression011404.mpjWorksheet“Sales.MTW”50精選2021版課件剎車板銷售量我們的目的是找到適用于下列形式的多元回歸:Ourgoalistofitamultipleregressionofthefollowingform這個問題便于闡明下列多元回歸的其他方面:Thisproblemwillillustratethefollowingadditionalaspectsofmultipleregression去掉沒有解釋能力的變量X

eliminationofX-variablesthathavenoexplanatorypower;殘差分析

residualanalysis留在模式里的變量是能控制的.在6西格瑪里,我們的目標就是要控制少數(shù)變量.Whatstaysinthemodelmusthavecontrols.InSixSigma,goalistocontrolafew.51精選2021版課件多元回歸MultipleRegression路線分析圖規(guī)劃分析內(nèi)容收集數(shù)據(jù)利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關(guān)性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines52精選2021版課件相關(guān)的預測變量(多元共線性)CorrelatedPredictorVariables(Multicollinearity)nnXbXbXbbY++++=...22110流程結(jié)果(Y)與預測變量(X’s)間的相關(guān)性是有用的—它可以幫助我們找出可能的因果關(guān)系.

Correlationbetweentheprocessoutput(Y)andthepredictorvariables(X’s)isgood--helpsusidentifypossiblecauseandeffectrelationships.相反,預測變量間的相關(guān)性卻是一個問題.

Correlationbetweenpredictors,incontrast,isaproblem.計算里的正負符號和預測變量間的相關(guān)性大小可能有錯誤.Calculatedsignsandmagnitudesofcorrelatedpredictorsmaybewrong.計算出的P值可能偏大.CalculatedP-valuesmaybelarge.預測變量間的高相關(guān)性被稱為”共線性”Highcorrelationbetweenpredictorvariablesiscalled“collinearity”53精選2021版課件多元共線性:剎車板銷售量

Multicollinearity:BrakeSales左側(cè)是前20剎車板銷售量預測變量:PredictorVariables:

(1)年度Year;(2)市場營銷費用Marketing$;(3)今年銷售人員數(shù)量HowmanySalesRepsthisyear;(4)去年銷售人員數(shù)量HowmanySalesRepslastyear.(5)產(chǎn)品Product

032regression011404.mpjWorksheet“Sales.MTW”Year Mktg$ SalesRep LY(SalesRep) Product Sales1 9.6 30 20 18 1302 10.3 20 30 17 1573 10.2 15 20 19 1294 10.4 25 15 22 1295 10.6 30 25 24 1626 10.7 15 30 18 1547 10.5 25 15 17 1328 10.9 35 25 16 1729 11.0 40 35 14 20710 11.1 20 40 18 20411 11.2 25 20 22 14412 11.2 35 25 25 17513 11.4 5 35 27 16714 11.2 12 5 28 9715 11.6 16 12 18 12216 11.7 21 16 16 13917 11.8 22 21 15 15318 11.8 24 22 16 15619 11.8 26 24 10 17220 12.1 28 26 18 17854精選2021版課件多元共線性:剎車板銷售量選擇所有五個預測變量和響應變量.Selectallfivepredictorvariablesandtheresponsevariable.使用Minitab菜單,

STAT>BASICSTATS>CORRELATION.不選擇p值選項Uncheckpvalue55精選2021版課件年度和市場營銷費用有著很高的相關(guān)性!我們必須只能選擇一個作為預測變量在回歸擬合中使用.市場營銷費用可能受年度影響,因此我們保留市場營銷費用,而去掉年度變量.TheYearandMarketing$Variablesarehighlycorrelated!Wewillhavetochooseoneortheotherofthecorrelatedpredictorvariables(butnotboth)touseinaregressionfit.Possiblethatmarketing$isafunctionoftheyear-sokeepthemarketing$andeliminate

year.基本原則,如果相關(guān)性

>0.8or

<-0.8時則去掉變量相關(guān)性:年度,市場營銷費用,銷售人員數(shù),去年銷售人員數(shù),產(chǎn)品Correlations:Year,Mktg$,SalesRep,LY(SalesRep),ProductYearMktg$ SalesRep LY(SalesMktg$0.973SalesRe-0.095-0.097LY(Sales-0.1110.0020.143Product-0.172-0.164-0.353 -0.181CellContents:Pearsoncorrelation多元共線性:剎車板銷售量56精選2021版課件多元回歸MultipleRegression路線分析圖規(guī)劃分析內(nèi)容收集數(shù)據(jù)利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關(guān)性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines57精選2021版課件最佳子集回歸BestSubsetsRegression

“最好的模式是盡可能簡單的模式,沒有比此模式更簡單的”“Thebestmodelistheonethatisassimpleaspossible,butnosimpler.”

-AlbertEinstein58精選2021版課件最佳子集回歸:剎車板銷售BestSubsets:BrakeSales

選擇所剩四個預測變量和響應變量.(去掉”年度”)Selectthefourremainingpredictorvariablesandtheresponsevariable.(Exclude“year”)使用Minitab

菜單,

STAT>Regression>BestSubsets.59精選2021版課件最佳子集回歸:剎車板銷售

注意”年度”從模式中去掉了.BestSubsetsRegression:SalesversusMktg$,SalesRep,...ResponseisSalesSLaYPl(rMeSoksadtlugRecVarsR-SqR-Sq(adj)C-pS$est179.077.8156.012.841X120.916.6631.324.910X290.189.066.89.0570XX285.283.5107.011.084XX398.297.83.04.0222XXX390.588.765.89.1570XXX498.297.75.04.1540XXXX60精選2021版課件多元回歸MultipleRegression路線分析圖規(guī)劃分析內(nèi)容收集數(shù)據(jù)利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關(guān)性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines61精選2021版課件回歸:剎車板銷售Regression:BrakeSales

選擇所有四個預測變量和響應變量.Selectallfourpredictorvariablesandtheresponsevariable.使用

Minitab菜單,

STAT>Regression>Regression62精選2021版課件回歸分析:剎車板銷售RegressionAnalysis:BrakeSales

零假設=變量間沒有任何關(guān)系備擇假設=變量間有一些關(guān)系Ho=NorelationshipbetweenvariablesHa=SomerelationshipexistsbetweenvariablesRegressionAnalysis:SalesversusMktg$,SalesRep,...TheregressionequationisSales=-66.6+11.8Mktg$+1.18SalesRep+2.70LY(SalesRep)-0.007ProductPredictorCoefSECoefTPConstant-66.6419.17-3.480.003Mktg$11.8381.4947.920.000 HaSalesRe1.17510.12249.600.000 Ha LY(Sales2.70230.115423.420.000 HaProduct-0.00680.2337-0.030.977 HoS=4.154R-Sq=98.2%R-Sq(adj)=97.7%63精選2021版課件回歸/簡化模式:剎車板銷售Regression/ReducedModel:BrakeSales

選擇所剩三個預測變量和響應變量.Selectthethreeremainingpredictorvariablesandtheresponsevariable.UsingMinitabMenu,

STAT>Regression>Regression記住檢查殘差圖Remembertocheckyourresidualplots64精選2021版課件回歸分析:剎車板銷售RegressionAnalysis:BrakeSales

零假設=變量間沒有任何關(guān)系備擇假設=變量間有一些關(guān)系Ho=NorelationshipbetweenvariablesHa=Somerelationshipexistsbetweenvariables回歸分析:銷售量v.市場營銷費用,銷售人員數(shù),去年銷售人員數(shù)RegressionAnalysis:SalesversusMktg$,SalesRep,LY(SalesRep)TheregressionequationisSales=-66.9+11.8Mktg$+1.18SalesRep+2.70LY(SalesRep)PredictorCoefSECoefTPConstant-66.9116.22-4.120.001Mktg$11.8471.4148.380.000 HaSalesRe1.17640.110610.640.000 HaLY(Sales2.70270.110624.440.000 HaS=4.022R-Sq=98.2%R-Sq(adj)=97.8%65精選2021版課件剎車板銷售案例的其他MiniTab輸出TheRestofMiniTabOutputBrakeSales

AnalysisofVarianceSourceDFSSMSFPRegression313870.14623.4285.780.000ResidualError16258.816.2Total1914128.9SourceDFSeqSSMktg$1893.9SalesRe13313.2LY(Sales19663.0UnusualObservationsObsMktg$SalesFitSEFitResidualStResid1011.1204.000196.2362.1617.7642.29RRdenotesanobservationwithalargestandardizedresidual66精選2021版課件剎車板銷售R-Sq

(修正后)BrakeSalesR-Sq(Adjusted)R-Sq(Adj)=97.8%Y的變差可由回歸里的三個元素解釋.R-Sq(Adj)=97.8%ofthevariationinYisexplainedbytheThreefactorsincludedintheregression.盡管結(jié)果不錯,但仍有2.2%剎車板銷售的變差不能解釋(Whilegood,thisstillmeansthatabout2.2%ofthevariationinBrakeSalesisstillunexplained.)S=4.022R-Sq=98.2%R-Sq(adj)=97.8%67精選2021版課件多元回歸MultipleRegression路線分析圖AnalyzeRoadmap規(guī)劃分析內(nèi)容收集數(shù)據(jù)利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關(guān)性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines68精選2021版課件剎車板銷售殘差BrakeSalesResiduals殘差分析同樣不容忽視.對殘差進行仔細分析會幫助我們確定我們沒有違反leastsquares擬合規(guī)律

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論