初步回歸分析培訓(xùn)資料課件_第1頁
初步回歸分析培訓(xùn)資料課件_第2頁
初步回歸分析培訓(xùn)資料課件_第3頁
初步回歸分析培訓(xùn)資料課件_第4頁
初步回歸分析培訓(xùn)資料課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

回歸分析初步二OO四年二月二十五日培訓(xùn)資料0回歸分析初步二OO四年二月二十五日培訓(xùn)資料0目的:

介紹作為實(shí)證模型建立方法的回歸分析,以模擬具有連續(xù)響應(yīng)變量“Y”的過程

(定義:‘實(shí)證’-基于觀測(cè)值或事實(shí))目標(biāo):確定何時(shí)使用回歸,以及為什么使用理解使用回歸方法構(gòu)建一個(gè)連續(xù)“X”變量與連續(xù)“Y”響應(yīng)變量的關(guān)系模型在Minitab中應(yīng)用回歸方法,根據(jù)數(shù)據(jù)擬合一條直線。在給定X的情況下,用擬合的直線方程式預(yù)測(cè)“Y”了解確定模型是否為所給定數(shù)據(jù)的最佳模型的數(shù)學(xué)方法說明并理解確定模型是否為所給定數(shù)據(jù)的最佳模型的圖形方法單變量回歸1目的:目標(biāo):?jiǎn)巫兞炕貧w1什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建工序的“模型”Y=b0+b1x+e 其中: b0為Y截距 b1為直線斜率 e為模型的誤差項(xiàng)為何要使用回歸?尋找潛在的關(guān)鍵少數(shù)“X”預(yù)測(cè)“Y”

優(yōu)化“Y”

確定如何設(shè)置“X”以優(yōu)化“Y”何時(shí)使用回歸?篩選被動(dòng)數(shù)據(jù)(歷史或基準(zhǔn)數(shù)據(jù)),以找到潛在的關(guān)鍵“X”危險(xiǎn)!不要使用被動(dòng)數(shù)據(jù)得出最終結(jié)論。還要繼續(xù)進(jìn)行

DOE(試驗(yàn)設(shè)計(jì))…記住被動(dòng)數(shù)據(jù)是歷史數(shù)據(jù);這種關(guān)系

當(dāng)前可能并不存在分析DOE(試驗(yàn)設(shè)計(jì))的結(jié)果回歸…尋找“Y”與“X”關(guān)系的方法回歸是一種必須謹(jǐn)慎使用的強(qiáng)有力的工具2什么是回歸?回歸…尋找“Y”與“X”關(guān)系的方法回歸是一種必須

單變量回歸我們可能對(duì)獨(dú)立變量(X)和響應(yīng)變量之間的關(guān)系感興趣。表示它們之間關(guān)系的散點(diǎn)圖可能如下所示:

假定真正的關(guān)系為:?

線性關(guān)系存在“b0”(常數(shù))和“b1”(系數(shù))為固定、但未知的參數(shù)“X”為獨(dú)立變量“Y”為觀測(cè)的響應(yīng)值“e”為誤差。常見的誤差假設(shè)有:平均值為0.0不相關(guān)正態(tài)分布誤差不存在型式的分布Yi=bo+b1*Xi+ei3單變量回歸我們可能對(duì)獨(dú)立變量(X)和響應(yīng)變·收集數(shù)據(jù)以估測(cè)方程的最佳方法是什么?·“b0”和“b1”的估測(cè)值是多少?·這是否是正確的函數(shù)形式(直線)?·關(guān)系是否具有統(tǒng)計(jì)顯著性(不是偶然出現(xiàn))?·誤差“ei”有多大?與擬合方程相關(guān)的問題有:4·收集數(shù)據(jù)以估測(cè)方程的最佳方法是什么?·“b0”和“b1”收集數(shù)據(jù)要使估計(jì)的斜率誤差最小,將觀測(cè)值的1/2置于“X”的下限,將其它1/2置于上限,并使獨(dú)立變量在廣范圍內(nèi)取值這適用于Y值高度變化、獨(dú)立變量的范圍較小、而且它們之間的關(guān)系預(yù)期為直線的情形-11xy要確定關(guān)系的形式(是直線還是曲線?),采用兩級(jí)以上的獨(dú)立變量。如果數(shù)據(jù)高度變化,常常采用3個(gè)級(jí)別-11xy0最好是以隨機(jī)順序收集數(shù)據(jù),而不要以低值的“X”開始然后逐漸遞增--另一個(gè)隨時(shí)間變化的可能影響工序5收集數(shù)據(jù)要使估計(jì)的斜率誤差最小,將觀測(cè)值的1/2置于“X”的Minitab的單變量回歸在Minitab中打開新工作表,并在C1和C2中輸入以下數(shù)據(jù):舉例:您在盡力優(yōu)化油漆烤箱的性能。一種理論稱鼓風(fēng)機(jī)風(fēng)扇速度影響油漆中溶劑的蒸發(fā)。您在盡力通過下列數(shù)據(jù)證明這種關(guān)系的存在6Minitab的單變量回歸在Minitab中打開新工作表,并看上去是線性!!!1)始終首先將數(shù)據(jù)制圖Graph>Plot單擊“OK”

運(yùn)行7看上去是線性!!!1)始終首先將數(shù)據(jù)制圖Graph>Pl2)運(yùn)行數(shù)據(jù)的回歸分析自變量單擊‘Graphs’單擊‘Storage’Stat>Regression>Regression...(參見下頁的子對(duì)話框)并82)運(yùn)行數(shù)據(jù)的回歸分析自變量單擊‘Graphs’單擊此對(duì)話框用于生成殘差(誤差)圖-采用這些圖形檢驗(yàn)?zāi)哪P椭杏嘘P(guān)誤差的假設(shè)單擊此框,指明您想看的圖形單擊‘OK’,然后單擊對(duì)話框中的‘Storage’按鈕單擊‘Fits’和‘Residuals’,以在數(shù)據(jù)窗口存儲(chǔ)信息點(diǎn)擊‘OK’兩次9此對(duì)話框用于生成殘差(誤差)圖單擊‘OK’,然后單擊對(duì)話框“X”變量的p值-速度

Ho:斜率=0

Ha:斜率=0或者,另一種表達(dá)方式:

Ho:“X”不顯著

Ha:“X”顯著會(huì)話窗口包含分析結(jié)果...關(guān)于會(huì)話窗口輸出結(jié)果的進(jìn)一步描述,可參見附錄接受Ha無法拒絕Ho“Ctrl-M”移至?xí)挻翱诔?shù)的p-值

H0:直線通過原點(diǎn)(0,0)… (0速度=0蒸發(fā))

Ha:直線不通過原點(diǎn)(0,0)…10“X”變量的p值-速度會(huì)話窗口包含分析結(jié)果...關(guān)于會(huì)s:殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,指觀測(cè)點(diǎn)至回歸方程式中描述的擬合線的距離(對(duì)于優(yōu)秀的模型,此值應(yīng)較小)

s=MS(error)1/2R-Sq:由擬合線“解釋”的總變差的百分?jǐn)?shù)。由“X”解釋的變差。(對(duì)于優(yōu)秀的模型,此值應(yīng)較大)

R-Sq(adj):對(duì)過于擬合情況(方程式中的變量過多)的調(diào)整,它將包括模型中的項(xiàng)數(shù)與觀測(cè)值的個(gè)數(shù)進(jìn)行對(duì)比

其中 n=觀測(cè)值數(shù)量

p=模型中項(xiàng)數(shù),包括常數(shù)

請(qǐng)參見附錄更多的定義R2越大,模型對(duì)工序模擬得越好對(duì)于良好的模型,該值應(yīng)接近R2值該值越小(誤差的大小),模型越好R2=SSregressionSStotal11s:殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,通過查看R-Sq,R-Sq(adj),s和p值來評(píng)估模型SSregression:由模型中的“X”而解釋的響應(yīng)變量“Y”的變差;每一X值對(duì)應(yīng)的模型預(yù)測(cè)值和Y的總平均值之差的平方和SSerror:未被解釋的“Y”的變差;每個(gè)數(shù)據(jù)點(diǎn)的Y觀測(cè)值和該數(shù)據(jù)點(diǎn)Y的預(yù)測(cè)值之差的平方和SStotal:Y值相對(duì)其平均值的總變差誤差項(xiàng)相對(duì)總數(shù)應(yīng)很小p-值應(yīng)<0.05,以表示統(tǒng)計(jì)顯著性(良好擬合的方程式)回歸項(xiàng)(的SS和MS)應(yīng)比誤差項(xiàng)的(SS和MS)大請(qǐng)參見附錄更多的定義12通過查看R-Sq,R-Sq(adj),s和p值SSregrFITS指“Y”的預(yù)測(cè)值,即根據(jù)回歸方程式計(jì)算出的與“X”值相對(duì)應(yīng)的Y值C3=0.069+0.00383C1(會(huì)話窗口中的回歸方程式)或者響應(yīng)變量的預(yù)測(cè)值=0.069+0.00383(速度)殘差為誤差。殘差的出現(xiàn)說明模型顯示的數(shù)據(jù)有誤差。(每個(gè)

點(diǎn)的實(shí)際響應(yīng)變量Y值減去其預(yù)測(cè)值(擬合值)。因此:數(shù)據(jù)窗口將出現(xiàn)兩個(gè)新欄…按‘Ctrl-d’返回?cái)?shù)據(jù)窗口C4=C2-C3“FITS1”and“RESI1”13FITS指“Y”的預(yù)測(cè)值,即根據(jù)回歸方程式計(jì)算出的與“X”值ResidFitorTimeResidFitResidFit

殘差圖-檢查回歸模型“優(yōu)劣”的診斷工具殘差的平均值始終為0.0殘差應(yīng)為正態(tài)分布?xì)埐顟?yīng)隨機(jī)分布。殘差存在的型態(tài)可能指出所選擇的模型不對(duì);型態(tài)舉例:曲線(起點(diǎn)低,逐漸上升,然后下降)隨數(shù)據(jù)收集的時(shí)間而變化不等變差(一般情況下,值越大,變差越大)一個(gè)或兩個(gè)極端值改進(jìn)不良擬合的幾種方法:

調(diào)查非同尋常的數(shù)據(jù),它可能是錯(cuò)誤,也可能是您的研究中最重要信息擬合不同的方程式(可能不是線性關(guān)系)轉(zhuǎn)換Y(對(duì)數(shù),平方根,倒數(shù),yk…)轉(zhuǎn)換“X”變量(對(duì)數(shù),平方根,倒數(shù))14ResidFitorTimeResidFitResidF用“Scrtl-Tab”鍵滾動(dòng)窗口,直至找到殘差圖檢查殘差:不象是鐘形曲線...注:此例中的樣本容量較小(10個(gè));盡管殘差直方圖往往能夠說明問題,但在此例中數(shù)據(jù)不足,難以得出結(jié)論殘差應(yīng)正態(tài)分布:15用“Scrtl-Tab”鍵滾動(dòng)窗口,直至找到殘差圖檢查殘差如果型態(tài)較明顯,單變量線性模型可能不是所具有的數(shù)據(jù)的最佳擬合,或者說,還有其它的關(guān)鍵“X”這些誤差的分布相當(dāng)隨機(jī)殘差應(yīng)為平均值為0.0的正態(tài)分布誤差必須在平均值0上下隨機(jī)分布16如果型態(tài)較明顯,單變量線性模型可能不是所具有的這些誤差的分布回歸分析也可用圖形表示!Stat>Regression>FittedLinePlot單擊這些選項(xiàng)以在

圖形輸出窗口顯示更多的信息“擬合線圖”提供:會(huì)話窗口中的回歸分析顯示運(yùn)用最小二乘法原理擬合直線*圖顯示置信區(qū)間(C.I.)和預(yù)測(cè)區(qū)間(P.I.)圖單擊兩次“OK”*參見附錄中的最小二乘法單擊“Options”17回歸分析也可用圖形表示!Stat>Regression>Fi置信區(qū)間和預(yù)測(cè)區(qū)間C.I.=置信區(qū)間(95%置信度表示所有數(shù)據(jù)的平均值都位于此帶內(nèi))P.I.=預(yù)測(cè)區(qū)間

(95%置信度表示單個(gè)數(shù)據(jù)點(diǎn)位于此帶內(nèi))置信帶預(yù)測(cè)帶}{18置信區(qū)間和預(yù)測(cè)區(qū)間C.I.=置信區(qū)間(95%置信度表示會(huì)話窗口中的信息與早期生成的信息相同…無法否定Ho:接受Ha:結(jié)論:我們已經(jīng)找到潛在的關(guān)鍵“X”-速度根據(jù)散點(diǎn)圖、及殘差圖(無型態(tài))得出結(jié)論,線性模型擬合良好擬合有多好?給定速度來預(yù)測(cè)蒸發(fā)率,為此目的,這個(gè)模型應(yīng)該可以接受(基于:R2=90.5%,以及較小誤差項(xiàng)(S=.16))如果工序非常關(guān)鍵,應(yīng)使用更多的數(shù)據(jù)。然后,可以建立誤差分布更接近正態(tài)的回歸模型19會(huì)話窗口中的信息與早期生成的信息相同…無法否定Ho:接受Ha課堂練習(xí):您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售量。您已經(jīng)收集了過去12個(gè)月內(nèi),多個(gè)零售點(diǎn)銷售量與總的占地面積方面的數(shù)據(jù)?,F(xiàn)在,您希望分析這些數(shù)據(jù),看占地面積是否確實(shí)與年銷售量存在某種關(guān)系在Minitab輸入以下數(shù)據(jù):應(yīng)用您所學(xué)的單變量回歸方法。準(zhǔn)備好解釋您的答案、以及支持您的結(jié)論的結(jié)果($K)(平方英尺)20課堂練習(xí):您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售關(guān)鍵概念在進(jìn)行回歸之前,將“Y”與“X”的數(shù)據(jù)畫圖-您首先需要知道哪種模型合適回歸可用于被動(dòng)數(shù)據(jù),但一定要謹(jǐn)慎,因?yàn)樗皇且粋€(gè)受到控制的試驗(yàn)在采用回歸方法得出有關(guān)被動(dòng)數(shù)據(jù)的結(jié)論之前,一定要進(jìn)行DOE觀察‘殘差與擬合值’圖,以集中精力于您的模型可能存在的潛在問題。借助殘差圖來判斷“擬合的優(yōu)劣”采用擬合線圖,通過數(shù)據(jù)創(chuàng)建一個(gè)回歸線圖形,并確定模型的置信區(qū)間和預(yù)測(cè)區(qū)間21關(guān)鍵概念在進(jìn)行回歸之前,將“Y”與“X”的數(shù)據(jù)畫圖-您首先附錄22附錄22回歸術(shù)語

r: 多重回歸的相關(guān)系數(shù)(r)。越接近+/-1,模型擬合越好;‘0’表示無線性關(guān)系R-Sq: 相關(guān)系數(shù)的平方(R2)。R2的值越接近100%,說明可能存在關(guān)系,由模型解釋的變差的百分比越高R-Sq(Adj):在過度擬合情況下對(duì)R2的調(diào)整(將模型中的項(xiàng)數(shù)考慮在內(nèi))估計(jì)值的 數(shù)據(jù)相對(duì)預(yù)測(cè)“表面”的標(biāo)準(zhǔn)變差標(biāo)準(zhǔn)誤差 s=MS誤差1/2回歸均方 模型總體“之間”變差的估測(cè)。(MS回歸) MS回歸=SS回歸/DF回歸 (DF=自由度)F-比率: “F”統(tǒng)計(jì)量。數(shù)值大表示模型可鑒別因素(X)與因變量Y值之間的關(guān)系 F=MS回歸/MS誤差p-值: 接受“存在差異”時(shí),發(fā)生錯(cuò)誤的機(jī)率 p值<0.05說明有差異(顯著)

p值>0.05說明無法得出存在差異(顯著)的結(jié)論 模型不是“好”模型的機(jī)率 “好”表明找到了因素X與響應(yīng)變量Y之間的關(guān)系23回歸術(shù)語r: 多重回歸的相關(guān)系數(shù)(r)。越接近+/-1,?;貧w術(shù)語(續(xù))α和β經(jīng)常用于表示總體值?!癰0”“b1”是從數(shù)據(jù)中得出的總體值

選擇“b0”“b1”,使誤差平方和為最小“最小平方”:取與“b0”和“b1”相關(guān)的偏導(dǎo)數(shù),并使導(dǎo)數(shù)為0.0最小化:

(ei2)=(Yi-b0-b1Xi)2-Y)=b1(X最小平方線通過(X,Y):(Yii-X)

斜率為b1=------------------------------=---------------------------(Xi-nX

-X)-Y)-X)(Y

-nXYX

Yii(XiiXi

22

224回歸術(shù)語(續(xù))α和β經(jīng)常用于表示總體值?!癰0”“b1”計(jì)算系數(shù)的置信區(qū)間(斜率)(參考7.11頁的例子)會(huì)話窗口中的回歸方程式為:蒸發(fā)率=0.069+0.00383速度斜率估算值0.00383為根據(jù)數(shù)據(jù)得出的直線斜率估測(cè)值。由于它是估測(cè)值,我們知道實(shí)際值位于可能取值的范圍內(nèi)-置信區(qū)間。斜率的置信區(qū)間可根據(jù)下列方程式計(jì)算:估算值+/-(tdf,)(估計(jì)值的標(biāo)準(zhǔn)誤差)斜率估計(jì)值標(biāo)準(zhǔn)誤差在StDev欄中查找:0.00044(上舍入)t值是使用模型中誤差項(xiàng)的自由度(8)以及雙邊檢驗(yàn)的a=0.05而從T表中獲得的結(jié)果:t=2.31斜率的95%置信區(qū)間是:0.00383+/-2.31(0.00044) (0.00281,0.00485)25計(jì)算系數(shù)的置信區(qū)間(斜率)(參考7.11頁的例子)會(huì)話窗口課堂練習(xí)答案首先將數(shù)據(jù)制圖...Graph>Plot占地面積和年銷售量看上去呈線性關(guān)系…下一步,運(yùn)行回歸功能得到模擬方程式…不要忘記保存殘差并創(chuàng)建殘差圖26課堂練習(xí)答案首先將數(shù)據(jù)制圖...Graph>Plot占地面積這里“R-Sq”的大小對(duì)于這兩種變量之間的關(guān)系大概可以接受(商業(yè)質(zhì)量過程具有大量無法控制的‘噪音’)“R-Sq(adj)”接近R-Sq,同樣屬于良好首先查看會(huì)話窗口27這里“R-Sq”的大小對(duì)于這兩種變量之間的關(guān)系大概可以接受此直方圖并不是正態(tài)分布。試確定分布呈如此形狀的原因(數(shù)據(jù)輸入錯(cuò)誤,數(shù)據(jù)太少等)通過查看殘差圖分析模型28此直方圖并不是正態(tài)分布。試確定分布呈如此形狀的原因(數(shù)據(jù)輸入殘差沒有一定的型態(tài)結(jié)論:占地面積對(duì)銷售量有影響。同時(shí),可能還有其它關(guān)鍵的Xs需要考慮,并添加到方程式中以下步驟:找出其它潛在的關(guān)鍵“X”。優(yōu)化占地面積與銷售量之間的關(guān)系29殘差沒有一定的型態(tài)結(jié)論:293030演講完畢,謝謝觀看!演講完畢,謝謝觀看!回歸分析初步二OO四年二月二十五日培訓(xùn)資料32回歸分析初步二OO四年二月二十五日培訓(xùn)資料0目的:

介紹作為實(shí)證模型建立方法的回歸分析,以模擬具有連續(xù)響應(yīng)變量“Y”的過程

(定義:‘實(shí)證’-基于觀測(cè)值或事實(shí))目標(biāo):確定何時(shí)使用回歸,以及為什么使用理解使用回歸方法構(gòu)建一個(gè)連續(xù)“X”變量與連續(xù)“Y”響應(yīng)變量的關(guān)系模型在Minitab中應(yīng)用回歸方法,根據(jù)數(shù)據(jù)擬合一條直線。在給定X的情況下,用擬合的直線方程式預(yù)測(cè)“Y”了解確定模型是否為所給定數(shù)據(jù)的最佳模型的數(shù)學(xué)方法說明并理解確定模型是否為所給定數(shù)據(jù)的最佳模型的圖形方法單變量回歸33目的:目標(biāo):?jiǎn)巫兞炕貧w1什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建工序的“模型”Y=b0+b1x+e 其中: b0為Y截距 b1為直線斜率 e為模型的誤差項(xiàng)為何要使用回歸?尋找潛在的關(guān)鍵少數(shù)“X”預(yù)測(cè)“Y”

優(yōu)化“Y”

確定如何設(shè)置“X”以優(yōu)化“Y”何時(shí)使用回歸?篩選被動(dòng)數(shù)據(jù)(歷史或基準(zhǔn)數(shù)據(jù)),以找到潛在的關(guān)鍵“X”危險(xiǎn)!不要使用被動(dòng)數(shù)據(jù)得出最終結(jié)論。還要繼續(xù)進(jìn)行

DOE(試驗(yàn)設(shè)計(jì))…記住被動(dòng)數(shù)據(jù)是歷史數(shù)據(jù);這種關(guān)系

當(dāng)前可能并不存在分析DOE(試驗(yàn)設(shè)計(jì))的結(jié)果回歸…尋找“Y”與“X”關(guān)系的方法回歸是一種必須謹(jǐn)慎使用的強(qiáng)有力的工具34什么是回歸?回歸…尋找“Y”與“X”關(guān)系的方法回歸是一種必須

單變量回歸我們可能對(duì)獨(dú)立變量(X)和響應(yīng)變量之間的關(guān)系感興趣。表示它們之間關(guān)系的散點(diǎn)圖可能如下所示:

假定真正的關(guān)系為:?

線性關(guān)系存在“b0”(常數(shù))和“b1”(系數(shù))為固定、但未知的參數(shù)“X”為獨(dú)立變量“Y”為觀測(cè)的響應(yīng)值“e”為誤差。常見的誤差假設(shè)有:平均值為0.0不相關(guān)正態(tài)分布誤差不存在型式的分布Yi=bo+b1*Xi+ei35單變量回歸我們可能對(duì)獨(dú)立變量(X)和響應(yīng)變·收集數(shù)據(jù)以估測(cè)方程的最佳方法是什么?·“b0”和“b1”的估測(cè)值是多少?·這是否是正確的函數(shù)形式(直線)?·關(guān)系是否具有統(tǒng)計(jì)顯著性(不是偶然出現(xiàn))?·誤差“ei”有多大?與擬合方程相關(guān)的問題有:36·收集數(shù)據(jù)以估測(cè)方程的最佳方法是什么?·“b0”和“b1”收集數(shù)據(jù)要使估計(jì)的斜率誤差最小,將觀測(cè)值的1/2置于“X”的下限,將其它1/2置于上限,并使獨(dú)立變量在廣范圍內(nèi)取值這適用于Y值高度變化、獨(dú)立變量的范圍較小、而且它們之間的關(guān)系預(yù)期為直線的情形-11xy要確定關(guān)系的形式(是直線還是曲線?),采用兩級(jí)以上的獨(dú)立變量。如果數(shù)據(jù)高度變化,常常采用3個(gè)級(jí)別-11xy0最好是以隨機(jī)順序收集數(shù)據(jù),而不要以低值的“X”開始然后逐漸遞增--另一個(gè)隨時(shí)間變化的可能影響工序37收集數(shù)據(jù)要使估計(jì)的斜率誤差最小,將觀測(cè)值的1/2置于“X”的Minitab的單變量回歸在Minitab中打開新工作表,并在C1和C2中輸入以下數(shù)據(jù):舉例:您在盡力優(yōu)化油漆烤箱的性能。一種理論稱鼓風(fēng)機(jī)風(fēng)扇速度影響油漆中溶劑的蒸發(fā)。您在盡力通過下列數(shù)據(jù)證明這種關(guān)系的存在38Minitab的單變量回歸在Minitab中打開新工作表,并看上去是線性!!!1)始終首先將數(shù)據(jù)制圖Graph>Plot單擊“OK”

運(yùn)行39看上去是線性!!!1)始終首先將數(shù)據(jù)制圖Graph>Pl2)運(yùn)行數(shù)據(jù)的回歸分析自變量單擊‘Graphs’單擊‘Storage’Stat>Regression>Regression...(參見下頁的子對(duì)話框)并402)運(yùn)行數(shù)據(jù)的回歸分析自變量單擊‘Graphs’單擊此對(duì)話框用于生成殘差(誤差)圖-采用這些圖形檢驗(yàn)?zāi)哪P椭杏嘘P(guān)誤差的假設(shè)單擊此框,指明您想看的圖形單擊‘OK’,然后單擊對(duì)話框中的‘Storage’按鈕單擊‘Fits’和‘Residuals’,以在數(shù)據(jù)窗口存儲(chǔ)信息點(diǎn)擊‘OK’兩次41此對(duì)話框用于生成殘差(誤差)圖單擊‘OK’,然后單擊對(duì)話框“X”變量的p值-速度

Ho:斜率=0

Ha:斜率=0或者,另一種表達(dá)方式:

Ho:“X”不顯著

Ha:“X”顯著會(huì)話窗口包含分析結(jié)果...關(guān)于會(huì)話窗口輸出結(jié)果的進(jìn)一步描述,可參見附錄接受Ha無法拒絕Ho“Ctrl-M”移至?xí)挻翱诔?shù)的p-值

H0:直線通過原點(diǎn)(0,0)… (0速度=0蒸發(fā))

Ha:直線不通過原點(diǎn)(0,0)…42“X”變量的p值-速度會(huì)話窗口包含分析結(jié)果...關(guān)于會(huì)s:殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,指觀測(cè)點(diǎn)至回歸方程式中描述的擬合線的距離(對(duì)于優(yōu)秀的模型,此值應(yīng)較小)

s=MS(error)1/2R-Sq:由擬合線“解釋”的總變差的百分?jǐn)?shù)。由“X”解釋的變差。(對(duì)于優(yōu)秀的模型,此值應(yīng)較大)

R-Sq(adj):對(duì)過于擬合情況(方程式中的變量過多)的調(diào)整,它將包括模型中的項(xiàng)數(shù)與觀測(cè)值的個(gè)數(shù)進(jìn)行對(duì)比

其中 n=觀測(cè)值數(shù)量

p=模型中項(xiàng)數(shù),包括常數(shù)

請(qǐng)參見附錄更多的定義R2越大,模型對(duì)工序模擬得越好對(duì)于良好的模型,該值應(yīng)接近R2值該值越小(誤差的大小),模型越好R2=SSregressionSStotal43s:殘差(誤差)的標(biāo)準(zhǔn)差。殘差為觀測(cè)值-預(yù)測(cè)值。換句話說,通過查看R-Sq,R-Sq(adj),s和p值來評(píng)估模型SSregression:由模型中的“X”而解釋的響應(yīng)變量“Y”的變差;每一X值對(duì)應(yīng)的模型預(yù)測(cè)值和Y的總平均值之差的平方和SSerror:未被解釋的“Y”的變差;每個(gè)數(shù)據(jù)點(diǎn)的Y觀測(cè)值和該數(shù)據(jù)點(diǎn)Y的預(yù)測(cè)值之差的平方和SStotal:Y值相對(duì)其平均值的總變差誤差項(xiàng)相對(duì)總數(shù)應(yīng)很小p-值應(yīng)<0.05,以表示統(tǒng)計(jì)顯著性(良好擬合的方程式)回歸項(xiàng)(的SS和MS)應(yīng)比誤差項(xiàng)的(SS和MS)大請(qǐng)參見附錄更多的定義44通過查看R-Sq,R-Sq(adj),s和p值SSregrFITS指“Y”的預(yù)測(cè)值,即根據(jù)回歸方程式計(jì)算出的與“X”值相對(duì)應(yīng)的Y值C3=0.069+0.00383C1(會(huì)話窗口中的回歸方程式)或者響應(yīng)變量的預(yù)測(cè)值=0.069+0.00383(速度)殘差為誤差。殘差的出現(xiàn)說明模型顯示的數(shù)據(jù)有誤差。(每個(gè)

點(diǎn)的實(shí)際響應(yīng)變量Y值減去其預(yù)測(cè)值(擬合值)。因此:數(shù)據(jù)窗口將出現(xiàn)兩個(gè)新欄…按‘Ctrl-d’返回?cái)?shù)據(jù)窗口C4=C2-C3“FITS1”and“RESI1”45FITS指“Y”的預(yù)測(cè)值,即根據(jù)回歸方程式計(jì)算出的與“X”值ResidFitorTimeResidFitResidFit

殘差圖-檢查回歸模型“優(yōu)劣”的診斷工具殘差的平均值始終為0.0殘差應(yīng)為正態(tài)分布?xì)埐顟?yīng)隨機(jī)分布。殘差存在的型態(tài)可能指出所選擇的模型不對(duì);型態(tài)舉例:曲線(起點(diǎn)低,逐漸上升,然后下降)隨數(shù)據(jù)收集的時(shí)間而變化不等變差(一般情況下,值越大,變差越大)一個(gè)或兩個(gè)極端值改進(jìn)不良擬合的幾種方法:

調(diào)查非同尋常的數(shù)據(jù),它可能是錯(cuò)誤,也可能是您的研究中最重要信息擬合不同的方程式(可能不是線性關(guān)系)轉(zhuǎn)換Y(對(duì)數(shù),平方根,倒數(shù),yk…)轉(zhuǎn)換“X”變量(對(duì)數(shù),平方根,倒數(shù))46ResidFitorTimeResidFitResidF用“Scrtl-Tab”鍵滾動(dòng)窗口,直至找到殘差圖檢查殘差:不象是鐘形曲線...注:此例中的樣本容量較小(10個(gè));盡管殘差直方圖往往能夠說明問題,但在此例中數(shù)據(jù)不足,難以得出結(jié)論殘差應(yīng)正態(tài)分布:47用“Scrtl-Tab”鍵滾動(dòng)窗口,直至找到殘差圖檢查殘差如果型態(tài)較明顯,單變量線性模型可能不是所具有的數(shù)據(jù)的最佳擬合,或者說,還有其它的關(guān)鍵“X”這些誤差的分布相當(dāng)隨機(jī)殘差應(yīng)為平均值為0.0的正態(tài)分布誤差必須在平均值0上下隨機(jī)分布48如果型態(tài)較明顯,單變量線性模型可能不是所具有的這些誤差的分布回歸分析也可用圖形表示!Stat>Regression>FittedLinePlot單擊這些選項(xiàng)以在

圖形輸出窗口顯示更多的信息“擬合線圖”提供:會(huì)話窗口中的回歸分析顯示運(yùn)用最小二乘法原理擬合直線*圖顯示置信區(qū)間(C.I.)和預(yù)測(cè)區(qū)間(P.I.)圖單擊兩次“OK”*參見附錄中的最小二乘法單擊“Options”49回歸分析也可用圖形表示!Stat>Regression>Fi置信區(qū)間和預(yù)測(cè)區(qū)間C.I.=置信區(qū)間(95%置信度表示所有數(shù)據(jù)的平均值都位于此帶內(nèi))P.I.=預(yù)測(cè)區(qū)間

(95%置信度表示單個(gè)數(shù)據(jù)點(diǎn)位于此帶內(nèi))置信帶預(yù)測(cè)帶}{50置信區(qū)間和預(yù)測(cè)區(qū)間C.I.=置信區(qū)間(95%置信度表示會(huì)話窗口中的信息與早期生成的信息相同…無法否定Ho:接受Ha:結(jié)論:我們已經(jīng)找到潛在的關(guān)鍵“X”-速度根據(jù)散點(diǎn)圖、及殘差圖(無型態(tài))得出結(jié)論,線性模型擬合良好擬合有多好?給定速度來預(yù)測(cè)蒸發(fā)率,為此目的,這個(gè)模型應(yīng)該可以接受(基于:R2=90.5%,以及較小誤差項(xiàng)(S=.16))如果工序非常關(guān)鍵,應(yīng)使用更多的數(shù)據(jù)。然后,可以建立誤差分布更接近正態(tài)的回歸模型51會(huì)話窗口中的信息與早期生成的信息相同…無法否定Ho:接受Ha課堂練習(xí):您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售量。您已經(jīng)收集了過去12個(gè)月內(nèi),多個(gè)零售點(diǎn)銷售量與總的占地面積方面的數(shù)據(jù)?,F(xiàn)在,您希望分析這些數(shù)據(jù),看占地面積是否確實(shí)與年銷售量存在某種關(guān)系在Minitab輸入以下數(shù)據(jù):應(yīng)用您所學(xué)的單變量回歸方法。準(zhǔn)備好解釋您的答案、以及支持您的結(jié)論的結(jié)果($K)(平方英尺)52課堂練習(xí):您相信我們的家電所占據(jù)的展示廳面積的大小會(huì)影響銷售關(guān)鍵概念在進(jìn)行回歸之前,將“Y”與“X”的數(shù)據(jù)畫圖-您首先需要知道哪種模型合適回歸可用于被動(dòng)數(shù)據(jù),但一定要謹(jǐn)慎,因?yàn)樗皇且粋€(gè)受到控制的試驗(yàn)在采用回歸方法得出有關(guān)被動(dòng)數(shù)據(jù)的結(jié)論之前,一定要進(jìn)行DOE觀察‘殘差與擬合值’圖,以集中精力于您的模型可能存在的潛在問題。借助殘差圖來判斷“擬合的優(yōu)劣”采用擬合線圖,通過數(shù)據(jù)創(chuàng)建一個(gè)回歸線圖形,并確定模型的置信區(qū)間和預(yù)測(cè)區(qū)間53關(guān)鍵概念在進(jìn)行回歸之前,將“Y”與“X”的數(shù)據(jù)畫圖-您首先附錄54附錄22回歸術(shù)語

r: 多重回歸的相關(guān)系數(shù)(r)。越接近+/-1,模型擬合越好;‘0’表示無線性關(guān)系R-Sq: 相關(guān)系數(shù)的平方(R2)。R2的值越接近100%,說明可能存在關(guān)系,由模型解釋的變差的百分比越高R-Sq(Adj):在過度擬合情況下對(duì)R2的調(diào)整(將模型中的項(xiàng)數(shù)考慮在內(nèi))估計(jì)值的 數(shù)據(jù)相對(duì)預(yù)測(cè)“表面”的標(biāo)準(zhǔn)變差標(biāo)準(zhǔn)誤差 s=MS誤差1/2回歸均方 模型總體“之間”變差的估測(cè)。(MS回歸) MS回歸=SS回歸/DF回歸 (DF=自由度)F-比率: “F”統(tǒng)計(jì)量。數(shù)值大表示模型可鑒別因素(X)與因變量Y值之間的關(guān)系 F=MS回歸/MS誤差p-值: 接受“存在差異”時(shí),發(fā)生錯(cuò)誤的機(jī)率 p值<0.05說明有差異(顯著)

p值>0.05說明無法得出存在差異(顯著)的結(jié)論 模型不是“好”模型的機(jī)率 “好”表明找到了因素X與響應(yīng)變量Y之間的關(guān)系55回歸術(shù)語r: 多重回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論