統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第1頁(yè)
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第2頁(yè)
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第3頁(yè)
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第4頁(yè)
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩60頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

方差分析(AnalysisofVariance,ANOVA)1928年由英國(guó)統(tǒng)計(jì)學(xué)家R.A.Fisher首先提出,為紀(jì)念Fisher,以F命名,故方差分析又稱為F檢驗(yàn)。1本文檔共65頁(yè);當(dāng)前第1頁(yè);編輯于星期日\(chéng)22點(diǎn)50分方差分析(ANOVA)①檢驗(yàn)多個(gè)總體均值是否相等②研究一個(gè)或多個(gè)分類型自變量對(duì)一個(gè)數(shù)值型因變量的影響③有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個(gè)分類的自變量雙因素方差分析:涉及兩個(gè)分類的自變量無(wú)交互作用的雙因素方差分析;有交互作用的雙因素方差分析;2本文檔共65頁(yè);當(dāng)前第2頁(yè);編輯于星期日\(chéng)22點(diǎn)50分方差分析檢驗(yàn)假定

①總體是服從正態(tài)分布的;

②總體方差是相等的;③隨機(jī)樣本是獨(dú)立的。

3本文檔共65頁(yè);當(dāng)前第3頁(yè);編輯于星期日\(chéng)22點(diǎn)50分單因素方差分析用于檢驗(yàn)由單一因素影響的一個(gè)(或幾個(gè)相互獨(dú)立的)因變量按因素各水平分組的均值之間是否具有顯著性差異,也可用于進(jìn)行兩兩組間均值的比較;可通過(guò)One-WayANOVA對(duì)話框?qū)崿F(xiàn)。4本文檔共65頁(yè);當(dāng)前第4頁(yè);編輯于星期日\(chéng)22點(diǎn)50分建立的假設(shè)組為:提出假設(shè)H0:12…k

自變量對(duì)因變量沒(méi)有顯著影響,沒(méi)有系統(tǒng)誤差H1:1,2,,k

不全相等自變量對(duì)因變量有顯著影響注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等5本文檔共65頁(yè);當(dāng)前第5頁(yè);編輯于星期日\(chéng)22點(diǎn)50分例1單因素方差分析某企業(yè)需要一種零件,現(xiàn)有三個(gè)不同的地區(qū)的企業(yè)生產(chǎn)的同種零件可供選擇,為了比較這三個(gè)零件的強(qiáng)度是否相同,每個(gè)地區(qū)的企業(yè)抽出6件產(chǎn)品進(jìn)行強(qiáng)度測(cè)試,其值如表所示。假設(shè)每個(gè)企業(yè)零件的強(qiáng)度值服從正態(tài)分布,試檢驗(yàn)這三個(gè)地區(qū)企業(yè)的零件強(qiáng)度是否存在顯著差異。地區(qū)強(qiáng)度樣本123111611089298103853100118994115106735831079761051161026本文檔共65頁(yè);當(dāng)前第6頁(yè);編輯于星期日\(chéng)22點(diǎn)50分1、單擊分析(Analyze)

比較均值(CompareMeans)

單因素(One-WayANOVA),打開(kāi)對(duì)話框。步驟:2、從左框中選擇因變量”零件強(qiáng)度”進(jìn)入因變量框內(nèi),選擇“地區(qū)”進(jìn)入因子框內(nèi)。點(diǎn)擊確定。7本文檔共65頁(yè);當(dāng)前第7頁(yè);編輯于星期日\(chéng)22點(diǎn)50分可以得到方差分析表由于F統(tǒng)計(jì)量值的P值明顯小于顯著性水平0.05,故拒絕假設(shè)H0,認(rèn)為這三個(gè)地區(qū)的零件強(qiáng)度有顯著差異。如果需要對(duì)各地區(qū)間的零件強(qiáng)度進(jìn)行進(jìn)一步的比較和分析,可以通過(guò)按紐選項(xiàng)Option選項(xiàng),contrast對(duì)比,PostHoc兩兩比較去實(shí)現(xiàn)。aF分布F(k-1,n-k)0拒絕H0不能拒絕H0F8本文檔共65頁(yè);當(dāng)前第8頁(yè);編輯于星期日\(chéng)22點(diǎn)50分3、單擊選項(xiàng)Option按紐,打開(kāi)對(duì)話框如圖所示,選擇輸出項(xiàng)。主要有不同水平下樣本方差的齊性檢驗(yàn),缺失值的處理方式及均值的圖形。本例中選擇描述性(Descriptive)進(jìn)行基本統(tǒng)計(jì)描述,以及方差同質(zhì)檢驗(yàn)(Homogeneityofvariancetest)進(jìn)行不同水平間方差齊性的檢驗(yàn)。在缺失值(MissingValue)欄中選擇系統(tǒng)默認(rèn)項(xiàng)。9本文檔共65頁(yè);當(dāng)前第9頁(yè);編輯于星期日\(chéng)22點(diǎn)50分完成所有選擇后返回主對(duì)話框,然后單擊OK,就可以得到三個(gè)地區(qū)零件強(qiáng)度分析表?;窘y(tǒng)計(jì)描述

方差齊性檢驗(yàn)

P值大于0.05,所以因素變量的各水平間的方差是沒(méi)有顯著差異的。Levene檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,與F檢驗(yàn)類似,但不依賴與正態(tài)性假設(shè),比F檢驗(yàn)更穩(wěn)健。10本文檔共65頁(yè);當(dāng)前第10頁(yè);編輯于星期日\(chéng)22點(diǎn)50分4、如果需要將水平間兩兩比較,可以單擊兩兩比較PostHoc按紐,打開(kāi)多重比較對(duì)話框。如圖所示:如果滿足在水平間方差相等的條件,常用LSD(最小顯著性差異法),用t檢驗(yàn)完成各組均值間的配對(duì)比較。當(dāng)方差不等的情況下,可以選擇TamhanesT2,用t檢驗(yàn)進(jìn)行各組均值間的配對(duì)比較。11本文檔共65頁(yè);當(dāng)前第11頁(yè);編輯于星期日\(chéng)22點(diǎn)50分選擇多重比較方式后,點(diǎn)擊OK,得到輸出結(jié)果。從表中可以看出,地區(qū)2與地區(qū)3之間的差異是非常顯著的,它們均值差的檢驗(yàn)的尾概率為0.005,明顯小于顯著性水平0.05。12本文檔共65頁(yè);當(dāng)前第12頁(yè);編輯于星期日\(chéng)22點(diǎn)50分某大型連鎖超市為了解不同促銷(xiāo)手段對(duì)商品銷(xiāo)售額的影響,在其下屬五個(gè)分店中,對(duì)同一類日常生活用品分別采用不同促銷(xiāo)方式進(jìn)行了為期四個(gè)月的銷(xiāo)售對(duì)比試驗(yàn)(銷(xiāo)售對(duì)比試驗(yàn)結(jié)果見(jiàn)所附數(shù)據(jù)集SY-22)。試?yán)梅讲罘治龇椒?,檢驗(yàn)不同促銷(xiāo)方式下的商品銷(xiāo)售量是否存在顯著性差異(試驗(yàn)前該類商品在五個(gè)分店內(nèi)的月銷(xiāo)售額基本處于同一水平)。例2分析思路:這是單一因素影響下的方差分析問(wèn)題,可以以月銷(xiāo)售額為因變量,以促銷(xiāo)方式為影響因素變量進(jìn)行分析;分析過(guò)程利用SPSS軟件中的One-WayANOVA菜單實(shí)現(xiàn)。13本文檔共65頁(yè);當(dāng)前第13頁(yè);編輯于星期日\(chéng)22點(diǎn)50分操作步驟:打開(kāi)數(shù)據(jù)集SY-22,變量SALE和A分別表示月銷(xiāo)售額和促銷(xiāo)方式

。依次選擇Analyze→CompareMeans→One-WayANOVA,展開(kāi)單因素方差分析對(duì)話框,將變量SALE送入Dependentlist框,將影響因素變量A送入Factor框。

單擊PostHoc項(xiàng),在打開(kāi)的對(duì)話框中,選中LSD復(fù)選框,以進(jìn)行各組均值間的兩兩比較。繼續(xù)單擊Continue按鈕,返回到主對(duì)話框。

單擊OK按鈕,即得出單因素方差分析的運(yùn)行結(jié)果。14本文檔共65頁(yè);當(dāng)前第14頁(yè);編輯于星期日\(chéng)22點(diǎn)50分單因素方差分析的輸出結(jié)果輸出結(jié)果15本文檔共65頁(yè);當(dāng)前第15頁(yè);編輯于星期日\(chéng)22點(diǎn)50分雙因素方差分析雙因素方差分析的應(yīng)用范圍很廣;應(yīng)用條件:因變量是數(shù)值型變量,且來(lái)自或近似來(lái)自正態(tài)總體。自變量是分類變量,變量可以是數(shù)值型或字符型的。各水平下的總體假設(shè)服從正態(tài)分布,而且假設(shè)各水平下的方差是相等的。16本文檔共65頁(yè);當(dāng)前第16頁(yè);編輯于星期日\(chéng)22點(diǎn)50分雙因素方差分析雙因素方差分析過(guò)程:可以分析出每一個(gè)因素的作用;各因素之間的交互作用;檢驗(yàn)各總體間方差是否相等;能夠?qū)σ蛩氐母魉介g均值差異進(jìn)行比較等。17本文檔共65頁(yè);當(dāng)前第17頁(yè);編輯于星期日\(chéng)22點(diǎn)50分例3雙因素方差分析下表是某商品S在不同地區(qū)和不同時(shí)期的銷(xiāo)售量(千件)表。已知數(shù)據(jù)服從正態(tài)分布,則要檢驗(yàn)地區(qū)因素及時(shí)間因素對(duì)銷(xiāo)售量的影響是否顯著。(SY-23)地區(qū)時(shí)期1234516.514.213.42.46.221.87.19.41.54.833.610.87.21.74.943.78.98.62.34.657.612.67.52.85.2由于銷(xiāo)售量受地區(qū)和時(shí)間兩個(gè)因素的影響,這是一個(gè)雙因素方差分析的問(wèn)題。18本文檔共65頁(yè);當(dāng)前第18頁(yè);編輯于星期日\(chéng)22點(diǎn)50分1、單擊分析(Analyze)

一般線性模型(GenerallinearModel)單變量(Univariate),打開(kāi)主對(duì)話框。

步驟:2、從左框中選擇因變量“銷(xiāo)售量

”進(jìn)入因變量框內(nèi),選擇“地區(qū)”和“時(shí)期”進(jìn)入固定因子框內(nèi)。點(diǎn)擊確定。19本文檔共65頁(yè);當(dāng)前第19頁(yè);編輯于星期日\(chéng)22點(diǎn)50分3、單擊模型(Model)按紐選擇分析模型,得到對(duì)話框如圖。全因子選項(xiàng)為系統(tǒng)默認(rèn)項(xiàng),建立全模型,全模型中包括因素之間的交互作用。如果選擇分析兩個(gè)因素的交互作用,則必須在每種水平組合下,取得兩個(gè)以上的實(shí)驗(yàn)數(shù)據(jù),才能實(shí)現(xiàn)兩個(gè)因素的交互作用的分析結(jié)果。如果不考慮因素間的交互作用時(shí),應(yīng)當(dāng)選擇設(shè)定模型。20本文檔共65頁(yè);當(dāng)前第20頁(yè);編輯于星期日\(chéng)22點(diǎn)50分先從左邊框中選擇因素變量進(jìn)入模型框中,然后選擇類型。一般不考慮交互作用時(shí),選擇主效應(yīng),考慮交互作用時(shí),選擇交互。本例中選擇主效應(yīng)。平方和一般選取默認(rèn)項(xiàng)類型Ⅲ。單擊繼續(xù),返回主對(duì)話框,點(diǎn)擊確定就可以得到相應(yīng)的雙因素方差分析表.21本文檔共65頁(yè);當(dāng)前第21頁(yè);編輯于星期日\(chéng)22點(diǎn)50分從表中數(shù)據(jù)可以看出,F(xiàn)值對(duì)應(yīng)概率P值都小于顯著性水平0.05,這說(shuō)明地區(qū)和時(shí)期對(duì)銷(xiāo)售量的影響都是顯著的。22本文檔共65頁(yè);當(dāng)前第22頁(yè);編輯于星期日\(chéng)22點(diǎn)50分實(shí)驗(yàn)4:相關(guān)與回歸分析相關(guān)分析回歸分析23本文檔共65頁(yè);當(dāng)前第23頁(yè);編輯于星期日\(chéng)22點(diǎn)50分相關(guān)分析相關(guān)分析是研究變量間密切程度的統(tǒng)計(jì)方法,線性相關(guān)分析研究的是兩變量間線性關(guān)系的程度,用相關(guān)系數(shù)表示;可以通過(guò)分析菜單進(jìn)行相關(guān)分析;

SPSS提供的相關(guān)分析功能有雙變量相關(guān)分析(Bivariate);偏相關(guān)分析(Partial);距離相關(guān)分析(Distance)。24本文檔共65頁(yè);當(dāng)前第24頁(yè);編輯于星期日\(chéng)22點(diǎn)50分雙變量相關(guān)分析(簡(jiǎn)單相關(guān)分析)兩個(gè)變量之間的相關(guān)關(guān)系稱簡(jiǎn)單相關(guān)關(guān)系。有兩種方法可以反映簡(jiǎn)單相關(guān)關(guān)系:通過(guò)散點(diǎn)圖直觀地顯示變量之間關(guān)系;通過(guò)相關(guān)系數(shù)準(zhǔn)確地反映兩變量的關(guān)系程度。25本文檔共65頁(yè);當(dāng)前第25頁(yè);編輯于星期日\(chéng)22點(diǎn)50分雙變量相關(guān)分析——散點(diǎn)圖例4數(shù)據(jù)庫(kù)SY-31中的變量X表示山東省人均國(guó)內(nèi)生產(chǎn)總值,Y表示山東省城鎮(zhèn)居民的消費(fèi)額(資料來(lái)源:山東省2003年統(tǒng)計(jì)年鑒),現(xiàn)畫(huà)出散點(diǎn)圖來(lái)觀察兩個(gè)變量的關(guān)聯(lián)程度。具體操作步驟如下:首先打開(kāi)數(shù)據(jù)SY-31;然后單擊圖形Graphs

散點(diǎn)Scatter,打開(kāi)散點(diǎn)圖Scatterplot對(duì)話框,選擇需要的散點(diǎn)圖,圖中的5個(gè)選項(xiàng)如下:26本文檔共65頁(yè);當(dāng)前第26頁(yè);編輯于星期日\(chéng)22點(diǎn)50分3.如果只考慮兩個(gè)變量,可選擇簡(jiǎn)單的散點(diǎn)圖Simple,然后點(diǎn)擊定義Define,打開(kāi)簡(jiǎn)單散點(diǎn)圖SimpleScatterplot對(duì)話框,如左圖所示。4.選擇變量分別進(jìn)入X軸和Y軸,點(diǎn)擊OK后就可以得到右邊的散點(diǎn)圖。27本文檔共65頁(yè);當(dāng)前第27頁(yè);編輯于星期日\(chéng)22點(diǎn)50分雙變量相關(guān)分析——相關(guān)系數(shù)具體操作如下:1.打開(kāi)數(shù)據(jù)庫(kù)SY-31后,單擊分析Analyze

相關(guān)Correlate雙變量Bivariate;如圖所示。28本文檔共65頁(yè);當(dāng)前第28頁(yè);編輯于星期日\(chéng)22點(diǎn)50分用于計(jì)算分類變量的秩相關(guān),考慮結(jié)點(diǎn)的影響用于計(jì)算分類變量的秩相關(guān)適用于正態(tài)分布等間隔測(cè)度的變量分析變量2、從左邊的變量框中選擇需要考察的兩個(gè)變量進(jìn)入變量框內(nèi),選擇相關(guān)系數(shù)的種類,選擇檢驗(yàn)方式,單擊選項(xiàng)Options按紐。

29本文檔共65頁(yè);當(dāng)前第29頁(yè);編輯于星期日\(chéng)22點(diǎn)50分3.選擇輸出項(xiàng)和缺失值的處理方式。本例中選擇輸出基本統(tǒng)計(jì)描述。成對(duì)剔除帶有缺失值的觀測(cè)量剔除所有帶有缺失值的觀測(cè)量30本文檔共65頁(yè);當(dāng)前第30頁(yè);編輯于星期日\(chéng)22點(diǎn)50分4.單擊OK,可以得到相關(guān)分析的結(jié)果。見(jiàn)圖所示。從表中可以看到兩個(gè)變量相關(guān)性分析的結(jié)果:相關(guān)系數(shù)是0.996,相關(guān)程度非常高,且假設(shè)檢驗(yàn)的P值遠(yuǎn)遠(yuǎn)地小于0.05,可以認(rèn)為人均國(guó)內(nèi)生產(chǎn)總值與城鎮(zhèn)居民消費(fèi)額存在線性正相關(guān)關(guān)系。31本文檔共65頁(yè);當(dāng)前第31頁(yè);編輯于星期日\(chéng)22點(diǎn)50分偏相關(guān)分析簡(jiǎn)單相關(guān)關(guān)系只反映兩個(gè)變量之間的關(guān)系,但如果因變量受到多個(gè)因素的影響時(shí),因變量與某一自變量之間的簡(jiǎn)單相關(guān)關(guān)系顯然受到其它相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其它因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分析。32本文檔共65頁(yè);當(dāng)前第32頁(yè);編輯于星期日\(chéng)22點(diǎn)50分例5為了考察火柴銷(xiāo)售量的影響因素,選擇煤氣戶數(shù)、卷煙銷(xiāo)量、蚊香銷(xiāo)量、打火石銷(xiāo)量作為影響因素,得數(shù)據(jù)表。試求火柴銷(xiāo)售量與煤氣戶數(shù)的偏相關(guān)系數(shù).

年份火柴銷(xiāo)售量(萬(wàn)件)煤氣戶數(shù)(萬(wàn)戶)卷煙銷(xiāo)量(百箱)蚊香銷(xiāo)量(十萬(wàn)盒)打火石銷(xiāo)量(百萬(wàn)粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.1733本文檔共65頁(yè);當(dāng)前第33頁(yè);編輯于星期日\(chéng)22點(diǎn)50分求解火柴銷(xiāo)售量與煤氣戶數(shù)的偏相關(guān)系數(shù)具體操作如下:1、首先打開(kāi)數(shù)據(jù)文件SY-32,單擊分析Analyze相關(guān)Correlate偏相關(guān)Partial,打開(kāi)對(duì)話框,見(jiàn)圖所示。要考察的變量

其它客觀存在的變量

2、從左邊框內(nèi)選擇要考察的兩個(gè)變量進(jìn)入變量框內(nèi),其它變量進(jìn)入控制框內(nèi),如本例中考察煤氣戶數(shù)與火柴銷(xiāo)量的偏相關(guān)系數(shù)進(jìn)入變量框內(nèi),其它(除年份外)進(jìn)入控制框內(nèi)。34本文檔共65頁(yè);當(dāng)前第34頁(yè);編輯于星期日\(chéng)22點(diǎn)50分PartialCorrelations對(duì)話框35本文檔共65頁(yè);當(dāng)前第35頁(yè);編輯于星期日\(chéng)22點(diǎn)50分PartialCorrelations對(duì)話框(即:Pearson相關(guān)系數(shù))本例中選擇簡(jiǎn)單相關(guān)系數(shù)。36本文檔共65頁(yè);當(dāng)前第36頁(yè);編輯于星期日\(chéng)22點(diǎn)50分輸出結(jié)果:從表中可以看出,火柴銷(xiāo)量與煤氣戶數(shù)的簡(jiǎn)單相關(guān)系數(shù)為0.826,自由度為13,檢驗(yàn)的P值為0.00;而偏相關(guān)系數(shù)為0.605,自由度為10,檢驗(yàn)的P值為0.037,表示煤氣戶數(shù)對(duì)火柴銷(xiāo)量的真實(shí)影響是顯著的。表中的上半部分是簡(jiǎn)單相關(guān)系數(shù),下半部分是偏相關(guān)系數(shù)。37本文檔共65頁(yè);當(dāng)前第37頁(yè);編輯于星期日\(chéng)22點(diǎn)50分回歸分析研究的是自變量與因變量之間的非確定性的因果關(guān)系;SPSS提供的回歸分析過(guò)程有:

線性回歸(Linear)、曲線估計(jì)(CurveEstimation)、二分變量邏輯回歸(BinaryLogistic)、多分變量邏輯回歸(MultinomialLogistic)、序回歸(Ordinal)、概率單位回歸(Probit)、非線性回歸(Nonlinear)、加權(quán)估計(jì)(WeightEstimation)、最優(yōu)編碼回歸(optimalScaling)和二階段最小平方法(2-StageLeastSquares)?;貧w分析38本文檔共65頁(yè);當(dāng)前第38頁(yè);編輯于星期日\(chéng)22點(diǎn)50分線性回歸分析線性回歸是統(tǒng)計(jì)分析方法中最常用的方法之一。如果所研究的現(xiàn)象有若干個(gè)影響因素,且這些因素對(duì)現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。介紹SPSS軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對(duì)輸出結(jié)果的分析等相關(guān)內(nèi)容。39本文檔共65頁(yè);當(dāng)前第39頁(yè);編輯于星期日\(chéng)22點(diǎn)50分1、線性回歸的假設(shè)理論(1)正態(tài)性假設(shè):即所研究的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無(wú)自相關(guān)性,即誤差項(xiàng)之間互不相關(guān);2、線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)40本文檔共65頁(yè);當(dāng)前第40頁(yè);編輯于星期日\(chéng)22點(diǎn)50分1、打開(kāi)數(shù)據(jù)文件,單擊分析Analyze

回歸Regression

線性Linear,打開(kāi)對(duì)話框如圖所示。指定回歸方法全部選入逐步回歸強(qiáng)行剔除向后剔除向前選擇加權(quán)最小平方法指定選擇參與回歸分析觀測(cè)量的變量指定作為觀測(cè)量標(biāo)簽的變量線性回歸分析的具體步驟:2、從左邊框中選擇因變量Y,選擇一個(gè)或多個(gè)自變量。從方法框內(nèi)下拉式菜單中選擇回歸分析方法。41本文檔共65頁(yè);當(dāng)前第41頁(yè);編輯于星期日\(chéng)22點(diǎn)50分3.單擊統(tǒng)計(jì)量Statistics,打開(kāi)線性回歸:統(tǒng)計(jì)量對(duì)話框,可以選擇輸出的統(tǒng)計(jì)量如圖所示。德賓-沃森檢驗(yàn)提供判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤、ANOVA表等顯示每個(gè)自變量進(jìn)入方程后對(duì)R2和F值的影響觀測(cè)值診斷估計(jì)(系統(tǒng)默認(rèn)):包括回歸系數(shù),回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量(t值)及相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量概率的P值(sig)。描述性統(tǒng)計(jì)量42本文檔共65頁(yè);當(dāng)前第42頁(yè);編輯于星期日\(chéng)22點(diǎn)50分4、如果需要觀察圖形,可單擊繪制Plots按紐,打開(kāi)線性回歸:圖對(duì)話框,如圖所示。在此對(duì)話框中可以選擇所需要的圖形。標(biāo)準(zhǔn)化預(yù)測(cè)值標(biāo)準(zhǔn)化殘差剔除殘差調(diào)整預(yù)測(cè)值學(xué)生化殘差學(xué)生化剔除殘差輸出標(biāo)準(zhǔn)化殘差相對(duì)于因變量的散布圖在左上角的源變量框中,選擇Dependent進(jìn)入X(或Y)軸變量框,選擇其它變量進(jìn)入Y(或X)軸變量框,除因變量外,其客觀存在變量依次是:ZPRED:標(biāo)準(zhǔn)化預(yù)測(cè)值,ZRESID:標(biāo)準(zhǔn)化殘差,DRESID:剔除殘差,ADJPRED:修正后預(yù)測(cè)值,SRESID學(xué)生化殘差,SDRESID:學(xué)生化剔除殘差。43本文檔共65頁(yè);當(dāng)前第43頁(yè);編輯于星期日\(chéng)22點(diǎn)50分5、單擊選項(xiàng)Options按紐,打開(kāi)線性回歸:選項(xiàng)對(duì)話框,如圖所示??梢詮闹羞x擇模型擬合判斷準(zhǔn)則及缺失值的處理方式。步行方法標(biāo)準(zhǔn)(SteppingMethodCriteria)欄,設(shè)置變量引入或剔除模型的判別標(biāo)準(zhǔn)。使用F的概率(UseprobabilityofF):采用F檢驗(yàn)的概率為判別依據(jù)。使用F值(UseFvalue):采用F值作為檢驗(yàn)標(biāo)準(zhǔn)。Includeconstantinequation回歸方程中包括常數(shù)項(xiàng)。缺失值(MissingValues):缺失值的處理方式。44本文檔共65頁(yè);當(dāng)前第44頁(yè);編輯于星期日\(chéng)22點(diǎn)50分6、如果要保存預(yù)測(cè)值等數(shù)據(jù),可單擊保存(Save)按紐打開(kāi)對(duì)話框。選擇需要保存的數(shù)據(jù)種類作為新變量存在數(shù)據(jù)編輯窗口。其中有預(yù)測(cè)值、殘差,預(yù)測(cè)區(qū)間等。7、當(dāng)所有選擇完成后,單擊OK得到分析結(jié)果。45本文檔共65頁(yè);當(dāng)前第45頁(yè);編輯于星期日\(chéng)22點(diǎn)50分分析思路:繪制散點(diǎn)圖,對(duì)兩個(gè)變量之間相關(guān)關(guān)系的形式、方向做出大致判斷;計(jì)算相關(guān)系數(shù)

;若二者之間存在顯著性線性相關(guān),則建立回歸方程;例6已知某市10家百貨商店職工的人均月銷(xiāo)售額和利潤(rùn)率的數(shù)據(jù)(見(jiàn)數(shù)據(jù)SY33),試分析人均月銷(xiāo)售額和利潤(rùn)率之間的關(guān)系,并建立利潤(rùn)率對(duì)人均月銷(xiāo)售額的回歸方程。46本文檔共65頁(yè);當(dāng)前第46頁(yè);編輯于星期日\(chéng)22點(diǎn)50分操作步驟:打開(kāi)數(shù)據(jù)集SY33,依次選擇圖形→散點(diǎn)/點(diǎn)狀,展開(kāi)對(duì)話框。選中簡(jiǎn)單分布選項(xiàng),單擊定義按鈕,進(jìn)入對(duì)話框。將變量rjxse送入“X軸”框中,將變量lrl送入Y軸框中。單擊確定按鈕,得到人均月銷(xiāo)售額與利潤(rùn)率的散點(diǎn)圖。依次選擇分析→相關(guān)→雙變量,展開(kāi)對(duì)話框;將變量rjxse和lrl同時(shí)送入變量框中;單擊確定按鈕,得到人均月銷(xiāo)售額與利潤(rùn)率的相關(guān)系數(shù)。依次選擇分析→回歸→線性,展開(kāi)對(duì)話框;將變量rjxse送入自變量框中,將變量lrl送入因變量框;單擊確定按鈕,得到回歸過(guò)程運(yùn)行結(jié)果。47本文檔共65頁(yè);當(dāng)前第47頁(yè);編輯于星期日\(chéng)22點(diǎn)50分輸出結(jié)果Ⅰ48本文檔共65頁(yè);當(dāng)前第48頁(yè);編輯于星期日\(chéng)22點(diǎn)50分回歸方程:輸出結(jié)果Ⅱ檢驗(yàn)假設(shè)H0:

線性關(guān)系不顯著49本文檔共65頁(yè);當(dāng)前第49頁(yè);編輯于星期日\(chéng)22點(diǎn)50分例7用數(shù)據(jù)SY-32,考察火柴銷(xiāo)售量與各影響因素之間的相關(guān)關(guān)系,建立火柴銷(xiāo)售量對(duì)于相關(guān)因素煤氣戶數(shù)、卷煙銷(xiāo)量、蚊香銷(xiāo)量、打火石銷(xiāo)量的線性回歸模型,通過(guò)對(duì)模型的分析,找出合適的線性回歸方程。50本文檔共65頁(yè);當(dāng)前第50頁(yè);編輯于星期日\(chéng)22點(diǎn)50分1、打開(kāi)數(shù)據(jù)文件SY-32,單擊分析回歸線性,打開(kāi)線性對(duì)話框。2、從左邊框中選擇因變量和自變量。從方法框內(nèi)下拉式菜單中選擇逐步回歸法。3、單擊統(tǒng)計(jì)量,打開(kāi)對(duì)話框,本例中選擇估計(jì)、所有與模型擬合及擬合效果有關(guān)的選擇項(xiàng)、D.W檢驗(yàn)及奇異值診斷,選擇標(biāo)準(zhǔn)差為2,即置信度約為95%。點(diǎn)擊繼續(xù)。4、單擊繪制按紐,打開(kāi)對(duì)話框。選擇Dependent進(jìn)入X軸變量框,選擇標(biāo)準(zhǔn)化殘差ZRESID變量進(jìn)入Y(或X)軸變量框,繪制殘差圖。5、單擊選項(xiàng)按紐,打開(kāi)對(duì)話框。選擇默認(rèn)項(xiàng)。6、點(diǎn)擊確定,得到結(jié)果。步驟:51本文檔共65頁(yè);當(dāng)前第51頁(yè);編輯于星期日\(chéng)22點(diǎn)50分輸出結(jié)果(部分):模型綜合分析表模型綜合分析表中,有模型的復(fù)相關(guān)系數(shù)R,樣本決定系數(shù)R2,修正的可決系數(shù),估計(jì)標(biāo)準(zhǔn)誤,模型變化導(dǎo)致的可決系數(shù)及F值的變化,D.W檢驗(yàn)值等。由上表中知模型3的修正的可決系數(shù)為0.993,其模型的擬合程度最好,DW值為2.066(在2附近),顯然通過(guò)DW檢驗(yàn),說(shuō)明殘差項(xiàng)不存在一階自相關(guān)。序列相關(guān)檢驗(yàn)52本文檔共65頁(yè);當(dāng)前第52頁(yè);編輯于星期日\(chéng)22點(diǎn)50分方差分析表:方差分析表同時(shí)給出了3個(gè)模型的方差分析表。其中模型3的F值最大,說(shuō)明模型3的回歸效果最顯著。53本文檔共65頁(yè);當(dāng)前第53頁(yè);編輯于星期日\(chéng)22點(diǎn)50分回歸系數(shù)表:表中的Model欄中,模型1是先將卷煙銷(xiāo)量作為自變量進(jìn)入模型,模型2將卷煙銷(xiāo)量與打火石銷(xiāo)量?jī)蓚€(gè)自變量進(jìn)入模型,模型3是將卷煙、打火石和煤氣戶數(shù)三個(gè)自變量進(jìn)入模型。第四個(gè)自變量蚊香銷(xiāo)量沒(méi)有通過(guò)檢驗(yàn)自動(dòng)剔除。建立火柴銷(xiāo)售量對(duì)于相關(guān)因素煤氣戶數(shù)、卷煙銷(xiāo)量、蚊香銷(xiāo)量、打火石銷(xiāo)量的線性回歸模型54本文檔共65頁(yè);當(dāng)前第54頁(yè);編輯于星期日\(chéng)22點(diǎn)50分回歸系數(shù)表:回歸系數(shù)表的輸出結(jié)果可以看出,回歸系數(shù)都通過(guò)檢驗(yàn),模型中自變量與因變量的偏相關(guān)系數(shù)都在0.7以上,說(shuō)明進(jìn)入模型的自變量對(duì)因變量的影響都比較顯著。非標(biāo)準(zhǔn)化回歸系數(shù)標(biāo)準(zhǔn)化回歸系數(shù)55本文檔共65頁(yè);當(dāng)前第55頁(yè);編輯于星期日\(chéng)22點(diǎn)50分由最后兩列的容忍度Tolerance和方差膨脹因子VIF的值來(lái)看,自變量之間不存在強(qiáng)烈的共線性。共線性統(tǒng)計(jì)方差膨脹因子其值介于1~∞之間,其值越大,自變量之間存在共線性的可能性越大。檢驗(yàn)表明,VIF≥10,說(shuō)明解釋變量與其余解釋變量之間存在嚴(yán)重的多重共線性容忍度介于0-1之間,其值越小,自變量與其他自變量之間的共線性越強(qiáng)。使用容忍度作為共線性度量標(biāo)準(zhǔn)的條件比較嚴(yán)格,觀測(cè)量一定要大致近似于正態(tài)分布。56本文檔共65頁(yè);當(dāng)前第56頁(yè);編輯于星期日\(chéng)22點(diǎn)50分殘差統(tǒng)計(jì)表:殘差統(tǒng)計(jì)表中表示了預(yù)測(cè)值、殘差、標(biāo)準(zhǔn)化預(yù)測(cè)值和標(biāo)準(zhǔn)化殘差的特征值。其中包括預(yù)測(cè)值及殘差項(xiàng)的最小值和最大值、均值、標(biāo)準(zhǔn)誤和樣本容量。57本文檔共65頁(yè);當(dāng)前第57頁(yè);編輯于星期日\(chéng)22點(diǎn)50分奇異值表(標(biāo)準(zhǔn)化殘差值大于2)奇異值表中依次是序號(hào),標(biāo)準(zhǔn)化殘差值,實(shí)際觀測(cè)值、預(yù)測(cè)值及殘差值。表中給出的兩個(gè)個(gè)體數(shù)據(jù)的標(biāo)準(zhǔn)化殘差(數(shù)據(jù)號(hào)為12和14)超出了2。58本文檔共65頁(yè);當(dāng)前第58頁(yè);編輯于星期日\(chéng)22點(diǎn)50分標(biāo)準(zhǔn)化殘差圖(異方差的檢驗(yàn)):由圖中可以看出,殘差圖中的點(diǎn)分布是隨機(jī)的,沒(méi)有出現(xiàn)趨勢(shì)性,所以回歸模型是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論