版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、實驗四 相關(guān)分析與回歸分析【實驗項目】419023003-04【實驗?zāi)康呐c要求】1、掌握利用 SPSS 軟件進行簡單相關(guān)分析,偏相關(guān)分析的基本方法2、掌握利用 SPSS 軟件進行回歸分析的基本方法,包括一元線性回歸分析,多元線性回歸分析,非線性回歸分析(曲線估計)【實驗內(nèi)容】1、相關(guān)分析2、偏相關(guān)分析3、一元線性回歸分析4、多元線性回歸分析5、非線性回歸分析【實驗步驟】SPSS中的相關(guān)分析功能在【分析】【相關(guān)】中實現(xiàn)(圖4.1),可以進行“雙變量相關(guān)分析”、“偏相關(guān)分析”和“距離分析”。圖4.1 “相關(guān)分析”功能菜單雙變量相關(guān)分析 用于進行兩個/多個變量間的參數(shù)/非參數(shù)相關(guān)分析,主要用于分析兩
2、個變量之間是否存在相關(guān)關(guān)系,如果是多個變量,則給出兩兩相關(guān)的分析結(jié)果。這是相關(guān)分析最為常用功能,占到相關(guān)分析的 95%以上。下面的講述也以該過程為主。雙變量相關(guān)分析中,Person 相關(guān)系數(shù)用于度量定距連續(xù)變量間的相關(guān)性,如測度收入和儲蓄,身高和體重的關(guān)系:Kendall tau-b相關(guān)系數(shù)則用非參數(shù)檢驗方法來度量定序變量間的線性相關(guān)關(guān)系,如計算基于數(shù)據(jù)的秩:其中V為利用變量的秩計算得到的非一致對數(shù)目。Spearman等級相關(guān)系數(shù)用于度量定序變量間的相關(guān)性,如軍隊教員的軍銜與職稱。一般情況下選擇Person 相關(guān)系數(shù)。偏相關(guān)分析 如果需要進行相關(guān)分析的兩個變量其取值均受到其他變量的影響,就可以
3、利用偏相關(guān)分析對其他變量進行控制,輸出控制其他變量影響后的相關(guān)系數(shù),這種分析思想和協(xié)方差分析非常類似。距離相關(guān)分析 對同一變量內(nèi)部各觀察單位間的數(shù)值或各個不同變量間進行距離相關(guān)分析,前者可用于檢測觀測值的接近程度,后者則常用于考察預(yù)測值對實際值的擬合優(yōu)度。該過程在實際應(yīng)用中用的非常少。在進行相關(guān)分析的過程中還可以計算均數(shù)和標準差等基本統(tǒng)計量。一、相關(guān)分析為了估計山上積雪溶化后對河流下游灌溉的影響,在山上建立觀測站,測得連續(xù)10 年的最大積雪深度和灌溉面積數(shù)據(jù)(表4.1)。本實驗應(yīng)用SPSS相關(guān)分析方法分析最大積雪深度與灌溉面積之間的關(guān)系。表4.1 連續(xù)10 年的最大積雪深度和灌溉面積年份最大積
4、雪深度(米)灌溉面積(千畝)197115.228.6197210.419.3197321.240.5197418.635.6197526.448.9197623.445.0197713.529.2197816.734.1197924.046.7198019.137.4操作步驟1、在Excel中錄入表4.1數(shù)據(jù)。圖4.1 Excel中錄入的數(shù)據(jù)2、啟動SPSS,打開在Excel中錄入的數(shù)據(jù)(圖4.2)。圖4.2 SPSS打開Excel中錄入的數(shù)據(jù)3、【分析】【相關(guān)】【雙變量】,在彈出的“雙變量相關(guān)”對話框(圖4.3)中,將左邊欄三個變量中的“最大積雪深度”與“灌溉面積”兩個變量通過圖示中的箭頭輸
5、入到右邊欄“變量”列表框中。相關(guān)系數(shù)選擇“Pearson”,顯著性檢驗選擇“雙側(cè)檢驗”,選中標記顯著性相關(guān)后,在0.05水平顯著的相關(guān)系數(shù)用單個星號“*”標識,在0.01水平顯著的相關(guān)系數(shù)用兩個星號“*”標識。如果不選擇此項,則相關(guān)系數(shù)檢驗的顯著性不用星號“*”標識。 圖4.3 “雙變量相關(guān)”對話框中相應(yīng)選項4、單擊“雙變量相關(guān)”對話框中右邊“選項”按鈕,彈出“雙變量相關(guān)性:選項”對話框(圖4.4),選中統(tǒng)計量中兩個選擇項,缺失值選擇默認。點擊“繼續(xù)”按鈕,回到“雙變量相關(guān)”對話框(圖4.3右),點擊“確定”。圖4.4 “雙變量相關(guān)性:選項”對話框5、在彈出的輸出窗口中,左邊欄是輸出內(nèi)容列表(
6、圖4.5),右邊欄是相關(guān)內(nèi)容的詳細信息,其中描述性統(tǒng)計量和相關(guān)性以表格的形式給出(表4.2、表4.3)。雙擊這兩張表格可以對其進行修改。從表4.3可以看出兩個變量的相關(guān)系數(shù)0.989,在 0.01水平(雙側(cè))上顯著相關(guān)。圖4.5 輸出內(nèi)容列表表4.2 描述性統(tǒng)計量均值標準差N最大積雪深度(米)18.8505.031510灌溉面積(千畝)36.5309.219310表4.3 相關(guān)性最大積雪深度(米)灌溉面積(千畝)最大積雪深度(米)Pearson 相關(guān)性1.989*顯著性(雙側(cè)).000平方與叉積的和227.845413.065協(xié)方差25.31645.896N1010灌溉面積(千畝)Pearso
7、n 相關(guān)性.989*1顯著性(雙側(cè)).000平方與叉積的和413.065764.961協(xié)方差45.89684.996N1010*. 在 .01 水平(雙側(cè))上顯著相關(guān)。二、偏相關(guān)分析某農(nóng)場通過試驗取得某農(nóng)作物產(chǎn)量與春季降雨量和平均氣溫的數(shù)據(jù),如表4.4所示。在研究早稻產(chǎn)量與平均降雨量、平均氣溫之間的關(guān)系時,產(chǎn)量和平均降雨量之間的關(guān)系中實際還包含平均氣溫對產(chǎn)量的影響,同時平均降雨量對平均氣溫也會產(chǎn)生影響。因此,單純計算簡單相關(guān)系數(shù),顯然不能準確地反映事物之間的相關(guān)關(guān)系,而需要在剔除其他相關(guān)因素影響的條件下計算相關(guān)系數(shù)。偏相關(guān)分析正是用來解決這個問題的?,F(xiàn)以表4.4中數(shù)據(jù)為例求降雨量對產(chǎn)量的偏相關(guān)
8、。表4.4 某農(nóng)場早稻產(chǎn)量與降雨量和氣溫之間的關(guān)系早稻產(chǎn)量(kg)降雨量(mm)氣溫()150256230338300451045010513480111145001151655012017580120186001251860013020操作步驟1、在Excel中錄入表4.4數(shù)據(jù)。啟動SPSS,打開在Excel中錄入的數(shù)據(jù)。2、【分析】【相關(guān)】【偏相關(guān)】,在彈出的“偏相關(guān)”對話框(圖4.3)中,將左邊欄三個變量中的“早稻產(chǎn)量”與“降雨量”兩個變量通過圖示中的箭頭輸入到右邊欄“變量”列表框中,將“平均氣溫”輸入到“控制”列表框中。顯著性檢驗選擇“雙側(cè)檢驗”,不選中顯示實際顯著性水平。圖4.6 “
9、偏相關(guān)”對話框中相應(yīng)選項3、單擊右邊“選項”按鈕,彈出“偏相關(guān):選項”對話框(圖4.7),選中統(tǒng)計量中兩個選擇項,缺失值選擇默認。點擊“繼續(xù)”按鈕,回到“偏相關(guān)”對話框(圖4.6),點擊“確定”。圖4.7 “偏相關(guān):選項”對話框4、在彈出的輸出窗口中,左邊欄是輸出內(nèi)容列表(圖4.8),右邊欄是相關(guān)內(nèi)容的詳細信息,其中描述性統(tǒng)計量和相關(guān)性以表格的形式給出(表4.5、表4.6)。雙擊這兩張表格可以對其進行修改。根據(jù)有無控制變量,表4.6分為兩部分,當無控制變量時,得到的實際上就是三個變量兩兩之間的雙變量相關(guān)系數(shù)(即Pearson相關(guān)系數(shù)),在0.01水平上顯著相關(guān);當將“平均氣溫”作為控制變量時,
10、早稻產(chǎn)量與降雨量之間的偏相關(guān)系數(shù)為0.780,在0.05水平上顯著相關(guān)。圖4.8 輸出內(nèi)容列表表4.5 描述性統(tǒng)計量均值標準差N早稻產(chǎn)量444.00161.87810降雨量92.9041.27310平均氣溫14.004.69010表4.6 相關(guān)性控制變量早稻產(chǎn)量(kg)降雨量(mm)氣溫()-無-a早稻產(chǎn)量(kg)相關(guān)性1.000.981*.986*降雨量(mm)相關(guān)性.981*1.000.957*氣溫()相關(guān)性.986*.957*1.000氣溫()早稻產(chǎn)量(kg)相關(guān)性1.000.780*降雨量(mm)相關(guān)性.780*1.000a. 單元格包含零階 (Pearson) 相關(guān)。*. 在 0.0
11、1 水平上顯著相關(guān)*. 在 0.05 水平上顯著相關(guān)三、一元線性回歸分析操作步驟仍以表4.1數(shù)據(jù)為例說明建立一元線性回歸模型的方法。1、在Excel中錄入表4.1數(shù)據(jù)。啟動SPSS,打開在Excel中錄入的數(shù)據(jù)。2、作散點圖與線性趨勢判定2.1 【圖形】【舊對話框】【散點/點狀】(圖4.9)。圖4.9 “散點/點狀”命令 2.2 在彈出的“散點圖/點圖”對話框中選擇“簡單分布”(圖4.10),點擊“定義”。圖4.10 “散點圖/點圖”對話框2.3 在彈出的“簡單散點圖”對話框(圖4.11)中,設(shè)置X軸、Y軸對應(yīng)的變量,點擊“標題”,在“標題”對話框中輸入標題(圖4.12),點擊“繼續(xù)”,返回到
12、“簡單散點圖”對話框(圖4.11),點擊“確定”。圖4.11 “簡單散點圖”對話框圖4.12 “標題”對話框2.4 在輸出窗口中已繪制出“最大積雪面積與灌溉面積的關(guān)系”散點圖(圖4.13)。圖4.13 “最大積雪面積與灌溉面積的關(guān)系”散點圖2.5 散點圖編輯 雙擊“最大積雪面積與灌溉面積的關(guān)系”散點圖,通過“圖表編輯器”(圖4.14左)可以對散點圖進行編輯。修改坐標軸 左鍵單擊Y軸上的刻度值,單擊右鍵彈出快捷方式,選擇“屬性窗口”,在彈出的“屬性”對話框(圖4.14右)中對坐標軸進行修改,在“刻度”選項中將最小值改為 0。 圖4.14 “圖表編輯器”對話框和坐標軸“屬性窗口”修改坐標軸標題 單
13、擊左鍵兩次(注意:非雙擊)Y軸標題“灌溉面積千畝”,對其進行修改成“灌溉面積(千畝)”??梢詫軸標題做相應(yīng)修改。修改圖表 在散點圖上單擊右鍵,選擇“屬性窗口”,在彈出的圖表屬性窗口(圖4.15)中可以對圖表大小、填充和邊框和變量進行修改。圖4.15 圖表“屬性窗口”修改標記 在散點圖的標記上單擊右鍵,選擇“屬性窗口”,在彈出的標記屬性窗口(圖4.16)中可以對圖表大小、標記、花序和變量進行修改。圖4.16 對標記進行修改添加擬合線 在散點圖上單擊右鍵,在出現(xiàn)的快捷方式中選擇“添加總計擬合線”(圖4.17),在彈出的擬合線屬性窗口(圖4.18)中可以對擬合線的寬度、樣式、顏色、擬合方法和置信區(qū)
14、間進行修改。圖4.17 “添加總計擬合線”快捷方式圖4.18 對擬合線進行修改 修改圖例 在散點圖右側(cè)圖例“R2 線性=0.979”上單擊右鍵,在彈出的快捷方式中選擇屬性窗口(圖4.19),在彈出的圖例屬性窗口(圖4.20)中可以對圖例的文本布局、文本樣式、填充和邊框等進行修改。也可以移動圖例的位置。圖4.19 圖例修改快捷方式圖4.20 對圖例進行修改通過一系列修改,最后的散點圖如圖4.21所示,當然也可以對散點圖進行不同于圖4.21的修改。對散點圖的其它要素的修改也可以通過圖表編輯器(圖4.14左)的菜單和圖標等進行修改。圖4.21 修改后的散點圖3、回歸 3.1 【分析】【回歸】【線性】
15、(圖4.22)。圖4.22 “線性回歸”命令3.2 定義變量 在彈出的“線性回歸”對話框(圖4.23)中定義因變量(灌溉面積)和自變量(最大積雪面積)。圖4.23 “線性回歸”對話框3.3 設(shè)置回歸選項 點擊右側(cè)“統(tǒng)計量”按鈕,在“線性回歸:統(tǒng)計量”對話框(圖4.24)中選中回歸系數(shù)項下的“估計”、殘差項下的Durbin-Watson(這一項將給出DW 值),其余取默認值,如選中模型擬合度,這一項將給出回歸參數(shù)。點擊“繼續(xù)”回到“線性回歸”對話框(圖4.23)。圖4.24 “線性回歸:統(tǒng)計量”對話框點擊圖4.23右側(cè)的“繪制”按鈕,在“線性回歸:圖”對話框(圖4.25)中選中標準化殘差圖項下選
16、中直方圖和和正態(tài)概率圖。這兩項將給出標準殘差的頻率直方圖和及其正態(tài)分布的累計概率圖。單擊“繼續(xù)”回到“線性回歸”對話框(圖4.23)。圖4.25 “線性回歸:圖”對話框 點擊圖4.23右側(cè)的“保存”按鈕,在“線性回歸:保存”對話框(圖4.26)中選中預(yù)測值項下的“未標準化”和殘差項下的“未標準化”。這兩項將在原始表格數(shù)據(jù)中加上兩列,變量名稱分別為“PRE_1”和“RES_1”,對應(yīng)于通過回歸模型計算得到的預(yù)測值、預(yù)測值與原始值的殘差。其它選項可以不管:有些選項是用于多元線性回歸或逐步回歸的,在一元線性回歸中根本用不到;有些選項是用于特定場合保存文件的;還有一些選項只有做更細致的統(tǒng)計分析是才會用
17、上。單擊“繼續(xù)”回到“線性回歸”對話框(圖4.23)。圖4.26 “線性回歸:保存”對話框3.4 回歸結(jié)果 根據(jù)前述設(shè)定獲得的回歸結(jié)果如圖4.27所示,主要包括五個表格(輸入/移去的變量、模型匯總、Anova(方差分析Analysis of Variance)、系數(shù)和殘差統(tǒng)計量)和兩張圖(直方圖和正態(tài)概率圖)。圖4.27 回歸結(jié)果主要內(nèi)容3.4 結(jié)果解讀與模型檢驗 3.4.1 回歸系數(shù) 從表4.7中很容易讀出回歸系數(shù):截距a = 2.356 ,斜率b = 1.813。即一元線性回歸模型為表4.7 系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.B標準 誤差試用版1(常量)2.3561.8281.289
18、.233最大積雪深度米1.813.094.98919.286.000a. 因變量: 灌溉面積千畝3.4.2 模型檢驗 通過輸出結(jié)果的表(表4.8、4.9、4.10、4.11)可以獲得模型檢驗需要的統(tǒng)計量,主要包括:表4.8 模型匯總b模型RR 方調(diào)整 R 方標準估計的誤差Durbin-Watson1.989a.979.9761.4189.751a. 預(yù)測變量: (常量), 最大積雪深度米。b. 因變量: 灌溉面積千畝表4.9 Anovab模型平方和df均方FSig.1回歸748.8541748.854371.945.000a殘差16.10782.013總計764.9619a. 預(yù)測變量: (常
19、量), 最大積雪深度米。b. 因變量: 灌溉面積千畝表4.10 殘差統(tǒng)計量a極小值極大值均值標準 偏差N預(yù)測值21.21150.21836.5309.121710殘差-1.91082.3691.00001.337810標準 預(yù)測值-1.6791.501.0001.00010標準 殘差-1.3471.670.000.94310a. 因變量: 灌溉面積千畝模型擬合度檢驗統(tǒng)計量:從表4.8得到模型相關(guān)系數(shù)R=0.989,測定系數(shù)R2=0.979。F-檢驗統(tǒng)計量:從表4.9中得到,為371.945。t-檢驗統(tǒng)計量:從表4.7得到斜率的t值,為19.286。DW 檢驗統(tǒng)計量:從表4.8得到,為0.751
20、。標準誤差檢驗統(tǒng)計量(變異系數(shù)):從表4.8中得到標準差為1.419,從表表4.10中得到y(tǒng)的均值為36.530,因此可得到變異系數(shù)為得到各種檢驗統(tǒng)計量后,查閱相應(yīng)表格,確定回歸模型是否通過檢驗。3.4.3 預(yù)測值與殘差值 在圖4.26“線性回歸:保存”對話框進行了保存預(yù)測值和殘差的設(shè)定,原始數(shù)據(jù)表格自動增加了兩列,變量名稱分別為“PRE_1”和“RES_1”(圖4.28)。圖4.28 增加了“預(yù)測值”和“殘差”的數(shù)據(jù)表格 3.4.4回歸結(jié)果可靠程度判斷 根據(jù)殘差分布的直方圖(圖4.29)和殘差正態(tài)分布的累計概率圖(圖4.30)可以判斷回歸結(jié)果可靠程度的高低。圖4.29 殘差分布的直方圖圖4.
21、30 殘差正態(tài)分布的累計概率圖 一般來講,殘差分布的直方圖越是具有正態(tài)分布即鐘形曲線(bell-like curve)特征(圖4.29),表明殘差分布越是隨機,回歸結(jié)果越可靠。殘差分布的累計概率越是接近對角線(圖4.30),表明殘差分布越是隨機,回歸結(jié)果越可靠。四、多元線性回歸分析本實驗利用某省工業(yè)產(chǎn)值、農(nóng)業(yè)產(chǎn)值、固定資產(chǎn)投資和運輸業(yè)產(chǎn)值的統(tǒng)計數(shù)據(jù)(表4.11),分析該省工業(yè)產(chǎn)值、農(nóng)業(yè)產(chǎn)值與固定資產(chǎn)投資對運輸業(yè)產(chǎn)值的影響為例予以說明多元線性回歸分析方法。表4.11 某省工業(yè)產(chǎn)值、農(nóng)業(yè)產(chǎn)值、固定資產(chǎn)投資和運輸業(yè)產(chǎn)值的統(tǒng)計數(shù)據(jù)序號年份工業(yè)產(chǎn)值x1農(nóng)業(yè)產(chǎn)值x2固定資產(chǎn)投資x3運輸業(yè)產(chǎn)值y119705
22、7.8227.0514.543.092197158.0528.8916.833.403197259.1533.0212.263.884197363.8335.2312.873.905197465.3624.9411.653.226197567.2632.9512.873.767197666.9230.3510.803.598197767.7938.7010.934.039197875.6547.9914.714.3410197980.5754.1817.564.6511198079.0258.7320.324.7812198180.5259.8518.675.0413198286.8864.5
23、725.345.5914198395.4870.9725.066.01151984109.7181.5429.697.03161985126.5094.0143.8610.03171986138.89103.2348.9010.83181987160.56119.3360.9812.90操作步驟1、錄入或調(diào)入數(shù)據(jù),此處不再贅述。2、多元線性回歸分析的過程與一元線性回歸分析的過程大致相似,差別在于多元線性回歸分析需要定義多個自變量。【分析】【回歸】【線性】調(diào)出“線性回歸”對話框(圖4.31),定義“運輸業(yè)產(chǎn)值”為因變量,定義“工業(yè)產(chǎn)值”、“農(nóng)業(yè)產(chǎn)值”和“固定資產(chǎn)投資”為自變量。單擊“統(tǒng)計量”,在
24、“線性回歸:統(tǒng)計量”對話框中的選擇如圖4.32所示。同理,單擊“繪制”,在 “線性回歸:圖”對話框的選擇如圖4.33所示;單擊“保存”,在“線性回歸:保存”對話框的選擇如圖4.34所示,其他的選擇默認。單擊“繼續(xù)”,回到“線性回歸”對話框(圖4.31),單擊“確定”。圖4.31 “線性回歸”對話框圖4.32 “線性回歸:統(tǒng)計量”對話框圖4.33 “線性回歸:圖”對話框圖4.34 “線性回歸:保存”對話框3、在原始數(shù)據(jù)的表格中新增了四個變量,名稱分別為“PRE_1”、“RES_1”、“ZPR_1”、“ZRE_1”(圖4.35),分別對應(yīng)“運輸業(yè)產(chǎn)值預(yù)測值”、“殘差值”、“標準化的運輸業(yè)產(chǎn)值預(yù)測值
25、”和“標準化的殘差”,在“變量視圖”窗口中作相應(yīng)的修改(圖4.36),在“數(shù)據(jù)視圖”窗口中可以查看修改后的數(shù)據(jù)表格(圖4.37)。圖4.35 數(shù)據(jù)表格中新增的四個變量圖4.36 “變量視圖”窗口中所做的修改圖4.37 在“數(shù)據(jù)視圖”窗口中查看所做的修改4、在輸出窗口相應(yīng)的表格中查看回歸分析所需要的參數(shù):表4.12 模型匯總b模型RR 方調(diào)整 R 方標準 估計的誤差Durbin-Watson1.994a.989.986.335431.853a. 預(yù)測變量: (常量), 固定資產(chǎn)投資x3, 農(nóng)業(yè)產(chǎn)值x2, 工業(yè)產(chǎn)值x1。b. 因變量: 運輸業(yè)產(chǎn)值y從表4.12中可以看出:復相關(guān)系數(shù)R = 0.99
26、4 、測定系數(shù)R2 = 0.989、估計的標準誤差s = 0.3354 以及DW 值DW = 1.853。表4.13 Anovab模型平方和df均方FSig.1回歸136.896345.632405.580.000a殘差1.57514.113總計138.47117a. 預(yù)測變量: (常量), 固定資產(chǎn)投資x3, 農(nóng)業(yè)產(chǎn)值x2, 工業(yè)產(chǎn)值x1。b. 因變量: 運輸業(yè)產(chǎn)值y從表4.13中可以看出:回歸平方和SSr = 136.896 ,剩余平方和SSe = 1.575 ,總平方和SSt = 138.471 ,顯然R=SSr/SSt=0.994。同時可以讀到F = 405.580 。順便說明,df
27、為degree of freedom 的簡稱:3 為回歸自由度,等于變量個數(shù)k;14 為剩余自由度;17 為總自由度,等于n-1 即樣本個數(shù)減1。易見回歸自由度剩余自由度總自由度。我們在各種檢驗參數(shù)用到的自由度為剩余自由度,即v=n-k-1。在本例中,v=18-3-1=14。各種檢驗都要根據(jù)剩余自由度和變量個數(shù)判定臨界值。 從表4.14中可以得出回歸分析模型中的回歸系數(shù),a = 1.004 ,b1=0.05533, b2 =-0.00402,b3 =0.09069,以及回歸系數(shù)對應(yīng)的標準誤差(Std. Error)。據(jù)此可以建立回歸模型:從表4.14中還可以得出零階相關(guān)系數(shù),即各個自變量與因變
28、量的簡單相關(guān)系數(shù): 工業(yè)產(chǎn)值與運輸業(yè)產(chǎn)值的線性相關(guān)系數(shù)為0.989, 農(nóng)業(yè)產(chǎn)值與運輸業(yè)產(chǎn)值的線性相關(guān)系數(shù)為0.965,固定資產(chǎn)投資與運輸業(yè)產(chǎn)值的線性相關(guān)系數(shù)為0.987。與之對應(yīng)的還有偏相關(guān)系數(shù)和部分相關(guān)系數(shù)(對于一元線性回歸而言,這三個相關(guān)系數(shù)是相等的)。表4.15 殘差統(tǒng)計量a極小值極大值均值標準 偏差N預(yù)測值3.247412.92995.55942.8377318殘差-.40058.63261.00000.3043918標準 預(yù)測值-.8152.597.0001.00018標準 殘差-1.1941.886.000.90718a. 因變量: 運輸業(yè)產(chǎn)值y下面對圖形進行說明,回歸標準殘差的直
29、方圖(圖4.38)應(yīng)該呈正態(tài)分布(下圖不具備正態(tài)曲線的鐘形圖式);累計概率點列應(yīng)該沿著對角線分布(圖4.39),當且僅當觀察的累計概率與預(yù)期的累計概率相等時才會形成嚴格意義的對角線,統(tǒng)計結(jié)果給出的坐標圖越接近對角線說明回歸效果越好(下圖的分布有些偏離對角線較遠)。說明本實驗建立的多元線性回歸模型的回歸效果不是很好。圖4.38回歸標準殘差的直方圖圖4.39回歸標準殘差分布的累計概率圖五、非線性回歸分析本實驗以Boston 人口密度的空間分布模型為例說明非線性回歸分析方法。Clark是城市人口密度模型的最早提出者。他按照等距離的方式將城市分成若干環(huán)帶(rings),然后借助人口普查區(qū)段(censu
30、s tract)計算各個環(huán)帶的平均人口密度。這樣就得到兩組變量:到城市中心(CBD)的距離r(基于環(huán)帶的中線或者外邊界)和r 處的平均人口密度(r)。Clark 用這種方法先后測量了歐美國家的20 多個城市的人口密度數(shù)據(jù),發(fā)現(xiàn)了所謂的Clark 定律。下面是Clark測量的原始數(shù)據(jù)之1940 年美國Boston 的城市人口密度,數(shù)據(jù)由Banks(1994)提供(表4.12)。操作步驟1、錄入或調(diào)入數(shù)據(jù),此處不再贅述。2、做散點圖?!緢D形】【舊對話框】【散點/點狀】【簡單分布】調(diào)出“簡單散點圖”對話框,分別將“距離”和“密度”導入X-軸和Y-軸對應(yīng)的欄目中(圖4.40),點擊“確定”按鈕,生成散點圖(圖4.41)。 觀察圖4.41 所示的散點圖,發(fā)現(xiàn)點列具有指數(shù)衰減特征,可以初步判斷Boston的人口密度服從負指數(shù)模型,即對于城市人口密度,習慣上用r 表示x,(r)表示y,用0 表示a,從而有表4.12 1940 年美國Boston 的城市人口密度距離(英里) 密度(人/平方米) 0.5263001.5251002.519900
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆維吾爾自治區(qū)昌吉市教育共同體四校2025屆高三英語第一學期期末綜合測試試題含解析
- 福清市福清華僑中學2025屆數(shù)學高三第一學期期末調(diào)研試題含解析
- 云南省中央民族大附屬中學芒市國際學校2025屆高二數(shù)學第一學期期末監(jiān)測試題含解析
- 重慶市聚奎中學2025屆英語高三第一學期期末調(diào)研試題含解析
- 2025屆山東省濟寧市兗州區(qū)生物高三第一學期期末調(diào)研試題含解析
- 2025屆福建省福州四中語文高三第一學期期末綜合測試試題含解析
- 貴州省長順縣二中2025屆高一數(shù)學第一學期期末綜合測試模擬試題含解析
- 2025屆北京海淀中關(guān)村中學高三語文第一學期期末綜合測試模擬試題含解析
- 2025屆安徽省宣城市六校英語高三上期末質(zhì)量檢測試題含解析
- 2025屆吉林省松原市生物高二上期末監(jiān)測試題含解析
- 第20課清朝君主專制的強化 教案
- (新版)食品生產(chǎn)企業(yè)食品安全員理論考試題庫500題(含答案)
- 2024-2030年中國應(yīng)急產(chǎn)業(yè)市場發(fā)展分析及競爭形勢與投資機會研究報告
- 2輸變電工程施工質(zhì)量驗收統(tǒng)一表式(變電工程土建專業(yè))-2024年版
- 2024年中國具身智能行業(yè)研究:知行合一擁抱AI新范式-19正式版
- 數(shù)字中國發(fā)展報告(2023年)
- DB33936-2022公路橋梁整體頂升技術(shù)規(guī)程
- 2024年醫(yī)院招聘筆試試題及參考答案
- 北京市西城區(qū)2023-2024學年高一下學期期末英語試題(解析版)
- 三位數(shù)乘兩位數(shù)乘法豎式計算練習100道及答案
- 2025高考語文步步高大一輪復習講義65練答案精析
評論
0/150
提交評論