![計量地理學第五章地理要素間的相關分析和回歸分析_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/3b3750c2-3b72-4a60-92e0-b7e19534593a/3b3750c2-3b72-4a60-92e0-b7e19534593a1.gif)
![計量地理學第五章地理要素間的相關分析和回歸分析_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/3b3750c2-3b72-4a60-92e0-b7e19534593a/3b3750c2-3b72-4a60-92e0-b7e19534593a2.gif)
![計量地理學第五章地理要素間的相關分析和回歸分析_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/3b3750c2-3b72-4a60-92e0-b7e19534593a/3b3750c2-3b72-4a60-92e0-b7e19534593a3.gif)
![計量地理學第五章地理要素間的相關分析和回歸分析_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/3b3750c2-3b72-4a60-92e0-b7e19534593a/3b3750c2-3b72-4a60-92e0-b7e19534593a4.gif)
![計量地理學第五章地理要素間的相關分析和回歸分析_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/3b3750c2-3b72-4a60-92e0-b7e19534593a/3b3750c2-3b72-4a60-92e0-b7e19534593a5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第五章 地理要素間的相關分析與回歸分析 地理系統(tǒng),是由多種要素相復合而構成的復雜巨系統(tǒng)。在這個系統(tǒng)中,一方面,各種要素之間存在著相互聯(lián)系、相互影響和相互制約的關系;另一方面,各種要素的復合作用又使各種地理事物和地理現(xiàn)象表現(xiàn)出強烈的地域差異性。為了定量地揭示各種地理要素之間的相互關系,以及各種地理事物和地理現(xiàn)象所表現(xiàn)出來的地域分異規(guī)律,就必須采用以概率論和多元統(tǒng)計分析方法對地理系統(tǒng)進行深入研究。地理要素間的相關分析地理要素間的回歸分析空間趨勢面分析 地理要素的時間序列分析地理要素的逐步回歸模型分析 第1節(jié) 相關分析 相關分析的任務,是揭示地理要素之間相互關系的密切程度。 地理要素之間相互關系密切
2、程度的測定,主要是通過對相關系數(shù)的計算與檢驗來完成的。地理要素間的相關類型根據(jù)相關所涉及變量的多少,相關關系分為單相關與復相關。兩個變量之間的相關關系稱為單相關;多個變量之間的相關關系稱為復相關。根據(jù)相關的形式不同,相關關系分為線性相關與非線性相關。如果變量之間的關系近似地表現(xiàn)為一條直線,則稱為線性相關;如果變量之間的關系近似地表現(xiàn)為一條曲線,則稱為非線性相關或曲線相關。根據(jù)變量相關方向的不同,相關關系分為正相關與負相關。正相關是指兩個變量之間的變化方向一致,都是增長或下降趨勢,如居民收入增加,居民消費額隨之增加,故它們是正相關;負相關是指兩個變量變化趨勢方向相反,如產品單位成本降低,利潤隨之
3、增加,故它們是負相關。根據(jù)相關程度的不同,相關關系分為不相關、完全相關和不完全相關。如果兩個變量彼此的數(shù)量變化相互獨立,這種關系稱為不相關;如果一個變量的數(shù)量變化完全由另一個變量的數(shù)量變化所唯一確定,這種關系稱為完全相關;介于不相關與完全相關之間的關系,稱為不完全相關。本節(jié)主要內容:兩要素之間相關程度的測定多要素間相關程度的測定一、兩要素之間相關程度的測定相關系數(shù)的計算與檢驗秩相關系數(shù)的計算與檢驗相關系數(shù)的計算相關系數(shù)的計算 定義: 和 為兩要素的平均值。 niiniiniiixyyyxxyyxxr12121)()()(yx(3.1.1)(一)相關系數(shù)的計算與檢驗(一)相關系數(shù)的計算與檢驗 說
4、明 :- 1 = 0.432,所以在=0.01的置信水平上來看,中國大陸各?。ㄖ陛犑?、自治區(qū))人口規(guī)模與GDP是等級相關的。 rr01. 0rxyr01. 0r二、多要素間相關程度的測定偏相關系數(shù)的計算與檢驗復相關系數(shù)的計算與檢驗 偏相關和復相關是兩個相對應的概念 (一)偏相關系數(shù)的計算與檢驗(一)偏相關系數(shù)的計算與檢驗 定義:在多要素所構成的地理系統(tǒng)中,先不考慮其他要素的影響,而單獨研究單獨研究兩個要素之間的相互關系的密切程度,這兩個要素之間的相互關系的密切程度,這稱為偏相關稱為偏相關。用以度量偏相關程度的統(tǒng)計量,稱為偏相關系數(shù)。n偏相關系數(shù)偏相關系數(shù)(partial correlation
5、 coefficient)624C2/ ) 1(2mmCm當研究2個相關變量x1、x2的關系時,用直線相關系數(shù)r12表示x1與x2線性相關的性質與程度。此時固定的變量個數(shù)為0,所以直線相關系數(shù)r12又叫做零級偏相關系數(shù)。當研究3個相關變量x1、x2、x3的相關時,我們把x3保持固定不變,x1與x2的相關系數(shù)稱為x1與x2的偏相關系數(shù),記為r12.3,類似地,還有偏相關系數(shù)r13.2、 r23.1。這3個偏相關系數(shù)固定的變量個數(shù)為1,所以都叫做一級偏相關系數(shù)。當研究4個相關變量x1、x2、x3、x4的相關時,須將其中的2個變量固定不變,研究另外兩個變量間的相關。即此時只有二級偏相關系數(shù)才真實地反
6、映兩個相關變量間線性相關的性質與程度。二級偏相關系數(shù)共有個:r12.34,r13.24,r14.23,r23.14,r24.13,r34.12。一般,當研究m個相關變量x1、x2、xm的相關時,只有將其中的m-2個變量保持固定不變,研究另外兩個變量的相關才能真實地反映這兩個相關變量間的相關,即此時只有m-2級偏相關系數(shù)才真實地反映了這兩個相關變量間線性相關的性質與程度。m-2級偏相關系數(shù)共有個。xi與xj的m-2級偏相關系數(shù)記為rij.(i,j=1,2,m,ij)。偏相關系數(shù)的取值范圍為-1,1,即:-1rij.1。 計算:3個要素的偏相關系數(shù))1)(1(2232132313123.12rrr
7、rrr(3.1.5) (3.1.6) )1)(1(2232122312132.13rrrrrr)1)(1(2132121312231.23rrrrrr(3.1.7) 4個要素的偏相關系數(shù)(3.1.8) )1)(1(23.2423.143.243.143.1234.12rrrrrr)1)(1(22.3422.142.342.142.1324.13rrrrrr(3.1.9) )1)(1(22.4322.132.432.132.1423.14rrrrrr(3.1.10) )1)(1(21.3421.241.341.241.2314.23rrrrrr(3.1.11) 例如:對于某4個地理要素x1,x2
8、,x3,x4的23個樣本數(shù)據(jù),經過計算得到了如下的單相關系數(shù)矩陣: 1469.0950.0579.0469.01592.0346.0950.0592.01416.0579.0346.0416.0144434241343332312423222114131211rrrrrrrrrrrrrrrrR 利用公式計算一級偏向關系數(shù),如表3.1.6所示:r1234r1324r1423r2314r2413r3412-0.1700.8020.635-0.1870.821 -0.337r123r132r142r143r231r241r243r341r3420.8210.8080.6470.895-0.8630.
9、9560.945-0.8750.371 利用公式計算二級偏相關系數(shù),如表3.1.7所示: 4個要素的一級偏相關系數(shù)有12個,這里給出了9個;二級偏相關系數(shù)有6個,這里全部給出來了。 寫出其余3個一級偏相關系數(shù)表表3.1.6 3.1.6 一級偏相關系數(shù)一級偏相關系數(shù) 表表3.1.7 3.1.7 二級偏相關系數(shù)二級偏相關系數(shù) n 偏相關系數(shù)的性質偏相關系數(shù)的性質 偏相關系數(shù)分布的范圍在-1到1之間; 偏相關系數(shù)的絕對值越大,表示其偏相關程度越大; 偏相關系數(shù)的絕對值必小于或最多等于由同一系列資料所求得的復相關系數(shù),即 R123|r123|。偏相關系數(shù)的顯著性檢驗偏相關系數(shù)的顯著性檢驗 偏相關系數(shù)的
10、顯著性檢驗,一般采用t檢驗法。其統(tǒng)計量計算公式為 式中: 為偏相關系數(shù);n為樣本數(shù);m為自變量個數(shù)。 11341223412 mnrrtmm(3.1.14) mr312 查t分布表,在自由度為23-3-1=19時,t0.001=3.883,顯然 ,這表明在置信度水平 =0.001上,偏相關系數(shù)r2413是顯著的。268. 61323821. 01821. 02ttt 譬如,對于上例計算得到的偏相關系數(shù) ,由于n=23,m=3,故821. 01324r小結偏相關分析 ( Partial ) 是研究在多變量的情況下,變量之間的復雜相關關系。在多變量的情況下, 2 個變量間的簡單相關系數(shù)往往不能正確
11、揭示這 2 個變量間的關系,只有在除去其他變量影響的情況下,計算它們之間的相關系數(shù),才能更確切地揭示他們間的相關關系。簡單相關關系有時不能真實反映現(xiàn)象的關系簡單相關關系有時不能真實反映現(xiàn)象的關系, 如:在研究商品的需求量和價格、消費者收入之間的關系時會發(fā)現(xiàn),需求量和價格之間的相關關系實際上還包含了消費者收入對商品需求量的影響。 例如,一種商品的需求既受收入水平的影響又受其價格的影響。按照經濟學理論,在一定收入水平下,該商品的價格越高,商品的需求量就越小。也就是說,需求與價格之間應當是負相需求與價格之間應當是負相關關??墒?在現(xiàn)實經濟生活中,由于收入和價格常常收入和價格常常都有不斷提高的趨勢都有
12、不斷提高的趨勢,如果不考慮收入對需求的影響,僅僅利用需求和價格的時間序列數(shù)據(jù)去計算簡單相關系數(shù)簡單相關系數(shù),就有可能得出價格越高需求越大的錯誤結論。 所以,我們在進行相關分析時往往要控制第三個變量,而研究變量之間的相關關系。通過偏相關系數(shù)與相關系數(shù)的比較,來確定這兩個變量之間的內在線性聯(lián)系會更真實,更可靠自然因素中平均坡度和平均海拔均表現(xiàn)出與土地生產率的負相關關系,其中以低值區(qū)的系數(shù)絕對值最大,平均海拔的相關系數(shù)達到平均海拔的相關系數(shù)達到-0.599 的顯著負相的顯著負相關關,說明當前該地區(qū)的土地生產率水平受到地形海拔高度的明顯負向影響。社會經濟因素中,化肥投入量和有效灌溉率化肥投入量和有效灌
13、溉率與土地生產率的正向偏相關關系顯著,尤其是中值區(qū)中值區(qū)的正相關度較高,明顯高于其他地區(qū).(二)復相關系數(shù)的計算與檢驗(二)復相關系數(shù)的計算與檢驗 復相關系數(shù)(multiple correlation analysis ) :反映幾個要素與某一個要素之間的復相關程度 。復相關系數(shù)的計算復相關系數(shù)的計算 當有兩個自變量時 當有三個自變量時(3.1.15) )1)(1 (11 . 221212.yyyrrR)1)(1)(1 (112. 321 . 2212123.yyyyrrrR(3.1.16)可利用單相關系數(shù)和偏相關系數(shù)求得 當有k個自變量時)1 )1)(1 (1)1.(12.21 .2212.
14、12. kykyykyrrrR(3.1.17) 復相關系數(shù)的性質 復相關系數(shù)介于0到1之間,即1012.kyR 復相關系數(shù)越大,則表明要素(變量)之間的相關程度越密切。復相關系數(shù)為1,表示完全相關;復相關系數(shù)為0,表示完全無關。 復相關系數(shù)必大于或至少等于單相關系數(shù)的絕對值。復相關系數(shù)的顯著性檢驗復相關系數(shù)的顯著性檢驗 F檢驗法。其統(tǒng)計量計算公式為kknRRFkyky11212.212.(3.1.18)例題:在上例中,若以x4為因變量,x1,x2,x3為自變量,試計算x4與x1,x2,x3之間的復相關系數(shù)。 解:按照公式(3.1.16)計算 檢驗: ,故復相關達到了極顯著水平。974.0337
15、.01)(956.01)(579.01 (1)1)(1)(1 (1222212.4321 .42241123.4)rrrR3010. 57190.12001. 0FF相關系數(shù)取值在相關系數(shù)取值在 -1 與與 1 之間。之間。相關系數(shù)是一種對稱測量。相關系數(shù)是一種對稱測量。相關系數(shù)無量綱,可以進行比較。相關系數(shù)無量綱,可以進行比較。2222)()( yynxxnyxxynr使用相關系數(shù)時應注意的問題:使用相關系數(shù)時應注意的問題:相關關系不等于因果關系;相關關系不等于因果關系;相關系數(shù)只度量變量間的線性關系,因此,相關系數(shù)只度量變量間的線性關系,因此,弱相關不一定表明變量間沒有關系;弱相關不一定表
16、明變量間沒有關系;極端值可能影響相關系數(shù)。極端值可能影響相關系數(shù)。注意相關關系成立的數(shù)據(jù)范圍。注意相關關系成立的數(shù)據(jù)范圍。警惕虛假相關警惕虛假相關第2節(jié) 地理要素間的回歸分析Regression Analysis回歸分析的意義和作用l一、一元線性回歸模型l二、一元非線性回歸模型l三、多元線性回歸模型l四、多元非線性回歸模型回歸:退回回歸:退回regression相關與回歸統(tǒng)計方法的創(chuàng)始人相關與回歸統(tǒng)計方法的創(chuàng)始人-弗朗西斯弗朗西斯高爾頓高爾頓, 1877年年 研究人類身長的遺傳研究人類身長的遺傳 “回歸回歸”到平均到平均數(shù)數(shù)平均身高平均身高回歸名稱來自于早期研究父母和他們的孩子的身高早期研究父
17、母和他們的孩子的身高時所采用的方法?;貧w分析,就是對具有相互聯(lián)系的要素,根據(jù)其聯(lián)系的形態(tài),選擇一個合適的數(shù)學模式,用來近似地表達要素間平均變化關系。回歸分析是研究要素之間具體的數(shù)量關系的一種強有力的工具,運用這種方法能夠建立反映地理要素之間具體的數(shù)量關系的數(shù)學模型,即回歸模型。 回歸分析的定義地理回歸分析的意義和作用地理系統(tǒng)是一個要素眾多、聯(lián)系復雜的大系統(tǒng)。各個因素之間存在著錯綜復雜的關系。在水文、氣象、地震等預報中,人文地理與經濟地理分析中,常常需要選擇對某一地理變量(因變量)有影響的因子(自變量)。雖然可以從理論上分析,選出影響因子,但是影響程度不是單憑理論分析就可判定的。需要回歸分析來測
18、定各變量(因素)對不同地理現(xiàn)象的影響程度;并以此建立模型進行預測或控制。因此,在地理研究中回歸分析具有極其重要的作用回歸分回歸分析分類析分類按自變量按自變量個數(shù)分類個數(shù)分類一元回歸一元回歸簡單回歸簡單回歸多元回歸多元回歸復回歸復回歸按模型特按模型特征分類征分類線性回歸線性回歸非線性回歸非線性回歸Simple Linear regression一一 元元線線性性回回歸歸 為了研究鋼材消費量與國民收入之間的關系,在統(tǒng)計年鑒上查得某地區(qū)一組歷史數(shù)據(jù)。引例:鋼材消費量與國民收入的關系 年 份199419951996200720082009鋼材消費(噸)698872988144627362825國民收入
19、(億)109712841502294831553372 試分析預測若2010年到2015年該地區(qū)國民收入以4.5%的速度遞增,2015年鋼材消費量將達到什么樣的水平? 鋼材消費量-因變量y dependent variable 被被解釋變量,待估測的變量解釋變量,待估測的變量國民收入-自變量 x independent variable解釋變量,給定的或可以控制的變量,作為估測根據(jù)的變量解釋變量,給定的或可以控制的變量,作為估測根據(jù)的變量建立數(shù)據(jù)擬合函數(shù) y = E(Y | x)= f(x);作擬合曲線圖形分析。 問題分析:10001500200025003000350050010001500
20、200025003000y=a+bx 鋼材消費量y與國民收入x的散點圖 鋼材消費量y國民收入x 定義:假設有兩個地理要素(變量)x 和y,x為自變量,y為因變量。則一元線性回歸模型的基本結構形式為 式中:a和b為待定參數(shù); 為各組觀測數(shù)據(jù)的下標; 為隨機變量。iiibxay(3.2.1) ni,1,2,i一、一元線性回歸模型需要解決的問題: 1) 在回歸模型中如何估計參數(shù)a、b? 2) 模型的假設是否正確?需要檢驗。3)利用回歸方程對y進行預測或對x進行控制? 記 和 分別為參數(shù)a與b的擬合值,則一元線性回歸模型為 (3.2.2)式代表x與y之間相關關系的擬合直線,稱為回歸直線; 是y的估計值
21、,亦稱回歸值。a bxbay(3.2.2) y 1.參數(shù)估計:最小二乘法(Ordinary Least Squares)截距截距斜率斜率xbay10001500200025003000350050010001500200025003000 鋼材消費量y與國民收入x的散點圖ei(xi , yi)y 鋼材消費量y國民收入xmin)(1122niniiiiyyeQ 參數(shù)a與b的最小二乘擬合原則要求yi與 的誤差ei的平方和達到最小,即 根據(jù)取極值的必要條件,有 niiininiiiibxayyyeQ121122min)()(niiiiniiixbxaybQbxayaQ110)(20)(2(3.2.4
22、) iy 參數(shù)參數(shù)a、b的的最小二乘估計(最小二乘估計(OLSOLS) (3.2.3) 正規(guī)方程組iniiniiniiniiniiyxbxaxybxan112111(3.2.5) 解上述正規(guī)方程組(3.2.5)式,得到參數(shù)a與b的擬合值xxxyniiniiiLLxxyyxxb121)()(xbya2112111)(1)(1niiniininiiniiiixnxyxnyx(3.2.6) (3.2.7) 例1:為了估計山上積雪融化后對下游灌溉的影響,在山上建立了一個觀測站,測量了最大積雪深度(X)與當年灌溉面積(Y),得到連續(xù)10年的數(shù)據(jù)年序年序最大積雪最大積雪深度深度X(X(尺尺) )灌溉面積灌
23、溉面積Y(Y(千千畝畝 ) )年序年序最大積雪最大積雪深度深度X(X(尺尺) )灌溉面積灌溉面積Y(Y(千千畝畝 ) )1 115.215.228.628.66 623.423.445452 210.410.419.319.37 713.513.529.229.23 321.221.240.540.58 816.716.734.134.14 418.618.635.635.69 9242446.746.75 526.426.448.948.9101019.119.137.437.4第一步:判斷是否存在線性關系首先,正確的分析和判斷兩個變量之間的關系是線性關系還是非線性關系?方法:作散點圖法、差
24、分法、曲度法、計算器法等。從散點圖可以看出:兩個變量間關系的性質(是正相關還是負相關)和程度(是相關密切還是不密切);兩個變量間關系的類型,是直線型還是曲線型(如果數(shù)據(jù)接近一條直線,則認為變量間存在線性關系;如果數(shù)據(jù)接近一條光滑的曲線,則稱之為非線性關系);是否有異常觀測值的干擾。做出散點圖xbay第二步:求解a和b年序年序 x y(x- )(x- )2 2 ( y- )2(x- )* ( y- )1 115.215.228.628.613.362.88 28.94 2 210.410.419.319.371.4296.87 145.59 3 321.221.240.540.55.5215.7
25、6 9.33 4 418.618.635.635.60.060.86 0.23 5 526.426.448.948.957153.02 93.39 6 623.423.4454520.771.74 38.54 7 713.513.529.229.228.653.73 39.22 8 816.716.734.134.14.625.90 5.22 9 9242446.746.726.5103.43 52.38 101019.119.137.437.40.060.76 0.22 求和求和188.5188.5365.3365.3228228764.96764.96413.06413.06平均值平均值1
26、8.8518.8536.5336.53xyyxxy813. 1256. 2256.285.18*813.153.6xbya813. 122806.413xxxyLLb一元線性回歸模型的顯著性檢驗一元線性回歸模型的顯著性檢驗 方法:F 檢驗法(方差分析)。構造F統(tǒng)計量來衡量回歸模型的效果。2. 回歸模型的假設檢驗自由度剩余平方和自由度回歸平方和1knQkUF(3.2.8) 總的離差平方和:在回歸分析中,表示y的n次觀測值之間的差異,記為) () ()(yyyyyy兩端平方,然后對所有的n點求和,則有2)(yy2)()( yyyy) )( (2) () (22yyyyyyyyxbya又因為)(xx
27、bybxay)(xxbyy) )() )(yyxxbyyyy)()(xxbyyxxb)()()(xxbxxbyyxxbxxxyLbLb202xxxxxyxyxxxyLLLLLLxxxyLLb niiyyyyLS12)(總niiyyyyLS12)(總niniiiiUQyyyy1122)()((3.2.9) (3.2.10) Q稱為誤差平方和,或剩余平方和;U稱為回歸平方和。 可以證明可以證明: :在假設在假設y y和和x x不存在線性關系(不存在線性關系(b=0b=0)時,)時,F(xiàn) F統(tǒng)計量統(tǒng)計量 因此,在給定的顯著水平(通常=0.01或0.05)下,若FF,則拒絕假設,認為回歸方程效果在此水平
28、下顯著。一般地,當FF(0.01,1,8)=11.25;回歸效果顯著Finding the Critical FFinding the Computed FConclusion on Significance of Slopes00 xbay點估計量3. 預測與控制給定的自變量x0,給出: 但是由于各種因素的影響但是由于各種因素的影響,在在x= x0時時,實際上的觀察到的數(shù)值實際上的觀察到的數(shù)值y0一般不會恰好等于一般不會恰好等于 , 它們之間總是存在一定的偏差它們之間總是存在一定的偏差,即預即預測誤差。為了掌握預測的精度,要對誤差的變動范圍作出測定。測誤差。為了掌握預測的精度,要對誤差的變動
29、范圍作出測定。通常用通常用估計標準誤差估計標準誤差S來說明來說明 與與 的差異程度的差異程度 0 yiy iy2)(2nyySii區(qū)間估計一般情況下,若一般情況下,若y為正態(tài)分布,當為正態(tài)分布,當n很大時,并且自變量很大時,并且自變量x不遠離不遠離均值時,則可以確定預測區(qū)間為:均值時,則可以確定預測區(qū)間為:以以0.6287概率保證的概率保證的y預測區(qū)間為:預測區(qū)間為:以以0.9545概率保證的概率保證的y預測區(qū)間為:預測區(qū)間為:以以0.9973概率保證的概率保證的y預測區(qū)間為:預測區(qū)間為:可見,可見,S 越小,數(shù)據(jù)越集中,由回歸模型估計越小,數(shù)據(jù)越集中,由回歸模型估計y值,其精度越高值,其精度
30、越高SySySySySySy3,32,2,000000例1 : 預測2009年最大積雪深度(X)達到28尺,概率度取1 時,預測2009年灌溉面積將是多少千畝?灌溉面積應在51.702, 54.538千畝。418. 128*813. 1356. 200Sxbay例2 :貨運量和工業(yè)總產值二、一元非線性回歸模型1選配曲線的基本方法確定曲線類型 數(shù)學表達式 化曲為直 利用最小二乘法求參數(shù)曲線回歸分析(curvilinear regression analysis)的基本任務是通過兩個相關變量x與y的實際觀測數(shù)據(jù)建立曲線回歸方程,以揭示x與y間的曲線聯(lián)系的形式。曲線回歸分析最困難和首要的工作是確定變
31、量與x間的曲線關系的類型。通常通過兩個途徑來確定:1、利用已有的有關專業(yè)知識,根據(jù)已知的理論規(guī)律和實踐經驗。例如,謀取與人口增長常具有“S”型曲線的形狀,即Logistic曲線的形式等。2、若沒有已知的理論規(guī)律和經驗可資利用,則可用描點法將實測點在直角坐標紙上描出Scatter diagram ,觀察實測點的分布趨勢與哪一類已知的函數(shù)曲線最接近,然后再選用該函數(shù)關系式來擬合實測點。非線性關系線性化的幾種情況非線性關系線性化的幾種情況對于指數(shù)曲線 ,令 , 可以將其轉化為直線形式: , 其中, ; 對于對數(shù)曲線 ,令 , ,可以將其轉化為直線形式: ;對于冪函數(shù)曲線 ,令 , ,可以將其轉化為直
32、線形式: 其中, ; bxdyexbayxbaylnxbaybdxy xbayyylnxx dalnyy xxlnyylnxxlndaln對于雙曲線 令 ,轉化為直線形式: ; 對于S型曲線 ,可 轉化為直線形式: ; 對于冪乘積 ,只要令 ,就可以將其轉化為線性形式 其中, ;xbay1xbayxxxyybaye,1,e1令xbaykkxxdxy2121kkxxxy22110 xxyy1,1kkxxxxxxyyln,ln,ln,ln2211dln0對數(shù)模型雙曲線模型課本例題一元非線性回歸模型的建立一元非線性回歸模型的檢驗總離差平方和回歸平方和2222)()()(1yyyyyycRiii22)
33、(2nQnyySi相關系數(shù)越大,表明回歸模型效果越好;反之,越差。剩余標準差越小,表明回歸模型效果越好;反之,越差。F檢驗法對于對數(shù)函數(shù)和 只要令 ,就可以將其化為線性形式 例例: :表3.2.1給出了某地區(qū)林地景觀斑塊面積(area)與周長(perimeter)的數(shù)據(jù)。下面我們建立林地景觀斑塊面積A與周長P之間的非線性回歸模型 。 kkxxxylnlnln22110kkxxxy22110kkxxxxxxyyln,ln,ln,2211 序號面積A周長P序號面積A周長P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 05
34、4.660289.307330 976.770775.7124430 833.840895.98049 442.902530.202451 823.355205.131510 858.9201 906.1034626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.195243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.0
35、70261.8181111 749.080558.921522 038.617320.396122 372.105199.667533 432.137253.335138 390.633592.893541 600.391230.030146 003.719459.467553 867.586419.406表3.2.1 某地區(qū)各個林地景觀斑塊面積(m2)與周長(m) 15527 620.2006 545.291561 946.184198.66116179 686.2002 960.4755777.30556.9021714 196.460597.993587 977.719715.75218
36、22 809.1801 103.0705919 271.8201 011.1271971 195.9401 154.118608 263.480680.710203 064.242245.049 6114 697.1301 234.1142146 9416.7008 226.009624 519.867326.317225 738.953498.6566313 157.6601 172.916238 359.465415.151646 617.270609.801246 205.016414.790 654 064.137437.355256 0619.0201 549.871665 645.
37、820432.355261 4517.740791.943676 993.355503.7842731 020.1001 700.965684 304.281267.9512826 447.1601 246.977696 336.383347.136297 985.926918.312702 651.414292.235303 638.766399.725712 656.824298.4733158 5425.10011 474.770721 846.988179.8663235 220.6401 877.476731 616.684172.8083310 067.820497.394741
38、730.563172.1433427 422.5701 934.5967511 303.970881.0423543 071.5501 171.4137614 019.790638.1763657 585.9402 275.389779 277.172862.0883728 254.1301 322.7957813 684.750712.78738497 261.0009 581.298791 949.164228.4033924 255.030994.906804 846.016324.481401 837.699229.40181521 457.4007 393.938411 608.62
39、5225.84282564 370.80012 212.410 解解:(1)作變量替換,令: , ,將表3.2.1中的原始數(shù)據(jù)進行對數(shù)變換,變換后得到的各新變量對應的觀測數(shù)據(jù)如表3.2.2所示。 AylnPxln序號y=lnAx=LnP序號y=lnAx=LnP1 9.254 1066.438 3794212.358 138.362 1862 9.678 7636.417 243 8.307 6225.667 487310.340 996.653 7824410.336 376.797 9184 9.153 0196.273 258457.508 4335.323 655 9.292 7427.
40、552 8164610.176 196.875 2946 9.977 3387.168 551479.515 9096.951 8417 8.838 076.033 2264811.091 187.718 8798 8.214 7895.496 7894911.965 727.786 3649 7.723 25.284 414507.643 2085.585 52810 5.812 1354.602 457518.042 0795.567 65111 9.371 536.326 008527.620 0275.7695 58表3.2.2 經對數(shù)變換后的數(shù)據(jù)127.771 5335.296 65
41、3538.140 9385.534 711139.034 8716.385 013547.378 0035.438 211148.700 1346.130 066558.260 3866.038 8391513.176 138.786 501567.573 6265.291 5971612.098 977.993 105574.347 7554.041 328179.560 7486.393 579588.984 4086.573 3341810.034 927.005 852599.866 3996.918 8211911.173 197.051 092609.019 6016.523 13
42、6208.027 5565.501 457619.595 4087.118 1092113.059 259.0150 56628.416 2385.787 871228.655 0326.211 917639.484 7597.067 248239.031 156.028 643648.797 4386.413 133248.733 1136.027 773658.309 9576.080 7442511.012 367.345 927668.638 6716.069 247269.583 1276.674 49678.852 7166.222 1472710.342 397.438 9516
43、88.367 3655.590 8062810.182 97.128 478698.754 0635.849 717298.985 4366.822 537707.882 8485.677 56308.199 45.990 776717.884 8875.698 6783113.280 099.347 906727.521 3115.192 2133210.469 397.537 684737.388 1325.152 181339.217 0996.209 381747.456 2025.148 3263410.219 127.567 654759.332 9096.781 1053510.
44、670 627.065 966769.548 2256.458 6143610.961 037.729 906779.135 3126.759 3583710.248 997.187 502789.524 0376.569 1823813.116 879.167 568797.575 1565.431 1123910.096 386.902 648808.485 9125.782 227407.516 275.435 4718113.164 388.908 416417.383 1355.419 8378213.243 479.410 208 (2) 以x為橫坐標、y為縱坐標,在平面直角坐標系
45、中作出散點圖。很明顯,y與x呈線性關系。圖3.2.2 林地景觀斑塊面積(A)與周長(P)之間的雙對數(shù)關系 (3)根據(jù)所得表中的數(shù)據(jù),運用建立線性回歸模型的方法,建立y與x之間的線性回歸模型,得到 對應于(3.2.19)式,x與y的相關系數(shù)高 達 =0.966 5。 (4)將(3.2.19)還原成雙對數(shù)曲線,即 7505.0505.1xy(3.2.19)7505.0ln505.1lnPA (3.2.20)xyr三、多元線性回歸模型回歸模型的建立回歸模型的建立 多元線性回歸模型的結構形式為 aakaaaxxxyk22110(3.2.11) 式中: 為待定參數(shù); 為隨機變量。 k,10a 回歸方程:
46、 如果 分別為式(3.2.11)中 的擬和值,則回歸方程為 在(3.2.12)式中,b0為常數(shù),b1,b2,bk稱為偏回歸系數(shù)。偏回歸系數(shù)偏回歸系數(shù)的意義是,當其他自變量都固定時,自變量 每變化一個單位而使因變量平均改變的數(shù)值。kkxbxbxbby22110(3.2.12) kbbb,10k,210ix 偏回歸系數(shù)的推導過程:根據(jù)最小二乘法原理, 的估計值 應該使 由求極值的必要條件得 方程組(3.2.14)式經展開整理后得 min)()(122211012nakakaaanaaaxbxbxbbyyyQ(3.2.13) ), 2, 1(0)(20)(2110kjxyybQyybQnajaaaj
47、naaa), 2 , 1 , 0(kii)(k,1,2, 0iib(3.2.14) 方程組(3.2.15)式稱為正規(guī)方程組。 引入矩陣nanaakanakkanakaakaanakananaaanakkaanaaaanaananaaanakkaanaaanaananaanakkanaaayxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb11122121101112122122121012111112121121011111212110)(.)()()()()()()()()()()()()()( (3.2.15) knnnkkxxxxxxxxxxxxX2
48、132313222121k211111.11knnnkkkknkkknnTxxxxxxxxxxxxxxxxxxxxxxxxXXA213231322212121113212232221113121111111111nakanakaanakaanakanakaanaanaaanaanakaanaaananaanakanaanaaxxxxxxxxxxxxxxxxxxxxxn12121111212212112111211211111211nyyyY21nbbbbb210 則正規(guī)方程組(3.2.15)式可以進一步寫成矩陣形式BAb naakanaaanaaanaanknkkknnTyyyxyxyyyyy
49、xxxxxxxxxxxxYXB112111321321223222111312111111求解得引入記號 YXXXBAbTT11)(najjiiajiijxxxxLL1)(naaiiaiyyyxxL1)((3.2.16) ),2, 1,(kji),2,1(ki正規(guī)方程組也可以寫成kkkykkkkkykkykkxbxbxbybLbLbLbLLbLbLbLLbLbLbL2211022112222212111212111)51 . 2 . 3( n回歸模型的顯著性檢驗回歸模型的顯著性檢驗 回歸平方和U與剩余平方和Q: 回歸平方和 剩余平方和為 F統(tǒng)計量為 計算出來F之后,可以查F分布表對模型進行顯著
50、性檢驗。k21x,x,xQULSyy總nanaiyiLbyyU112)(nayyaaULyyQ12)()1/(/knQkUF關于自由度模型中樣本值可以自由變動的個數(shù),稱為自由度自由度=樣本個數(shù)- 樣本數(shù)據(jù)受約束條件(方程)的個數(shù)例如,樣本數(shù)據(jù)個數(shù)=n,它們受k+1個方程的約束(這n個數(shù)必須滿足這k+1個方程)那么,自由度df = n-k-1補充:線性相關與回歸的區(qū)別補充:線性相關與回歸的區(qū)別 相關系數(shù)的計算只適用于兩個變量都服從正態(tài)分相關系數(shù)的計算只適用于兩個變量都服從正態(tài)分布的情形,而在回歸分析中,因變量是隨機變量,布的情形,而在回歸分析中,因變量是隨機變量,自變量既可以是隨機變量(自變量既
51、可以是隨機變量(IIII型回歸模型,兩個型回歸模型,兩個變量都應該服從正態(tài)分布),也可以是給定的量變量都應該服從正態(tài)分布),也可以是給定的量(I I型回歸模型,這時,與每個型回歸模型,這時,與每個X X 取值相對應的變取值相對應的變量量Y Y必須服從正態(tài)分布)。必須服從正態(tài)分布)。 線性相關表示兩個變量之間的相互關系是雙向的,線性相關表示兩個變量之間的相互關系是雙向的,回歸則反映兩個變量之間的依存關系,是單向的?;貧w則反映兩個變量之間的依存關系,是單向的。 補充:線性相關與回歸的聯(lián)系補充:線性相關與回歸的聯(lián)系 如果對同一資料進行相關與回歸分析,則得到如果對同一資料進行相關與回歸分析,則得到的相
52、關系數(shù)的相關系數(shù)r r與回歸方程中的與回歸方程中的b b正負號是相同的。正負號是相同的。 在相關分析中,求出在相關分析中,求出r r后要進行假設檢驗,同樣,后要進行假設檢驗,同樣,在回歸分析中,對在回歸分析中,對b b也要進行假設檢驗。實際上,也要進行假設檢驗。實際上,通過數(shù)學推導,對同一樣本可以得出通過數(shù)學推導,對同一樣本可以得出r r與與b b互化的互化的公式,同一樣本的這兩種假設檢驗也是等價的。公式,同一樣本的這兩種假設檢驗也是等價的。因此,由于因此,由于r r的假設檢驗可以直接查表,較為簡的假設檢驗可以直接查表,較為簡單,所以可以用其代替對單,所以可以用其代替對b b的假設檢驗。的假設
53、檢驗。 相關回歸可以互相解釋。相關回歸可以互相解釋??偦貧wSSSSll/llllrRYYXX2XYYYXX2XY22R R 的平方稱為確定系數(shù)的平方稱為確定系數(shù) (coefficient of determinationcoefficient of determination)應用確定系數(shù),也可以從回歸的角度對相關程度做應用確定系數(shù),也可以從回歸的角度對相關程度做進一步的了解。進一步的了解。補充:線性相關與回歸的聯(lián)系補充:線性相關與回歸的聯(lián)系第3節(jié) 空間趨勢面分析(Trend-Surface Analysis )一、概念 趨勢面分析趨勢面分析是用數(shù)學曲面數(shù)學曲面來擬合地理系統(tǒng)要素在空間的分布及
54、變化趨勢的一種數(shù)學方法。它實質上是通過回歸分析原理,模擬地理要素在空間上的空間上的分布規(guī)律分布規(guī)律,展示地理要素在地域空間上的變化趨勢。趨勢面分析常常被用來模擬資源、環(huán)境、人口及經濟要素在空間上的分布規(guī)律,它在空間分析方面具有重要的應用價值。 二、空間趨勢面分析的一般原理 空間趨勢面空間趨勢面并不是地理要素的實際分布面,而是模擬地理要素空間分布的近似曲面。因此,通常把實際的地理曲面分解為趨勢面趨勢面和剩余面剩余面兩部分 。前者反映地理要素的宏觀分布宏觀分布規(guī)律,屬于確定性因素作用的結果;而后者則對應于微觀局域,是隨機隨機因素因素的結果。趨勢面分析的一個基本要求就是所選擇的趨勢面模型應該是剩余值
55、最小剩余值最小,而趨勢值最大趨勢值最大,這樣擬合精度才能達到足夠的精確性。 1.趨勢面模型的建立 設 某 地 理 要 素 的 實 際 觀 測 數(shù) 據(jù) 為zi(xi,yi)(i=1,2,n),趨勢面擬合值為,則有式中,i為剩余值(殘差值) 采用回歸分析方法 在最小二乘法意義下的趨勢面擬合。 用來計算趨勢面的數(shù)學方程式有多項式和傅立葉級數(shù),其中最常用的是多項式函數(shù)形式。 多項式趨勢面的形式為:一次趨勢面模型:二次趨勢面模型: First-order (linear) trend surfaceSecond-order (quadratic) trend surfaceAn isoline map
56、of a third-order trend surface created from 105 points with annual precipitation values (105個年降水量點)zx,y = b0 + b1x + b2y + b3x2 + b4xy + b5y2 + b6x3 + b7x2y + b8xy2 + b9y3 需要注意在實際應用中,往往用次數(shù)低的趨勢面逼近變化比較小的地理要素數(shù)據(jù),用次數(shù)高的趨勢面逼近起伏變化復雜的地理要素數(shù)據(jù)。次數(shù)低的趨勢面使用起來比較方便,但是具體到某點擬合較差;次數(shù)較高的趨勢面只在觀測點附近效果較好,而在外推和內插時則效果較差。 2.趨勢面
57、模型的參數(shù)估計 將多項式回歸(非線性模型)模型轉化為多元線性回歸模型。 若要偏差平方和Q達到最小,求偏差平方和Q對a0,a1,a2ap的偏導數(shù),并令其等于0。經化簡后得到正規(guī)方程組。用矩陣形式表示正規(guī)方程組則正規(guī)方程組為nnPPnnnzzzzaaaAXpnXXXXXXXXXXXX101021321123121111322211ZXXXAZXXAXTTTT1)(那么,三、趨勢面模型的適度檢驗 1擬合度R2檢驗2.趨勢面模型的顯著性F檢驗 n為觀測值的個數(shù) p為自變量的個數(shù)3.趨勢面適度的逐次檢驗四、應用舉例課本例題:1建立趨勢面模型Z=18.44-1.38x-1.54y(R2=0.915,F=1
58、19.74) Z=18.27-1.161x-1.49y+0.07xy-0.07x2-0.04y2(R2=0.92,F=43.73)2.模型檢驗(1)根據(jù)R2檢驗方法計算(2)顯著性F檢驗。在顯著性水平0.01下,二次趨勢面的F值,大于臨界值4.17;一次趨勢面模型的F值大于臨界值 5.72。說明二者的整體顯著性均很高 。(3)一次和二次趨勢面回歸模型的逐次檢驗方差分析表 離差來源平方和自由度均方差F檢驗2次回歸214.77543.95543.722次剩余18.6625-5-10.9821次回歸213.82106.9119.741次剩余19.6425-2-10.893由1次增高到2次的回歸0.9
59、730.3230.329結論:二次趨勢面,F(xiàn)值不顯著,則二次多項式對于回歸并無新貢獻。因此選取一次趨勢面比較合適。 第4節(jié) 時間序列分析時間序列分析的基本原理 趨勢擬合方法季節(jié)變動預測 自回歸模型時間序列:時間序列:各種社會、經濟、自然現(xiàn)象的數(shù)量指標按照時間次序排列起來的統(tǒng)計數(shù)據(jù)時間序列分析模型:時間序列分析模型:解釋時間序列自身的變化規(guī)律和相互聯(lián)系的數(shù)學表達式一、時間序列分析的基本原理 (一)時間序列的組合成份(一)時間序列的組合成份 長期趨勢(長期趨勢(T, Trend T, Trend ) 是指時間序列隨時間的變化而逐漸增加或減少的長期變化的趨勢。上升或下降季節(jié)變動(季節(jié)變動(S,Sea
60、sonalS,Seasonal) 是指時間序列在一年中或固定時間內,呈現(xiàn)出的固定規(guī)則的變動。 循環(huán)變動循環(huán)變動(C,CyclicalC,Cyclical) 是指沿著趨勢線如鐘擺般地循環(huán)變動,又稱景氣循環(huán)變動(business cycle movement) 。資本主義經濟危機不規(guī)則變動(不規(guī)則變動(I,IrregularI,Irregular) 是指在時間序列中由于隨機因素影響所引起的變動。 SARS、戰(zhàn)爭、地震等405060708090100110120130123456789 10 11 12月銷量無趨勢無趨勢606570758085909510010513579 11 13 15 17
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年水冷空調機組市場環(huán)境分析
- 2025年中國瓣閥行業(yè)市場深度分析及投資策略研究報告
- 個人裝卸勞務合同范例
- 2025年度高端醫(yī)療器械銷售代理合同
- 修路擋墻工程合同范本
- 買賣寵物定金合同范本
- eps采購合同范本
- 辦公室收購合同范本
- 企業(yè)加薪合同范本
- 傳媒公司資質合同范本
- 統(tǒng)編版2024-2025學年一年級上冊期末語文素養(yǎng)評估卷(含答案)
- 中小學教師家訪記錄表內容(18張)8
- 專題15 機械振動與機械波(講義)(解析版)-2024年高考二輪復習
- 養(yǎng)生館拓客培訓
- 《大學計算機基礎》第2章計算機系統(tǒng)組成
- 2024年廣東省初中學業(yè)水平考試中考英語試卷(真題+答案解析)
- 人教版PEP英語單詞表三年級到六年級
- 新疆烏魯木齊市2024年中考英語模擬試題(含答案)
- 實驗室監(jiān)督人員培訓
- 教案設計常見問題及解決措施
- (正式版)JBT 14932-2024 機械式停車設備 停放客車通-用技術規(guī)范
評論
0/150
提交評論