版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
地理加權(quán)回歸(GWR)2012年12月24日基本框架普通線性回歸模型及估計OLS工作的基本原理解釋OLS結(jié)果GWR提出的背景及意義地理加權(quán)回歸模型及估計權(quán)函數(shù)選擇權(quán)函數(shù)寬帶優(yōu)化診斷工具膀胱癌死亡率實例OLS工作的基本原理在我們國家是否有持續(xù)發(fā)生年輕人早逝的地方?哪里為犯罪或火災(zāi)的高發(fā)地點?城市中哪里的交通事故發(fā)生率比預(yù)期的要高?……在實際工作中,我們可能會遇到以下類似的問題對于上面的每一個問題都詢問了“where”,但是我們自然會想到“why”為什么國家會存在持續(xù)發(fā)生年輕人早逝的地方?是什么導(dǎo)致了這種情況?我們能否對犯罪、911呼叫或火災(zāi)頻發(fā)地區(qū)的特征進行建模,以幫助減少這些事件的發(fā)生?導(dǎo)致交通事故發(fā)生率比預(yù)期要高的因素有哪些,有沒有相關(guān)政策或者措施來減少整個城市或特定事故高發(fā)區(qū)的交通事故?通過回歸分析,我們可以對空間關(guān)系進行建模、檢查和探究,還可以解釋所觀測到的空間模式背后的諸多因素。例如分析有些地區(qū)為什么會持續(xù)發(fā)生年輕人早逝或者糖尿病的發(fā)病率比預(yù)期的要高。通過空間關(guān)系建模,對這些現(xiàn)象進行預(yù)測。例如,對影響大學(xué)生畢業(yè)率的因素進行建模,可以對近期的勞動力技能和資源進行預(yù)測;因為監(jiān)測站數(shù)量不足而無法進行充分插值的情況下(沿山脊地區(qū)和山谷內(nèi),雨量計通常會短缺),可以用回歸法來預(yù)測這些地區(qū)的降雨量或者是空氣質(zhì)量。使用回歸分析的主要原因1.對某一現(xiàn)象建模,測量一個或多個變量的變化對另一變量變化的影響程度。例如,了解某些特定瀕危鳥類的主要棲息地特征(降水,食物源、植被、天敵),以協(xié)助通過立法來保護該物種。2.對某種現(xiàn)象建模以預(yù)測其他地點或其他時間的數(shù)值,構(gòu)建一個持續(xù)準(zhǔn)確的預(yù)測模型。例如,如果已知人口增長情況和典型的天氣狀況,那么明年的用電量將會是多少?3.深入探索某些假設(shè)情況。假設(shè)您正在對住宅區(qū)的犯罪活動進行建模,以更好的了解犯罪活動并希望實施可能阻止犯罪活動的策略,開始分析時,就會有很多問題或想要檢驗的假設(shè)情況:1).“破窗理論”表明公共財產(chǎn)的破壞(涂鴉、被毀壞的建筑物等)可招致其他犯罪行為,破壞財產(chǎn)行為與入世盜竊之間是否存在正關(guān)系?2).非法使用毒品與盜竊行為之間存在某種關(guān)系嗎(吸毒成癮的人又可能通過偷取財物來維持他們吸毒的習(xí)慣嗎)?OLS回歸方程4.不穩(wěn)定性:一個輸入變量在區(qū)域A中具有很強的解釋能力,但是在區(qū)域B中卻不顯著。如果因變量與自變量之間的關(guān)系在研究區(qū)域內(nèi)不一致,將人為地擴大計算出的標(biāo)準(zhǔn)誤差。用Koenker測試關(guān)聯(lián)的概率很小時,區(qū)域變化具有統(tǒng)計顯著性。(地理加權(quán)回歸改進)6.殘差的方差不一致:對于較小的因變量值,模型的預(yù)測效果較好,但對于較大的因變量值,模型的預(yù)測值變得不可靠。7.空間自相關(guān)殘差:注意模型偏低預(yù)計值(紅色)出現(xiàn)空間聚類的方式。殘差(模型的偏低預(yù)計值和偏高預(yù)計值)在統(tǒng)計學(xué)上的顯著空間聚類表明模型缺失關(guān)鍵的因變量,可以使用空間自相關(guān)工具來確定模型殘差的空間聚類是否有統(tǒng)計學(xué)上的顯著性。解釋OLS結(jié)果(1)評估模型性能。R平方的倍數(shù)和校正R平方值都可以用來測量模型性能。取值范圍從0.0-
1.0。由于“校正R平方”值與數(shù)據(jù)相關(guān),更能準(zhǔn)確地測量出模型性能,能夠反映模型的復(fù)雜性,因此“校正R平方”值始終要比“R平方的倍數(shù)”值略小。為模型額外添加一個解釋變量可能會增大“R平方的倍數(shù)”值,但可能會減小“校正的R平方”值。假設(shè)正在創(chuàng)建一個入室盜竊(與每個人口普查區(qū)塊相關(guān)的入室盜竊數(shù)量為因變量,y)的回歸模型。如果“校正R平方”值為0.84,則表示該模型(使用線性回歸建模的解釋變量)可解釋因變量中大約84%的變化。使用R平方值量化模型性能(2)評估模型中的每一個解釋變量:系數(shù)、概率、穩(wěn)健概率和方差膨脹因子(VIF)。系數(shù)——反映它與因變量之間關(guān)系的強度,以及它們之間的關(guān)系類型。當(dāng)系數(shù)為負時,表明自變量與因變量負相關(guān)。當(dāng)系數(shù)為正號時,自變量與因變量為正相關(guān)。概率或穩(wěn)健概率(p值)——P值很小時,系數(shù)實際為零的幾率也會很小。如果Koenker測試(見下圖)具有統(tǒng)計學(xué)上的顯著性,應(yīng)使用穩(wěn)健概率來評估自變量的統(tǒng)計學(xué)顯著性。對于具有統(tǒng)計學(xué)上顯著性的概率,其旁邊帶有一個星號(*)。VIF——測量自變量中的冗余。一般來說,與大于7.5的VIF值關(guān)聯(lián)的自變量應(yīng)逐一從回歸模型中移除。(3)評估模型是否具有顯著性。聯(lián)合F統(tǒng)計量(聯(lián)合卡方統(tǒng)計量)用于測量整個模型的統(tǒng)計學(xué)顯著性。只有在Koenker(BP)統(tǒng)計量(見下圖)不具有統(tǒng)計學(xué)上的顯著性時,“聯(lián)合F統(tǒng)計量”才可信。如果Koenker(BP)統(tǒng)計量具有顯著性,應(yīng)參考“聯(lián)合卡方統(tǒng)計量”來確定整個模型的顯著性。對于大小為95%的置信度,p值(概率)小于0.05表示模型具有統(tǒng)計學(xué)上的顯著性。(4)評估穩(wěn)定性。Koenker(BP)統(tǒng)計量(Koenker的標(biāo)準(zhǔn)化Breusch-Pagan統(tǒng)計量)是一種測試,用于確定模型的自變量是否在地理空間和數(shù)據(jù)空間中都與因變量具有一致的關(guān)系。如果模型在地理空間中一致,由自變量表示的空間進程在研究區(qū)域各位置處的行為也將一致。如果模型在數(shù)據(jù)空間中一致,則預(yù)測值與每個自變量之間關(guān)系的變化不會隨自變量值(模型沒有異方差性)的變化而變化。該測試的零假設(shè)測試模型穩(wěn)定性。對于大小為95%的置信度,p值(概率)小于0.05表示模型具有統(tǒng)計學(xué)上的顯著異方差性和/或不穩(wěn)定性。如果該測試的結(jié)果具有統(tǒng)計學(xué)上的顯著性,需參考穩(wěn)健系數(shù)標(biāo)準(zhǔn)差和概率來評估每個解釋變量的效果。具有統(tǒng)計學(xué)上顯著不穩(wěn)定性的回歸模型通常很適合進行地理加權(quán)回歸
分析。(6)評估殘差空間自相關(guān)。對回歸殘差運行空間自相關(guān)(Moran‘sI)
可確?;貧w殘差在空間上隨機分布。高殘差和/或低殘差(模型偏高預(yù)計值和偏低預(yù)計值)在統(tǒng)計學(xué)上的顯著聚類表明模型中的某個關(guān)鍵變量缺失了。當(dāng)錯誤指定了模型時,OLS結(jié)果不可信。GWR提出的背景和意義在空間分析(Spatialanalysis)中,變量的觀測值(數(shù)據(jù))一般都是按照某給定的地理單位為抽樣單位得到的,隨著地理位置的變化,變量間的關(guān)系或者結(jié)構(gòu)會發(fā)生變化,這種因地理位置的變化而引起的變量間關(guān)系或結(jié)構(gòu)的變化稱之為空間非平穩(wěn)性(spatialnonstationarity)。這種空間非平穩(wěn)性普遍存在在空間數(shù)據(jù)中,如果采用通常的線性回歸模型或莫伊特定形式的非線性回歸函數(shù)來分析空間數(shù)據(jù),一般很難得到滿意的結(jié)果,因為全局模型(globalmodel)在分析之前就假定了變量間的關(guān)系具有同質(zhì)性(homogeneity),從而掩蓋了變量間關(guān)系的局部特性,所得結(jié)果也只有研究區(qū)域內(nèi)的某種“平均”,因此需要對傳統(tǒng)的分析方法進行改進。地理加權(quán)回歸模型地理加權(quán)回歸模型是對普通線性回歸模型的擴展,將數(shù)據(jù)的地理位置嵌入到回歸參數(shù)中,即:這里的為第i個采樣點的坐標(biāo)(如經(jīng)緯度),是第i個采樣點上的第k個回歸參數(shù),是地理位置的函數(shù)。簡便記為:空間權(quán)函數(shù)的選擇地理加權(quán)回歸模型的核心是空間權(quán)重矩陣,它是通過選取不同的空間權(quán)函數(shù)來表達對數(shù)據(jù)久安空間關(guān)系的不同認識。空間權(quán)函數(shù)的正確選取對地理加權(quán)回歸模型參數(shù)的正確估計非常重要,介紹常用的幾種空間全函數(shù)。1.距離閾值法4.截尾型函數(shù)法權(quán)函數(shù)寬帶優(yōu)化在實際應(yīng)用中我們發(fā)現(xiàn),地理加權(quán)回歸分析對Gauss函數(shù)和bi-square函數(shù)的選擇并不是很敏感,但是對特定權(quán)函數(shù)的寬帶卻很敏感,寬帶過大回歸參數(shù)估計的偏差過大,寬帶過小又會導(dǎo)致回歸參數(shù)估計的方差過大,那么如何選擇一個合適的寬帶呢?1.交叉驗證法(CV)2.AIC準(zhǔn)則膀胱癌死亡率實例實驗數(shù)據(jù)研究區(qū)域:美國本土的506個經(jīng)濟發(fā)展區(qū)膀胱癌死亡率數(shù)據(jù):國際癌癥研究所Atlas癌癥死亡率,1970-1994年,年齡標(biāo)準(zhǔn)化死亡率(每年每10萬人)肺癌死亡率:1954-1969年,年齡標(biāo)準(zhǔn)化死亡率數(shù)局人口密度:取每年人口密度的自然對數(shù)普通線性回歸模型分析
GWR模型分析現(xiàn)在回歸系數(shù)根據(jù)經(jīng)濟發(fā)展區(qū)變化而變化,通過交叉驗證(VC),GWR核函數(shù)的波段寬度的估計為1.27。擬合系數(shù)變?yōu)?.52,提高了擬合精度。估計的系數(shù)展現(xiàn)出一種明顯的變化,在一些地區(qū)出現(xiàn)了違反直覺的負相關(guān)關(guān)系,肺癌和人口密度都是,而且人口密度的負相關(guān)更加明顯。Wheeler等人用散點圖估計系數(shù)之間的相關(guān)性。
對回歸系數(shù)進一步探索他們之間的獨立性,方差比例和條件指數(shù)作為診斷工具。在506個SEA中,13個SEA的狀態(tài)指數(shù)大于30,85個的條件指數(shù)要大于20,500個的條件指數(shù)大于10。436個方差比例大于0.5,在這些最大方差比例中,又有431個的條件指數(shù)大于10??傮w來說,方差變異分解和條件指數(shù)在一定程度上說明了局部共線性的存在。另外通過總結(jié),可以分析相關(guān)性具體位于哪個位置上。一個條件指數(shù)和方差比例的平行坐標(biāo)圖,一個條件指數(shù)的直方圖。在最大條件指數(shù)下的30個SEAs的選擇集被高亮顯示。在相關(guān)系數(shù)圖中也按照條件指數(shù)大于30的用黃色標(biāo)注,周邊靠近海洋的地方大部分被選擇。在平行坐標(biāo)系中很清楚可以看到大部分被選擇的點在截距和肺癌死亡率上存在最大的方差變異。通過表1可以看到,方差比例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度二手房買賣合同線上線下融合營銷服務(wù)合同4篇
- 二零二五年度石子購銷合同的驗收標(biāo)準(zhǔn)3篇
- 二零二五年科研課題合作研究合同5篇
- 2025版特色旅游線路導(dǎo)游人員勞動合同范本4篇
- 2025年度綠色建筑個人工程承包施工合同范本2篇
- 2025年食品代加工食品安全與品質(zhì)提升協(xié)議3篇
- 2025年高精度設(shè)備維護與技術(shù)支持合同3篇
- 2025版事業(yè)單位教師崗位聘用合同續(xù)簽協(xié)議3篇
- 二零二五版文化創(chuàng)意產(chǎn)業(yè)園區(qū)勞務(wù)分包合同3篇
- 個性化離婚合同書范本(2024)版B版
- 2025-2030年中國陶瓷電容器行業(yè)運營狀況與發(fā)展前景分析報告
- 二零二五年倉儲配送中心物業(yè)管理與優(yōu)化升級合同3篇
- 2025屆廈門高三1月質(zhì)檢期末聯(lián)考數(shù)學(xué)答案
- 音樂作品錄制許可
- 江蘇省無錫市2023-2024學(xué)年高三上學(xué)期期終教學(xué)質(zhì)量調(diào)研測試語文試題(解析版)
- 拉薩市2025屆高三第一次聯(lián)考(一模)英語試卷(含答案解析)
- 開題報告:AIGC背景下大學(xué)英語教學(xué)設(shè)計重構(gòu)研究
- 師德標(biāo)兵先進事跡材料師德標(biāo)兵個人主要事跡
- 連鎖商務(wù)酒店述職報告
- 《實踐論》(原文)毛澤東
- 第三單元名著導(dǎo)讀《紅星照耀中國》(公開課一等獎創(chuàng)新教學(xué)設(shè)計+說課稿)
評論
0/150
提交評論