




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第八講增量空間自相關(guān)王德輝點數(shù)據(jù)的密度計算,是一個很常用的分析方式,在計算密度的時候,最令人頭痛的是如何去確定密度的距離,也就是密度收集區(qū)域的半徑。距離,又見距離!不同的情況下,分析空間數(shù)據(jù)對使用的距離是非常敏感的。對于不同的分析,使用的距離也是不同的。比如你要計算人的活動區(qū)域熱點,步行的話,一般不會超過3公里,而騎自行車,就變成了5-10公里了。所以在做類似熱點分析或者密度分析的時候,選擇一個合適的距離,非常重要的事情。那么怎么選擇一個合適的距離的?回顧空間自相關(guān)及其指數(shù)莫蘭指數(shù)這個算法其實與上一篇文章講的多距離空間聚類方法很像,就是通過不同的距離進行迭代計算,然后對計算出來的值進行比較,最
2、后給出迭代計算結(jié)果的建議。所以,如果你的數(shù)據(jù)分析,只關(guān)心空間位置,那么實際上沒必要使用這個工具,用多距離聚類分析就行了,但是如果你關(guān)注的除了空間位置以外,還需要關(guān)心數(shù)據(jù)屬性的話,就有必要采用這個工具了。另外需要說明的是,參與計算的屬性值,一般是數(shù)字類型的值。案例:一份上海市停車場的數(shù)據(jù),大約有2900多條,數(shù)據(jù)描述如下:我們現(xiàn)在要研究他們的空間分布熱點以及聚集度情況,并且以價格price字段作為他們的聚類屬性約束,從空間上和價格上進行聚類研究。最簡單的方法就是做一個核密度計算,以價格為高斯核函數(shù)的自變量帶入進行計算,如下:好吧,既然瞎猜大法已經(jīng)失效了,就啟動增量空間自相關(guān)工具算算好了,工具說明
3、如下:需要注意的是分析的區(qū)間,這個區(qū)間值如果不手動設(shè)置數(shù)據(jù)的話,系統(tǒng)會直接采用最小距離來計算,這樣如果你的數(shù)據(jù)有一些明顯的離群點的話,就會出現(xiàn)非常郁悶的結(jié)果。我們先采用完全默認(rèn)的參數(shù),計算結(jié)果如圖:如果你選擇了生成pdf,還會生成一個PDF,內(nèi)容如下:主要是把上面的內(nèi)容通過統(tǒng)計圖表的方式展現(xiàn)出來。其中我們可以看見,有一個點,被特別加亮的標(biāo)識了出來,這個就是系統(tǒng)計算出來的,認(rèn)為這個峰值反映這份數(shù)據(jù)促進空間過程聚類最明顯的距離是多少。那么下面通過計算出來的10個數(shù)據(jù),進行一下核密度計算看看效果如何:可以看見,對于全市范圍的計算,聚類效果最顯著的是搜索半徑5739的區(qū)域?,F(xiàn)在我們再來看看不對全市的數(shù)
4、據(jù)進行分析,僅僅對黃浦區(qū)的數(shù)據(jù)進行分析,計算之后,出現(xiàn)了兩個峰值:然后進行核密度計算:其中,602和699,是兩個明顯的峰值,也就是表示在這兩個值,空間統(tǒng)計值是最顯著的。所謂的聚類,指的是讓同類間差別最小,不同類之間差別最大,所以我們可以對比一下標(biāo)成紅色的的兩個圖,602和699,他們明顯處于核密度曲線值變異的關(guān)鍵拐點上面,這也是我們使用這個工具,進行點數(shù)據(jù)分析之前進行探索時候的主要作用。閑話相關(guān)性分析通過數(shù)學(xué)公式,可以計算出這個相關(guān)系數(shù),相關(guān)系數(shù)的值一般都在【-1,1】之間,情況如下:我們現(xiàn)在用最強大R語言,來對一下數(shù)據(jù)進行一下相關(guān)系數(shù)計算:關(guān)于計算相關(guān)系數(shù)的公式,大家自己百度一下就行,以免
5、有數(shù)學(xué)恐懼癥的同學(xué)抓狂這個表,一下位置(格網(wǎng)編號2317)的當(dāng)天24小時的出租車車流量與車速統(tǒng)計數(shù)據(jù),如下:上面有5個數(shù)據(jù),我們依次用這五個數(shù)據(jù),來計算一下相關(guān)性,相關(guān)性矩陣計算如下(因為是無向圖,所以就不填入了重復(fù)的數(shù)據(jù)了):從上面的五個變量計算出來的相關(guān)性,可以看見,相關(guān)性最高的是總體車流量數(shù)與運行中的車輛數(shù),而且是正相關(guān),說明了如果這個格子里面的總體車輛數(shù)非常多的話,那么在運行中的出租車數(shù)量也相應(yīng)增多。第二高的是運行中的車輛數(shù)與整個格網(wǎng)中的平均時速,但是是負(fù)相關(guān),也就說明了,如果運行中的車多,那么時速就會相應(yīng)的降低。當(dāng)要素之間的相關(guān)系數(shù)計算出來之后,還需要對求出來的數(shù)據(jù)進行一下檢驗。為什
6、么要檢驗?zāi)?,因為我們的相關(guān)系數(shù)是通過這些數(shù)據(jù)樣本值計算出來的,樣本數(shù)量的多少或者取值方式的不同,也會導(dǎo)致我們算出來的相關(guān)系數(shù)不同,一般來說,檢驗相關(guān)系數(shù),都是通過相關(guān)系數(shù)檢驗表來計算的,如下:上面這個就是相關(guān)系數(shù)檢驗表,一般大于這個表里面表示的值,我們就認(rèn)為是相關(guān)性顯著了,這個表在網(wǎng)上有下載,大家可以百度一下就搜索到了。如何讀取這個表呢,我們逐個來解釋:首先看自由度,自由度就是指你受約束的程度,我們都知道,受約束的情況,是隨著條件越多,自由就越少,這里的自由度也是一樣的,自由度數(shù)值越大,表示約束越多。自由度的計算,一般是n-m-1,n表示你的樣本數(shù)量,我們這里的樣本數(shù)量是24個,m是因子數(shù)(m元回歸),我們這里用一個值對比一個值,所以就是一元回歸,所以我們的自由度 = 24 -1-1 = 22 。上面那個0.1,0.05和0.01就是置信度,關(guān)于置信度的問題,請查看前面的“白話空間統(tǒng)計十三:零假設(shè)”,懶得查看的,看下面圖片復(fù)習(xí)一下:然后,我們用這個表里面的顯著性,來對比一下我們的相似性矩陣,如下:從以上表可以看出,只有4個條件有顯著相關(guān)性,而如果我們將置信度區(qū)間設(shè)為95%的,就剩下三個了。最后兩個條件,也
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 抵押合同借款合同
- 甘肅減震支架施工方案
- 三農(nóng)村電商推廣營銷策略手冊
- 國際公路貨運合同
- 人力資源開發(fā)合同
- 生態(tài)木墻板施工方案
- 種植屋面施工方案報價
- 銅包鋼施工方案
- 鐵路橋墩基坑回填施工方案
- 贈針高教學(xué)文學(xué)
- 牙周檢查記錄表
- GB/T 10060-2023電梯安裝驗收規(guī)范
- 《民航地面服務(wù)與管理》項目一
- 高一生物實驗室教學(xué)計劃安排表
- 地質(zhì)學(xué)第五章地殼演化簡史課件
- 初中信息技術(shù)-初識Python教學(xué)課件設(shè)計
- 第三單元名著導(dǎo)讀《駱駝祥子》課件部編版語文七年級下冊
- 電路分析基礎(chǔ)(第5版)PPT完整全套教學(xué)課件
- Unit 1 My day B Lets talk(說課稿)人教PEP版英語五年級下冊
- 2022年組織能力調(diào)研白皮書-騰訊
- 高老師講語文-燈籠-部編版
評論
0/150
提交評論