柵格分類方法詳細(xì)介紹(共8頁)_第1頁
柵格分類方法詳細(xì)介紹(共8頁)_第2頁
柵格分類方法詳細(xì)介紹(共8頁)_第3頁
柵格分類方法詳細(xì)介紹(共8頁)_第4頁
柵格分類方法詳細(xì)介紹(共8頁)_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上沒有進(jìn)行過分類的地圖,很難讓人理解其表意。比如,以中共十八大的各省代表人數(shù)為例。本屆會議各省代表共計(jì)1556人,假若為每一個?。ǜ郯呐_除外)單獨(dú)設(shè)色,會是這樣的效果,這樣的地圖讓人不明其意,不知道各個省的代表人數(shù)到底幾何。常用的分類方法以ArcGIS提供的六種分類方法為例:Defined Interval、Equal Interval、Quantile、Standard Deviation、Natural Breaks(Jenks)、Geometry Interval(Geometry Interval是Esri自己開發(fā)的一種分類法,資料太少,這個就先不討論),介紹下

2、各種方法的原理、實(shí)現(xiàn)以及用途。1. Equal Interval等距分類。定義一個分類數(shù),比如0100的數(shù)據(jù),分為4類,那么間隔就是25。間隔定了,那就和定義間隔分類的原理一致了。等距分類和上面的定義間隔分類原理簡單,易于計(jì)算。比較適合用在溫度、成績和百分比等范圍、間隔都為人熟知的數(shù)據(jù)。但是這兩種分類法可能會有“空類”(定義間隔也是的),比如0100的數(shù)據(jù),大部分都在050中,剩下的幾個在90100。如果你再按10為間隔去分類,那將會有4個空類!下圖按等間隔分為4類2.Defined Interval定義間隔分類。定義一個間隔,比如0100的數(shù)據(jù),定義10為間隔,那么10,20就是斷點(diǎn),分類數(shù)

3、由間隔大小決定。用Defined Interval分類,提供的信息不多,只能看出不同的省份落在了不同的區(qū)間而已,而這個區(qū)間的大小沒有太大的實(shí)際意義。3.Quantile等量分類。又叫分位數(shù)分類,每一類的數(shù)目一樣,這樣就不會出現(xiàn)空類了。等量分類適合用于線性分布的數(shù)據(jù),比如排名數(shù)據(jù)。但它不考慮數(shù)值大小,很可能將兩個大小相近的值分到不同的類別中,也可能數(shù)據(jù)一樣的數(shù)據(jù),卻分在不同的類中。Quantile分類,每一類中的數(shù)目是相同的,也就是每一種顏色的省份個數(shù)一樣,但它忽視了省份之間人數(shù)的差異。4. Standard Deviation標(biāo)準(zhǔn)差分類。顯然適合正態(tài)分布的數(shù)據(jù),用于表現(xiàn)與均值相異的程度。但涉及

4、一點(diǎn)點(diǎn)統(tǒng)計(jì)知識,普通用戶可能不好理解。Standard Deviation分類可以看出黃色的省份人數(shù)適中(均值),而綠色就偏少了,紅色最多。另外,這種分類法的圖例與一般的不一樣,原因是顯而易見的。5.Natural Breaks(Jenks)自然斷點(diǎn)分類。一般來說,分類的原則就是差不多的放在一起,分成若干類。統(tǒng)計(jì)上可以用方差來衡量,通過計(jì)算每類的方差,再計(jì)算這些方差之和,用方差和的大小來比較分類的好壞。因而需要計(jì)算各種分類的方差和,其值最小的就是最優(yōu)的分類結(jié)果(但并不唯一)。這也是自然斷點(diǎn)分類法的原理。另外,當(dāng)你去看數(shù)據(jù)的分布時,可以比較明顯的發(fā)現(xiàn)斷裂之處(可以參看前文直方圖),這些斷裂之處和

5、Natural Breaks方法算出來也是一致的。因而這種分類法很“自然”。那Jenks又是誰?簡單介紹下:George F. Jenks (1916-1996),美國制圖學(xué)家,生于紐約。41年本科畢業(yè)后加入陸軍航空隊(duì),退伍后進(jìn)入雪城大學(xué)深造,在Richard Harrison指導(dǎo)下學(xué)習(xí)制圖。49年博士畢業(yè)后獲堪薩斯大學(xué)教職,設(shè)計(jì)并執(zhí)教制圖學(xué)課程至退休。Jenks發(fā)明的Natural Breaks分類法是最常用的數(shù)據(jù)分類法,也是ArcGIS中的默認(rèn)分類法。Natural Breaks算法又有兩種:(1)Jenks-Caspall algorithm(1971),是Jenks和Caspall發(fā)明

6、的算法。原理就如前所述,實(shí)現(xiàn)的時候要將每種分類情況都計(jì)算一遍,找到方差和最小的那一種,計(jì)算量極大。n個數(shù)分成k類,就要從n-1個數(shù)中找k-1個組合,這個數(shù)目是很驚人的。數(shù)據(jù)量較大時,如果分類又多,以當(dāng)時的計(jì)算機(jī)水平根本不能窮舉各種可能性。所以當(dāng)時計(jì)算的得到的自然斷點(diǎn)是看“運(yùn)氣”的!當(dāng)然也有一些經(jīng)驗(yàn)得來的評價(jià)指標(biāo)。(2)Fisher-Jenks algorithm(1977),F(xiàn)isher(1958)發(fā)明了一種算法提高計(jì)算效率,不需要進(jìn)行窮舉(暫時還沒看明白,文獻(xiàn)也很少。等我弄明白了,再另寫吧)。Jenks將這種方法引入到數(shù)據(jù)分類中。但后來者幾乎只知道Jenks而不知Fisher了,難道是學(xué)地理

7、的數(shù)學(xué)都太差的緣故: P。ArcGIS也是以這個算法為基礎(chǔ)改進(jìn)的,就是說還要更快!開源軟件中也有些實(shí)現(xiàn)了,后面再說。Natural Breaks分類可以很好地“物以類聚”,類別之間的差異明顯,而類內(nèi)部的差異是很小的,每一類之間都有一個明顯的斷裂之處。6.比較與總結(jié)從直觀上看這份數(shù)據(jù)用Standard Deviation和Natural Breaks分類的效果較好,它們兩個都考慮了數(shù)據(jù)分布的統(tǒng)計(jì)特征。而Equal(Defined) Interval和Quantile,僅僅是兩種相對主觀的分類法,不管是類間的距離還是類的數(shù)目,在這里都沒有明確的標(biāo)準(zhǔn)。不像溫度這樣的數(shù)據(jù),長久以來大家都有默認(rèn)的區(qū)間,比如以10度為區(qū)間。這個比較還說明了一點(diǎn),即相同的數(shù)據(jù),用不同分類方法,所表現(xiàn)的效果是截然不同的,特別是偏度很大或很小的數(shù)據(jù)。idvsolutions曾撰文討論過,可參考。另外,如果要表示時序數(shù)據(jù)的時候,分類一定要確定,不能因?yàn)椴煌瑫r刻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論