




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、沒有進行過分類的地圖,很難讓人理解其表意。比如,以中共十八大的各省代表人數(shù)為例。本屆會議各省代表共計1556人,假若為每一個省(港澳臺除外)單獨設色,會是這樣的效果,這樣的地圖讓人不明其意,不知道各個省的代表人數(shù)到底幾何。常用的分類方法以ArcGIS提供的六種分類方法為例:Defined Interval、Equal Interval、Quantile、Standard Deviation、Natural Breaks(Jenks)、Geometry Interval(Geometry Interval是Esri自己開發(fā)的一種分類法,資料太少,這個就先不討論),介紹下各種方法的原理、實現(xiàn)以及用
2、途。1. Equal Interval等距分類。定義一個分類數(shù),比如0100的數(shù)據(jù),分為4類,那么間隔就是25。間隔定了,那就和定義間隔分類的原理一致了。等距分類和上面的定義間隔分類原理簡單,易于計算。比較適合用在溫度、成績和百分比等范圍、間隔都為人熟知的數(shù)據(jù)。但是這兩種分類法可能會有“空類”(定義間隔也是的),比如0100的數(shù)據(jù),大部分都在050中,剩下的幾個在90100。如果你再按10為間隔去分類,那將會有4個空類!下圖按等間隔分為4類2.Defined Interval定義間隔分類。定義一個間隔,比如0100的數(shù)據(jù),定義10為間隔,那么10,20就是斷點,分類數(shù)由間隔大小決定。用Defi
3、ned Interval分類,提供的信息不多,只能看出不同的省份落在了不同的區(qū)間而已,而這個區(qū)間的大小沒有太大的實際意義。3.Quantile等量分類。又叫分位數(shù)分類,每一類的數(shù)目一樣,這樣就不會出現(xiàn)空類了。等量分類適合用于線性分布的數(shù)據(jù),比如排名數(shù)據(jù)。但它不考慮數(shù)值大小,很可能將兩個大小相近的值分到不同的類別中,也可能數(shù)據(jù)一樣的數(shù)據(jù),卻分在不同的類中。Quantile分類,每一類中的數(shù)目是相同的,也就是每一種顏色的省份個數(shù)一樣,但它忽視了省份之間人數(shù)的差異。4. Standard Deviation標準差分類。顯然適合正態(tài)分布的數(shù)據(jù),用于表現(xiàn)與均值相異的程度。但涉及一點點統(tǒng)計知識,普通用戶可
4、能不好理解。Standard Deviation分類可以看出黃色的省份人數(shù)適中(均值),而綠色就偏少了,紅色最多。另外,這種分類法的圖例與一般的不一樣,原因是顯而易見的。5.Natural Breaks(Jenks)自然斷點分類。一般來說,分類的原則就是差不多的放在一起,分成若干類。統(tǒng)計上可以用方差來衡量,通過計算每類的方差,再計算這些方差之和,用方差和的大小來比較分類的好壞。因而需要計算各種分類的方差和,其值最小的就是最優(yōu)的分類結(jié)果(但并不唯一)。這也是自然斷點分類法的原理。另外,當你去看數(shù)據(jù)的分布時,可以比較明顯的發(fā)現(xiàn)斷裂之處(可以參看前文直方圖),這些斷裂之處和Natural Break
5、s方法算出來也是一致的。因而這種分類法很“自然”。那Jenks又是誰?簡單介紹下:George F. Jenks (1916-1996),美國制圖學家,生于紐約。41年本科畢業(yè)后加入陸軍航空隊,退伍后進入雪城大學深造,在Richard Harrison指導下學習制圖。49年博士畢業(yè)后獲堪薩斯大學教職,設計并執(zhí)教制圖學課程至退休。Jenks發(fā)明的Natural Breaks分類法是最常用的數(shù)據(jù)分類法,也是ArcGIS中的默認分類法。Natural Breaks算法又有兩種:(1)Jenks-Caspall algorithm(1971),是Jenks和Caspall發(fā)明的算法。原理就如前所述,實
6、現(xiàn)的時候要將每種分類情況都計算一遍,找到方差和最小的那一種,計算量極大。n個數(shù)分成k類,就要從n-1個數(shù)中找k-1個組合,這個數(shù)目是很驚人的。數(shù)據(jù)量較大時,如果分類又多,以當時的計算機水平根本不能窮舉各種可能性。所以當時計算的得到的自然斷點是看“運氣”的!當然也有一些經(jīng)驗得來的評價指標。(2)Fisher-Jenks algorithm(1977),F(xiàn)isher(1958)發(fā)明了一種算法提高計算效率,不需要進行窮舉(暫時還沒看明白,文獻也很少。等我弄明白了,再另寫吧)。Jenks將這種方法引入到數(shù)據(jù)分類中。但后來者幾乎只知道Jenks而不知Fisher了,難道是學地理的數(shù)學都太差的緣故: P。
7、ArcGIS也是以這個算法為基礎改進的,就是說還要更快!開源軟件中也有些實現(xiàn)了,后面再說。Natural Breaks分類可以很好地“物以類聚”,類別之間的差異明顯,而類內(nèi)部的差異是很小的,每一類之間都有一個明顯的斷裂之處。6.比較與總結(jié)從直觀上看這份數(shù)據(jù)用Standard Deviation和Natural Breaks分類的效果較好,它們兩個都考慮了數(shù)據(jù)分布的統(tǒng)計特征。而Equal(Defined) Interval和Quantile,僅僅是兩種相對主觀的分類法,不管是類間的距離還是類的數(shù)目,在這里都沒有明確的標準。不像溫度這樣的數(shù)據(jù),長久以來大家都有默認的區(qū)間,比如以10度為區(qū)間。這個比較還說明了一點,即相同的數(shù)據(jù),用不同分類方法,所表現(xiàn)的效果是截然不同的,特別是偏度很大或很小的數(shù)據(jù)。idvsolutions曾撰文討論過,可參考。另外,如果要表示時序數(shù)據(jù)的時候,分類一定要確定,不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Z=82附近原子核形狀共存研究
- 面向數(shù)據(jù)與設備異構(gòu)的聯(lián)邦學習優(yōu)化方法研究與應用
- 精神疾病健康指導
- 精油開背培訓
- 超聲科科室簡介
- 關注心理健康 創(chuàng)造和諧班級
- 預防食源性疾病課件
- 順豐快遞教學課件
- 幼兒園教師教育教學能力提升培訓
- 音樂說課教育課件
- 北京市海淀區(qū)2025屆高一下生物期末檢測模擬試題含解析
- JT∕T 795-2023 事故汽車修復技術(shù)規(guī)范
- 2024四川廣元市檢察機關招聘聘用制書記員22人筆試備考題庫及答案解析
- 內(nèi)科患者VTE風險評估表
- 一年級上冊美術(shù)教案-第1課 讓大家認識我:誠實最好 ▏人美版
- 科學認識天氣智慧樹知到期末考試答案2024年
- (高清版)DZT 0064.15-2021 地下水質(zhì)分析方法 第15部分:總硬度的測定 乙二胺四乙酸二鈉滴定法
- 心理體檢收費目錄
- 雅魯藏布江米林-加查段沿線暴雨泥石流危險度評價的中期報告
- 抗生素的正確使用與合理配比
- 讀書分享讀書交流會《局外人》課件
評論
0/150
提交評論