空間數(shù)據(jù)的統(tǒng)計(jì)分析1本學(xué)習(xí)教案_第1頁(yè)
空間數(shù)據(jù)的統(tǒng)計(jì)分析1本學(xué)習(xí)教案_第2頁(yè)
空間數(shù)據(jù)的統(tǒng)計(jì)分析1本學(xué)習(xí)教案_第3頁(yè)
空間數(shù)據(jù)的統(tǒng)計(jì)分析1本學(xué)習(xí)教案_第4頁(yè)
空間數(shù)據(jù)的統(tǒng)計(jì)分析1本學(xué)習(xí)教案_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1空間數(shù)據(jù)的統(tǒng)計(jì)分析空間數(shù)據(jù)的統(tǒng)計(jì)分析1本本第一頁(yè),共88頁(yè)。2主要內(nèi)容主要內(nèi)容(nirng):GIS屬性數(shù)據(jù)屬性數(shù)據(jù)一般統(tǒng)計(jì)分析一般統(tǒng)計(jì)分析探索性數(shù)據(jù)分析探索性數(shù)據(jù)分析探索性空間數(shù)據(jù)分析方法探索性空間數(shù)據(jù)分析方法空間點(diǎn)模式分析方法空間點(diǎn)模式分析方法格網(wǎng)或面狀數(shù)據(jù)空間統(tǒng)計(jì)分析格網(wǎng)或面狀數(shù)據(jù)空間統(tǒng)計(jì)分析方法方法地統(tǒng)計(jì)分析概述地統(tǒng)計(jì)分析概述空間變異函數(shù)空間變異函數(shù)克里金估計(jì)方法克里金估計(jì)方法地統(tǒng)計(jì)分析研究展望地統(tǒng)計(jì)分析研究展望空間統(tǒng)計(jì)分析軟件空間統(tǒng)計(jì)分析軟件第1頁(yè)/共88頁(yè)第二頁(yè),共88頁(yè)。3GIS屬性數(shù)據(jù)屬性數(shù)據(jù)第2頁(yè)/共88頁(yè)第三頁(yè),共88頁(yè)。4nGIS屬性數(shù)據(jù)屬性數(shù)據(jù)n屬性數(shù)據(jù)是屬性數(shù)

2、據(jù)是GIS的重要特征。的重要特征。n屬性數(shù)據(jù)包含了兩方面的含義:屬性數(shù)據(jù)包含了兩方面的含義:n它是什么,即它有什么樣的特性它是什么,即它有什么樣的特性(txng),劃分為,劃分為地物的哪一類(lèi);(類(lèi)別屬性)地物的哪一類(lèi);(類(lèi)別屬性)n實(shí)體的詳細(xì)描述信息,例如一棟房子的建造年限實(shí)體的詳細(xì)描述信息,例如一棟房子的建造年限、房主、住戶(hù)等。、房主、住戶(hù)等。 (描述屬性)(描述屬性)第3頁(yè)/共88頁(yè)第四頁(yè),共88頁(yè)。5一般一般(ybn)統(tǒng)計(jì)分析統(tǒng)計(jì)分析第4頁(yè)/共88頁(yè)第五頁(yè),共88頁(yè)。6n一般統(tǒng)計(jì)分析一般統(tǒng)計(jì)分析n指對(duì)指對(duì)GIS地理空間數(shù)據(jù)庫(kù)中的屬性數(shù)據(jù)進(jìn)行常規(guī)統(tǒng)地理空間數(shù)據(jù)庫(kù)中的屬性數(shù)據(jù)進(jìn)行常規(guī)統(tǒng)計(jì)分析

3、。計(jì)分析。n先對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,先對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,n再選擇進(jìn)一步分析的方法。再選擇進(jìn)一步分析的方法。n描述性統(tǒng)計(jì)分析:對(duì)調(diào)查總體所有變量的有關(guān)描述性統(tǒng)計(jì)分析:對(duì)調(diào)查總體所有變量的有關(guān)(yugun)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述,主要包括數(shù)據(jù)的頻數(shù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述,主要包括數(shù)據(jù)的頻數(shù)分析、數(shù)據(jù)的集中趨勢(shì)分析、數(shù)據(jù)的離散程度分析、分析、數(shù)據(jù)的集中趨勢(shì)分析、數(shù)據(jù)的離散程度分析、數(shù)據(jù)的分布、以及一些基本的統(tǒng)計(jì)圖形。數(shù)據(jù)的分布、以及一些基本的統(tǒng)計(jì)圖形。第5頁(yè)/共88頁(yè)第六頁(yè),共88頁(yè)。7對(duì)于空間數(shù)據(jù)來(lái)說(shuō),描述性分析是空間數(shù)據(jù)分析的第一步,通過(guò)(tnggu)描述性分析,提取有價(jià)值的空間信息,便于后

4、續(xù)的空間分析和處理。第6頁(yè)/共88頁(yè)第七頁(yè),共88頁(yè)。8n數(shù)據(jù)的頻數(shù)分析數(shù)據(jù)的頻數(shù)分析n頻數(shù):頻數(shù): 將變量將變量xi(i=1,2,n)按大小順序排列按大小順序排列,并按一定的間距分組。變量在各組出現(xiàn)或發(fā),并按一定的間距分組。變量在各組出現(xiàn)或發(fā)生的次數(shù)生的次數(shù)(csh)稱(chēng)為頻數(shù)。稱(chēng)為頻數(shù)。n頻率:各組頻數(shù)與總頻數(shù)之比叫做頻率。頻率:各組頻數(shù)與總頻數(shù)之比叫做頻率。n頻率分布圖:計(jì)算出各組的頻率后,就可以頻率分布圖:計(jì)算出各組的頻率后,就可以做出頻率分布圖。做出頻率分布圖。n頻率直方圖:若以縱軸表示頻率,橫軸表示頻率直方圖:若以縱軸表示頻率,橫軸表示分組,就可做出頻率直方圖,用以表示事件發(fā)分組,就

5、可做出頻率直方圖,用以表示事件發(fā)生的概率和分布狀況。生的概率和分布狀況。第7頁(yè)/共88頁(yè)第八頁(yè),共88頁(yè)。9n數(shù)據(jù)的集中趨勢(shì)分析數(shù)據(jù)的集中趨勢(shì)分析n數(shù)據(jù)的集中趨勢(shì)分析是用來(lái)反映數(shù)據(jù)的一般數(shù)據(jù)的集中趨勢(shì)分析是用來(lái)反映數(shù)據(jù)的一般水平,常用水平,常用(chn yn)的指標(biāo)有平均值、中位的指標(biāo)有平均值、中位數(shù)和眾數(shù)等。數(shù)和眾數(shù)等。n平均值:平均值:n是衡量數(shù)據(jù)的中心位置的重要指標(biāo),反映了是衡量數(shù)據(jù)的中心位置的重要指標(biāo),反映了一些數(shù)據(jù)必然性的特點(diǎn),包括算術(shù)平均值、加一些數(shù)據(jù)必然性的特點(diǎn),包括算術(shù)平均值、加權(quán)算術(shù)平均值、調(diào)和平均值和幾何平均值。權(quán)算術(shù)平均值、調(diào)和平均值和幾何平均值。第8頁(yè)/共88頁(yè)第九頁(yè),

6、共88頁(yè)。10n數(shù)據(jù)的集中趨勢(shì)分析數(shù)據(jù)的集中趨勢(shì)分析n算術(shù)平均值:將所有算術(shù)平均值:將所有(suyu)數(shù)據(jù)相加,再除以數(shù)數(shù)據(jù)相加,再除以數(shù)據(jù)的總數(shù)目。據(jù)的總數(shù)目。niixnX11加權(quán)算術(shù)(sunsh)平均值:考慮數(shù)據(jù)對(duì)數(shù)據(jù)總體的影響的權(quán)重值的不同,將每個(gè)數(shù)據(jù)乘以其權(quán)值后再相加,所得的和除以數(shù)據(jù)的總體權(quán)重?cái)?shù)。 ninpiiipPxPX11/Pi為數(shù)據(jù)(shj)xi的權(quán)值 第9頁(yè)/共88頁(yè)第十頁(yè),共88頁(yè)。11調(diào)和平均值:各個(gè)(gg)數(shù)據(jù)的倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又稱(chēng)為倒數(shù)平均值。調(diào)和平均值也分為簡(jiǎn)單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)l簡(jiǎn)單(jindn)調(diào)和平均數(shù): )1/(11nxXniitl加權(quán)調(diào)和(

7、tio h)平均數(shù): )/(111npiniiitpPxPX第10頁(yè)/共88頁(yè)第十一頁(yè),共88頁(yè)。12l幾何(j h)平均數(shù):是n個(gè)數(shù)據(jù)連乘的積開(kāi)n次方根。 nniigxX1第11頁(yè)/共88頁(yè)第十二頁(yè),共88頁(yè)。13中位數(shù):一種反映數(shù)據(jù)的中心位置的指標(biāo),其確定方法是將所有數(shù)據(jù)以由小到大的順序排列,位于中央的數(shù)據(jù)值就是中位數(shù)。眾數(shù):在數(shù)據(jù)中發(fā)生頻率最高的數(shù)據(jù)值。 如果各個(gè)數(shù)據(jù)之間的差異程度較小,用平均值就有較好的代表性;如果數(shù)據(jù)之間的差異程度較大(jio d),特別是有個(gè)別極端值的情況,用中位數(shù)或眾數(shù)有較好的代表性。 第12頁(yè)/共88頁(yè)第十三頁(yè),共88頁(yè)。14n數(shù)據(jù)的離散程度分析n數(shù)據(jù)的離散程度

8、分析主要是用來(lái)反映數(shù)據(jù)之間的差異程度,n常用的指標(biāo)(zhbio)有:方差和標(biāo)準(zhǔn)差。n方差是標(biāo)準(zhǔn)差的平方,根據(jù)不同的數(shù)據(jù)類(lèi)型有不同的計(jì)算方法。 n反映數(shù)據(jù)的離散程度的指標(biāo)(zhbio)還包括:n極差、離差、平均離差、離差平方和、變差系數(shù)等。 第13頁(yè)/共88頁(yè)第十四頁(yè),共88頁(yè)。15方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差方差是均方差的簡(jiǎn)稱(chēng)方差是均方差的簡(jiǎn)稱(chēng)(jinchng),是以離差平方和除以變量,是以離差平方和除以變量個(gè)數(shù)求得的。個(gè)數(shù)求得的。 nxxnii/)(122) 1/()(122nxxnii第14頁(yè)/共88頁(yè)第十五頁(yè),共88頁(yè)。16方差方差(fn ch)和標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是方差標(biāo)準(zhǔn)差是方差(fn

9、 ch)的平方根。的平方根。niinxx12/)(niinxx12) 1/()(第15頁(yè)/共88頁(yè)第十六頁(yè),共88頁(yè)。17極差極差極差是一組數(shù)據(jù)極差是一組數(shù)據(jù)(shj)中最大值與最小值之差,即:中最大值與最小值之差,即:R=maxx1, x2, , xn - minx1, x2, , xn第16頁(yè)/共88頁(yè)第十七頁(yè),共88頁(yè)。18離差、平均離差與離差平方和離差、平均離差與離差平方和離差:一組數(shù)據(jù)集中的各數(shù)據(jù)值與其平均數(shù)之差離差:一組數(shù)據(jù)集中的各數(shù)據(jù)值與其平均數(shù)之差稱(chēng)為離差。稱(chēng)為離差。一個(gè)一個(gè)(y )數(shù)據(jù)集的離差和恒等于數(shù)據(jù)集的離差和恒等于0。平均離差:將離差取絕對(duì)值,然后求和,再取平平均離差:

10、將離差取絕對(duì)值,然后求和,再取平均數(shù),就得到平均離差。均數(shù),就得到平均離差。 xxdi0)(xxniixxnd1|1l離差平方和:對(duì)離差求平方和就得到(d do)離差平方和。niixxd122)(第17頁(yè)/共88頁(yè)第十八頁(yè),共88頁(yè)。19數(shù)據(jù)的分布數(shù)據(jù)的分布在統(tǒng)計(jì)分析中,通常要假設(shè)樣本的分布屬于正態(tài)在統(tǒng)計(jì)分析中,通常要假設(shè)樣本的分布屬于正態(tài)分布,因此需要用偏度和峰度兩個(gè)指標(biāo)來(lái)檢查樣本分布,因此需要用偏度和峰度兩個(gè)指標(biāo)來(lái)檢查樣本是否符合正態(tài)分布。是否符合正態(tài)分布。偏度:衡量的是樣本分布的偏斜方向和程度;偏度:衡量的是樣本分布的偏斜方向和程度;峰度:衡量的是樣本分布曲線的尖峰程度。峰度:衡量的是樣

11、本分布曲線的尖峰程度。一般情況下,如果一般情況下,如果(rgu)樣本的偏度接近于樣本的偏度接近于0,而峰度接近于而峰度接近于3,就可以判斷總體的分布接近于正,就可以判斷總體的分布接近于正態(tài)分布。態(tài)分布。 第18頁(yè)/共88頁(yè)第十九頁(yè),共88頁(yè)。20統(tǒng)計(jì)圖表分析統(tǒng)計(jì)圖表分析用圖形的形式表達(dá)數(shù)據(jù)用圖形的形式表達(dá)數(shù)據(jù)(shj),比用文字表達(dá)更,比用文字表達(dá)更清晰、更簡(jiǎn)明。清晰、更簡(jiǎn)明。對(duì)于屬性數(shù)據(jù)對(duì)于屬性數(shù)據(jù)(shj),統(tǒng)計(jì)圖的主要類(lèi)型有柱狀,統(tǒng)計(jì)圖的主要類(lèi)型有柱狀圖、扇形圖、直方圖、折線圖和散點(diǎn)圖等。圖、扇形圖、直方圖、折線圖和散點(diǎn)圖等。 第19頁(yè)/共88頁(yè)第二十頁(yè),共88頁(yè)。21柱狀圖:用水平或垂

12、直長(zhǎng)方形表示不同種類(lèi)間某一屬性的差異,每個(gè)長(zhǎng)方形表示一個(gè)種類(lèi),其長(zhǎng)度表示這個(gè)種類(lèi)的屬性數(shù)值。扇形圖:將圓劃分為若干個(gè)扇形,表示各種成分在總體(zngt)中的比重,各種成分的比重可以用扇形的面積或者弧長(zhǎng)來(lái)表示,當(dāng)有很多種成分或成分比重差異懸殊時(shí)表示效果不好。第20頁(yè)/共88頁(yè)第二十一頁(yè),共88頁(yè)。22散點(diǎn)圖:以?xún)蓚€(gè)(lin )屬性作為坐標(biāo)系的軸,將與這兩種屬性相關(guān)的現(xiàn)象標(biāo)在圖上,表示出兩種屬性間的相互關(guān)系,在此基礎(chǔ)上可以分析這兩種屬性是否相關(guān)和相關(guān)關(guān)系的種類(lèi)。折線圖:反映某一屬性隨時(shí)間變化的過(guò)程,它以時(shí)間為圖形的一個(gè)坐標(biāo)軸,以屬性為另一坐標(biāo)軸,將各個(gè)時(shí)間的屬性值標(biāo)到圖上,并將這些點(diǎn)按時(shí)間順序連接

13、起來(lái),反映實(shí)體發(fā)展的動(dòng)態(tài)過(guò)程和趨勢(shì)。第21頁(yè)/共88頁(yè)第二十二頁(yè),共88頁(yè)。23直方圖:表示單一屬性在各個(gè)種類(lèi)中的分布情況,可以確定屬性在不同區(qū)間的分布,如某種現(xiàn)象的分布是否是正態(tài)分布。統(tǒng)計(jì)表格:是詳盡表示非空間數(shù)據(jù)的方法,它不直觀,但可提供詳細(xì)數(shù)據(jù),可對(duì)數(shù)據(jù)再處理。統(tǒng)計(jì)表格分為表頭和表體兩部分,除直接數(shù)據(jù)外有時(shí)還有匯總、比重(bzhng)等派生項(xiàng)。 第22頁(yè)/共88頁(yè)第二十三頁(yè),共88頁(yè)。24探索性空間探索性空間(kngjin)數(shù)據(jù)分析數(shù)據(jù)分析第23頁(yè)/共88頁(yè)第二十四頁(yè),共88頁(yè)。25Hoaglin D C, Mosteller F, Tukey J W美著. 陳忠璉, 郭德媛譯. 199

14、8. 探索性數(shù)據(jù)分析. 北京: 中國(guó)(zhn u)統(tǒng)計(jì)出版社n探索性數(shù)據(jù)分析:第24頁(yè)/共88頁(yè)第二十五頁(yè),共88頁(yè)。26n探索性數(shù)據(jù)分析:n統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的主要(zhyo)工具,大量的統(tǒng)計(jì)分析方法以數(shù)據(jù)總體滿足正態(tài)假設(shè)為依據(jù),并在此基礎(chǔ)上建立模型和推演。n然而實(shí)踐中大量的數(shù)據(jù)不能滿足正態(tài)假設(shè),并且基于均值、方差等的模型在實(shí)際數(shù)據(jù)分析中缺乏穩(wěn)健性,于是導(dǎo)致很多統(tǒng)計(jì)分析方法不能滿足海量數(shù)據(jù)分析的要求。n19世紀(jì)60年代的Tukey面向數(shù)據(jù)分析的主題,提出了探索性數(shù)據(jù)分析(exploratory data analysis, EDA)的新思路。第25頁(yè)/共88頁(yè)第二十六頁(yè),共88頁(yè)。27n探索性

15、數(shù)據(jù)分析(fnx):n探索性數(shù)據(jù)分析(fnx)(EDA)的特點(diǎn):對(duì)數(shù)據(jù)來(lái)源的總體不作假設(shè),并且假設(shè)檢驗(yàn)也經(jīng)常被排除在外。n這一技術(shù)使用統(tǒng)計(jì)圖表、圖形和統(tǒng)計(jì)概括方法對(duì)數(shù)據(jù)的特征進(jìn)行分析(fnx)和描述。nEDA技術(shù)的核心:“讓數(shù)據(jù)說(shuō)話”,在探索的基礎(chǔ)上再對(duì)數(shù)據(jù)進(jìn)行更為復(fù)雜的建模分析(fnx)。第26頁(yè)/共88頁(yè)第二十七頁(yè),共88頁(yè)。28n探索性數(shù)據(jù)分析的基本方法探索性數(shù)據(jù)分析的基本方法nEDA是不對(duì)數(shù)據(jù)總體做任何假設(shè)是不對(duì)數(shù)據(jù)總體做任何假設(shè)(或很少假設(shè)或很少假設(shè))的條件下識(shí)別數(shù)據(jù)特征的條件下識(shí)別數(shù)據(jù)特征(tzhng)和關(guān)系的分析技和關(guān)系的分析技術(shù)。術(shù)。n主要有兩類(lèi)方法:主要有兩類(lèi)方法:n計(jì)算計(jì)算

16、EDA方法:包括從簡(jiǎn)單的統(tǒng)計(jì)計(jì)算到高級(jí)方法:包括從簡(jiǎn)單的統(tǒng)計(jì)計(jì)算到高級(jí)的用于探索分析多變量數(shù)據(jù)集中模式的多元統(tǒng)計(jì)的用于探索分析多變量數(shù)據(jù)集中模式的多元統(tǒng)計(jì)分析方法分析方法n圖形圖形EDA方法:即可視化的探索數(shù)據(jù)分析。常方法:即可視化的探索數(shù)據(jù)分析。常用的圖形方法有直方圖用的圖形方法有直方圖(histogram)、莖葉圖、莖葉圖(stem leaf)、箱線圖、箱線圖(box plot)、散點(diǎn)圖、散點(diǎn)圖(scatter plot)、平行坐標(biāo)圖、平行坐標(biāo)圖(parallel coordinate plot)等。等。第27頁(yè)/共88頁(yè)第二十八頁(yè),共88頁(yè)。29(1)直方圖與莖葉圖)直方圖與莖葉圖直方圖

17、和莖葉圖用于表述數(shù)據(jù)的分布信息,可根據(jù)數(shù)直方圖和莖葉圖用于表述數(shù)據(jù)的分布信息,可根據(jù)數(shù)據(jù)的分布進(jìn)一步作出相關(guān)的假設(shè)。據(jù)的分布進(jìn)一步作出相關(guān)的假設(shè)。直方圖:直方圖:是一種二維統(tǒng)計(jì)圖表,它的兩個(gè)坐標(biāo)分別是統(tǒng)計(jì)樣本是一種二維統(tǒng)計(jì)圖表,它的兩個(gè)坐標(biāo)分別是統(tǒng)計(jì)樣本和該樣本對(duì)應(yīng)的某個(gè)屬性的度量。和該樣本對(duì)應(yīng)的某個(gè)屬性的度量。在圖像處理在圖像處理(t xin ch l)領(lǐng)域的常用概念是灰度直領(lǐng)域的常用概念是灰度直方圖,描述的是圖像中具有該灰度級(jí)的像素的個(gè)數(shù):方圖,描述的是圖像中具有該灰度級(jí)的像素的個(gè)數(shù):橫坐標(biāo)是灰度級(jí),縱坐標(biāo)是該灰度出現(xiàn)的頻率橫坐標(biāo)是灰度級(jí),縱坐標(biāo)是該灰度出現(xiàn)的頻率(像素個(gè)像素個(gè)數(shù)數(shù))。 第

18、28頁(yè)/共88頁(yè)第二十九頁(yè),共88頁(yè)。30莖葉圖:又稱(chēng)“枝葉圖”,將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣可以清楚(qng chu)地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。莖葉圖是一個(gè)與直方圖類(lèi)似的工具,莖葉圖保留了原始資料的信息,直方圖則失去原始數(shù)據(jù)的訊息。莖 | 葉 頻數(shù)(pn sh)0 | 1569 41 | 0569 42 | 24 23 | 1 14 | 016 35 | 257 36 | 0159 47 | 0159 48 | 59 29 | 124 341, 52, 6, 19, 9

19、2, 10, 40, 55, 60, 75, 22, 15, 31, 61, 9, 70, 91, 65, 69, 16, 94, 85, 89, 79, 57, 46, 1, 24, 71, 5 第29頁(yè)/共88頁(yè)第三十頁(yè),共88頁(yè)。31莖葉圖的特征:用莖葉圖表示數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):(1)從統(tǒng)計(jì)圖上沒(méi)有原始數(shù)據(jù)信息的損失,所有(suyu)數(shù)據(jù)信息都可以從莖葉圖中得到;(2)莖葉圖中的數(shù)據(jù)可以隨時(shí)記錄、隨時(shí)添加,方便記錄與表示。莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù)。 莖 | 葉 頻數(shù)(pn sh)0 | 1569 41 | 0569 42 | 24 23 | 1 14 | 016 35 | 257

20、36 | 0159 47 | 0159 48 | 59 29 | 124 341, 52, 6, 19, 92, 10, 40, 55, 60, 75, 22, 15, 31, 61, 9, 70, 91, 65, 69, 16, 94, 85, 89, 79, 57, 46, 1, 24, 71, 5 第30頁(yè)/共88頁(yè)第三十一頁(yè),共88頁(yè)。32(2)箱線圖)箱線圖(盒須圖盒須圖)箱線圖箱線圖(Box plot),亦稱(chēng)箱須圖,亦稱(chēng)箱須圖(Box-whisker plot),或骨,或骨架圖架圖(Schematic Plot)。箱線圖能夠直觀明了地識(shí)別數(shù)據(jù)集中的異常值,利用數(shù)箱線圖能夠直觀明了地

21、識(shí)別數(shù)據(jù)集中的異常值,利用數(shù)據(jù)中的五個(gè)統(tǒng)計(jì)量:最小值、第一四分位數(shù)據(jù)中的五個(gè)統(tǒng)計(jì)量:最小值、第一四分位數(shù)Q1、中位數(shù)、中位數(shù)F、第三、第三(d sn)四分位數(shù)四分位數(shù)Q3、最大值來(lái)描述數(shù)據(jù)。、最大值來(lái)描述數(shù)據(jù)。第一四分位數(shù)Q1:又稱(chēng)“下四分位數(shù)”,等于該樣本(yngbn)中所有數(shù)值由小到大排列后第25%的數(shù)字。 中位數(shù)F:又稱(chēng)第二四分位數(shù)(Q2),又稱(chēng)“中位數(shù)”,等于該樣本(yngbn)中所有數(shù)值由小到大排列后第50%的數(shù)字。 第三四分位數(shù):又稱(chēng)“上四分位數(shù)”,等于該樣本(yngbn)中所有數(shù)值由小到大排列后第75%的數(shù)字。 第31頁(yè)/共88頁(yè)第三十二頁(yè),共88頁(yè)。33(2)箱線圖)箱線圖(盒

22、須圖盒須圖)箱線圖的繪制依靠實(shí)際數(shù)據(jù),不需要事先假定數(shù)據(jù)服從特箱線圖的繪制依靠實(shí)際數(shù)據(jù),不需要事先假定數(shù)據(jù)服從特定的分布定的分布(fnb)形式,沒(méi)有對(duì)數(shù)據(jù)作任何限制性要求,它形式,沒(méi)有對(duì)數(shù)據(jù)作任何限制性要求,它只是真實(shí)直觀地表現(xiàn)數(shù)據(jù)形狀的本來(lái)面貌;只是真實(shí)直觀地表現(xiàn)數(shù)據(jù)形狀的本來(lái)面貌;箱線圖判斷異常值的標(biāo)準(zhǔn)以四分位數(shù)和四分位距為基礎(chǔ)。箱線圖判斷異常值的標(biāo)準(zhǔn)以四分位數(shù)和四分位距為基礎(chǔ)。四分位距四分位距(QR, Quartile range):上四分位數(shù)與下四分位數(shù):上四分位數(shù)與下四分位數(shù)之間的間距,即上四分位數(shù)減去下四分位數(shù)(之間的間距,即上四分位數(shù)減去下四分位數(shù)(Q3-Q1)。)。箱線圖識(shí)別異

23、常(ychng)值的結(jié)果比較客觀,在識(shí)別異常(ychng)值方面有一定的優(yōu)越性。第32頁(yè)/共88頁(yè)第三十三頁(yè),共88頁(yè)。34箱線圖的制作過(guò)程:畫(huà)一個(gè)矩形盒,兩端邊的位置分別對(duì)應(yīng)數(shù)據(jù)集的上下四分位數(shù)。在矩形盒內(nèi)部的中位數(shù)位置畫(huà)一條(y tio)線段為中位線。 在Q3+1.5QR(四分位距)和Q1-1.5QR處畫(huà)兩條與中位線一樣的線段,這兩條線段為異常值截?cái)帱c(diǎn),稱(chēng)其為內(nèi)限;在Q3+3QR和Q1-3QR處畫(huà)兩條線段,稱(chēng)其為外限。內(nèi)限以外位置的點(diǎn)表示的數(shù)據(jù)都是異常值(x Q3+1.5QR)在內(nèi)限與外限之間的異常值為溫和(wnh)異常值(Q1-3QR x Q1-1.5QR; Q3+1.5QR x Q3+

24、3QR)在外限以外的為極端異常值。一般的統(tǒng)計(jì)軟件中表示外限的線并不畫(huà)出,這里用虛線表示第33頁(yè)/共88頁(yè)第三十四頁(yè),共88頁(yè)。35(3)散點(diǎn)圖與散點(diǎn)圖矩陣)散點(diǎn)圖與散點(diǎn)圖矩陣散點(diǎn)圖用于初步圖示兩個(gè)數(shù)據(jù)之間的關(guān)系散點(diǎn)圖用于初步圖示兩個(gè)數(shù)據(jù)之間的關(guān)系(gun x),是分析兩個(gè)要素或變量之間關(guān)系是分析兩個(gè)要素或變量之間關(guān)系(gun x)時(shí)常用的方時(shí)常用的方法和技術(shù)。法和技術(shù)。散點(diǎn)圖的作法:將兩個(gè)變量的坐標(biāo)點(diǎn)對(duì)畫(huà)在(散點(diǎn)圖的作法:將兩個(gè)變量的坐標(biāo)點(diǎn)對(duì)畫(huà)在(x, y)坐)坐標(biāo)平面上。在分析變量之間的關(guān)系標(biāo)平面上。在分析變量之間的關(guān)系(gun x)、判斷異、判斷異常點(diǎn)以及數(shù)據(jù)的分類(lèi)等方面,散點(diǎn)圖都有重要的

25、作用常點(diǎn)以及數(shù)據(jù)的分類(lèi)等方面,散點(diǎn)圖都有重要的作用。第34頁(yè)/共88頁(yè)第三十五頁(yè),共88頁(yè)。361)散點(diǎn)圖與變量)散點(diǎn)圖與變量(binling)之間關(guān)系的之間關(guān)系的可視化可視化4組數(shù)據(jù):統(tǒng)計(jì)分析的結(jié)果(ji gu)是相同的(忽略殘差)第35頁(yè)/共88頁(yè)第三十六頁(yè),共88頁(yè)。37散點(diǎn)圖展示(zhnsh)了變量之間的差異性信息第36頁(yè)/共88頁(yè)第三十七頁(yè),共88頁(yè)。382)散點(diǎn)圖與異常)散點(diǎn)圖與異常(ychng)點(diǎn)分析點(diǎn)分析異常(ychng)數(shù)據(jù)或者有著特別的價(jià)值,或者會(huì)引起錯(cuò)誤的結(jié)果或判斷。異常(ychng)數(shù)據(jù)一般是非典型的,較少見(jiàn)的觀測(cè)數(shù)據(jù)。在回歸線的確定中,異常(ychng)數(shù)據(jù)的出現(xiàn)將對(duì)

26、回歸方程的斜率和數(shù)據(jù)的相關(guān)關(guān)系產(chǎn)生深遠(yuǎn)的影響,由于異常(ychng)點(diǎn)參與了計(jì)算,可能導(dǎo)致虛假的關(guān)系。第37頁(yè)/共88頁(yè)第三十八頁(yè),共88頁(yè)。39在異常點(diǎn)消除之前,兩個(gè)變量的的相關(guān)系數(shù)r=0.88,表明存在很強(qiáng)的正相關(guān);消除了異常數(shù)據(jù)后,r=0.08,出于隨機(jī)(su j)水平。在回歸模型建立之前通過(guò)散點(diǎn)圖技術(shù)進(jìn)行數(shù)據(jù)的探索性分析,有利于消除異常數(shù)據(jù),尋找更為合理的關(guān)系或模式。第38頁(yè)/共88頁(yè)第三十九頁(yè),共88頁(yè)。40如果樣本的規(guī)模相對(duì)較小,是否包含“異常數(shù)據(jù)”不是非常清晰,需要仔細(xì)判斷。是否剔除數(shù)據(jù)可能(knng)會(huì)對(duì)變量之間的關(guān)系產(chǎn)生很大的影響。第39頁(yè)/共88頁(yè)第四十頁(yè),共88頁(yè)。413

27、)散點(diǎn)圖與不同類(lèi)別)散點(diǎn)圖與不同類(lèi)別(libi)的數(shù)的數(shù)據(jù)據(jù)散點(diǎn)圖中的兩個(gè)變量是房屋價(jià)格和人口密度的關(guān)系(gun x)(a)反應(yīng)了房屋的價(jià)格和人口密度之間存在正的空間相關(guān)關(guān)系(gun x)。(b)這些數(shù)據(jù)來(lái)自?xún)蓚€(gè)不同的地區(qū),按照區(qū)位做出散點(diǎn)圖后,就可輕易地發(fā)現(xiàn):任何一個(gè)區(qū)位的人口密度和價(jià)格之間都變現(xiàn)出負(fù)的相關(guān)關(guān)系(gun x)。有些異常(ychng)數(shù)據(jù)可能來(lái)自于另外的類(lèi)型。第40頁(yè)/共88頁(yè)第四十一頁(yè),共88頁(yè)。424)散點(diǎn)圖矩陣)散點(diǎn)圖矩陣(j zhn)散點(diǎn)圖矩陣通過(guò)建立(jinl)任意兩個(gè)變量之間的關(guān)系的圖形表示來(lái)初步獲得相關(guān)信息和異常信息,相當(dāng)于在由m個(gè)變量構(gòu)成的矩陣中,用相應(yīng)的兩個(gè)變

28、量之間的散點(diǎn)圖替代矩陣中的元素構(gòu)成的圖形。5個(gè)變量(binling)間的散點(diǎn)圖矩陣在對(duì)角線上是變量自身的關(guān)系,在這些位置上一般由測(cè)量這個(gè)變量分布特征的圖形(直方圖、箱線圖等)構(gòu)成第41頁(yè)/共88頁(yè)第四十二頁(yè),共88頁(yè)。43平行坐標(biāo)圖平行坐標(biāo)圖平行坐標(biāo)圖將高維數(shù)據(jù)在二維空間上表示,為可視平行坐標(biāo)圖將高維數(shù)據(jù)在二維空間上表示,為可視化地探索分析高維數(shù)據(jù)空間中的關(guān)系建立可行的途徑化地探索分析高維數(shù)據(jù)空間中的關(guān)系建立可行的途徑。平行坐標(biāo)圖提供的是一種在平行坐標(biāo)圖提供的是一種在2維平面上表示高維空維平面上表示高維空間中變量之間關(guān)系的技術(shù)。間中變量之間關(guān)系的技術(shù)。傳統(tǒng)的坐標(biāo)系中所有傳統(tǒng)的坐標(biāo)系中所有(su

29、yu)的變量軸都是交叉的的變量軸都是交叉的,而平行坐標(biāo)系中所有,而平行坐標(biāo)系中所有(suyu)的變量軸都是平行的的變量軸都是平行的。6維空間的兩個(gè)(lin )點(diǎn)A(-5, 3, 4, -2, 0, 3)、B(4, -1, 3, 3, 0, -1)的平行坐標(biāo)圖第42頁(yè)/共88頁(yè)第四十三頁(yè),共88頁(yè)。44平行坐標(biāo)圖表示(biosh)高維空間數(shù)據(jù)的實(shí)例第43頁(yè)/共88頁(yè)第四十四頁(yè),共88頁(yè)。45平行坐標(biāo)圖的優(yōu)點(diǎn):可以在平行坐標(biāo)圖的優(yōu)點(diǎn):可以在2維空間上考察分析維空間上考察分析m維維變量的相關(guān)性。但是為了表示變量的相關(guān)性。但是為了表示m維數(shù)據(jù),所有的變量維數(shù)據(jù),所有的變量都以折線的形式畫(huà)在平行坐標(biāo)圖上

30、,對(duì)于非常大的都以折線的形式畫(huà)在平行坐標(biāo)圖上,對(duì)于非常大的數(shù)據(jù)集,平行坐標(biāo)圖容易引起視覺(jué)上的混淆。數(shù)據(jù)集,平行坐標(biāo)圖容易引起視覺(jué)上的混淆。平行坐標(biāo)圖更為重要的作用平行坐標(biāo)圖更為重要的作用(zuyng)在于:在于:1)可用于突出顯示異常數(shù)據(jù);)可用于突出顯示異常數(shù)據(jù);2)根據(jù)某一變量選擇數(shù)據(jù)子集;)根據(jù)某一變量選擇數(shù)據(jù)子集;3)與其他可視化技術(shù)結(jié)合探索數(shù)據(jù)中的模式。)與其他可視化技術(shù)結(jié)合探索數(shù)據(jù)中的模式。平行坐標(biāo)圖技術(shù)成為高維空間變量關(guān)系顯示的重要平行坐標(biāo)圖技術(shù)成為高維空間變量關(guān)系顯示的重要技術(shù)。技術(shù)。高維數(shù)據(jù)在高維數(shù)據(jù)在2維平面中的其它可視化技術(shù):徑向坐標(biāo)維平面中的其它可視化技術(shù):徑向坐標(biāo)可視

31、化可視化(RADVIZ)及其組合變化形式等。及其組合變化形式等。第44頁(yè)/共88頁(yè)第四十五頁(yè),共88頁(yè)。46探索性空間探索性空間(kngjin)數(shù)據(jù)數(shù)據(jù)分析分析(exploratory spatial data analysis, ESDA)第45頁(yè)/共88頁(yè)第四十六頁(yè),共88頁(yè)。47探索性空間數(shù)據(jù)分析(ESDA)是探索性數(shù)據(jù)分析(EDA)在空間數(shù)據(jù)分析領(lǐng)域的推廣。ESDA著重于概括空間數(shù)據(jù)的性質(zhì),探索空間數(shù)據(jù)中的模式,產(chǎn)生和地理數(shù)據(jù)相關(guān)的假設(shè),并在地圖上識(shí)別異常數(shù)據(jù)的分布位置,發(fā)現(xiàn)是否存在熱點(diǎn)區(qū)域(hot spots)等。ESDA將數(shù)據(jù)的統(tǒng)計(jì)分析和地圖定位緊密結(jié)合在一起。地圖能夠定位案例及其

32、空間關(guān)系,并能在分析、檢驗(yàn)和表示(biosh)模型的結(jié)果中發(fā)揮重要作用。第46頁(yè)/共88頁(yè)第四十七頁(yè),共88頁(yè)。48ESDA通過(guò)地理空間(地圖表示)和屬性空間(數(shù)據(jù)空間)的關(guān)聯(lián)分析來(lái)凸顯空間關(guān)系??梢曰卮鹨韵聠?wèn)題:直方圖上的極端數(shù)值分布在地圖的什么地方?地圖上某一部分的屬性值在散點(diǎn)圖上的分布狀況如何?落入地圖上的一個(gè)子區(qū)域(qy)內(nèi)并滿足屬性標(biāo)準(zhǔn)的個(gè)例有哪些?第47頁(yè)/共88頁(yè)第四十八頁(yè),共88頁(yè)。49在GIS環(huán)境中的ESDA的主要方法是動(dòng)態(tài)聯(lián)系窗口(dynamic linking windows)和刷新(brushing)技術(shù),通過(guò)(tnggu)地圖、統(tǒng)計(jì)圖表、屬性記錄等多種方式解釋空間模式

33、,能對(duì)多種形式的信息表示進(jìn)行可視化的操作分析。第48頁(yè)/共88頁(yè)第四十九頁(yè),共88頁(yè)。50動(dòng)態(tài)聯(lián)系窗口通過(guò)刷新技術(shù)將地理空間和屬性空間的各種視圖組合在一起(yq),是一種交互式探索空間數(shù)據(jù)的選擇、聚集、趨勢(shì)、分類(lèi)、異常識(shí)別的工具。第49頁(yè)/共88頁(yè)第五十頁(yè),共88頁(yè)。51動(dòng)態(tài)聯(lián)系窗口的動(dòng)態(tài)交互技術(shù)的特點(diǎn): (1)在一種信息窗口中點(diǎn)擊或選擇,其它的信息窗口產(chǎn)生相應(yīng)的響應(yīng),并高亮顯示選中的信息。例如,在地圖窗口中選擇一些地理實(shí)體,則地圖上選中的部分和屬性表中相應(yīng)的記錄都以高亮的方式顯示一般(ybn)GIS軟件也提供了交互的操作方式,但是缺乏多種探索性數(shù)據(jù)分析工具,利用現(xiàn)有的GIS軟件難以快速地完成

34、趨勢(shì)分析和異常數(shù)據(jù)識(shí)別等分析工作。第50頁(yè)/共88頁(yè)第五十一頁(yè),共88頁(yè)。52動(dòng)態(tài)(dngti)聯(lián)系窗口的動(dòng)態(tài)(dngti)交互技術(shù)的特點(diǎn):(2)ESDA將多種可視化的數(shù)據(jù)分析工具和地圖分析結(jié)合在一起,并提供了豐富的交互工具,不僅可以進(jìn)行選擇操作,而且能夠進(jìn)行改變數(shù)據(jù)參數(shù)等模式的探索。第51頁(yè)/共88頁(yè)第五十二頁(yè),共88頁(yè)。53ESDA與空間數(shù)據(jù)挖掘:ESDA需要熟知空間數(shù)據(jù)的特殊性及數(shù)據(jù)分析的探索性方法。ESDA和數(shù)據(jù)挖掘一樣是交互的、迭代的搜索過(guò)程,其中數(shù)據(jù)中的模式和關(guān)系被用于精煉并搜索更多的興趣模式和關(guān)系。在龐大的數(shù)據(jù)集中,ESDA等價(jià)于空間數(shù)據(jù)挖掘,其基本的思想是極力使用(shyng)

35、數(shù)據(jù)來(lái)表示其本身,以識(shí)別興趣模式并幫助產(chǎn)生有關(guān)的假設(shè)。第52頁(yè)/共88頁(yè)第五十三頁(yè),共88頁(yè)。54邸凱昌等將探索性數(shù)據(jù)分析方法、面向?qū)傩缘臍w納和粗糙集方法結(jié)合起來(lái),形成了一種靈活通用的探測(cè)性歸納學(xué)習(xí)方法(Exploratory Inductive Learning, EIL),該方法可以從空間(kngjin)數(shù)據(jù)庫(kù)中發(fā)現(xiàn)普遍知識(shí)、屬性依賴(lài)、分類(lèi)知識(shí)等多種知識(shí)。利用中國(guó)分省農(nóng)業(yè)統(tǒng)計(jì)數(shù)據(jù)的空間(kngjin)數(shù)據(jù)挖掘?qū)嶒?yàn)說(shuō)明了EIL方法的可行性和有效性。第53頁(yè)/共88頁(yè)第五十四頁(yè),共88頁(yè)。55ESDA提供了兩類(lèi)統(tǒng)計(jì)分析方法:全局方法(global):對(duì)所有實(shí)例的一個(gè)或多個(gè)屬性數(shù)據(jù)(shj)進(jìn)行

36、處理;局部方法(local):對(duì)某個(gè)時(shí)段的數(shù)據(jù)(shj)子集進(jìn)行統(tǒng)計(jì)分析。第54頁(yè)/共88頁(yè)第五十五頁(yè),共88頁(yè)。56ESDA對(duì)空間數(shù)據(jù)的處理包括(boku):對(duì)非空間屬性數(shù)據(jù)的處理對(duì)空間數(shù)據(jù)的處理第55頁(yè)/共88頁(yè)第五十六頁(yè),共88頁(yè)。57ESDA對(duì)非空間屬性數(shù)據(jù)的處理:中值分析:計(jì)算屬性值分布(fnb)的中心;提供ESDA查詢(xún):查詢(xún)?cè)谥兄抵匣蛑碌膮^(qū)域。四分位和四分位間的分布(fnb)分析:對(duì)中值的分布(fnb)進(jìn)行分析;提供ESDA查詢(xún):查詢(xún)高于或低于四分位的數(shù)值區(qū)域箱線圖分析:對(duì)屬性值的分布(fnb)進(jìn)行圖形化的總結(jié);ESDA查詢(xún):查詢(xún)實(shí)例位于箱線圖的哪個(gè)特定部分?例外實(shí)例位于地圖的

37、哪個(gè)區(qū)域?第56頁(yè)/共88頁(yè)第五十七頁(yè),共88頁(yè)。58ESDA對(duì)空間數(shù)據(jù)的處理方法:平滑:地圖中包含的許多小的區(qū)域,可以利用(lyng)平滑方法進(jìn)行處理。具體處理依賴(lài)于于平滑算子的尺度。利用(lyng)平滑處理有利于解釋總體模式;ESDA的平滑處理:最簡(jiǎn)單的形式是空間平均,計(jì)算一個(gè)區(qū)域的屬性及其鄰域的屬性,并取其平均值,然后對(duì)每個(gè)區(qū)域利用(lyng)類(lèi)似方法重復(fù)該步驟。識(shí)別地圖數(shù)據(jù)的趨勢(shì)和梯度:包括核估計(jì)方法、生成數(shù)據(jù)的橫斷面并且繪圖、對(duì)于特定區(qū)域進(jìn)行空間滯后箱線圖分析、非規(guī)則格網(wǎng)數(shù)據(jù)的中值分析等。第57頁(yè)/共88頁(yè)第五十八頁(yè),共88頁(yè)。59空間自相關(guān)分析(spatial autocorrel

38、ation):ESDA技術(shù)使用散點(diǎn)圖進(jìn)行(jnxng)分析,該散點(diǎn)圖將垂直軸對(duì)應(yīng)區(qū)域本身的屬性值,水平軸對(duì)應(yīng)其鄰域的屬性值的均值。呈現(xiàn)向上傾斜的散點(diǎn)圖顯示了一種正空間相關(guān)(鄰域值傾向于相同)呈現(xiàn)向下傾斜的散點(diǎn)圖顯示了一種負(fù)空間自相關(guān)(鄰域值傾向于不同)第58頁(yè)/共88頁(yè)第五十九頁(yè),共88頁(yè)。60檢測(cè)空間例外:檢測(cè)區(qū)域值在鄰域范圍中具有極端值的情況。相應(yīng)的ESDA方法包括:使用散點(diǎn)圖技術(shù)對(duì)空間自相關(guān)進(jìn)行分析,然后進(jìn)行最小均方回歸分析。例如(lr),那些標(biāo)準(zhǔn)殘差值大于3.0或小于-3.0的實(shí)例可能屬于例外。第59頁(yè)/共88頁(yè)第六十頁(yè),共88頁(yè)。61ESDA與空間數(shù)據(jù)可視化與空間數(shù)據(jù)可視化第60頁(yè)/

39、共88頁(yè)第六十一頁(yè),共88頁(yè)。62地學(xué)可視化:地理學(xué)分析方法和GIS以及其他相關(guān)學(xué)科的密切結(jié)合導(dǎo)致了“地學(xué)可視化”這一新的研究領(lǐng)域的產(chǎn)生。地學(xué)可視化被定義為使用地理空間視覺(jué)顯示(包括虛擬現(xiàn)實(shí))探索空間數(shù)據(jù),并通過(guò)這種探索回答問(wèn)題,產(chǎn)生假設(shè),提出問(wèn)題的解決方案,構(gòu)建領(lǐng)域知識(shí)等。地學(xué)可視化為地理學(xué)研究提供(tgng)了新的技術(shù)手段與方法第61頁(yè)/共88頁(yè)第六十二頁(yè),共88頁(yè)。63探索性空間數(shù)據(jù)分析技術(shù):探索性空間數(shù)據(jù)分析技術(shù)的重要領(lǐng)域是空間參考數(shù)據(jù),這種數(shù)據(jù)的可視化必須包括地圖,地圖用于表示空間關(guān)系和模式。靜態(tài)的、非交互的地圖不能滿足探索性數(shù)據(jù)分析的基本需要。當(dāng)前努力(n l)的方向是直接面向支持

40、各種分析活動(dòng)的地圖顯示技術(shù)的發(fā)展,其中最重要好的技術(shù)是地圖與各種統(tǒng)計(jì)圖動(dòng)態(tài)聯(lián)系的技術(shù)。第62頁(yè)/共88頁(yè)第六十三頁(yè),共88頁(yè)。64空間數(shù)據(jù)的地圖化表示空間數(shù)據(jù)的地圖化表示(biosh)-主題地圖主題地圖地圖不僅是地理空間信息的表示,而且可用于探索地理空間數(shù)據(jù)。在對(duì)地理空間數(shù)據(jù)沒(méi)有假設(shè)的條件下,可視化輔助工具輔助人們交互地、非直接(zhji)地搜索結(jié)構(gòu)和趨勢(shì),此時(shí)地圖和圖形提供了一種表現(xiàn)工具,同時(shí)地圖和圖形用戶(hù)思考過(guò)程的設(shè)備工具。ESDA關(guān)注的是地圖如何表示空間數(shù)據(jù)的分布、趨勢(shì)、聚集、異常等方面空間信息的表示,關(guān)注的是如何利用地理實(shí)體的屬性數(shù)據(jù)進(jìn)行制圖分析,即主題地圖問(wèn)題。第63頁(yè)/共88頁(yè)第六

41、十四頁(yè),共88頁(yè)。65當(dāng)前各種商業(yè)GIS軟件都提供了主題制圖功能,根據(jù)地理(dl)實(shí)體的屬性數(shù)據(jù)用顏色、符號(hào)并結(jié)合統(tǒng)計(jì)圖形進(jìn)行多變量的空間數(shù)據(jù)表示等。MapInfo-GIS,其主題制圖模塊提供(tgng)了點(diǎn)密度、漸變符號(hào)、分層設(shè)色、獨(dú)立值、表面分析以及餅狀圖和柱狀圖等主題表示。第64頁(yè)/共88頁(yè)第六十五頁(yè),共88頁(yè)。66在建立空間數(shù)據(jù)的主題地圖表示中首先需要研究適合的制圖方式,這和數(shù)據(jù)的類(lèi)型有關(guān)。屬性數(shù)據(jù)分為名義的、序數(shù)的、間隔的、比率的4種類(lèi)型。前兩種是定性的離散型的變量,后兩者是定量的連續(xù)的變量。在地圖表示中,必須用能夠體現(xiàn)這些數(shù)據(jù)特征(tzhng)的方式才能正確地表示。名義變量適合于用

42、獨(dú)立名義變量適合于用獨(dú)立(dl)值表示,因?yàn)槊x變量只表示同值表示,因?yàn)槊x變量只表示同類(lèi)地理對(duì)象的類(lèi)型的區(qū)分,例如國(guó)家政區(qū)劃分、土地利用、類(lèi)地理對(duì)象的類(lèi)型的區(qū)分,例如國(guó)家政區(qū)劃分、土地利用、氣候類(lèi)型區(qū)等通常用這種方式表示。氣候類(lèi)型區(qū)等通常用這種方式表示。序數(shù)變量可以使用等級(jí)符號(hào)和分層設(shè)色圖表示。序數(shù)變量可以使用等級(jí)符號(hào)和分層設(shè)色圖表示。間隔變量和比率變量體現(xiàn)的數(shù)據(jù)的連續(xù)變化,一般使用等級(jí)間隔變量和比率變量體現(xiàn)的數(shù)據(jù)的連續(xù)變化,一般使用等級(jí)符號(hào)、范圍圖表示,但是點(diǎn)密度圖只是和于比率變量的表示符號(hào)、范圍圖表示,但是點(diǎn)密度圖只是和于比率變量的表示。第65頁(yè)/共88頁(yè)第六十六頁(yè),共88頁(yè)。67圖(a

43、)是用上海市2000人口普查數(shù)據(jù)(shj)制作的分街道/鄉(xiāng)鎮(zhèn)的人口總量分布的主題地圖。第66頁(yè)/共88頁(yè)第六十七頁(yè),共88頁(yè)。68餅狀圖和柱狀圖是為了在地圖上表示(biosh)多變量的分布特征及其空間差異性而設(shè)計(jì)的表示(biosh)方式,前者適合于表示(biosh)結(jié)構(gòu)關(guān)系,后者著重表示(biosh)數(shù)量差異。當(dāng)變量個(gè)數(shù)多時(shí),可能會(huì)超出人的視覺(jué)判斷能力,不利于信息的表示(biosh)。2000年上海市分街道(jido)/鄉(xiāng)鎮(zhèn)的男女人口結(jié)構(gòu)分布的餅狀圖第67頁(yè)/共88頁(yè)第六十八頁(yè),共88頁(yè)。69主題地圖表示的數(shù)據(jù)分類(lèi)問(wèn)題主題地圖表示的數(shù)據(jù)分類(lèi)問(wèn)題地圖制圖地圖制圖(zh t)過(guò)程中數(shù)據(jù)的分類(lèi)是非常

44、重要的。過(guò)程中數(shù)據(jù)的分類(lèi)是非常重要的。GIS軟件都提供了相關(guān)的數(shù)據(jù)分類(lèi)方法:等間隔、等軟件都提供了相關(guān)的數(shù)據(jù)分類(lèi)方法:等間隔、等范圍、自然分割法、分位數(shù)分類(lèi)、自定義等。范圍、自然分割法、分位數(shù)分類(lèi)、自定義等。第68頁(yè)/共88頁(yè)第六十九頁(yè),共88頁(yè)。 同一數(shù)據(jù)應(yīng)用(yngyng)不同的分類(lèi)方法將會(huì)產(chǎn)生顯著不同的解釋。70第69頁(yè)/共88頁(yè)第七十頁(yè),共88頁(yè)。設(shè)計(jì)數(shù)據(jù)分類(lèi)時(shí)必須注意的因素:1)包括所有范圍的數(shù)據(jù)(最小和最大);2)使用(shyng)不重疊的值和不空的類(lèi);3)分類(lèi)數(shù)量足夠大以避免犧牲數(shù)據(jù)的精確性4)劃分?jǐn)?shù)據(jù)集到合理)劃分?jǐn)?shù)據(jù)集到合理(hl)的等價(jià)的觀測(cè)組中;的等價(jià)的觀測(cè)組中;5)如果

45、可能給定一個(gè)邏輯數(shù)學(xué)關(guān)系)如果可能給定一個(gè)邏輯數(shù)學(xué)關(guān)系71第70頁(yè)/共88頁(yè)第七十一頁(yè),共88頁(yè)。等間隔分類(lèi)假設(shè)分割之間的距離是相同的。本例中的數(shù)據(jù)按照15個(gè)單位(dnwi)的等距離進(jìn)行分割。72第71頁(yè)/共88頁(yè)第七十二頁(yè),共88頁(yè)。分位數(shù)分類(lèi)是將所有的觀測(cè)數(shù)據(jù)按照相等的數(shù)量分配(fnpi)到每一個(gè)類(lèi)中。本例中,分位數(shù)計(jì)算的分類(lèi)結(jié)果為:73第72頁(yè)/共88頁(yè)第七十三頁(yè),共88頁(yè)。自然分割的分類(lèi)方法:用戶(hù)沿著數(shù)字線選擇最大的分割,或者在數(shù)據(jù)出現(xiàn)顯著的空隙。其基本思想是最小化數(shù)據(jù)集內(nèi)部的變異(biny)、最大化類(lèi)型間的差異(聚類(lèi))。74第73頁(yè)/共88頁(yè)第七十四頁(yè),共88頁(yè)。其他分類(lèi)方法:嵌套均

46、值、標(biāo)準(zhǔn)差、曲線下面積等。在利用GIS進(jìn)行主題制圖分析時(shí),必須知道系統(tǒng)所提供的分類(lèi)方法以及這些方法的限制。在許多研究中,應(yīng)當(dāng)注意(zh y)面向具體問(wèn)題進(jìn)行自定義分類(lèi)。利用各種分類(lèi)方法(fngf)的比較75第74頁(yè)/共88頁(yè)第七十五頁(yè),共88頁(yè)。交互技術(shù)與交互技術(shù)與ESDAESDA主題地圖是傳統(tǒng)的空間數(shù)據(jù)表示方法,提供了空間數(shù)據(jù)可視化主題地圖是傳統(tǒng)的空間數(shù)據(jù)表示方法,提供了空間數(shù)據(jù)可視化的能力。的能力。地圖是現(xiàn)實(shí)物理空間的同構(gòu)物,它將空間關(guān)系展現(xiàn)在人們面前地圖是現(xiàn)實(shí)物理空間的同構(gòu)物,它將空間關(guān)系展現(xiàn)在人們面前。高度的用戶(hù)交互是地圖顯示的一般要求,以支持空間思考,即高度的用戶(hù)交互是地圖顯示的一般

47、要求,以支持空間思考,即假設(shè)的生成、數(shù)據(jù)分析和決策制定。假設(shè)的生成、數(shù)據(jù)分析和決策制定。當(dāng)能夠合理利用這些手段時(shí),交互技術(shù)和工具能夠支持信息當(dāng)能夠合理利用這些手段時(shí),交互技術(shù)和工具能夠支持信息(xnx)探索和知識(shí)構(gòu)建。探索和知識(shí)構(gòu)建。76第75頁(yè)/共88頁(yè)第七十六頁(yè),共88頁(yè)。交互技術(shù)與交互技術(shù)與ESDAESDA交互式的分析技術(shù)(jsh)包括:1)地圖與其他圖形顯示方式之間的刷新(brushing)技術(shù)建立的動(dòng)態(tài)聯(lián)系,即在一種顯示方式中被選中的對(duì)象同時(shí)在其他的所有顯示方式中被高亮顯示;2)利用實(shí)時(shí)控制工具改變常規(guī)的制圖方法的參數(shù),獲得新?tīng)顟B(tài)下的分布特征等,例如專(zhuān)題中的類(lèi)別的改變交互技術(shù)的重要特征是建立了地理空間和數(shù)據(jù)空間的聯(lián)系,或者將EDA方法緊密(jnm)地融合于ESDA中??梢詮目臻g特征到屬性特征對(duì)地理現(xiàn)象進(jìn)行全面的研究和分析。77第76頁(yè)/共88頁(yè)第七十七頁(yè),共88頁(yè)。地理(dl)空間和空間數(shù)據(jù)地理空間(geographic space)就是由空間參考數(shù)據(jù)構(gòu)成的坐標(biāo)空間,它使用地理坐標(biāo)定義地理事物和現(xiàn)象,也就是地圖形式的地理表示。數(shù)據(jù)空間(data space)是地理實(shí)體(sht)屬性所構(gòu)成的空間,其中每一個(gè)點(diǎn)代表地理事物在數(shù)據(jù)空間中的位置。地理空間(kng

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論