




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1 西安科技大學(xué) 畢業(yè)設(shè)計畢業(yè)設(shè)計( (論文論文) ) 題 目 arcgis 地統(tǒng)計分析 院、系(部) 測量工程系 專業(yè)及班級 地理信息系統(tǒng) 042 班 姓 名 王春博 指 導(dǎo) 教 師 賈建華 日 期 2008-5-28 1 目 錄 目目 錄錄 .1 1 摘摘 要要 .3 3 abstractabstract .4 4 第一章第一章 緒緒 論論 .5 5 1.1 課題的目的意義 .5 1.2 國內(nèi)外發(fā)展現(xiàn)狀 .5 第二章第二章 軟件簡介軟件簡介 .7 7 2.1arcgis 軟件簡介 .7 2.1.1arcgis 的概念.7 2.1.2arcgis 的發(fā)展歷史.7 2.2arcgis 軟件體系
2、 .7 2.3 arcgis 9 軟件的特色 .8 第三章第三章 地統(tǒng)計基礎(chǔ)地統(tǒng)計基礎(chǔ) .1010 3.1 基本理論 .10 3.1.1 前提假設(shè) .10 3.1.2. 區(qū)域化變量 .11 3.1.3.變異分析 .11 3.1.4.空間估值 .15 3.2 空間插值.15 3.2.1 地統(tǒng)計插值.17 3.2.2 空間確定性插值.19 第四章第四章 arcgisarcgis 地統(tǒng)計分析功能模塊地統(tǒng)計分析功能模塊.2323 4.1 探索性數(shù)據(jù)分析(explore data) .23 4.1.1 數(shù)據(jù)分析工具.23 2 4.1.2 檢驗(yàn)數(shù)據(jù)分布.29 4.1.3 尋找數(shù)據(jù)離群值.30 4.1.4
3、全局趨勢分析.30 4.1.5 空間自相關(guān)及方向變異.30 4.1.6 多數(shù)據(jù)集協(xié)變分析.31 4.2 地統(tǒng)計分析向?qū)В╣eostatistical wizard) .31 4.2.1 選擇內(nèi)插方法與數(shù)據(jù)集界面 .31 4.2.2 參數(shù)設(shè)置界面 .32 4.2.3 精度評定界面 .32 4.2.4 生成數(shù)據(jù)子集(create subsets).33 第五章第五章 以某地高程采樣點(diǎn)為例進(jìn)行地統(tǒng)計分析以某地高程采樣點(diǎn)為例進(jìn)行地統(tǒng)計分析 .3434 5.1 數(shù)據(jù)背景知識和要求.34 5.2 操作步驟.34 5.3 結(jié)論.41 第六章第六章 總結(jié)與展望總結(jié)與展望 .4343 6.1 本次畢業(yè)設(shè)計的總結(jié)
4、 .43 6.2 展望與改進(jìn) .43 致致謝謝 .4545 參考文獻(xiàn)參考文獻(xiàn) .4646 3 摘 要 隨著 gis 和計算機(jī)技術(shù)的不斷發(fā)展和人們在研究工作中對空間高質(zhì)量數(shù)據(jù)的要求, 空間數(shù)據(jù)插值應(yīng)用越來越廣,受到人們的高度重視.運(yùn)用 arcgis 中地統(tǒng)計分析的功能,實(shí) 現(xiàn)了由離散數(shù)據(jù)插值生成區(qū)域數(shù)據(jù),供管理者進(jìn)行分析研究。 地統(tǒng)計分析方法被廣泛應(yīng)用許多領(lǐng)域,已成為空間統(tǒng)計學(xué)的一個重要分支。很長時 間以來,地統(tǒng)計分析一直沒能很好的和 gis 分析模型緊密結(jié)合在一起,這成為 gis 軟件 一大遺憾。arcgis 地統(tǒng)計分析模塊在地統(tǒng)計學(xué)與 gis 之間架起了一座橋梁,使得復(fù)雜的 地統(tǒng)計方法可以在
5、軟件中輕易實(shí)現(xiàn),體現(xiàn)了以人為本、可視化發(fā)展的趨勢。這種結(jié)合具 有重要的開創(chuàng)性意義,通過測定預(yù)測表面的統(tǒng)計誤差,gis 應(yīng)用人員首次能夠?qū)︻A(yù)測表 面的模型質(zhì)量進(jìn)行量化。本文主要通過對地統(tǒng)計分析的概念介紹,逐步引導(dǎo)讀者在 arcgis 中如何應(yīng)用地統(tǒng)計分析解決實(shí)際問題。 關(guān)鍵詞:關(guān)鍵詞:arcgisarcgis,地統(tǒng)計分析,克里格方法,插值算法,地統(tǒng)計分析,克里格方法,插值算法 4 abstract with the constant development of gis and computer technology and peoples requirement for high-qualit
6、y spatial data in researches, the use of spatial data inserting is growing wider and is being paid high attention. with the function of statistical analysis of ground of arcgis , turned into the surface land data by the spatial dispersed data, for the administrator to carry on research. the method o
7、f statistical analysis of ground is used widely and has became one of the most important branches of sptial statistics.for a long time, ground statistical analysis and gis analysis model didnt combine well, which becomes great regret of gis software researchers .the module of statistical analysis ha
8、s in arcgis erected a bridge between statistics of ground and gis, make complicated ground statistical method can be realized in the software easily, has reflected the human-oriented, visual development trend. this kind of combination has important initiative meaning. predicting superficial statisti
9、cal error,gis users can quantize the quality of predicting superficial model.this paper introduce the concept of ground statistical analysis, tells readers how to olve the practical problem with arcgis. keykey words:words: arcgis,geostatistics,kriging,interpolation algorithm 5 第一章 緒 論 1.1 課題的目的意義 地統(tǒng)
10、計學(xué)是在大量樣本的基礎(chǔ)上,通過分析樣本間的規(guī)律,探索其分布規(guī)律,并進(jìn) 行預(yù)測。地統(tǒng)計學(xué)認(rèn)為研究區(qū)域中的所有樣本值都是隨機(jī)過程的結(jié)果,即所有樣本值都 不是相互獨(dú)立的,是遵循一定的內(nèi)在規(guī)律的。因此地統(tǒng)計學(xué)就是要揭示這種內(nèi)在規(guī)律, 并進(jìn)行預(yù)測。而地統(tǒng)計分析的核心就是通過對采樣數(shù)據(jù)的分析、對采樣區(qū)地理特征的認(rèn) 識選擇合適的空間內(nèi)插方法創(chuàng)建表面。因此本次設(shè)計就是為了掌握 arcgis 地統(tǒng)計分析 的三個主要模塊,選用克里格方法生成高程表面完成多種地統(tǒng)計分析,比較不同方法進(jìn) 行表面預(yù)測的優(yōu)劣。 1.2 國內(nèi)外發(fā)展現(xiàn)狀 20 世紀(jì) 80 年代是 gis 發(fā)展具有突破性的年代,伴隨著計算機(jī)科學(xué)、現(xiàn)代數(shù)字和計
11、算機(jī)圖形學(xué)的發(fā)展 gis 逐步走向成熟,并在全世界范圍內(nèi)全面推廣,應(yīng)用領(lǐng)域不斷擴(kuò)大, 并與衛(wèi)星遙感技術(shù)結(jié)合,開始應(yīng)用于全球性的問題,涌現(xiàn)出一批有代表性的 gis 軟件, 如 arcgis,mge,geostar,mapinfo,erdas,citystar 等。arcgis 是美國環(huán)境系統(tǒng)研究 所(environment system research institute,esri)開發(fā)的新一代 gis 軟件。它由數(shù) 據(jù)服務(wù)器 arcsde 及四個基礎(chǔ)框架組成:桌面軟件 desktop、服務(wù)器 gis、嵌入式 gis 和 移動 gis 組成。 地統(tǒng)計學(xué)是以區(qū)域化變量理論為基礎(chǔ),以變異函數(shù)為主要
12、工具,研究在空間分布上 既有隨機(jī)性又有結(jié)構(gòu)性(或空間相關(guān)和依賴性)的自然現(xiàn)象的科學(xué)。地統(tǒng)計分析方法已成 為空間統(tǒng)計學(xué)的一個重要分支,很長時間以來,地統(tǒng)計分析一直沒能很好地和 gis 分析 模型緊密結(jié)合在一起,成為 gis 軟件的一大遺憾。arcgis 地統(tǒng)計分析模塊的出現(xiàn)為地統(tǒng) 計學(xué)和 gis 之間架起了一座橋梁,使得復(fù)雜的地統(tǒng)計方法可以在軟件中得以實(shí)現(xiàn)。 arcgis 與地統(tǒng)計方法的結(jié)合具有重要的開創(chuàng)性意義,通過測定預(yù)測表面的統(tǒng)計誤差, 6 gis 應(yīng)用人員首次能夠?qū)︻A(yù)測表面的模型質(zhì)量進(jìn)行量化。雖然眾多學(xué)者都已經(jīng)在空間數(shù) 據(jù)插值方面做了大量的研究工作,并將不同的插值方法應(yīng)用于各自領(lǐng)域中,但是
13、基本上 都是一些簡單的應(yīng)用,沒有針對地質(zhì)空間可視化這一具體問題對各類算法做充分的論證 比較。在地質(zhì)空間可視化數(shù)據(jù)插值方面,要想達(dá)到較好的插值效果,就要完成包括對具 體地質(zhì)條件的分析,對現(xiàn)有各類數(shù)據(jù)的整理、篩選和預(yù)處理,以及針對具體插值算法的 理論模型的選擇和插值參數(shù)的確定等等必要的步驟,而對于這方面的全面的研究更是少 之又少,很多都是根據(jù)經(jīng)驗(yàn)、行業(yè)慣例或現(xiàn)有條件簡單的選擇一種。 隨著 gis 和計算機(jī)技術(shù)的不斷發(fā)展和人們在研究工作中對空間高質(zhì)量數(shù)據(jù)的要求, 空間數(shù)據(jù)插值應(yīng)用越來越廣,受到人們的高度重視.。以 arcgis、oracle 和 sql+軟件的 支持下,運(yùn)用 arcgis 中地統(tǒng)計分
14、析的功能,對自己所做的具體工作進(jìn)行詳細(xì)總結(jié)。許多 地理調(diào)查和勘察的結(jié)果為一系列離散的、空間上分布不均勻的數(shù)據(jù),而由于工作場地及 資金成本等問題的限制,在一定的研究區(qū)域內(nèi)往往只能獲得有限的數(shù)據(jù)和勘察資料,對 許多現(xiàn)象的解釋以及構(gòu)建三維數(shù)據(jù)模型往往都是基于這些數(shù)據(jù)做出的。這就要求使用插 值技術(shù)、選用合適的插值算法來對研究場區(qū)進(jìn)行有效的數(shù)據(jù)加密,最大限度地利用這些 數(shù)據(jù)所蘊(yùn)涵的信息,這是實(shí)現(xiàn)地理空間可視化的關(guān)鍵步驟,也是許多地學(xué)家和計算機(jī)專 家一直探索的課題。 7 第二章 軟件簡介 2.1 arcgis 軟件簡介 2.1.1 arcgis 的概念 arcgis 9 是美國環(huán)境系統(tǒng)研究所(enviro
15、nment system research institute,esri)開 發(fā)的新一代 gis 軟件。 arcgis 9 是世界上應(yīng)用廣泛的 gis 軟件之一。 arcgis 9 是我國 gis 領(lǐng)域常用的商業(yè)軟件。 2.1.2 arcgis 的發(fā)展歷史 1978 年 第一個 arc/info 產(chǎn)品誕生 1999 年 推出 arc/info 8 2000 年 推出 arcgis 8 2004 年 推出 arcgis 9 arcgis 9 是 esri 在全面整合了 gis 與數(shù)據(jù)庫、軟件工程、人工智能、網(wǎng)絡(luò)技術(shù)及其它 多方面的計算機(jī)主流技術(shù)之后,成功地推出了代表 gis 最高技術(shù)水平的全系列
16、 gis 產(chǎn)品。 arcgis 是一個全面的,可伸縮的 gis 平臺,為用戶構(gòu)建一個完善的 gis 系統(tǒng)提供完整的 解決方案。 2.2 arcgis 軟件體系 arcgis 9 由 esri 在 2004 年推出,是一個統(tǒng)一的地理信息系統(tǒng)平臺,由數(shù)據(jù)服務(wù) 器 arcsde 及 4 個基礎(chǔ)框架組成:桌面軟件 desktop、服務(wù)器 gis、嵌入式 gis 和移動 gis。 1.desktop gis 8 desktop gis 是 arcmap、arccatalog、arctoobox 以及 arcglobe 等在內(nèi)的用戶界面 組件,其功能可分為三個級別:arcview 、arceditor 、
17、arcinfo 是三級不同的桌面軟 件系統(tǒng),共用通用的結(jié)構(gòu)、通用的編碼基數(shù)、通用的擴(kuò)展模塊和統(tǒng)一的開發(fā)環(huán)境,功能 由簡單到復(fù)雜。 2.server gis arcgis 9 所包含的三種服務(wù)端產(chǎn)品:arcsde、arcims 和 arcgis server。 arcsde 是管理地理信息的高級空間數(shù)據(jù)服務(wù)器。arcims 則是一個可伸縮的,通過 開放的 internet 協(xié)議進(jìn)行 gis 地圖、數(shù)據(jù)和元數(shù)據(jù)發(fā)布的地圖服務(wù)器。arcgis server 是應(yīng)用服務(wù)器,用于構(gòu)建中式的企業(yè) gis 應(yīng)用,基于 soap 的 web serveices 和 web 應(yīng) 用,包含在企業(yè)和 web 框架上
18、建設(shè)服務(wù)端 gis 應(yīng)用的共享 gis 軟件對象庫。 3.embedded gis 在嵌入 gis 支持方面,arcgis 9 提供了 arcgis engine,是應(yīng)用于 arcgis desktop 應(yīng)用框架之外的嵌入式 arcgis 組件。使用 arcgis engine,開發(fā)者在 c+、com、.net 和 jave 環(huán)境中使用簡單的借口接口獲取任意 gis 功能的組合來構(gòu)建專門的 gis 應(yīng)用解 決方案。 4. mobile gis 在移動 gis 方面,arcgis 9 提供了實(shí)現(xiàn)簡單 gis 操作的 arcpad 和實(shí)現(xiàn)高級 gis 復(fù) 雜操作的 mobile arcgis de
19、sktop system。arcpad 是 arcgis 實(shí)現(xiàn)簡單的移動 gis 和野 外計算之解決方案;arcgis desktop 和 arcgis engine 集中組建的 mobile arcgis desktop systems,一般在高端平板電腦上執(zhí)行,以執(zhí)行 gis 分析和決策分析的野外工作 任務(wù)。 5. geodatabase geodatabase 是 geographic database 的簡寫,是一種在專題圖層和空間表達(dá)中組 織 gis 數(shù)據(jù)的核心地理信息模型,是一套獲取和管理 gis 數(shù)據(jù)的全面地應(yīng)用邏輯和工具。 不管是客戶端的應(yīng)用,服務(wù)器配置,還是嵌入式的定制開發(fā)都
20、可以運(yùn)用 geodatabase 的 應(yīng)用邏輯。geodatabase 還是一個基于 gis 和 dbms 標(biāo)準(zhǔn)的物理數(shù)據(jù)存儲庫,可以應(yīng)用于 多用戶訪問、個人 dbms 以及 xml 等情形。 9 2.3 arcgis 9 軟件的特色 1 1制圖編輯的高度一體化制圖編輯的高度一體化 * arcmap 不僅可以按照要素屬性編輯和表現(xiàn)圖形,也可直接繪制和生成要素數(shù)據(jù); * 可以在數(shù)據(jù)視圖按照特定的符號瀏覽地理要素,也可同時在版面視圖生成打印 輸出地圖; * 有全面的地圖符號、線形、填充和字體庫,支持多種輸出格式; * 可自動生成坐標(biāo)格網(wǎng)或經(jīng)緯網(wǎng),能夠進(jìn)行多種方式的地圖標(biāo)注,具有強(qiáng)大的制 圖編輯功能
21、 。 2 2便捷的元數(shù)據(jù)管理便捷的元數(shù)據(jù)管理 arcgis 可以管理其支持的所有數(shù)據(jù)類型的元數(shù)據(jù),可以建立自身支持的數(shù)據(jù)類型和 元數(shù)據(jù),也可以建立用戶定義數(shù)據(jù)的元數(shù)據(jù),并可以對元數(shù)據(jù)進(jìn)行編輯和瀏覽。arcgis 可以建立元數(shù)據(jù)的數(shù)據(jù)類型很多,arccatalog 模塊用以組織和管理所有的 gis 信息,如 地圖、數(shù)據(jù)集、模型、元數(shù)據(jù)、服務(wù)等支持多種常用的元數(shù)據(jù),提供了元數(shù)據(jù)編輯器以 及用來瀏覽的特性頁,元數(shù)據(jù)存儲采用了 xml 標(biāo)準(zhǔn),對這些數(shù)據(jù)可以使用所有的管理操 作。 3 3靈活的定制與開發(fā)靈活的定制與開發(fā) arcgis 的 desktop 部分通過一系列可視化應(yīng)用操作界面,滿足了大多數(shù)終端
22、用戶的 需求,同時,也為更高級的用戶和開發(fā)人員提供了全面的客戶化定制功能。 arcmap 提供了多個被添加到界面上的不同工具條對數(shù)據(jù)進(jìn)行編輯和操作,用戶也可 以創(chuàng)建添加自定義的工具。arccatalog 和 arcmap 的基礎(chǔ)是 micrsoft 公司的組件對象模 型,因此可以說 arcgis 是完全 com 化的。對于需要對 arcgis 進(jìn)行結(jié)構(gòu)定制和功能擴(kuò)展 的高級開發(fā)人員來說,這是非常有吸引力的。任何 com 兼容的編程語言,如 visual c+、delphi 或者 visual j+都能用來定制和擴(kuò)展 arcgis。 arcgis 還提供了工業(yè)標(biāo)準(zhǔn)的 vba,用于所有的腳本編程和
23、定制工作。arcmap 和 arccatalog 這兩個模塊的 vba 編輯器,可以讓用戶編寫定制的腳本,并作為宏來運(yùn)行和 保存、添加到界面上的命令按鈕里。 10 4 4arcgisarcgis 9 9 的新功能的新功能 與 arcgis 8 相比,arcgis 9 最大的變化是增加了兩個基于 arcobject 的產(chǎn)品:面 向開發(fā)的嵌入式 arcgis engine 和面向企業(yè)用戶基于服務(wù)器的 arcgis server。這兩個 產(chǎn)品都支持包括 windows、unix 和 linux 在內(nèi)的跨平臺技術(shù)。 11 第三章 地統(tǒng)計基礎(chǔ) 3.1 基本理論 地統(tǒng)計(geostatistics)又稱地
24、質(zhì)統(tǒng)計,是在法國著名統(tǒng)計學(xué)家 g. matheron 大 量理論研究的基礎(chǔ)上逐漸形成的一門新的統(tǒng)計學(xué)分支。它是以區(qū)域化變量為基礎(chǔ),借助 變異函數(shù),研究既具有隨機(jī)性又具有結(jié)構(gòu)性,或空間相關(guān)性和依賴性的自然現(xiàn)象的一門 科學(xué)。凡是與空間數(shù)據(jù)的結(jié)構(gòu)性和隨機(jī)性,或空間相關(guān)性和依賴性,或空間格局與變異 有關(guān)的研究,并對這些數(shù)據(jù)進(jìn)行最優(yōu)無偏內(nèi)插估計,或模擬這些數(shù)據(jù)的離散性、波動性 時,皆可應(yīng)用地統(tǒng)計學(xué)的理論與方法。 地統(tǒng)計學(xué)與經(jīng)典統(tǒng)計學(xué)的共同之處在于:它們都是在大量采樣的基礎(chǔ)上,通過對 樣本屬性值的頻率分布或均值、方差關(guān)系及其相應(yīng)規(guī)則的分析,確定其空間分布格局與 相關(guān)關(guān)系。但地統(tǒng)計學(xué)區(qū)別于經(jīng)典統(tǒng)計學(xué)的最大特
25、點(diǎn)即是:地統(tǒng)計學(xué)既考慮到樣本值的 大小,又重視樣本空間位置及樣本間的距離,彌補(bǔ)了經(jīng)典統(tǒng)計學(xué)忽略空間方位的缺陷。 地統(tǒng)計分析理論基礎(chǔ)包括前提假設(shè)、區(qū)域化變量、變異分析和空間估值。 3.1.1 前提假設(shè) (1) 隨機(jī)過程 地統(tǒng)計學(xué)認(rèn)為研究區(qū)域中的所有樣本值都是隨機(jī)過程的結(jié)果,即所有樣本值都不是 相互獨(dú)立的,它們是遵循一定的內(nèi)在規(guī)律的。因此地統(tǒng)計學(xué)就是要揭示這種內(nèi)在規(guī)律, 并進(jìn)行預(yù)測。 (2) 正態(tài)分布 在統(tǒng)計學(xué)分析中,假設(shè)大量樣本是服從正態(tài)分布的,地統(tǒng)計學(xué)也不例外。在獲得數(shù) 據(jù)后首先應(yīng)對數(shù)據(jù)進(jìn)行分析,若不符合正態(tài)分布的假設(shè),應(yīng)對數(shù)據(jù)進(jìn)行變換,轉(zhuǎn)為符合 正態(tài)分布的形式,并盡量選取可逆的變換形式。 (
26、3) 平穩(wěn)性 對于統(tǒng)計學(xué)而言,重復(fù)的觀點(diǎn)是其理論基礎(chǔ)。統(tǒng)計學(xué)認(rèn)為,從大量重復(fù)的觀察中可 12 以進(jìn)行預(yù)測和估計,并可以了解估計的變化性和不確定性。對于大部分的空間數(shù)據(jù)而言, 平穩(wěn)性的假設(shè)是合理的。這其中包括兩種平穩(wěn)性:一是均值平穩(wěn),即假設(shè)均值是不變的 并且與位置無關(guān);另一類是與協(xié)方差函數(shù)有關(guān)的二階平穩(wěn)和與半變異函數(shù)有關(guān)的內(nèi)蘊(yùn)平 穩(wěn)。二階平穩(wěn)是假設(shè)具有相同的距離和方向的任意兩點(diǎn)的協(xié)方差是相同的,協(xié)方差只與 這兩點(diǎn)的值相關(guān)而與它們的位置無關(guān)。內(nèi)蘊(yùn)平穩(wěn)假設(shè)是指具有相同距離和方向的任意兩 點(diǎn)的方差(即變異函數(shù))是相同的。二階平穩(wěn)和內(nèi)蘊(yùn)平穩(wěn)都是為了獲得基本重復(fù)規(guī)律而 作的基本假設(shè),通過協(xié)方差函數(shù)和變異函
27、數(shù)可以進(jìn)行預(yù)測和估計預(yù)測結(jié)果的不確定性。 3.1.2. 區(qū)域化變量 當(dāng)一個變量呈現(xiàn)一定的空間分布時,稱之為區(qū)域化變量,它反映了區(qū)域內(nèi)的某種特 征或現(xiàn)象。區(qū)域化變量與一般的隨機(jī)變量不同之處在于,一般的隨機(jī)變量取值符合一定 的概率分布,而區(qū)域化變量根據(jù)區(qū)域內(nèi)位置的不同而取不同的值。而當(dāng)區(qū)域化變量在區(qū) 域內(nèi)確定位置取值時,表現(xiàn)為一般的隨機(jī)變量,也就是說,它是與位置有關(guān)的隨機(jī)變量。 在實(shí)際分析中,常采用抽樣的方式獲得區(qū)域化變量在某個區(qū)域內(nèi)的值,即此時區(qū)域化變 量表現(xiàn)為空間點(diǎn)函數(shù): z(x)= z( xu ,xv ,xw ) (3.1) 根據(jù)其定義,區(qū)域化變量具有兩個顯著特征:即隨機(jī)性和結(jié)構(gòu)性。首先,區(qū)
28、域化 變量是一個隨機(jī)變量,它具有局部的、隨機(jī)的、異常的特征;其次,區(qū)域化變量具有一 定的結(jié)構(gòu)特點(diǎn),即變量在點(diǎn) x 與偏離空間距離為 h 的點(diǎn) x+h 處的值 z(x)和 z(x+h) 具有某種程度的相似性,即自相關(guān)性,這種自相關(guān)性的程度依賴于兩點(diǎn)間的距離 h及變 量特征。除此之外,區(qū)域化變量還具有空間局限性(即這種結(jié)構(gòu)性表現(xiàn)為一定范圍內(nèi))、 不同程度的連續(xù)性和不同程度的各向異性(即各個方向表現(xiàn)出的自相關(guān)性有所區(qū)別)等 特征。 3.1.3.變異分析 (1) 協(xié)方差函數(shù) 協(xié)方差又稱半方差,表示兩隨機(jī)變量之間的差異。在概率論中,隨機(jī)變量 x 與y的 13 協(xié)方差定義為: (3.2)()(),(yey
29、xexeyxcov 借鑒上式,地統(tǒng)計學(xué)中的協(xié)方差函數(shù)可表示為: (3.3) )( 1 )()()()( )( 1 )( hn i iiii hxzhxzxzxz hn hc 其中,z(x)為區(qū)域化隨機(jī)變量,并滿足二階平穩(wěn)假設(shè),即隨機(jī)變量z(x)的空間分布 規(guī)律不因位移而改變;h為兩樣本點(diǎn)空間分隔距離;為z(x)在空間點(diǎn)處的樣本值;)( i xz i x 是z(x)在處距離偏離h的樣本值i=1,2,n(h);n(h)是分隔距離為h時的樣)(hxz i i x 本點(diǎn)對總數(shù);分別為的樣本平均數(shù),即:)x()(hzxz ii 和)x()(hzxz ii 和 (3.4)( 1 )( 1 n i ii x
30、z n xz (3.5)( 1 )( 1 hxz n hxz n i ii 上式中,n為樣本單元數(shù)。一般情況下,(特殊情況下可以認(rèn)為近)x()(hzxz ii 似相等。) (2) 半變異函數(shù) 半變異函數(shù)又稱半變差函數(shù)、半變異矩,是地統(tǒng)計分析的特有函數(shù)。區(qū)域化變量 z(x)在點(diǎn) x 和 x+h 處的值z(x)與 z(x+h)差的方差的一半稱為區(qū)域化變量 z(x)的半變 異函數(shù),記為 r(h),2r(h)稱為變異函數(shù)。 根據(jù)定義有: (3.6)()( 2 1 ),(hxzxzvarhxr 即 (3.7) 2 2 )()( 2 1 )()( 2 1 ),(hxzexzehxzxzehxr 區(qū)域化變量
31、z(x)滿足二階平穩(wěn)假設(shè),因此對于任意的h有: (3.8)()(xzehxze 因此,半變異函數(shù)可改寫為: 14 (3.9) 2 )()( 2 1 ),(hxzxzehxr 由上式可知,半變異函數(shù)依賴于自變量x和h,當(dāng)半變異函數(shù)r(x,h)僅僅依賴于距離 h而與位置x無關(guān)時,r(x,h)可改寫為r(x),即: (3.10) 2 )()()( 2 1 )(hxzxzxzehr 具體表示為: (3.11) 2 )( 1 )()( )(2 1 )(hxzxz hn hr i hn i i 各變量的含義同前。也有將r(h)稱為變異函數(shù),兩者使用不上引起本質(zhì)上的差別。 (3) 變異分析 半變異函數(shù)和協(xié)方
32、差函數(shù)把統(tǒng)計相關(guān)系數(shù)的大小作為一個距離的函數(shù),是地理學(xué)相 近相似定理定量量化。 圖3.1 半變異函數(shù)圖 圖3.2 協(xié)方差函數(shù)圖 由以上兩圖顯示,半變異值的變化隨著距離的加大而增加,協(xié)方差隨著距離的加大 而減小。這主要是由于半變異函數(shù)和協(xié)方差函數(shù)都是事物空間相關(guān)系數(shù)的表現(xiàn),當(dāng)兩事 物彼此距離較小時,它們是相似的,因此協(xié)方差值較大,而半變異值較小;反之,協(xié)方 差值較小,而半變異值較大。此外,協(xié)方差函數(shù)和半變異函數(shù)隨著距離的加大基本呈反 向變化特征,它們之間的近似關(guān)系表達(dá)式為: r(h)=sill- c(h) (3.12) 半變異函數(shù)曲線圖和協(xié)方差函數(shù)曲線反映了一個采樣點(diǎn)與其相鄰采樣點(diǎn)的空間關(guān)系。
33、15 此外,它們對異常采樣點(diǎn)具有很好的探測作用,在 arcgis 地統(tǒng)計分析模塊中可以使用 兩者的任意一個,一般采用半變異函數(shù)。在半變異曲線圖中有兩個非常重要的點(diǎn):間隔 為 0 時的點(diǎn)和半變異函數(shù)趨近平穩(wěn)時的拐點(diǎn),由這兩個點(diǎn)產(chǎn)生四個相應(yīng)的參數(shù):塊金 值 (nugget)、變程(range)、基臺值(sill)、偏基臺值(partial sill)它們的 含義表示如下: 塊金值(nugget):理論上,當(dāng)采樣點(diǎn)間的距離為 0 時,半變異函數(shù)值應(yīng)為 0, 但由于存在測量誤差和空間變異,使得兩采樣點(diǎn)非常接近時,它們的半變異函數(shù)值不為 0,即存在塊金值。測量誤差是儀器內(nèi)在誤差引起的,空間變異是自然現(xiàn)象
34、在一定空間 范圍內(nèi)的變化。它們?nèi)我庖环交騼烧吖餐饔卯a(chǎn)生了塊金值。 基臺值(sill):當(dāng)采樣點(diǎn)間的距離 h 增大時,半變異函數(shù) r(h)從初始的塊金值 達(dá)到一個相對穩(wěn)定的常數(shù)時,該常數(shù)值稱為基臺值。當(dāng)半變異函數(shù)值超過基臺值時,即 函數(shù)值不隨采樣點(diǎn)間隔距離而改變時,空間相關(guān)性不存在。 偏基臺值(partial sill):基臺值與塊金值的差值。 變程(range):當(dāng)半變異函數(shù)的取值由初始的塊金值達(dá)到基臺值時,采樣點(diǎn)的間 隔距離稱為變程。變程表示了在某種觀測尺度下,空間相關(guān)性的作用范圍,其大小受觀 測尺度的限定。在變程范圍內(nèi),樣點(diǎn)間的距離越小,其相似性,即空間相關(guān)性越大。當(dāng) hr 時,區(qū)域化變
35、量 z(x)的空間相關(guān)性不存在,即當(dāng)某點(diǎn)與已知點(diǎn)的距離大于變程時, 該點(diǎn)數(shù)據(jù)不能用于內(nèi)插或外推。 當(dāng)限定的樣本點(diǎn)間隔過小時,可能出現(xiàn)曲線圖上所有 r(h) nugget,即曲線為一 近似平行于橫坐標(biāo)的直線,此時半變異函數(shù)表現(xiàn)為純塊金效應(yīng)。這是由于所限定的樣本 間隔內(nèi),點(diǎn)與點(diǎn)的變化很大,即各個樣點(diǎn)是隨機(jī)的,不具備空間相關(guān)性,區(qū)域內(nèi)樣點(diǎn)的 平均值即是最佳估計值。此時只有增大樣本間隔,才能反映出樣本間的空間相關(guān)性。 空間相關(guān)性的強(qiáng)弱可由 partial_sill/sill 來反映,該值越大,空間相關(guān)性越強(qiáng)。 相應(yīng)地,nugget/sill 稱為基底效應(yīng),表示樣本間的變異特征,該值越大,表示樣本間 的
36、變異更多得是由隨機(jī)因素引起的。 16 3.1.4.空間估值 一個完整的地統(tǒng)計分析過程,或者說空間估值過程,一般為:首先是獲取原始數(shù)據(jù), 檢查、分析數(shù)據(jù),找尋數(shù)據(jù)暗含的特點(diǎn)和規(guī)律,比如是否為正態(tài)分布、有沒有趨勢效應(yīng)、 各向異性等等;然后選擇合適的模型進(jìn)行表面預(yù)測,這其中包括半變異模型的選擇和預(yù) 測模型的選擇;最后檢驗(yàn)?zāi)P褪欠窈侠砘驇追N模型進(jìn)行對比。盡管在 arcgis 中利用 地統(tǒng)計分析模塊完成上述過程非常簡單,但是遵循一個結(jié)構(gòu)化處理過程仍很重要,如圖 (1) 數(shù)據(jù)顯示 在arcmap數(shù)據(jù)視圖窗口中添加并顯示待分析的數(shù)據(jù)圖層。 (2) 數(shù)據(jù)檢查 分析數(shù)據(jù)集的統(tǒng)計屬性,對數(shù)據(jù)進(jìn)行深入了解。數(shù)據(jù) 檢
37、查內(nèi)容包括檢驗(yàn)數(shù)據(jù)分布、尋找數(shù)據(jù)離群值、全局趨勢分析、 探測空間自相關(guān)及方向變異,以及多數(shù)據(jù)集協(xié)變分析。 (3) 模型擬合 基于對數(shù)據(jù)的認(rèn)識,初步選擇一個認(rèn)為合適的模型創(chuàng)建表面。全面 的數(shù)據(jù)檢查有助于選擇出合適的模型。 (4) 模型診斷 評估模型的輸出(表面) ,了解所選模型對未知值的預(yù)測效果。診斷的主要內(nèi)容 包括:預(yù)測的準(zhǔn)確性。模型的有效性。 (5) 模型比較 通過設(shè)置不同參數(shù)或者選擇多個可選模型創(chuàng)建表面,通過對比分析可以確定哪個模 型對未知值的預(yù)測更好。 3.2 空間插值 地統(tǒng)計分析的核心就是通過對采樣數(shù)據(jù)的分析、對采樣區(qū)地理特征的認(rèn)識選擇合適 的空間內(nèi)插方法創(chuàng)建表面。插值方法按其實(shí)現(xiàn)的數(shù)
38、學(xué)原理可以分為兩類:一是確定性插 數(shù)據(jù)顯示 數(shù)據(jù)檢查 模型擬合 模型診斷 模型比較 17 值方法,另一類是地統(tǒng)計插值,也就是克里格插值,如圖 3.3 全局性插值:全局多項(xiàng)式插值 確定性插值 反距離權(quán)插值 局部性插值 徑向基插值 局部多項(xiàng)式插值 空間插值 普通克里格插值 簡單克里格插值 地統(tǒng)計插值 泛克里格插值 概率克里格插值 析取克里格插值 協(xié)同克里格插值 圖 3.3 空間插值分類圖一 確定性插值方法以研究區(qū)域內(nèi)部的相似性(如反距離加權(quán)插值法) 、或者以平滑度 為基礎(chǔ)(如徑向基函數(shù)插值法)由已知樣點(diǎn)來創(chuàng)建表面。地統(tǒng)計插值方法(例如克里格 法) 利用的則是已知樣點(diǎn)的統(tǒng)計特性。地統(tǒng)計插值方法不但能
39、夠量化已知點(diǎn)之間的空 間自相關(guān)性,而且能夠解釋說明采樣點(diǎn)在預(yù)測區(qū)域范圍內(nèi)的空間分布情況。 確定性插值方法有可以分為兩種:即全局性插值方法和局部性插值方法,如上圖所 示。全局性插值方法以整個研究區(qū)的樣點(diǎn)數(shù)據(jù)集為基礎(chǔ)來計算預(yù)測值,局部性插值方法 則使用一個大研究區(qū)域內(nèi)較小的空間區(qū)域內(nèi)的已知樣點(diǎn)來計算預(yù)測值。 克里格方法與反距離權(quán)插值方法有些類似,兩者都通過對已知樣本點(diǎn)賦權(quán)重來求得 未知樣點(diǎn)的值,可統(tǒng)一表示為: z(x0)=ni=1iz(xi) (3.13) 式中,z(x0)為未知樣點(diǎn)的值,z(xi)為未知樣點(diǎn)周圍的已知樣本點(diǎn)的值,i為第 i 個已 知樣本點(diǎn)對未知樣點(diǎn)的權(quán)重,n 為已知樣本點(diǎn)的個數(shù)。
40、 18 不同的是,在賦權(quán)重時,反距離權(quán)插值方法只考慮已知樣本點(diǎn)與未知樣點(diǎn)的距離遠(yuǎn) 近,而克里格方法不僅考慮距離,而且通過變異函數(shù)和結(jié)構(gòu)分析,考慮了已知樣本點(diǎn)的 空間分布及與未知樣點(diǎn)的空間方位關(guān)系。 空間插值方法根據(jù)是否能保證創(chuàng)建的表面經(jīng)過所有的采樣點(diǎn),又可以分為精確性插 值和非精確性插值(圖 3.4) 。精確性插值法預(yù)測值在樣點(diǎn)處的值與實(shí)測值相等,非精確 性插值法預(yù)測值在樣點(diǎn)處的值與實(shí)測值一般不會相等。使用非精確性插值法可以避免在 輸出表面上出現(xiàn)明顯的波峰或波谷。反距離權(quán)插值和徑向基插值屬于精確性插值方法, 而全局多項(xiàng)式插值、局部多項(xiàng)式插值,以及克里格插值都屬于非精確性插值方法。 反距離權(quán)插值
41、 精確性插值 徑向基插值 空間插值 全局多項(xiàng)式插值 普通克里格插值 非精確性插值 局部多項(xiàng)式插值 簡單克里格插值 克里格插值 泛克里格插值 概率克里格插值 析取克克里格插值 協(xié)同克里格插值 圖 3.4 空間插值分類示意圖二 3.2.1 地統(tǒng)計插值 克里格插值克里格插值基礎(chǔ)基礎(chǔ) 克里格插值(kriging)又稱空間局部插值法,是以變異函數(shù)理論和結(jié)構(gòu)分析為基 礎(chǔ),在有限區(qū)域內(nèi)對區(qū)域化變量進(jìn)行無偏最優(yōu)估計的一種方法,是地統(tǒng)計學(xué)的主要內(nèi)容 之一。南非礦產(chǎn)工程師 d.r.krige(1951 年)在尋找金礦時首次運(yùn)用這種方法,法國 著名統(tǒng)計學(xué)家 g.matheron 隨后將
42、該方法理論化、系統(tǒng)化,并命名為 kriging,即克里 格方法。 克里格方法的適用范圍為區(qū)域化變量存在空間相關(guān)性,即如果變異函數(shù)和結(jié)構(gòu)分析 19 的結(jié)果表明區(qū)域化變量存在空間相關(guān)性,則可以利用克里格方法進(jìn)行內(nèi)插或外推;否則 反之。其實(shí)質(zhì)是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結(jié)構(gòu)特點(diǎn),對未知樣點(diǎn)進(jìn)行線 性無偏、 最優(yōu)估計。無偏是指偏差的數(shù)學(xué)期望為 0,最優(yōu)是指估計值與實(shí)際值之差的 平方和最小。也就是說,克里格方法是根據(jù)未知樣點(diǎn)有限鄰域內(nèi)的若干已知樣本點(diǎn)數(shù)據(jù), 在考慮了樣本點(diǎn)的形狀、大小和空間方位,與未知樣點(diǎn)的相互空間位置關(guān)系,以及變異 函數(shù)提供的結(jié)構(gòu)信息之后,對未知樣點(diǎn)進(jìn)行的一種線性無偏最優(yōu)估計
43、,是地統(tǒng)計學(xué)的主 要內(nèi)容之一。 用克里格方法進(jìn)行插值的主要步驟如下圖 3.5 所示: 是 否 導(dǎo)入數(shù)據(jù) 數(shù)據(jù)分析 是否服從 正態(tài)分布 數(shù)據(jù)變換 根據(jù)數(shù)據(jù)選擇合適 的方法 計算樣點(diǎn)間的距離 矩陣 計算樣點(diǎn)間的屬性 方差 是否存 在趨勢 按距離分組 按組統(tǒng)計平均距離 及對應(yīng)的平均方差 繪制方差 變異云圖 繪制經(jīng)驗(yàn)半 變異函數(shù)圖 擬合理論半變異 函數(shù)圖 計算克里格系數(shù) 進(jìn)行預(yù)測 泛克里格方法 20 圖 3.5 克里格方法的主要步驟 在克里格插值過程中,需注意以下幾點(diǎn): (1) 數(shù)據(jù)應(yīng)符合前提假設(shè)。 (2) 數(shù)據(jù)應(yīng)盡量充分,樣本數(shù)盡量大于 80,每一種距離間隔分類中的樣本對數(shù)盡 量多于 10 對。 (
44、3) 在具體建模過程中,很多參數(shù)是可調(diào)的,且每個參數(shù)對結(jié)果的影響不同。 a. 塊金值:誤差隨塊金值得增大而增大。 b. 基臺值:對結(jié)果影響不大。 c. 變程:存在最佳變程值。 d. 擬合函數(shù):存在最佳擬合函數(shù)。 (4) 當(dāng)數(shù)據(jù)足夠多時,各種插值方法的效果基本相同。 克里格方法的分類及使用條件 目前,克里格方法主要有以下幾種類型:普通克里格(ordinary kriging) ;簡單 克里格(simple kriging) ;泛克里格(universal kriging) ;協(xié)同克里格(co- kriging) ;對數(shù)正態(tài)克里格(logistic normal kriging)
45、;指示克里格(indicator kriging) ;概率克里格(probability kriging) ;析取克里格(disjunctive kriging)等。下面簡要介紹一下 arcgis 中常用的幾種克里格方法的適用條件,其具體 的算法、原理可查閱相關(guān)文獻(xiàn)資料。 不同的方法有其適用的條件,當(dāng)數(shù)據(jù)不服從正態(tài)分布時,若服從對數(shù)正態(tài)分布,則 選用對數(shù)正態(tài)克里格;若不服從簡單分布時,選用析取克里格。當(dāng)數(shù)據(jù)存在主導(dǎo)趨勢時, 選用泛克里格。當(dāng)只需了解屬性值是否超過某一閾值時,選用指示克里格。當(dāng)同一事物 的兩種屬性存在相關(guān)關(guān)系,且一種屬性不易獲取時,可選用協(xié)同克里格方法,借助另一 屬性實(shí)現(xiàn)該屬性的
46、空間內(nèi)插。當(dāng)假設(shè)屬性值的期望值為某一已知常數(shù)時,選用簡單克里 格。當(dāng)假設(shè)屬性值的期望值是未知的,選用普通克里格。 21 3.2.2 空間確定性插值 確定性插值方法以研究區(qū)域內(nèi)部的相似性、或者以平滑度為基礎(chǔ),由已知樣點(diǎn)來 創(chuàng)建表面。本節(jié)主要對確定性空間插值中的反距離權(quán)插值、全局多項(xiàng)式插值、局部多項(xiàng) 式插值和徑向基函數(shù)插值的概念、原理及在 arcgis9 中的實(shí)現(xiàn)過程進(jìn)行詳細(xì)介紹。 反距離加權(quán)插值 反距離權(quán)插值是基于相近相似的原理:即兩個物體離得近,它們的性質(zhì)就越相似。 反之,離得越遠(yuǎn)則相似性越小。它以插值點(diǎn)與樣本點(diǎn)間的距離為權(quán)重進(jìn)行加權(quán)平均,離 插值點(diǎn)越近的樣點(diǎn)賦予的權(quán)重越大。
47、反距離加權(quán)插值法的一般公式如下: )()( 1 0i n i i szsz (3.14) 其中,z(s0)為 s0處的預(yù)測值; n 為預(yù)測計算過程中要使用的預(yù)測點(diǎn)周圍樣點(diǎn)的數(shù)量; i為預(yù)測計算過程中使用的各樣點(diǎn)的權(quán)重,該值隨著樣點(diǎn)與預(yù)測點(diǎn)之間 距離的增加而減少; z(si)是在 si出獲得的測量值。 確定權(quán)重的計算公式為: n i p i p ii dd 1 00 /1 1 n i i (3.15)其中,p 為指數(shù)值;di0是預(yù)測點(diǎn) s0與各已知樣點(diǎn) si之間的距離。 樣點(diǎn)在預(yù)測點(diǎn)值的計算過程中所占權(quán)重的大小受參數(shù) p 的影響;也就是說,隨著采 樣點(diǎn)與預(yù)測值之間距離的增加,標(biāo)準(zhǔn)樣點(diǎn)對預(yù)測點(diǎn)影響
48、的權(quán)重按指數(shù)規(guī)律減少。在預(yù)測 過程中,各樣點(diǎn)值對預(yù)測點(diǎn)值作用的權(quán)重大小是成比例的,這些權(quán)重值得總和為 1. 22 全局多項(xiàng)式插值 全局性插值方法以整個研究區(qū)的樣點(diǎn)數(shù)據(jù)集為基礎(chǔ),用一個多項(xiàng)式來計算預(yù)測值, 即用一個平面或曲面進(jìn)行全區(qū)特征擬合。全局多項(xiàng)式插值所得的表面很少能與實(shí)際的已 知樣點(diǎn)完全重合,所以全局插值法是非精確的插值法。利用全局性插值法生成的表面容 易受極高和極低樣點(diǎn)值得影響,尤其在研究區(qū)邊沿地帶,因此用于模擬的有關(guān)屬性在研 究區(qū)域內(nèi)。最好是變化平緩的。全局多項(xiàng)式插值法適用的情況有:1.當(dāng)一個研究區(qū)域的 表面變化緩慢,即這個表面上的樣點(diǎn)值由一個區(qū)域向另一個區(qū)域的變化平緩
49、時,可以采 用全局多項(xiàng)式插值法利用該研究區(qū)域內(nèi)的樣點(diǎn)對該研究區(qū)進(jìn)行表面插值。2.檢驗(yàn)長期變 化的、全局性趨勢的影響時一般采用全局多項(xiàng)式插值法,在這種情況下應(yīng)用的方法通常 被稱為趨勢面分析。 局部多項(xiàng)式插值 局部多項(xiàng)式插值采用多個多項(xiàng)式,每個多項(xiàng)式都處在特定重疊的鄰近區(qū)域內(nèi)。通過 使用搜索鄰近區(qū)域?qū)υ捒蚩梢远x搜索的鄰近區(qū)域。局部多項(xiàng)式插值法不是一個精確的 插值方法,但它能得到一個平滑的表面。建立平滑表面和確定變量的小范圍的變異可以 使用局部多項(xiàng)式插值法,特別是數(shù)據(jù)集中含有短程變異時,局部多項(xiàng)式插值法生成的表 面就能描述這種短程變異。 在局部多項(xiàng)式插值法中,鄰近區(qū)域的形狀、要用到
50、的樣點(diǎn)數(shù)量的最大值和最小值以 及扇區(qū)的構(gòu)造都需要進(jìn)行設(shè)定,還可以使用另外一種方法,就是通過拖動一個滑塊改變 參數(shù)值定義鄰近區(qū)域的寬度,這個參數(shù)以預(yù)測點(diǎn)與已知樣點(diǎn)之間的距離為基礎(chǔ),所用的 鄰近區(qū)域內(nèi)的采樣點(diǎn)的權(quán)重隨著預(yù)測點(diǎn)與標(biāo)準(zhǔn)點(diǎn)之間距離的增加而減小。因此,局部多 項(xiàng)式插值法產(chǎn)生的表面更多地用來解釋局部變異。 徑向基函數(shù)插值 從概念上來說,徑向基函數(shù)插值法如同將一個軟膜插入并經(jīng)過各個已知樣點(diǎn),同時 又使表面的總曲率最小。它不同于全局多項(xiàng)式和局部多項(xiàng)式插值方法,屬于精確插值方 法。所謂精確插值方法就是指表面必須經(jīng)過每一個已知樣點(diǎn)。徑向基函數(shù)包括五種不同 23 的基本函數(shù):平面樣條函
51、數(shù),張力樣條函數(shù),規(guī)則樣條函數(shù),高次曲面函數(shù)和反高次曲 面樣條函數(shù)。選擇何種基本函數(shù)意味著將以何種方式使徑向基表面穿過一系列已知樣點(diǎn)。 徑向基函數(shù)插值法適用于對大量點(diǎn)數(shù)據(jù)進(jìn)行插值計算,同時要求獲得平滑表面的情 況。將徑向基函數(shù)應(yīng)用于表面變化平緩的表面,如表面上平緩的點(diǎn)高程插值,能得到令 人滿意的結(jié)果。而在一段較短的水平距離內(nèi),表面值發(fā)生較大的變化,或無法確定采樣 點(diǎn)數(shù)據(jù)的準(zhǔn)確性,或采樣點(diǎn)數(shù)據(jù)具有很大的不確定性時,徑向基函數(shù)插值的方法并不適 用。 24 第四章 arcgis 地統(tǒng)計分析功能模塊 arcgis 地統(tǒng)計分析模塊主要由三個功能模塊組成,探索性數(shù)據(jù)分析(explore data) 、地統(tǒng)
52、計分析向?qū)В╣eostatistical wizard ) ,以及生成數(shù)據(jù)子集(create subsets) 。利用這些基本功能模塊,可以方便的完成多種地統(tǒng)計分析,創(chuàng)建完善的專題 地圖(表面預(yù)測) 4.1 探索性數(shù)據(jù)分析(explore data) 數(shù)據(jù)分析工具可以讓用戶更全面地了解所使用的數(shù)據(jù),以便于選取合適的參數(shù)及 方法。如,數(shù)據(jù)是否服從正態(tài)分布,是否存在某種趨勢等;在 arcgis 地統(tǒng)計分析模塊 中,內(nèi)嵌了多種探索性空間數(shù)據(jù)分析工具,包括 histogram(直方圖)、voronoi map(voronoi 地圖)、normal qqplot(正態(tài) qqplot 分布圖)、gener
53、al qqplot(普通 qqplot 分布圖)、trend analysis(趨勢分析)、semivariogram/covariance cloud(半 變異/協(xié)方差函數(shù)云)、crosscovariance cloud(正交協(xié)方差函數(shù)云)。這些探索性空間 數(shù)據(jù)分析工具對數(shù)據(jù)從不同的視圖,提供用戶用多種方式檢測空間數(shù)據(jù)。 4.1.1 數(shù)據(jù)分析工具 直方圖 直方圖指對采樣數(shù)據(jù)按一定的分級方案(等間隔分級、標(biāo)準(zhǔn)差分,等等)進(jìn)行分級, 統(tǒng)計采樣點(diǎn)落入各個級別中的個數(shù)或占總采樣數(shù)的百分比,并通過條帶圖或柱狀圖表現(xiàn) 出來。直方圖可以直觀的反映采樣數(shù)據(jù)分布特征、總體規(guī)律,可以用來檢驗(yàn)數(shù)據(jù)
54、分布和 尋找數(shù)據(jù)離群值。 25 圖 4.1 直方圖 參數(shù)含義: 1) bars:直方圖條帶個數(shù),也就是分級級數(shù)。 2) translation:數(shù)據(jù)變換方式。 3) none:對原始采樣數(shù)據(jù)的值不作變換,直接生成直方圖。 4) log:首先對原始采樣數(shù)據(jù)取對數(shù),再生成直方圖。 5) box-cox:首先對原始采樣數(shù)據(jù)進(jìn)行博克斯-考克斯變換(也稱冪變換) ,再生 成直方圖。 6) layer:當(dāng)前正在分析的數(shù)據(jù)圖層。 7) attribute:生成直方圖的屬性字段。 在直方圖右上方的小視窗中,顯示了一些基本統(tǒng)計信息,包括:個數(shù)(count) 、最 小值(min) 、最大值(max) 、平均值(m
55、ean) 、標(biāo)準(zhǔn)差(std. dev.) 、峰度(kurtosis) 、 偏態(tài)(skewness) 、1/4 分位數(shù)(1-st quartile) 、中數(shù)(median) 、3/4 分位數(shù)(3-rd quartile) ,通過這些信息可以對數(shù)據(jù)有個初步的了解。 四分位數(shù):如果將 n 個數(shù)值由小至大排列,第 n41 個數(shù)就是第一個四分位數(shù),通常 以 q1 來表示;第 n41 個數(shù)就是第二個四分位數(shù)(q2) ,即中位數(shù);第 n41 個數(shù)就是第三 個四分位數(shù)(q3) 。四分位距即為:q= q3- q1,它將極端的前 1/4 和后 1/4 去除,而利 用第三個與第一個分位數(shù)的差距來表示分散情形,因此避
56、免了極端值的影響。但它需要 將數(shù)據(jù)由小到大排序,且沒有利用全部數(shù)據(jù)。 峰度(kurtosis):用于描述數(shù)據(jù)分布高度的指標(biāo),正態(tài)分布的峰度等于 3。如果 數(shù)據(jù)的峰度大于 3,那么該數(shù)據(jù)的分布就會比正態(tài)分布高聳且狹窄,此時數(shù)據(jù)比正態(tài)分 布集中于平均數(shù)附近。反之,如果峰度小于 3,數(shù)據(jù)的分布就比正態(tài)分布平坦且寬闊, 26 此時數(shù)據(jù)比正態(tài)分布分散。 偏態(tài)(skewness):用于描述數(shù)據(jù)分布左右對稱性的指標(biāo),正態(tài)分布的偏態(tài)等于 0。如果數(shù)據(jù)的直方圖向右延伸,即大部分的數(shù)據(jù)集中于左邊,則偏態(tài)大于 0,稱為正偏 態(tài)或右偏態(tài)。如果數(shù)據(jù)的直方圖向左延伸,即大部分的數(shù)據(jù)集中于右邊,則偏態(tài)小于 0,稱為負(fù)偏態(tài)或
57、左偏態(tài)。 voronoi 圖 voronoi 地圖是由在樣點(diǎn)周圍形成的一系列多邊形組成的。某一樣點(diǎn)的 voronoi 多 邊形按下述方法生成:多邊形內(nèi)任何位置距這一樣點(diǎn)的距離都比該多邊形到其它樣點(diǎn)的 距離要將要近。voronoi 多邊形生成之后,相鄰的點(diǎn)就被定義為其 voronoi 多邊形與選 擇樣點(diǎn)的 voronoi 多邊形具有公共邊的其它樣點(diǎn)。 voronoi 地圖可以了解到每個采樣點(diǎn)控制的區(qū)域的范圍,也可以體現(xiàn)出每個采樣點(diǎn) 對區(qū)域內(nèi)插的重要性。利用 voronoi 地圖中就可以找出一些對區(qū)域內(nèi)插作用不大且可能 影響內(nèi)插精度的采樣點(diǎn)值,可以將它剔除。用聚類和熵的方法生成的 v
58、onoroi 圖可也可 用來幫助識別可能的離群值。自然界中,距離相近的事物比距離遠(yuǎn)的事物具有更大的相 似性。熵值是量度相鄰單元相異性的一個指標(biāo)。因此,局部離群值可以通過高熵值的區(qū) 域識別出來。同樣,一般認(rèn)為某個特定單元的值至少應(yīng)與它周圍單元中的某一個的值相 近。因此聚類方法也能將那些與它們周圍單元不相同的單元識別出來。 圖 4.2 voronoi 圖 27 參數(shù)說明: 1) type:分配和計算多邊形值的方法。 2) layer:當(dāng)前正在分析的數(shù)據(jù)圖層。 3) atrribute:生成直方圖的屬性字段。 voronoi map 對話框 type 選項(xiàng)提供了多種分 配和計算多邊形值的方法: (1
59、) 簡化(simple):分配到某個多邊形單元的值是該多邊形單元的方法。 (2) 平均(mean):分配到某個多邊形單元的值是這個單元與其相鄰單元的平均值。 (3) 模式(mode):所有的多邊形單元被分為五級區(qū)間,分配到某個多邊形單元的值是這個 單元與其相鄰單元的(級發(fā)生頻率的)模式。 (4) 聚類(cluster):所有的多邊形單元被分配到這五級區(qū)間中,如果某個多邊形 單元的級區(qū)間與它的相鄰單元的級區(qū)間都有不同,這個單元用灰色表示,以區(qū)別于其它 單元。 (5) 熵(entropy):所有單元都根據(jù)數(shù)據(jù)值的自然分組分配到這五級中。分配到某 個多邊形單元的值是根據(jù)該單元和其相鄰單元計算出來的熵
60、。 (6) 中值(median):分配給某多邊形的值是根據(jù)該單元和其相鄰單元的頻率分布計 算的中值。 (7) 標(biāo)準(zhǔn)差(stdev):分配給某多邊形的值是根據(jù)該單元和其相鄰單元計算出的標(biāo) 準(zhǔn)差。 (8) 四分位數(shù)間間隔(iqr):第一和第三四分位數(shù)是根據(jù)某單元和其相鄰單元的頻 率分布計算出來的。分配給某多邊形單元的值是用第三四分位數(shù)減去第一四分位數(shù)得到 的差。 voronoi 地圖可以了解到每個采樣點(diǎn)控制的區(qū)域的范圍,也可以體現(xiàn)出每個采樣點(diǎn) 對區(qū)域內(nèi)插的重要性。利用 voronoi 地圖中就可以找出一些對區(qū)域內(nèi)插作用不大且可能 影響內(nèi)插精度的采樣點(diǎn)值,可以將它剔除。用聚類和熵的方法生成的 von
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小麥加工資源增值策略考核試卷
- 土木工程建筑排水系統(tǒng)施工考核試卷
- 2017社保培訓(xùn)課件
- 孔樁勞務(wù)合同范本
- 民宅鋪面出售合同范本
- 碼頭設(shè)備采購合同范本
- 購買國外技術(shù)合同范本
- 熱水買賣合同范本
- led燈改造合同范本
- 寵物寄養(yǎng)服務(wù)中動物健康保證協(xié)議
- 22陳涉世家 司馬遷 公開課一等獎創(chuàng)新教學(xué)設(shè)計 度部編版初中語文九年級下冊
- 2021年飽和蒸汽及過熱蒸汽焓值表
- 《抗戰(zhàn)中的英雄人物》課件
- 外墻真石漆施工方案
- 森林防火安全生產(chǎn)工作
- 《服裝市場營銷》課件
- 網(wǎng)絡(luò)安全風(fēng)險評估報告模板
- 什么是法律談判課件
- 成考教材-數(shù)學(xué)教程(文史財經(jīng)類)
- 保安服務(wù)管理制度范文
- 汽車行業(yè)維修記錄管理制度
評論
0/150
提交評論