![空間數(shù)據(jù)挖掘的常用方法_第1頁](http://file4.renrendoc.com/view/78d5f2cd0da199996a446cffc86f582e/78d5f2cd0da199996a446cffc86f582e1.gif)
![空間數(shù)據(jù)挖掘的常用方法_第2頁](http://file4.renrendoc.com/view/78d5f2cd0da199996a446cffc86f582e/78d5f2cd0da199996a446cffc86f582e2.gif)
![空間數(shù)據(jù)挖掘的常用方法_第3頁](http://file4.renrendoc.com/view/78d5f2cd0da199996a446cffc86f582e/78d5f2cd0da199996a446cffc86f582e3.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、4.1 空間分析方法空間分析是指利用 GIS 的各種空間分析模型和空間操作對空間數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行深加工,從而產(chǎn)生新的信息和知識,其結(jié)果取決于被 分析對象的位置,可采用拓?fù)浣Y(jié)構(gòu)分析、空間緩沖區(qū)及距離分析、疊置分析等方法,旨在發(fā)現(xiàn)目標(biāo)在空間上的相連、相鄰和共生等關(guān)聯(lián) 關(guān)系。這些技術(shù)不僅需要獲取對象的位置,還需要知道對象的屬性。 GIS 數(shù)據(jù)庫中的空間數(shù)據(jù)提供了空間分析所需要的位置,非空間數(shù) 據(jù)提供了對象的屬性數(shù)據(jù),因此 GIS 數(shù)據(jù)庫提供了空間分析所需要的各種數(shù)據(jù),可以進(jìn)行空間分析。空間分析的主要目的是從空間關(guān)系中開發(fā)數(shù)據(jù),以得到空間的內(nèi)部關(guān)系并加以理解。例如空間分析中的探測性空間分析方法不僅可
2、以揭 示空間數(shù)據(jù)庫中許多非直觀的內(nèi)容,如空間異常點、層次關(guān)系、時域變化及空間交互模型,還可以揭示用傳統(tǒng)的地圖不能辨明的數(shù)據(jù)模 為了達(dá)到此目的,空間分析應(yīng)利用和開發(fā) GIS 及其數(shù)字環(huán)境。在這種數(shù)字環(huán)境中,數(shù)據(jù)的比例尺寸能夠很方便地改變,能放下層次間的 不連續(xù)性,還能將不同的數(shù)據(jù)媒介如文字、聲音、圖形和影像聯(lián)結(jié)在一起。此外,數(shù)字環(huán)境要能提供物體間更廣泛的聯(lián)系,因為地圖上只是表明了物體空間上的接近及鄰近關(guān)系,而不能提供物體間的相互作 用,以及文化、貿(mào)易和社會網(wǎng)絡(luò)的聯(lián)系。在面向?qū)ο蟮沫h(huán)境中,屬性和空間數(shù)據(jù)統(tǒng)一在一個對象中存儲和管理,以上這些想法相對而言更易于實現(xiàn)。從現(xiàn)實來看,地理位置與地形、土壤、植
3、被及氣候 等要素是緊密相關(guān)的,相互制約的。所以說屬性與空間數(shù)據(jù)是一對矛盾統(tǒng)一體,如果能找到屬性形成與空間分布的對應(yīng)關(guān)系,那么若已 知某一對象的屬性則可知道其相應(yīng)的空間分布,若已知其空間分布情況,則也可以根據(jù)其對應(yīng)關(guān)系知道其相應(yīng)的屬性。4.2 統(tǒng)計的方法統(tǒng)計的方法一直是 DM 中最主要的方法,有著較強(qiáng)的理論基礎(chǔ),擁有大量的算法,可有效地處理數(shù)字型數(shù)據(jù),在 A I 領(lǐng)域的關(guān)系數(shù)據(jù)庫中它已經(jīng)得到了充分的利用,它還可以用于空間數(shù)據(jù)庫中。這類方法有時需要數(shù)據(jù)滿足統(tǒng)計不相關(guān)假設(shè),但很多情況下這種假設(shè)在空間 數(shù)據(jù)庫中難以滿足,另外,統(tǒng)計方法還難以處理字符型數(shù)據(jù)。應(yīng)用統(tǒng)計方法需要有領(lǐng)域知識和統(tǒng)計知識,一般由具
4、有統(tǒng)計經(jīng)驗的領(lǐng)域?qū)<襾硗瓿伞H缭谶b感影像分析中,對影像進(jìn)行監(jiān)督分類和非監(jiān)督分類,都是利用統(tǒng)計的方法得出影像模式后,再按此模式對影像分類。實際上,遙感影像的計算機(jī)自動分類也可算是較簡單的 DM 過程,只是其數(shù)據(jù)為一些以柵格方式存儲的影像數(shù)據(jù),而不是像關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)那樣以關(guān)系元組的方式存儲。4.3 歸納和演繹的方法歸納方法是一種邏輯方法,是從數(shù)據(jù)庫中獲取知識的最基本的方法,即從多個已存在的事實中歸納出規(guī)則。在 GIS 中,無論是屬性數(shù)據(jù)還是空間拓?fù)潢P(guān)系,若進(jìn)行抽象和概括時,均可用到此方法。大部分算法歸納學(xué)習(xí)的算法來源于機(jī)器學(xué)習(xí)領(lǐng)域,有很多算法:如 Michaski 歸納法一般需要背景知識,常以
5、概念樹的形式給出。在 GIS 數(shù)據(jù)庫中,可有屬性概念樹和空間關(guān)系概念樹兩類。背景知識由用戶提供, 在有些情況下也可以作為知識發(fā)現(xiàn)任務(wù)的一部分自動獲取。如在對游牧民族地區(qū)草資源調(diào)查中,通過相鄰分析,便可歸納出只要有蒙古 包,其周圍都有草地,且附近必有淡水湖泊。這樣的規(guī)則完全可以從 GIS 數(shù)據(jù)庫中發(fā)現(xiàn),并用于以后的遙感調(diào)查和建立新的 GIS 。 4.4 聚類與分類的方法聚類和分類方法按一定的距離或相似性系數(shù)將數(shù)據(jù)分成一系列相互區(qū)分的組。分類和聚類都是對目標(biāo)進(jìn)行空間劃分,劃分的標(biāo)準(zhǔn)是類內(nèi) 差別最小而類間差別最大。分類和聚類的區(qū)別在于分類事先知道類別數(shù)和各類的典型特征,而聚類則事先不知道。聚類分析方
6、法按一定的距離或相似性測度將數(shù)據(jù)分成一系列相互區(qū)分的組,它與歸納法不同之處在于不需要背景知識而直接發(fā)現(xiàn)一些有 意義的結(jié)構(gòu)與模式。經(jīng)典統(tǒng)計學(xué)中的聚類分析方法對屬性數(shù)據(jù)庫中的大數(shù)據(jù)量存在速度慢、效率低的問題,對圖形數(shù)據(jù)庫應(yīng)發(fā)展空間聚 類方法。常用的經(jīng)典聚類方法有 Kmean 、Kmeriod 和 ISO DATA 等。4.5 探測性的數(shù)據(jù)分析李德仁、邸凱昌等提出的探測性的數(shù)據(jù)分析,簡稱 EDA ,采用動態(tài)統(tǒng)計圖形和動態(tài)鏈接窗口技術(shù)將數(shù)據(jù)及其統(tǒng)計特征顯示出來,可發(fā)現(xiàn)數(shù)據(jù)中非直觀的數(shù)據(jù)特征及異常數(shù)據(jù)。EDA 與空間分析相結(jié)合,構(gòu)成探測性的空間分析 (簡稱 ESA )。EDA 和 ESA 技術(shù)在知識發(fā)現(xiàn)
7、中用于選取感興趣的數(shù)據(jù)子集,即數(shù)據(jù)聚焦,并可初步發(fā)現(xiàn)隱含在數(shù)據(jù)中的某些特征和規(guī)律。4.6 粗集(Rough 集)方法粗集理論是波蘭華沙大學(xué) Z.Paw lak 教授在 1982 年提出的一種智能數(shù)據(jù)決策分析工具,被廣泛研究并應(yīng)用于不精確、不確定、不完全的 分類分析和知識獲取。粗集理論為 GIS 的屬性分析和知識發(fā)現(xiàn)開辟了 一條新途徑,可用于 GIS 數(shù)據(jù)庫屬性表的一致性分析、屬性的重要性、屬性依賴、屬性表簡化、最小決策和分類算法生成等。粗集理論與其它知識發(fā)現(xiàn)方法相結(jié)合,可以在 GIS 數(shù)據(jù)庫中數(shù)據(jù)不確定情況下獲取多種知識。例如,在經(jīng)過統(tǒng)計和歸納從原始數(shù)據(jù)得到 普遍化數(shù)據(jù)的基礎(chǔ)上,粗集用于普遍化
8、數(shù)據(jù)的進(jìn)一步簡化和最小決策算法生成,使得在保持普遍化數(shù)據(jù)內(nèi)涵的前提下最大限度地精練知 4.7 云理論云理論是李德仁、邸凱昌等為解決模糊集在隸屬度概念上的不確定性而提出的一種新理論,由云模型、不確定性推理和云變換 3 大支柱構(gòu)成,包括云模型、虛云、云運算、云變換和不確定性推理等主要內(nèi)容。云理論將模糊性和隨機(jī)性結(jié)合起來,解決了作為模糊集理論基石的隸屬函數(shù)概念的固有缺陷,為 KDD 中定量與定性相結(jié)合的處理方法奠 定了基礎(chǔ)。運用云理論進(jìn)行空間數(shù)據(jù)挖掘,可進(jìn)行概念和知識的表達(dá)、定量和定性的轉(zhuǎn)化、概念的綜合與分解、從數(shù)據(jù)中生成概念和概念層次結(jié)構(gòu)、不確定性推理和預(yù)測等。4.8 空間特征和趨勢探測方法這是
9、Ester 等人在第 4 屆 KDD 國際研討會( 1998)上提出的基于鄰域圖( neighbo rhood graphs )和鄰域路徑( neighbo rhood path )概Ester 等將一個空間特征定義為空間數(shù)據(jù)庫中具有空間 /非空間性質(zhì)的目標(biāo)對象集,并以非空間屬性值出現(xiàn)的相對頻率和不同空間對象出 現(xiàn)的相對頻率(目標(biāo)對象集相對于整個數(shù)據(jù)庫)作為感興趣的性質(zhì),從空間目標(biāo)集合經(jīng)過它的相鄰擴(kuò)展后的集合中,發(fā)現(xiàn)相對頻率的明 ,以此提取空間規(guī)則。空間趨勢探測挖掘是從一個開始點出發(fā),發(fā)現(xiàn)一個或多個非空間性質(zhì)的變化規(guī)律。這種算法的效率在很大程度上取決于其處理相鄰關(guān)系4.9 數(shù)字地圖圖像分析和模
10、式識別方法空間數(shù)據(jù)庫(數(shù)據(jù)倉庫)中含有大量的圖形圖像數(shù)據(jù),一些圖像分析和模式識別方法可直接用于挖掘數(shù)據(jù)和發(fā)現(xiàn)知識,或作為其他挖掘 用于圖像分析和模式識別的方法主要有:決策樹( Decision Tree )方法、神經(jīng)元網(wǎng)絡(luò)(A rtificial Neural Netw ork)方法、數(shù)學(xué)形態(tài)學(xué)方法、4.10 可視化方法可視化技術(shù)使用戶看到數(shù)據(jù)處理的全過程、監(jiān)測并控制數(shù)據(jù)分析過程。當(dāng)顯示 SDM 發(fā)現(xiàn)的結(jié)果時,將地圖同時顯示作為背景,一方面能 夠顯示其知識特征的分布規(guī)律,另一方面也可對挖掘出的結(jié)果進(jìn)行可視化解釋,從而達(dá)到最佳的分析效果??梢暬瘮?shù)據(jù)分析技術(shù)拓寬了傳統(tǒng)的圖表功能,使用戶對數(shù)據(jù)的剖析更
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度高校教師科研合作與成果轉(zhuǎn)化合同
- 二零二五年度汽車租賃抵押貸款服務(wù)合同
- 合同法修訂趨勢分析-深度研究
- 二零二五年度農(nóng)業(yè)土地承包權(quán)轉(zhuǎn)讓與農(nóng)業(yè)保險合作合同范本
- 2025-2030全球醫(yī)藥包裝用鋁箔行業(yè)調(diào)研及趨勢分析報告
- 旅游服務(wù)海上運輸合同樣本
- 2025年度農(nóng)家樂經(jīng)營權(quán)轉(zhuǎn)讓及租金支付標(biāo)準(zhǔn)合同
- 豪華酒店轉(zhuǎn)讓居間合同
- 瑜伽館裝修監(jiān)理合同模板
- 智能電網(wǎng)技術(shù)推廣應(yīng)用合同
- 2025-2030年中國清真食品行業(yè)運行狀況及投資發(fā)展前景預(yù)測報告
- 廣東省茂名市電白區(qū)2024-2025學(xué)年七年級上學(xué)期期末質(zhì)量監(jiān)測生物學(xué)試卷(含答案)
- 《教育強(qiáng)國建設(shè)規(guī)劃綱要(2024-2035年)》全文
- 山東省濱州市2024-2025學(xué)年高二上學(xué)期期末地理試題( 含答案)
- 2025年河南洛陽市孟津區(qū)引進(jìn)研究生學(xué)歷人才50人歷年高頻重點提升(共500題)附帶答案詳解
- 2025年度軍人軍事秘密保護(hù)保密協(xié)議與信息安全風(fēng)險評估合同3篇
- 蛋雞生產(chǎn)飼養(yǎng)養(yǎng)殖培訓(xùn)課件
- 數(shù)字化轉(zhuǎn)型中的職業(yè)能力重構(gòu)
- 運用PDCA降低住院患者跌倒-墜床發(fā)生率
- 2025屆高中數(shù)學(xué)一輪復(fù)習(xí)專練:橢圓(含解析)
- 立春氣象與生活影響模板
評論
0/150
提交評論