第04章空間數(shù)據(jù)挖掘與GIS的集成_第1頁
第04章空間數(shù)據(jù)挖掘與GIS的集成_第2頁
第04章空間數(shù)據(jù)挖掘與GIS的集成_第3頁
第04章空間數(shù)據(jù)挖掘與GIS的集成_第4頁
第04章空間數(shù)據(jù)挖掘與GIS的集成_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2021年11月17日星期三1第第四四章章 空間知識與空間知識與GISGIS的集成的集成 nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n日益發(fā)展的空間數(shù)據(jù)基礎設施為空間數(shù)據(jù)的自動化處理提出了新的課題。n空間數(shù)據(jù)庫,不同于關系數(shù)據(jù)庫,它一般具有空間拓撲或距離信息,通常需要以復雜的多維空間索引結構組織。n空間挖掘(Spatial Mining)

2、或被稱作空間數(shù)據(jù)挖掘/空間數(shù)據(jù)庫的知識發(fā)現(xiàn),是數(shù)據(jù)挖掘技術在空間數(shù)據(jù)方面的應用。簡言之,空間數(shù)據(jù)挖掘,就是從空間數(shù)據(jù)庫中抽取隱含的知識、空間關系或非顯式地存儲在空間數(shù)據(jù)庫中的其他模式,用于理解空間數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)間(空間或非空間)的關系。n由于空間數(shù)據(jù)的復雜性及其應用的專業(yè)性,在一般的數(shù)據(jù)挖掘的基本概念的基礎上,需要研究空間數(shù)據(jù)挖掘特有的理論、方法和應用。2021年11月17日星期三23S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2021年11月17日星期三3第四章第四章 空間知識與空間知識與GISGIS的集成的集成 內(nèi)容提要內(nèi)容提要nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基

3、礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n兩個空間實體之間存在若干拓撲關系。這些關系基于兩個實體的位置:n分離(Disjoint) :A與B分離,表示B中任何點都不在A中,反之亦然。n重疊/相交: A與B重疊或相交表示至少有一個點既在A里也在B里。n等價: A與B這兩個實體的所有點都是共有的。n包含于: A包含于B,表示A的所有點都在B里。反之不一定。n覆蓋/包含: A覆蓋或包含B,當且僅當B包含于A。n根據(jù)實體在空間中的位置,可以定義方向,

4、通常采用的是傳統(tǒng)的地圖方向:像東、南、西、北等等。n空間謂詞有三種形式:n表示拓撲關系的謂詞,如相交、覆蓋等;n表示空間方向的謂詞,如東、西、左、右等;n表示距離的謂詞,如接近、遠離等。2021年11月17日星期三43S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n常用的兩個空間實體之間的距離有:n最小值方法:最小值方法:定義實體A和B的距離為A中的所有點與和B中的所有點之間的歐氏或曼哈頓距離中最小的,即n最大值方法:最大值方法:定義實體A和B的距離為A中的所有點與和B中的所有點之間的歐氏或曼哈頓距離中最大的,即n平均值方法:平均值方法:定義實體A和B的距離為A中的所有點與和

5、B中的所有點之間的歐氏或曼哈頓距離的平均值,即n中心方法:中心方法:定義實體A和B的距離為A中的中心點與和B中的中心點之間的歐氏或曼哈頓距離的平均值,即),(),(min),(),( ,),(bbaaByxAyxyxyxdisBAdisbbaa),(),(max),(),( ,),(bbaaByxAyxyxyxdisBAdisbbaa2021年11月17日星期三5),(),(),(),( ,),(bbaaByxAyxyxyxdisaverageBAdisbbaa),(),(),(cbcbcacayxyxdisBAdis3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n空間統(tǒng)計

6、學(Spatial Statistics)是依靠有序的模型來描述無序事件,根據(jù)不確定性和有限的信息來分析、評價和預測空間數(shù)據(jù)。n空間統(tǒng)計學是基本的數(shù)據(jù)挖掘技術,特別是多元統(tǒng)計分析(如判別分析、主成分分析、因子分析、相關分析、多元回歸分析等)。n在空間數(shù)據(jù)庫中許多空間數(shù)據(jù)通常是相關的,即空間對象受其鄰近對象的影響,它是空間統(tǒng)計學向著實用的挖掘技術發(fā)展的一個重要研究課題。n數(shù)理統(tǒng)計方法對非線性規(guī)劃不能很好建模,難以處理不完全或不確定性數(shù)據(jù),而且運算的代價較高。它是空間統(tǒng)計學向著實用的挖掘技術發(fā)展的另一個研究課題。2021年11月17日星期三63S3S集成與應用集成與應用中南大學中南大學GIS研究中

7、心研究中心2021年11月17日星期三7第四章第四章 空間知識與空間知識與GISGIS的集成的集成 內(nèi)容提要內(nèi)容提要nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n概念層次的使用顯示了數(shù)據(jù)間關系的層次。應用空間數(shù)據(jù)特性,概念層次承認了層級中不同層次規(guī)則和關系的發(fā)展。n從空間數(shù)據(jù)中挖掘所蘊含的概念是空間挖掘的重要任務之一。n泛化與特化是概念歸納的主要手段,它對空間數(shù)據(jù)挖掘也是如此。2021年11月17日星期三

8、83S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n逐步求精(Progressive Refinement)的分層是基于空間關系的,因此空間關系可以應用在一個更粗糙或者更精細的層次上。n由于空間應用的數(shù)據(jù)量十分龐大,在尋求更多精確響應之前要先做出一些近似響應。MBR就是一個近似物體形狀的辦法。四叉樹、R-樹和其他大多數(shù)空間索引技術都采用了一種逐步求精的方式。n逐步求精可以看作是對處理問題無用的數(shù)據(jù)所做的過濾。2021年11月17日星期三93S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n數(shù)據(jù)庫中的數(shù)據(jù)和對象在原始的概念層次包含有詳細的信息,經(jīng)常需要將大量數(shù)據(jù)

9、的集合進行概括并以較高的概念層次展示,即對數(shù)據(jù)進行泛化。n基于泛化的數(shù)據(jù)挖掘方法假定背景知識以概念層次的形式存在。概念層次可由專家提供,或借助數(shù)據(jù)分析自動生成。n空間數(shù)據(jù)庫中可以定義兩種類型的概念層次:n空間概念層:地理區(qū)域之間空間關系的概念層次。n非空間概念層:非空間屬性所聯(lián)系的非空間數(shù)據(jù)對應的概念層次。2021年11月17日星期三103S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n首先對非空間屬性作面向?qū)傩缘臍w納,將其泛化至更高的概念層次。n對空間數(shù)據(jù)進行歸納:歸納進行至區(qū)域的數(shù)量達到閾值為止。然后對相關的非空間屬性做相應地更改。n將具有相同的泛化屬性值的相鄰區(qū)域合并在

10、一起,可用鄰近方法忽略具有不同非空間描述的小區(qū)域。n例如,要知道我國西北部地區(qū)的平均降雨量,可以在空間層次中尋找西北部所有省,再對非空間屬性(降雨量)進行比較,或者歸納(平均降雨量多、中等、少量等)。2021年11月17日星期三113S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n統(tǒng)計學信息網(wǎng)格方法(STatistical INformation Grid-based methodSTING),使用了一種類似四叉樹的分層技術,把空間區(qū)域分成矩形單元。n對空間數(shù)據(jù)庫掃描一次,可以找到每個單元的統(tǒng)計參數(shù)(平均數(shù),變化性,分布類型)。n網(wǎng)格結構中的每個結點概括了該網(wǎng)格中所含內(nèi)部屬性

11、的信息。nSTING方法可以看作是一種層次聚類技術。層級的頂層的組成就是整體空間。最低層是代表每個最小單元的葉子結點。如果使用一個單元在下一層中擁有四個子單元(網(wǎng)格)的話,單元的分割與四叉樹中是一樣的。2021年11月17日星期三123S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2021年11月17日星期三13空間知識與空間知識與GISGIS的集成的集成 內(nèi)容提要內(nèi)容提要nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學

12、中南大學GIS研究中心研究中心n空間規(guī)則可以概括對空間實體的結構及其之間關系的描述。在空間數(shù)據(jù)挖掘中有三種類型的規(guī)則:n空間特性規(guī)則:描述數(shù)據(jù),如:中國東部人均年收入約5萬元。n空間判別規(guī)則:描述不同種類數(shù)據(jù)間的差異,依靠它們能夠區(qū)分不同種類的特點。如:中國東部人均收入高于中國西部。n空間關聯(lián)規(guī)則:是兩個數(shù)據(jù)集合之間的關聯(lián)。如越靠近市中心區(qū)的房價越高。n所有這些規(guī)則都可以被看作是對空間類型的描述,而描述是一種為數(shù)據(jù)庫或者其中一些子集找到一個表示的方法。特性規(guī)則是一種最簡化的形式。2021年11月17日星期三143S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n空間關聯(lián)規(guī)則挖掘

13、是傳統(tǒng)關聯(lián)規(guī)則挖掘的延伸,常用最小支持度和最小可信度來作為基本的統(tǒng)計參數(shù),由于空間數(shù)據(jù)的特點,往往是在多層概念上進行歸納。n空間關聯(lián)規(guī)則是空間數(shù)據(jù)實體之間的關聯(lián),有:n非空間的先決條件和空間性的結果:如所有的重點學校都是位于老住宅區(qū)附近。n空間性先決條件和非空間的結果:如在市中心的房價就比較貴。n空間性先決條件和空間性結果:如在化工廠都分布市郊。n挖掘空間關聯(lián)規(guī)則的有效方法是自上而下、逐步加深的搜索技術,在空間數(shù)據(jù)庫的概念中搜索頻繁模式。2021年11月17日星期三153S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2021年11月17日星期三16空間知識與空間知識與GISG

14、IS的集成的集成 內(nèi)容提要內(nèi)容提要nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n空間分類方法用來對空間實體的集合進行分類。給空間實體分類,可以通過非空間屬性或空間屬性或二者結合,并可利用概念層次來進行取樣。對于樣本數(shù)據(jù)的訓練可以通過改造傳統(tǒng)的分類算法來完成,例如,對ID3算法擴展。2021年11月17日星期三173S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n空間聚類算法必須在大型多維

15、數(shù)據(jù)庫上有效工作,而且應該能夠探測到不同形狀的聚類。n空間聚類找到的聚類不應該依賴于檢驗空間中的點的順序,而且聚類也不應該受不相干的點影響。n傳統(tǒng)的聚類算法可以通過改造來實現(xiàn)空間數(shù)據(jù)聚類。nDBSCANnK-MeansnSTINGnWaveCluster2021年11月17日星期三183S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2021年11月17日星期三19第四章第四章 空間知識與空間知識與GISGIS的集成的集成 內(nèi)容提要內(nèi)容提要nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n

16、空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心1空間在線分析挖掘空間在線分析挖掘n空間在線分析挖掘(SOLAM:Spatial Online Analytical Mining)建立在多維視圖基礎之上,是基于網(wǎng)絡的驗證型空間數(shù)據(jù)挖掘和分析工具。 n空間在線分析挖掘通過數(shù)據(jù)分析與報表模塊的查詢和分析工具(OLAP、決策分析、數(shù)據(jù)挖掘)完成對信息和知識的提取,以滿足決策的需要。n美國BusinessObjects公司的BusinessObjects(BO)就是采用Dataarehouse+OLAP+DataMining方案推出的第一個集多數(shù)據(jù)源查詢

17、、任意報表生成和OLAP及數(shù)據(jù)挖掘技術為一體的決策支持工具軟件包。2021年11月17日星期三203S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2挖掘圖像數(shù)據(jù)庫的方法挖掘圖像數(shù)據(jù)庫的方法n圖像數(shù)據(jù)庫是一類特殊的空間數(shù)據(jù)庫,其數(shù)據(jù)幾乎全部是圖像或圖片。圖像數(shù)據(jù)庫用于遙感、醫(yī)學圖像等應用,通常以柵格形式表示,柵格代表一個或多個光譜范圍的圖像密度。n圖像數(shù)據(jù)庫的挖掘可以看成是空間數(shù)據(jù)挖掘的一部分,其主要問題在于如何區(qū)分圖像。2021年11月17日星期三213S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心3基于基于Rough集方法集方法nRough集理論被廣泛研究

18、并應用于不精確、不確定、不完全的信息的分類分析和知識獲取中。Rough集理論為空間數(shù)據(jù)的屬性分析和知識發(fā)現(xiàn)開辟了一條新途徑,可用于空間數(shù)據(jù)庫屬性表的一致性分析、屬性的重要性、屬性依賴、屬性表簡化、最小決策和分類算法生成等。Rough集方法與其他知識發(fā)現(xiàn)方法相結合,可以在數(shù)據(jù)庫中數(shù)據(jù)不確定情況下獲取多種知識。4基于云理論挖掘方法基于云理論挖掘方法n云理論是由李德毅等提出的一種用于處理不確定性的新理論,由云模型、不確定性推理和云變換三大支柱構成。云理論將模糊性和隨機性結合起來,解決了作為模糊集理論基石的隸屬函數(shù)概念的固有缺陷,為KDD中定量與定性相結合的處理方法奠定了基礎,可以用于處理GIS中融隨

19、機性和模糊性為一體的屬性不確定性。 2021年11月17日星期三223S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心5探測性的數(shù)據(jù)分析(探測性的數(shù)據(jù)分析(EDA)n探測性的數(shù)據(jù)分析,簡稱EDA,采用動態(tài)統(tǒng)計圖形和動態(tài)鏈接窗口技術將數(shù)據(jù)及其統(tǒng)計特征顯示出來,可發(fā)現(xiàn)數(shù)據(jù)中非直觀的數(shù)據(jù)特征及異常數(shù)據(jù)。nEDA技術在知識發(fā)現(xiàn)中用于選取感興趣的數(shù)據(jù)子集,即數(shù)據(jù)聚焦,并可初步發(fā)現(xiàn)隱含在數(shù)據(jù)中的某些特征和規(guī)律。6可視化可視化n現(xiàn)代的數(shù)據(jù)可視化(Data Visualization)技術是指運用計算機圖形學和圖像處理技術,將數(shù)據(jù)轉換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技

20、術。n涉及到計算機圖形學、圖像處理、計算機輔助設計、計算機視覺及人機交互技術等多個領域。數(shù)據(jù)可視化概念首先來自科學計算可視化。2021年11月17日星期三233S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心2021年11月17日星期三24第四章第四章 空間知識與空間知識與GISGIS的集成的集成 內(nèi)容提要內(nèi)容提要nSK與GIS集成的意義 n空間數(shù)據(jù)挖掘基礎n空間數(shù)據(jù)泛化在GIS中的應用n空間規(guī)則與GIS的集成n空間分類、聚類方法n空間挖掘的其他問題n空間數(shù)據(jù)挖掘原型系統(tǒng)介紹n其他3S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n加拿大Simon Fraser

21、大學開發(fā)的GeoMiner很有代表性,包含有三大模塊:n空間數(shù)據(jù)立方體構建模塊n空間聯(lián)機分析處理(OLAP)模塊和n空間數(shù)據(jù)挖掘模塊-空間數(shù)據(jù)挖掘語言是GMQLn目前已能挖掘三種類型的規(guī)則:n特征規(guī)則、n判別規(guī)則n關聯(lián)規(guī)則2021年11月17日星期三253S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n空間數(shù)據(jù)挖掘的研究比一般的關系型數(shù)據(jù)庫和事務數(shù)據(jù)庫的研究要晚n加拿大西蒙弗雷澤大學、德國慕尼黑大學、芬蘭赫爾辛基大學以及美國、澳大利亞等國家的許多大學和研究所,都有空間數(shù)據(jù)挖掘的成果報道。 n目前,在空間數(shù)據(jù)挖掘系統(tǒng)的開發(fā)方面,國際上有代表性的通用SDM系統(tǒng)有:GeoMiner

22、,Descartes和ArcView GIS的S-PLUS接口。 n在國內(nèi),目前已經(jīng)開展空間數(shù)據(jù)挖掘的單位主要有:北京大學、武漢大學、中科院軟件所、中科院地理所資源與環(huán)境信息系統(tǒng)國家重點實驗室、中科院遙感所、中國測繪科學研究院等。 2021年11月17日星期三263S3S集成與應用集成與應用中南大學中南大學GIS研究中心研究中心n1在面向?qū)ο蟮目臻g數(shù)據(jù)庫中進行數(shù)據(jù)挖掘在面向?qū)ο蟮目臻g數(shù)據(jù)庫中進行數(shù)據(jù)挖掘n2進行不確定性挖掘進行不確定性挖掘n3多邊形聚類技術多邊形聚類技術n4模糊空間關聯(lián)規(guī)則的挖掘模糊空間關聯(lián)規(guī)則的挖掘n5挖掘空間數(shù)據(jù)的偏離和演變規(guī)則挖掘空間數(shù)據(jù)的偏離和演變規(guī)則n6多維規(guī)則可視化多維規(guī)則可視化n7多多技術集成技術集成n8高效的分類算法高效的分類算法n9空間數(shù)據(jù)挖掘查詢語言空間數(shù)據(jù)挖掘查詢語言n10遙感遙感影像的挖掘影像的挖掘n13智能智能GIS方法方法n14并行數(shù)據(jù)并行數(shù)據(jù)挖掘挖掘20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論