版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一章地理空間數(shù)據(jù)分析與GIS各種類型的GIS中存貯了海量的地理空間數(shù)據(jù),且數(shù)據(jù)還在以指數(shù)級方式不斷增長,迫切需要高效、精確、科學地分析這些數(shù)據(jù),以找出數(shù)據(jù)所蘊涵的意義,進而了解事物的性質與規(guī)律,為科學決策提供必需的信息。所以,開發(fā)一些工具來進行一般性地理空間數(shù)據(jù)分析和復雜的地理空間對象模擬,以將數(shù)據(jù)“點石成金”是一項艱巨而又緊迫的任務。因此,GIS領域由原來重點關注數(shù)據(jù)庫創(chuàng)建和系統(tǒng)開發(fā)建設,逐漸轉向重點關注空間分析和空間建模。GIS的奠基人之一M.F.Goodchild曾指出:“地理信息系統(tǒng)真正的功能在于它利用空間分析技術,對空間數(shù)據(jù)的分析”??臻g分析使GIS超越一般空間數(shù)據(jù)庫、信息系統(tǒng)和地圖制圖系統(tǒng),成為不僅能進行海量空間數(shù)據(jù)管理、信息查詢檢索與量測,更可通過圖形操作與數(shù)學模擬運算分析出地理空間數(shù)據(jù)中隱藏的模式、關系和趨勢,挖掘出對科學決策具有指導意義的信息,從而解決復雜的地學應用問題,進行地學綜合研究的技術系統(tǒng)。目前多數(shù)地理信息系統(tǒng)的應用還局限于數(shù)據(jù)庫型GIS層面上,沒有充分利用和開發(fā)GIS的空間分析功能。因此,建立完善的空間數(shù)據(jù)分析理論和方法體系,集成先進的空間數(shù)據(jù)分析工具,增強GIS的空間分析能力,使數(shù)據(jù)庫型GIS上升為分析型GIS,是GIS技術與應用的發(fā)展目標和趨勢。1.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS1.1地理空間數(shù)據(jù)處理與建模
地理空間數(shù)據(jù)分析是地理學和地理信息科學領域的重要研究內容,它通過研究地理空間數(shù)據(jù)及其相應分析理論、方法和技術,探索、證明地理要素之間的關系,揭示地理特征和過程的內在規(guī)律和機理,實現(xiàn)對地理空間信息的認知、解釋、預測和調控。
1.1.1數(shù)量地理學數(shù)量地理學(QuantitativeGeography)又稱計量地理學或地理數(shù)量方法,是應用數(shù)學思想方法和計算機技術進行地理學研究的科學。它試圖以定量的精確判斷來彌補定性文字描述的不足;以抽象的、反映本質的數(shù)學模型去刻畫具體的、龐雜的各種地理現(xiàn)象;以對過程的模擬和預測來代替對現(xiàn)狀的分析和說明;以合理的趨勢推導和反饋機制分析來代替簡單的因果關系分析。
理論分析應用研究地理事物的時空分布、相互關系和地理區(qū)劃地理系統(tǒng)預測、控制和規(guī)劃地理現(xiàn)象的規(guī)律地理事物發(fā)生發(fā)展的過程數(shù)據(jù)整理實驗數(shù)據(jù)調查數(shù)據(jù)統(tǒng)計數(shù)據(jù)……計量地理學的特征以定量的精確判斷來補充定性文字描述的不足以抽象且能反映本質的數(shù)學模型去反映具體的龐雜的各種地理現(xiàn)象以地理過程的模擬和預測代替對現(xiàn)狀的解釋和對未來的主觀推測以內在機理推導代替簡單的因果關系分析地理學向定量化、精確化發(fā)展地理學發(fā)展階段:古代地理學——記載地理知識為主;近代地理學——地理現(xiàn)象條理化歸納,地理現(xiàn)象之間的關系解釋性描述;
現(xiàn)代地理學——定性與定量相結合,規(guī)范研究與實證研究并舉,解釋各種地理現(xiàn)象的內在機制并預測其未來演變。地理學定量研究的顯著進展是在20世紀50-70年代。數(shù)量地理學的產(chǎn)生與發(fā)展計量運動的萌芽1953年,舍弗爾(F.K.Schaefer)發(fā)表《地理學中的例外論》,批評哈特向的“地域獨特主義”。
其觀點:地理學是解釋現(xiàn)象,而不應該是羅列現(xiàn)象;解釋現(xiàn)象必須有法則,應該把地理現(xiàn)象看成是法則的實例;地理學的目的與其他科學有相似之處:都是追求、探索法則的。
舍弗爾等人對區(qū)域學派的批評與否定,拉開了現(xiàn)代地理學發(fā)展史上的計量運動的帷幕。第一階段(20世紀50年代末——60年代末)把統(tǒng)計學方法引入地理學研究領域,構造一系列統(tǒng)計量來定量地描述地理要素的分布特征,應用各種概率分布函數(shù)、方差等簡單的統(tǒng)計特征和回歸分析方法。第二階段(20世紀60年代末——70年代末)多元統(tǒng)計分析方法和電子計算機技術廣泛應用。地理學具備了分析多因素、復雜結構和動態(tài)特征等復雜地理問題的能力。數(shù)量地理學的產(chǎn)生與發(fā)展第三階段(20世紀70年代末——80年代末)系統(tǒng)理論、系統(tǒng)分析、系統(tǒng)優(yōu)化、系統(tǒng)調控方法等被引進地理學研究領域;GIS技術的發(fā)展為其提供技術手段支持。第四階段(20世紀90年代初至今)——計算地理時代
計算機技術與計算理論和方法的發(fā)展和3S技術在獲取大容量、整體性地理數(shù)據(jù)信息中的成功應用。引入神經(jīng)網(wǎng)絡、遺傳算法模型、細胞自動模型、模式參數(shù)隨機取樣模型、模糊邏輯模型、改進地理加權回歸等方法。數(shù)量地理學的產(chǎn)生與發(fā)展數(shù)量地理學的發(fā)展階段
數(shù)量地理學發(fā)展初期階段數(shù)量地理學發(fā)展中期階段數(shù)量地理學日趨成熟階段20世紀50年代末至60年代末20世紀60年代末至70年代20世紀70年代末至今把統(tǒng)計學方法引入地理學研究在地理學研究中應用多元統(tǒng)計方法和計算機技術地理學與運籌學、模糊數(shù)學、系統(tǒng)科學、GIS技術等結合現(xiàn)代地理學中的數(shù)量方法與理論模式的產(chǎn)生與形成,可以追溯到20世紀50年代末期開始的計量運動。計量運動主要由美國地理學家發(fā)起,早期集中在衣阿華、威斯康星、普林斯頓和華盛頓等幾所大學。不同學者所持觀點不同,研究方向各異,由此形成了所謂的經(jīng)濟、統(tǒng)計、社會等學派。美國計量運動的三大學派地理學的計量運動主要由美國地理學家發(fā)起。(1)衣阿華的經(jīng)濟派:代表人物是舍弗爾、麥卡爾蒂。受杜能、韋伯、廖什、克里斯泰勒等區(qū)位論學者影響很深,著重探討經(jīng)濟區(qū)位現(xiàn)象間相互內在聯(lián)系及其組合類型。(2)威斯康星的統(tǒng)計派:代表人物是威弗爾、羅賓遜、東坎和仇佐里,以經(jīng)典著作《統(tǒng)計地理學》為代表作,主要特征是發(fā)展和應用統(tǒng)計分析方法。美國計量運動的三大學派(續(xù))(3)普林斯頓的社會物理學派:代表人物是司徒瓦特(J.Q.Stewart)。該派把物理學原理應用于社會現(xiàn)象的研究之中,發(fā)展了理論地理學中的引力模型、位勢模型、空間相互作用模式。此外,20世紀50年代,加里森(WilliamL.Garrison)領導的華盛頓小組首次編定了第一本《計量地理學》教材,率先在華盛頓大學舉辦地理計量方法研討班。傳統(tǒng)地理學與數(shù)量地理學數(shù)學方法是人們進行數(shù)字運算和求解的工具,能以嚴密的邏輯和簡潔的形式描述復雜的問題,表達極為豐富的實質性思想。對于現(xiàn)代地理學而言,數(shù)學方法不僅是應用地理學研究中進行預測、決策、規(guī)劃及優(yōu)化設計的工具,也是理論地理學研究中進行邏輯推理和理論演繹的手段。世界上的任何事物都可以用數(shù)值來描述和度量,地理要素如區(qū)域范圍、城市位置、道路長短、氣溫高低、雨量多少、山高水深、人口增減、物產(chǎn)豐欠等都可用數(shù)量來表示。
傳統(tǒng)地理學分析方法所采用的推理方式以經(jīng)驗歸納型綜合為主,以觀察材料和事實為基礎,由直接的類推得出現(xiàn)實世界的結論,這一方法難以回避特殊情況或解釋者的主觀好惡問題。而數(shù)量地理學以理論演繹為主,整個研究過程經(jīng)歷了提出假設、建立模式、檢驗假設和建立理論四個步驟,符合感性-理性-實踐這一認識的過程規(guī)律。與地理學傳統(tǒng)的思維模式相比,地理數(shù)量方法有著明顯的優(yōu)勢(見下頁)。數(shù)量地理學與傳統(tǒng)地理學研究方法比較
傳統(tǒng)地理學方法數(shù)量地理學方法實地考察收集資料根據(jù)已有的概念體系條理化比較歸納、概括地理解釋建立理論與法則觀察實踐先期模式資料篩選建立理論與法則反復檢驗成功建立模型提出假設失敗數(shù)量地理學中地理數(shù)據(jù)分析模擬方法
數(shù)量地理學本質上是一門關于地理數(shù)據(jù)分析處理與建模的科學,其主要研究內容涉及地理要素的描述統(tǒng)計和數(shù)量分析技術,地理系統(tǒng)的分析方法,數(shù)學模型的構建和應用,數(shù)學模擬(仿真)技術,地理預測和決策的方法、程序、模型以及地理學理論表述的數(shù)學形式等。數(shù)量地理學的研究方法:地理系統(tǒng)分析123隨機數(shù)學方法地理系統(tǒng)數(shù)學模擬地理系統(tǒng)分析是指揚棄地理事物繁瑣的枝節(jié),抽象出地理事物在結構與功能上的主線,揭示地理事物動態(tài)演變的方向與強度,預測其狀態(tài)變化和穩(wěn)定性程度,將復雜、高級的地理系統(tǒng)簡化為次一級簡單的系統(tǒng),進而探討地理要素之間的數(shù)量關系。一般是首先列出所研究等級系統(tǒng)的要素清單,根據(jù)地理系統(tǒng)的實際繪出各要素的聯(lián)系框圖,再以定量方法研究系統(tǒng)要素之間的關系。地理系統(tǒng)輸入與輸出之間一般具有隨機性,數(shù)量地理學研究方法中隨機數(shù)學占很大比重。地理系統(tǒng)是多級、多元系統(tǒng),在進行系統(tǒng)分析時,分析一組或幾組地理要素之間的關系經(jīng)常應用多元統(tǒng)計分析方法,如多元線性回歸、逐步回歸、主成分分析、因子分析等;地理系統(tǒng)是具有空間范圍和地域界線的系統(tǒng),確定界線、進行地理區(qū)域的劃分等經(jīng)常應用二級判別分析、多級判別、逐步判別等數(shù)學分類技術;在探討地理系統(tǒng)結構、類型組合、空間關系時,常運用系統(tǒng)聚類分析方法;分析地理系統(tǒng)的空間特性時,常用趨勢面分析方法;地理系統(tǒng)研究中十分重視系統(tǒng)目標、系統(tǒng)結構的研究,以使地理系統(tǒng)達到符合一定目標的最佳狀態(tài)。此外,模擬地理系統(tǒng)狀態(tài)的轉移規(guī)律時還包括馬爾柯夫鏈、多元線性方程組、微分方程的應用等。建立地理系統(tǒng)數(shù)學模型的過程稱為地理系統(tǒng)的數(shù)學模擬(簡稱地理模型)。地理系統(tǒng)數(shù)學模擬的一般過程是:從實際的地理系統(tǒng)或其要素出發(fā),對空間狀態(tài)、空間成分、空間相互作用進行分析,建立地理系統(tǒng)或要素的數(shù)學模型。經(jīng)驗檢查,若與實際情況不符,則要重新分析,修改模型;若大致相符,則選擇計算方法,進行程序設計、程序調試和上機運算,從而輸出模型解。分析模型解,若模型解出錯,則修改模型;若模型解正確,則對成果進行地理解釋,提出切實可行的方案。可見,地理系統(tǒng)數(shù)學模擬過程是反復修改數(shù)學模型、調試和修改程序的過程。1.1.2地理信息系統(tǒng)英國著名地理學家R.J.Johnston在1995年曾指出“計量革命的直接成果是導致了GIS革命的到來”。GIS起源于20世紀60年代,是對地理空間數(shù)據(jù)進行采集、存儲、表達、更新、檢索、管理、綜合分析與輸出的計算機應用技術系統(tǒng)。GIS是以應用為導向的空間信息技術,強調空間實體及其關系,注重空間分析與模擬,是重要的地理空間數(shù)據(jù)管理和分析工具。GIS是客觀現(xiàn)實世界抽象化的數(shù)字模型GIS是地理空間數(shù)據(jù)管理、顯示與制圖的集成工具GIS是地理空間數(shù)據(jù)分析模擬與可視化的技術平臺客觀現(xiàn)實世界極其復雜,運用各種數(shù)據(jù)采集手段和量測工具,如野外調查、遙感技術等,獲取有關客觀世界的數(shù)據(jù),把各種來源和類型的地理空間數(shù)據(jù)數(shù)字化,輸入計算機,按一定的規(guī)則組織管理,構建客觀現(xiàn)實世界的抽象化數(shù)字模型,即GIS。空間數(shù)據(jù)管理GIS空間數(shù)據(jù)獲取空間數(shù)據(jù)輸入基于數(shù)學法則客觀世界數(shù)據(jù)數(shù)據(jù)庫客觀世界的抽象化過程1.1.3地理計算隨著計算機技術、數(shù)學方法的不斷進步,空間數(shù)據(jù)分析處理方法論也隨之革新,20世紀90年代,一門融合了計算機科學、地理學、地球信息科學(Geomatics)、信息科學、數(shù)學和統(tǒng)計學理論與方法的地理計算學(GeoComputation)開始形成并逐漸發(fā)展起來,數(shù)量地理學進入全新的計算地理學(GeocomputationalGeography)時代,地理空間數(shù)據(jù)分析與建模有了一個新的技術平臺。地理計算的概念與內涵
20世紀90年代中期,英國著名地理學家,里茲大學計算地理研究中心(TheCenterofComputationalGeography)StanOpenshaw教授認為空間數(shù)據(jù)挖掘已成為數(shù)量地理學中一個重要分支,并以GeoComputation命名這個新的學科,StanOpenshaw因此被稱為“地理計算之父”。此后,許多學者紛紛從不同角度對地理計算的定義與內容框架進行設計,并論證其作為一個學科的必要性和合理性。地理計算的各種定義Openshaw在2000年進一步深化對于地理計算的理解,認為地理計算是一種高性能計算,用以解決目前不能解決的、甚至未知的空間問題的科學。英國里茲大學著名地理學家Rees等提議將地理計算定義為:應用計算技術求解地理問題的理論、方法和過程。Gahegan在1999年發(fā)表的論文中細致地談到“…地理計算關注利用一系列方法的工具箱豐富地理模擬和分析大量高度復雜的、非確定性的問題…這是人類有意識的努力去探索地理學與計算機科學之間的關聯(lián)。這是一個真正的對于數(shù)量地理學家的技術,也是計算機科學家進行計算性應用的豐富源泉?!盋onclelis(1998)采用相對簡潔的定義:地理計算是應用數(shù)學計算方法與技術來描述空間特征、解釋地理現(xiàn)象、解決地理問題。Openshaw和Abrahart(2000)認為:地理計算是一門新興的交叉學科,它是在科學方法的整體范圍內利用各種不同類型的地理數(shù)據(jù)發(fā)展相關的地理工具和模型。2003年8月,我國亞運村地理學術沙龍談到“虛擬地理實驗室”建設,認為地理計算既不是數(shù)量地理學,也不是GIS,而是智能計算在地理學中的精確應用,是強大的高性能計算,其理論驅動是科學。地理計算試圖回歸計量革命時代的地理分析和建模,吸收了新的計算機科學成果,如高性能計算,模式識別、分類、預測與模型技術,知識挖掘,可視化等一系列計算方法和工具,建立地理模型并分析復雜的、具有不確定性的地理問題,從而豐富了地理學的研究。GeoComputation不僅僅是計算機在地理信息領域中的應用,關鍵是可以輔助進行地理研究,從而獲得基于數(shù)據(jù)驅動的地理信息管理和地理信息分析。綜上所述,地理計算這一學科的統(tǒng)一視角就是“計算”,它被認為是一系列有效的程序或算法(如神經(jīng)網(wǎng)絡、模糊邏輯、遺傳算法等),當應用到地理問題時必然產(chǎn)生結果,不同算法之間由于基本假設的不同而產(chǎn)生結果的差異。地理計算本質上可認為是對地理學時間與空間問題所進行的基于計算機的定量化分析。地理計算模型與方法
地理計算的目標是將地理學領域的知識引入計算機工具,設計合適的地理數(shù)據(jù)挖掘和知識發(fā)現(xiàn)操作,研發(fā)時空尺度上的集群算法,獲得超越目前軟件、硬件能力的地理數(shù)據(jù)分析方法,用可視化和虛擬現(xiàn)實的手段實現(xiàn)地理問題的理解與交流。地理計算學是數(shù)量地理學向深層次的拓展,強調數(shù)學模型與模擬實驗并重的理念,憑借計算機工具對地理學問題進行定量或非定量分析的抽象概括和綜合研究,解決海量、復雜數(shù)據(jù)集或數(shù)據(jù)庫分析的復雜空間問題。GeoComputation包含豐富的模型和方法體系,不僅采納了傳統(tǒng)的數(shù)量地理學理論與模型,還涉及一系列新的理論技術方法:GIS為之創(chuàng)建數(shù)據(jù)庫;人工智能技術(ArtificialIntelligence,AI)和智能計算技術(ComputationalIntelligence,CI)為之提供計算原理和計算工具;高性能計算服務系統(tǒng)為之提供動力。
智能計算技術中的神經(jīng)網(wǎng)絡模型(NeuralNetwork,NN)、模糊邏輯模型(FuzzyLogic)、遺傳算法模型(GeneticAlgorithm,GA)、元胞自動機模型(CellularAutomata,CA)以及分形分析(FractalAnalysis)等不斷被引入并成為地理計算的核心。
高性能計算(High-PerformanceComputing)是利用超級計算機對大容量資料、需要進行實時分析與控制的系統(tǒng)以及那些復雜而又不能用其他手段來處理的現(xiàn)實世界所實施的計算。1.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS1.2地理空間數(shù)據(jù)挖掘人類在空間科學技術、遙感、地理信息系統(tǒng)、全球定位系統(tǒng)等領域取得了巨大成就,對地球系統(tǒng)的不同層面、不同現(xiàn)象的綜合觀測能力達到了空前的水平,獲得了大量對地觀測數(shù)據(jù)。同時,隨著數(shù)據(jù)庫技術的成熟和信息應用的普及,人類累積的數(shù)據(jù)量正在呈指數(shù)級增長,全世界每天存入數(shù)據(jù)數(shù)量超過萬兆字符。
未來學家JohnNaisbitt驚呼:“人類正被數(shù)據(jù)淹沒,卻饑渴于信息”。面臨浩如煙海的數(shù)據(jù),人們呼喚從數(shù)據(jù)的汪洋大海中去蕪存精、去偽存真,因此,“從數(shù)據(jù)庫中發(fā)現(xiàn)知識”(KDD)及其核心技術——數(shù)據(jù)挖掘(DataMining)應運而生。1.2.1地理空間數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是一個由數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計和可視化等多學科與技術交叉、滲透、融合形成的交叉學科(邸凱昌,2000)。
地理空間數(shù)據(jù)挖掘(GeospatialDataMining)是數(shù)據(jù)挖掘的一個研究分支,其實質是從地理空間數(shù)據(jù)庫中挖掘時空系統(tǒng)中潛在的、有價值的信息、規(guī)律和知識的過程,包括空間模式與特征、空間與非空間數(shù)據(jù)之間的概要關系等。由于空間數(shù)據(jù)具有海量、多維和自相關性等特征,使得地理空間數(shù)據(jù)挖掘更為復雜。加拿大SimonFraser大學計算機科學系HanJiawei教授領導的小組進行了基于關系數(shù)據(jù)庫挖掘系統(tǒng)的研究,在MapInfo平臺上開發(fā)了空間數(shù)據(jù)挖掘原型系統(tǒng)GeoMiner,并設計了專門用于空間數(shù)據(jù)挖掘的語言GMQL,實現(xiàn)了空間數(shù)據(jù)特征描述、空間比較、空間關聯(lián)、空間聚類和空間分類等空間數(shù)據(jù)分析方法的集成。GeoMiner系統(tǒng)結構圖形用戶接口各種數(shù)據(jù)挖掘模塊空間數(shù)據(jù)庫空間數(shù)據(jù)庫服務器和數(shù)據(jù)立方體空間數(shù)據(jù)庫
空間數(shù)據(jù)庫
數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的進化歷程進化階段技術手段數(shù)據(jù)搜集(20世紀60年代)數(shù)據(jù)訪問(20世紀80年代)數(shù)據(jù)倉庫(20世紀90年代)數(shù)據(jù)挖掘(目前)計算機、磁帶和磁盤關系數(shù)據(jù)庫、結構化查詢語言、ODBC
聯(lián)機分析處理、多維數(shù)據(jù)庫、數(shù)據(jù)倉庫高級算法、多處理器計算機、海量數(shù)據(jù)庫空間聚類規(guī)則發(fā)現(xiàn)空間關聯(lián)規(guī)則發(fā)現(xiàn)空間序列模式發(fā)現(xiàn)空間預測模型發(fā)現(xiàn)空間異常值發(fā)現(xiàn)空間趨勢模型發(fā)現(xiàn)空間數(shù)據(jù)立方體地理空間數(shù)據(jù)挖掘體系結構圖形用戶界面空間依賴關系發(fā)現(xiàn)未來空間發(fā)現(xiàn)模塊挖掘模塊集合空間數(shù)據(jù)庫服務器空間數(shù)據(jù)庫非空間數(shù)據(jù)庫相關概念按照不同的挖掘任務,地理空間數(shù)據(jù)挖掘可以分為預測模型發(fā)現(xiàn)、聚類、關聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關系發(fā)現(xiàn)、異常值分析和趨勢發(fā)現(xiàn)等。
地理空間數(shù)據(jù)挖掘系統(tǒng)包括三大支柱模塊:地理空間數(shù)據(jù)立方體、聯(lián)機分析處理(OLAP)模塊和空間數(shù)據(jù)挖掘模塊。1.2.2地理空間數(shù)據(jù)立方體地理空間數(shù)據(jù)立方體(GeospatialDataCube)是一個面向對象的、集成的、以時間為變量的、持續(xù)采集空間與非空間數(shù)據(jù)的多維數(shù)據(jù)集合,組織和匯總成一個由一組維度和度量值定義的多維結構,用以支持地理空間數(shù)據(jù)挖掘技術和決策支持過程。地理空間數(shù)據(jù)立方體涉及的概念
維度是數(shù)據(jù)立方體的一種結構特性,是描述事實數(shù)據(jù)表中數(shù)據(jù)級別的有組織的層次結構。包括:非空間維度、空間-非空間維度、空間-空間維度。度量值是在數(shù)據(jù)立方體內基于該數(shù)據(jù)立方體的事實數(shù)據(jù)表中某列的一組值,它們通常是數(shù)字。包括:數(shù)值度量、空間度量。成員屬性是維度表的一個可選特性,為最終用戶提供成員的其他信息,僅從屬于級別。1.2.3聯(lián)機分析處理技術OLAP是共享多維信息的、針對特定問題的聯(lián)機數(shù)據(jù)訪問和分析的軟件技術,具有匯總、合并、聚集以及從不同角度觀察消息的能力。它可以跨越空間數(shù)據(jù)庫模式的多個版本,處理來自不同組織的信息和由多個數(shù)據(jù)存儲集成的信息。聯(lián)機分析處理對空間數(shù)據(jù)立方體進行的多維數(shù)據(jù)分析主要有切塊、切片、旋轉、鉆取等分析動作,目的是進行跨維、跨層次的計算與建模。地理空間數(shù)據(jù)立方體與OLAP的關系業(yè)務處理系統(tǒng)數(shù)據(jù)提取數(shù)據(jù)準備區(qū)OLAP服務器多維化處理客戶端可視化處理地理空間數(shù)據(jù)立方體數(shù)據(jù)加載1.2.4地理空間數(shù)據(jù)挖掘典型方法4地理空間統(tǒng)計方法1235地理空間聚類方法地理空間關聯(lián)分析地理空間分類與預測分析異常值分析1地理空間統(tǒng)計方法地理空間統(tǒng)計是指分析地理空間數(shù)據(jù)的統(tǒng)計方法,主要是基于空間中鄰近的要素通常比相離較遠的要素具有較高的相似性這一原理。地理空間統(tǒng)計分析與傳統(tǒng)分析主要有兩大差異:(1)空間數(shù)據(jù)間并非獨立,而是在D維空間中具有某種空間相關性,且在不同的空間分辨率下呈現(xiàn)不同的相關程度;(2)大多數(shù)空間問題僅有一組(不規(guī)則分布空間中)觀測值,而無重復觀測的資料。目前地理空間統(tǒng)計模型大致可分為三類:地統(tǒng)計:是以區(qū)域化變量理論為基礎,以變差函數(shù)為主要工具,研究空間分布上既具有隨機性又具有結構性的自然現(xiàn)象的科學。格網(wǎng)空間模型:用以描述分布于有限(或無窮離散)空間點(或區(qū)域)上數(shù)據(jù)的空間關系。空間點分布形態(tài):在自然科學研究中,許多資料是由點(或小區(qū)域)所構成的集合,比如,地震發(fā)生地點分布、樹木在森林中的分布、某種鳥類鳥巢的分布、生物組織中細胞核的分布,太空中星球的分布等,稱之為空間點分布形態(tài),其中點的位置為事件。空間數(shù)據(jù)統(tǒng)計分析是分析空間數(shù)據(jù)廣泛使用的一種方法,能夠很好地處理數(shù)字數(shù)據(jù),提出空間現(xiàn)象的現(xiàn)實模型。然而,需要指出的是統(tǒng)計分析方法往往假設在空間中分布的數(shù)據(jù)具有統(tǒng)計獨立性,而在現(xiàn)實中,空間物體相關性很大。此外,絕大多數(shù)統(tǒng)計模型需要在有豐富領域知識和統(tǒng)計專門技術的專家的協(xié)助下才能實現(xiàn)。而且,統(tǒng)計模型不能很好地處理字符值、不完整或非確定性數(shù)據(jù)。地理空間聚類方法地理空間數(shù)據(jù)聚類是按照某種距離度量準則,在大型、多維數(shù)據(jù)集中標識出聚類或稠密分布的區(qū)域,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分布模式。該方法把空間數(shù)據(jù)庫中的對象分為有意義的子類,使同一子類內部的成員有盡可能多的相同屬性,而不同的子類之間差異較大。目前,地理空間聚類方法主要有四類:分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。而經(jīng)典聚類法包括K-mean、K-meriod、ISODATA等。近年來,圍繞DMKD領域發(fā)展了CLARANS(NgR.etal.,1994)、DBSCAN(EsterM.etal.,1996)、Murray(MurrayA.J.etal.,1998)等算法。Kohonen自組織特征映射網(wǎng)絡、競爭學習網(wǎng)絡等自組織神經(jīng)網(wǎng)絡方法,在空間聚類應用中亦有較好的效果。完全的空間任意分布地理空間聚類聚集型分布分散型分布11222233333341:極密2:密3:一般密4:稀疏經(jīng)典聚類完全的空間任意分布模式空間聚類分散分布模式地理空間關聯(lián)分析地理空間關聯(lián)分析利用空間關聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫中空間目標間的關聯(lián)程度,是空間數(shù)據(jù)庫知識發(fā)現(xiàn)研究中的一個重要研究課題。GIS數(shù)據(jù)庫是典型的空間數(shù)據(jù)庫,從GIS數(shù)據(jù)庫中挖掘空間關聯(lián)規(guī)則是理解GIS模型和將GIS數(shù)據(jù)轉化成知識的一種有效方法。
地理空間關聯(lián)分析的核心內容是挖掘空間關聯(lián)規(guī)則??臻g關聯(lián)規(guī)則是指空間目標間相鄰(如村落與道路相鄰)、相連(如火車站與鐵路相連)、共生(如蒙古包與草場的關系)、包含(如區(qū)域中包含的城市)等空間相關關系??臻g關聯(lián)規(guī)則指明了空間謂詞與非空間謂詞間存在的關聯(lián)性。空間關聯(lián)規(guī)則提取算法并不唯一,較常用的是利用MBR技術、R+樹及其他快速方法進行空間分析,并采用概念層次樹對拓撲關系進行概化形成拓撲關系數(shù)據(jù)表,從而提取關聯(lián)規(guī)則。地理空間分類與預測分析
地理空間分類與預測是根據(jù)已知的分類模型把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中,進行數(shù)據(jù)趨勢預測分析的方法。
分類是將數(shù)據(jù)庫中的對象根據(jù)一定的意義劃分為若干個子集。
預測是利用歷史數(shù)據(jù)記錄自動推導出對給定數(shù)據(jù)的推廣描述,實現(xiàn)對未來數(shù)據(jù)的趨勢分析。
分類和聚類算法的差別在于:聚類算法是根據(jù)一定要求將對象聚為一個集合,最后得到的分布模式是聚類之前未確知的;分類算法則是根據(jù)已知分布模式的屬性要求,將數(shù)據(jù)庫對象歸入相應的分類中。在機器學習中,數(shù)據(jù)分類一般稱為監(jiān)督學習,而數(shù)據(jù)聚類則稱為非監(jiān)督學習。地理空間數(shù)據(jù)分類包括兩個步驟:通過分析數(shù)據(jù)庫中各數(shù)據(jù)行的內容建立一個分類模型(分類器),描述已知數(shù)據(jù)集類別或概念。利用所獲得的分類模型(分類器)進行分類操作。
分類和回歸都可用于預測,空間回歸規(guī)則與空間分類規(guī)則相似,也是一種分類器,其差別在于空間分類規(guī)則的預測值是離散的,空間回歸規(guī)則的預測值是連續(xù)的。二者常表現(xiàn)為一棵決策樹,根據(jù)數(shù)據(jù)值從樹根開始搜索,沿著滿足條件的分支往上走,走到樹葉就能確定類別??臻g分類或回歸的規(guī)則是普及知識,實質是對給定數(shù)據(jù)對象集的抽象和概括,可用宏元組表示。異常值分析若一個數(shù)據(jù)庫包含的數(shù)據(jù)目標與通常的行為或數(shù)據(jù)模型不一致,則這些數(shù)據(jù)目標被稱為異常值。絕大多數(shù)數(shù)據(jù)挖掘方法把異常值作為噪音或例外數(shù)據(jù),然而,在很多情況下這將會導致重要隱含信息的丟失。
基于計算機的異常值分析方法主要有三種:基于統(tǒng)計的異常值分析;基于距離的異常值探測;基于偏差的異常值探測。1.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS1.3.1空間分析概念空間分析(SpatialAnalysis,SA)是地理學的精髓,是為解答地理空間問題而進行的數(shù)據(jù)分析與挖掘。比較典型的空間分析定義有如下幾種:空間分析是對數(shù)據(jù)的空間信息、屬性信息或二者共同信息的統(tǒng)計描述或說明(Goodchild,1987)??臻g分析是對于地理空間現(xiàn)象的定量研究,其常規(guī)能力是操縱空間數(shù)據(jù)成為不同的形式,并且提取其潛在信息(Openshaw,1997;Bailyetal.,1995)??臻g分析是基于地理對象空間布局的地理數(shù)據(jù)分析技術(RobertHaining,1990)??臻g查詢和空間分析是從GIS目標之間的空間關系中獲取派生的信息和新的知識(李德仁,1993)??臻g分析是指為制定規(guī)劃和決策,應用邏輯或數(shù)學模型分析空間數(shù)據(jù)或空間觀測值(Landis.J,1995)?!臻g分析是集空間數(shù)據(jù)分析和空間模擬于一體的技術方法,通過地理計算和空間表達挖掘潛在空間信息,以解決實際問題。
空間分析的本質特征包括:探測空間數(shù)據(jù)中的模式;研究空間數(shù)據(jù)間的關系并建立相應的空間數(shù)據(jù)模型;提高適合于所有觀察模式處理過程的理解;改進發(fā)生地理空間事件的預測能力和控制能力。
空間分析的研究對象:空間分析主要通過對空間數(shù)據(jù)和空間模型的聯(lián)合分析來挖掘空間目標的潛在信息。
空間分析研究的主要目標有:認知。有效獲取空間數(shù)據(jù),并對其進行科學的組織描述,利用數(shù)據(jù)再現(xiàn)事物本身,例如繪制風險圖。解釋。理解和解釋地理空間數(shù)據(jù)的背景過程,認識事件的本質規(guī)律,例如住房價格中的地理鄰居效應。預報。在了解、掌握事件發(fā)生現(xiàn)狀與規(guī)律的前提下,運用有關預測模型對未來的狀況做出預測,例如傳染病的爆發(fā)。調控。對地理空間發(fā)生的事件進行調控,例如合理分配資源。1.3.2空間分析的萌芽與發(fā)展空間分析在地理學研究中有著悠久的傳統(tǒng)與歷史。從某種意義上講,空間分析孕育了地理學。在古代,人類出于生存和發(fā)展的需要,要學會分析周圍地理事物的空間關系,因而始終在進行著各種類型的空間分析。隨著地圖理論與應用的廣泛深入,物理、數(shù)學概念與方法的不斷引入以及地學各分支的發(fā)展,傳統(tǒng)的空間分析能力大大加強,人們對地圖表達空間信息的理解與解譯能力顯著提高?,F(xiàn)代“空間分析”概念的提出源于20世紀60年代地理與區(qū)域科學的計量革命。初始階段主要是應用統(tǒng)計分析方法,定量描述點、線、面的空間分布模式;后期逐漸強調地理空間本身的特征、空間決策過程和復雜空間系統(tǒng)的時空演化過程。地理信息系統(tǒng)把人們從過去繁重的手工操作中解脫出來,集成了多學科的最新技術和所能利用的空間分析方法,包括關系數(shù)據(jù)庫管理、高效圖形算法、插值、區(qū)劃和網(wǎng)絡分析等,為解決地理空間問題提供了便捷途徑,空間分析能力發(fā)生了質的飛躍。隨著GIS技術的不斷進步,空間分析成為地理信息系統(tǒng)的核心,是地理信息系統(tǒng)區(qū)別于一般空間數(shù)據(jù)庫和普通制圖系統(tǒng)的標志?!皬哪撤N意義上講,空間分析與GIS間的關系類似于統(tǒng)計學與統(tǒng)計軟件包間的關系”(Goodchild,1988)。國內外GIS軟件空間分析比較1.3.3GIS與空間分析空間分析一般采用專業(yè)分析模型與GIS集成方式。GIS軟件與空間分析軟件相結合的方式可分為兩種:緊耦合,即把空間分析模塊作為一個高級應用模塊嵌入GIS軟件包中,GIS不僅可以為空間分析提供圖形顯示功能,而且GIS中的有關數(shù)據(jù)直接參與空間分析計算。這種方式可以為用戶提供方便、全面、有效的使用功能,但造價高,實現(xiàn)周期長。松耦合,即在兩個相對獨立的GIS軟件和空間分析軟件之間增加數(shù)據(jù)交換接口,使空間分析數(shù)據(jù)及相關的影響因素和空間分析結果能夠在GIS中以各種簡單的或復雜的圖形方式顯示出來,這種方式適用于短期且費用較小的情況。GIS與空間分析的松耦合GIS與空間分析的緊耦合數(shù)據(jù)交換接口專業(yè)模型統(tǒng)計分析網(wǎng)絡分析其他空間分析模塊用戶界面GIS管理系統(tǒng)用戶GIS管理系統(tǒng)空間分析模型空間數(shù)據(jù)庫數(shù)據(jù)文件空間數(shù)據(jù)庫1.3.4GIS環(huán)境下空間分析框架從GIS應用角度看,空間分析大致可以歸納為如下兩大類:一類是基于點、線、面基本地理要素的空間分析,通過空間信息查詢與量測、緩沖區(qū)分析、疊置分析、網(wǎng)絡分析、地統(tǒng)計分析等空間分析方法挖掘出新的信息;另一類是地理問題模擬,解決應用領域對空間數(shù)據(jù)處理與輸出的特殊要求,地理實體和空間關系通過專業(yè)模型得到簡化和抽象,而系統(tǒng)則通過模型進行深入分析操作。GIS環(huán)境中的空間分析(AnselinL,1998)縮放瀏覽空間查詢緩存視圖選擇空間采樣地圖提取質心鑲嵌聚集分散空間權重拓撲插補覆蓋空間分布全局空間組織局域空間組織空間回歸模型評價模型診斷空間預測探索空間數(shù)據(jù)分析操作確認空間數(shù)據(jù)分析模型確定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 加盟合作協(xié)議書!2024年
- 建筑工程施工意外保險合同
- 藝術品創(chuàng)作委托協(xié)議
- 課課程設計java圖書管理
- 摩托車轉讓合同樣本
- 大學生就業(yè)合同協(xié)議書格式
- 房屋反擔保抵押合同2024年
- 個人林業(yè)機械租賃合同
- 租房協(xié)議終止:提前解約租房協(xié)議書模板
- 2024年公司間合作協(xié)議范本
- 【新版】小學《安全在我心中》主題班會.ppt課件
- 2018年人教版九年級英語單詞表
- 公路工程風險評估方案報告
- 語文三年級下語文S版《塞下曲》-課件
- 成語故事課件一諾千金
- (完整版)咨詢控制程序
- 國內旅游出團通知書(新版)
- 趕工措施費申請報告
- 主變大修施工方案
- 全橋逆變電路濾波電路設計步驟
- 國家開放大學《管理英語3》章節(jié)測試參考答案
評論
0/150
提交評論