版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
空間數(shù)據(jù)倉庫與數(shù)據(jù)挖掘演示文稿當(dāng)前1頁,總共81頁。(優(yōu)選)空間數(shù)據(jù)倉庫與數(shù)據(jù)挖掘當(dāng)前2頁,總共81頁。數(shù)據(jù)倉庫和空間數(shù)據(jù)倉庫空間信息基礎(chǔ)設(shè)施數(shù)據(jù)挖掘和空間數(shù)據(jù)挖掘主要內(nèi)容:當(dāng)前3頁,總共81頁?!?0.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫數(shù)據(jù)倉庫空間數(shù)據(jù)倉庫當(dāng)前4頁,總共81頁?!?0.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫隨著市場競爭的加劇和信息社會需求的發(fā)展,出現(xiàn)了數(shù)據(jù)集中化、業(yè)務(wù)綜合化、決策科學(xué)化的趨勢。伴隨這種數(shù)據(jù)信息化的趨勢,從大量數(shù)據(jù)中提取(檢索、查詢等)制定市場策略的信息就顯得越來越重要了。這種需求既要求聯(lián)機服務(wù),又涉及大量用于決策的數(shù)據(jù),而傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)已無法滿足這種需求。一、數(shù)據(jù)倉庫當(dāng)前5頁,總共81頁。歷史數(shù)據(jù)量很大;輔助決策信息涉及許多部門的數(shù)據(jù),而不同系統(tǒng)的數(shù)據(jù)難以集成;由于訪問數(shù)據(jù)的能力不足,它對大量數(shù)據(jù)的訪問性能明顯下降?!?0.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫一、數(shù)據(jù)倉庫無法滿足的需求具體體現(xiàn)在三個方面:當(dāng)前6頁,總共81頁。隨著C/S技術(shù)的成熟和并行數(shù)據(jù)庫的發(fā)展,信息處理技術(shù)的發(fā)展趨勢是從大量的事務(wù)數(shù)據(jù)庫中抽取數(shù)據(jù),并將其清理、轉(zhuǎn)換為新的存儲格式,即為決策目標把數(shù)據(jù)聚合在一種特殊的格式中。隨著此過程的發(fā)展和完善,這種支持決策的、特殊的數(shù)據(jù)存儲即被稱為數(shù)據(jù)倉庫(DataWarehouse,DW)。
數(shù)據(jù)倉庫產(chǎn)生趨勢§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前7頁,總共81頁。數(shù)據(jù)倉庫(DataWarehouse,簡稱DW)是支持管理決策過程的、面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合。主題是數(shù)據(jù)歸類的標準,每個主題對應(yīng)一個客觀分析領(lǐng)域,如客戶、商店等,它可為輔助決策集成多個部門不同系統(tǒng)的大量數(shù)據(jù)。數(shù)據(jù)倉庫包含了大量歷史數(shù)據(jù),經(jīng)集成后進入數(shù)據(jù)倉庫的數(shù)據(jù)是極少更新的。數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)時限為5至10年,主要用于進行時間趨勢分析。數(shù)據(jù)倉庫定義§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前8頁,總共81頁。數(shù)據(jù)倉庫的數(shù)據(jù)量很大,一般為10GB左右。它是一般數(shù)據(jù)庫(100MB)數(shù)據(jù)量的100倍,大型數(shù)據(jù)倉庫達到TB級。
數(shù)據(jù)倉庫定義§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫數(shù)據(jù)倉庫是一種分析型環(huán)境,它與一般的DBMS的操作型環(huán)境是不同的,兩者的比較有利于對數(shù)據(jù)倉庫的理解。當(dāng)前9頁,總共81頁?!?0.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫數(shù)據(jù)倉庫(DW)數(shù)據(jù)庫(DB)分析型數(shù)據(jù)環(huán)境操作型數(shù)據(jù)環(huán)境面向分析(主題),支持DSS面向業(yè)務(wù),日常事務(wù)處理集成的綜合數(shù)據(jù)非集成或者集成程度很低,主要是明細數(shù)據(jù)歷史數(shù)據(jù)(5-10年)主要關(guān)心當(dāng)前數(shù)據(jù)(60-90天)定期加載,加載后極少更新實時更新數(shù)據(jù)驅(qū)動的開發(fā)周期(CLDS)需求驅(qū)動的開發(fā)周期(SDLC)當(dāng)前10頁,總共81頁。數(shù)據(jù)倉庫主要應(yīng)用在兩個方面:使用瀏覽分析工具在DW中尋找有用的信息。數(shù)據(jù)倉庫系統(tǒng)支持在DW上的應(yīng)用,形成決策支持系統(tǒng)(DSS)。數(shù)據(jù)倉庫應(yīng)用§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前11頁,總共81頁。地球是一個復(fù)雜多變的系統(tǒng),傳統(tǒng)地學(xué)的各個學(xué)科由于自身的局限,其研究范圍已無法適應(yīng)全球變化和區(qū)域可持續(xù)發(fā)展的要求。如在交通規(guī)劃中,往往需要使用大量歷史的、現(xiàn)實的空間數(shù)據(jù)以及各應(yīng)用領(lǐng)域的復(fù)雜數(shù)據(jù)進行數(shù)據(jù)分析,涉及多維數(shù)據(jù)視圖的概念,僅靠關(guān)系數(shù)據(jù)庫就將難以解決。同時,傳統(tǒng)的GIS應(yīng)用系統(tǒng)是面向應(yīng)用、事務(wù)驅(qū)動的,其中分析所需要的主題相當(dāng)分散,不同的操作平臺和數(shù)據(jù)標準使得決策支持系統(tǒng)幾乎無法實現(xiàn)數(shù)據(jù)共享。為此,必須通過大型的、多維化的數(shù)據(jù)庫系統(tǒng)進行統(tǒng)一的組織、管理。二、空間數(shù)據(jù)倉庫§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫空間數(shù)據(jù)倉庫的產(chǎn)生趨勢當(dāng)前12頁,總共81頁。數(shù)據(jù)倉庫正是這樣一種數(shù)據(jù)的存儲系統(tǒng),它提供了來自異地、異構(gòu)、種類不同的應(yīng)用系統(tǒng)的集成化和歷史化的數(shù)據(jù)。對其加工后,在數(shù)據(jù)倉庫中存儲、提取和維護,靈活地重組數(shù)據(jù),呈現(xiàn)出多維數(shù)據(jù)視圖,并且面向復(fù)雜的數(shù)據(jù)分析及高層的決策支持,從而為有關(guān)部門或企業(yè)進行全局范圍的多維分析、戰(zhàn)略決策和長期趨勢分析提供了有效的支持。由于空間數(shù)據(jù)的特殊性,空間數(shù)據(jù)倉庫在數(shù)據(jù)倉庫的基礎(chǔ)上需引入空間維數(shù)據(jù),根據(jù)主題從不同的GIS應(yīng)用系統(tǒng)中截取從瞬態(tài)到區(qū)段直至全球系統(tǒng)上的信息,從而提供最好的信息服務(wù)??臻g數(shù)據(jù)倉庫的產(chǎn)生趨勢§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前13頁,總共81頁??臻g數(shù)據(jù)倉庫(SpatialDataWarehouse,簡稱SDW)是集成的、面向主題的、相對穩(wěn)定的、反映時間變化和地理空間變化的空間數(shù)據(jù)存儲,以支持各級管理人員基于空間數(shù)據(jù)的分析和決策??臻g數(shù)據(jù)倉庫的概念和內(nèi)涵§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前14頁,總共81頁。
空間數(shù)據(jù)倉庫是GIS、空間數(shù)據(jù)庫與數(shù)據(jù)倉庫技術(shù)相結(jié)合的產(chǎn)物,它在普通數(shù)據(jù)倉庫基礎(chǔ)上,引入空間數(shù)據(jù),增加對空間數(shù)據(jù)的存貯、管理和分析能力,根據(jù)主題從不同的空間數(shù)據(jù)源中截取不同規(guī)模的時空尺度上的信息,從而為地學(xué)研究以及有關(guān)資源環(huán)境政策的制定等空間決策支持過程提供最好的信息服務(wù)??臻g數(shù)據(jù)倉庫是數(shù)據(jù)倉庫與空間處理分析的綜合,具有空間,時間和主題的高度集成。從信息科學(xué)的角度來說,它是對數(shù)據(jù)倉庫加進了非結(jié)構(gòu)化信息處理。
空間數(shù)據(jù)倉庫的概念和內(nèi)涵§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前15頁,總共81頁。SDW支持多種數(shù)據(jù)源:數(shù)據(jù)庫、數(shù)據(jù)文件、應(yīng)用程序等;SDW中存放的不僅是供使用的數(shù)據(jù),還有在一定激發(fā)條件下能主動其作用的處理規(guī)則、算法,甚至是過程等;SDW中數(shù)據(jù)并不完全是原始數(shù)據(jù)的簡單歸并和搬家,而是增值和統(tǒng)一,因此,“匯總并統(tǒng)一”是一種可取的描述;空間數(shù)據(jù)倉庫的概念和內(nèi)涵§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前16頁,總共81頁。數(shù)據(jù)的集成化表明數(shù)據(jù)在結(jié)構(gòu)上具有綜合性,并且在語言上是異構(gòu)的,在進入SDW之前,必須經(jīng)過加工和集成,這是SDW建設(shè)中最關(guān)鍵,最復(fù)雜的一步;歷史化表明它可以截取不同時間尺度上的信息,從瞬態(tài)到區(qū)段直到全體。SDW以時間為基準管理(積累,使用并處理)數(shù)據(jù),即使依賴與時間維的數(shù)據(jù)結(jié)構(gòu);SDW保存和管理的是“對象”—數(shù)據(jù)以及與之相關(guān)的處理規(guī)則,算法和過程等的統(tǒng)一體,它們在SDW中以打包及有序存放的形式被保存和維護,且需要即可使用。空間數(shù)據(jù)倉庫的概念和內(nèi)涵§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前17頁,總共81頁??臻g數(shù)據(jù)倉庫的體系結(jié)構(gòu)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫空間數(shù)據(jù)倉庫應(yīng)用(空間決策支持系統(tǒng)等)分析結(jié)果聯(lián)機分析處理數(shù)據(jù)挖掘數(shù)據(jù)倉庫中信息多級存儲策略數(shù)據(jù)庫空間數(shù)據(jù)庫系統(tǒng)(數(shù)據(jù)管理部分)SDBSDBSDB數(shù)據(jù)采集與輸入系統(tǒng)(數(shù)據(jù)源部分)核心GIS數(shù)據(jù)政府統(tǒng)計數(shù)據(jù)市場經(jīng)濟數(shù)據(jù)土地利用數(shù)據(jù)分析工具數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)輸入決策運算MBKB空間數(shù)據(jù)倉庫當(dāng)前18頁,總共81頁。空間數(shù)據(jù)倉庫機制的研究圍繞空間數(shù)據(jù)倉庫的實際應(yīng)用需求,探索空間數(shù)據(jù)倉庫的關(guān)鍵技術(shù)。(1)支持空間信息的空間數(shù)據(jù)倉庫模型:空間數(shù)據(jù)倉庫的數(shù)據(jù)模型是普通數(shù)據(jù)倉庫的數(shù)據(jù)模型的有效擴充,必須針對空間信息的特點,對星型模型和雪花模型進行擴展。(2)支持空間數(shù)據(jù)導(dǎo)航的元數(shù)據(jù)機制:空間數(shù)據(jù)倉庫的元數(shù)據(jù)是人們定義空間數(shù)據(jù)倉庫模型、理解空間數(shù)據(jù)意義的重要窗口,空間數(shù)據(jù)倉庫的元數(shù)據(jù)必須支持對空間數(shù)據(jù)分析的導(dǎo)航??臻g數(shù)據(jù)倉庫的關(guān)鍵技術(shù)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前19頁,總共81頁。(3)面向海量空間信息的數(shù)據(jù)存儲策略:空間數(shù)據(jù)倉庫包含海量的空間信息。支持對海量空間信息的高效的存儲和檢索是空間數(shù)據(jù)倉庫的重要需求,也是空間數(shù)據(jù)倉庫的重要特征。因此需要研究面向海量空間信息的數(shù)據(jù)存儲策略。(4)面向海量空間信息高效檢索的空間索引機制:數(shù)據(jù)索引是提高數(shù)據(jù)檢索效率的有效途徑。由于空間數(shù)據(jù)倉庫中涉及海量的空間信息,因此需要研究面向空間數(shù)據(jù)倉庫的索引機制??臻g數(shù)據(jù)倉庫的關(guān)鍵技術(shù)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前20頁,總共81頁。(5)大規(guī)??臻g數(shù)據(jù)處理:由于空間數(shù)據(jù)所包含的數(shù)據(jù)量比較大,當(dāng)空間數(shù)據(jù)倉庫中地理數(shù)據(jù)、元數(shù)據(jù)以及歷史數(shù)據(jù)的數(shù)據(jù)量急速增長時數(shù)據(jù)的存儲和管理機制的調(diào)整策略等問題需要更加深入的研究。(6)查詢的建立和數(shù)據(jù)導(dǎo)航技術(shù):空間數(shù)據(jù)的查詢通常比較復(fù)雜,而目前的用戶界面形式很難滿足。必須為空間數(shù)據(jù)倉庫數(shù)據(jù)查詢的輸入以及數(shù)據(jù)查詢的建立提供一套合適的機制。(7)快速計算、高速網(wǎng)絡(luò)、空間數(shù)據(jù)庫的無縫連接、數(shù)據(jù)挖掘、空間數(shù)據(jù)聯(lián)機分析和處理及服務(wù)的互操作等關(guān)鍵技術(shù)。
空間數(shù)據(jù)倉庫的關(guān)鍵技術(shù)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前21頁,總共81頁。目前國外數(shù)據(jù)倉庫以及空間數(shù)據(jù)倉庫方面的主要工作基礎(chǔ)有很多。Stanford大學(xué)的數(shù)據(jù)倉庫WHIPS(WareHouseInformationProjectatStanford);美國正在啟動一個空間信息處理項目EOS(EarthOverviewSystem),到2003年,對全球地面監(jiān)測的精度將達到1米的分辨率,該項目對鞏固美國在全球的競爭優(yōu)勢具有重要的作用。該項目的主要組成部分之一就是空間數(shù)據(jù)的聯(lián)機分析與挖掘技術(shù)的研究;IBM的Almenden實驗室、北美和德國的一些公司、和科研機構(gòu)的實驗室在這個領(lǐng)域的研究中處于領(lǐng)先位置。國內(nèi)外研究現(xiàn)狀§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前22頁,總共81頁。目前的空間數(shù)據(jù)倉庫原型系統(tǒng)主要有:AMicrosoftTerraServer(由JimGray主持),GeoMiner(由加拿大SimonFraser大學(xué)開發(fā))等。在國內(nèi),國家“九五”科技重點攻關(guān)項目“空間信息共享和處理技術(shù)研究”專題項目已取得階段成果,提出了空間信息共享系統(tǒng)設(shè)計方案。視覺與聽覺信息處理國家重點實驗室開放課題基金項目“空間數(shù)據(jù)聯(lián)機分析與空間數(shù)據(jù)挖掘研究”,該項目重點對空間數(shù)據(jù)聯(lián)機分析與空間數(shù)據(jù)挖掘及底層的空間數(shù)據(jù)倉庫技術(shù)作基礎(chǔ)理論研究。國內(nèi)外研究現(xiàn)狀§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前23頁,總共81頁。(1)空間數(shù)據(jù)倉庫模型的研究:空間數(shù)據(jù)面向主題的集成的一個關(guān)鍵步驟是空間數(shù)據(jù)倉庫的建模??臻g數(shù)據(jù)倉庫的邏輯模型與普通數(shù)據(jù)倉庫模型一樣,通常采用類似的多維模型。普通數(shù)據(jù)倉庫模型通常采用星型模型或雪花模型。與普通數(shù)據(jù)倉庫模型相比,空間數(shù)據(jù)倉庫要管理復(fù)雜的空間數(shù)據(jù)類型,其維和度量中不僅可以包含簡單數(shù)據(jù)類型的數(shù)據(jù),同時也可以包含空間對象。由于空間對象占用的存儲空間較大,其操作也比較復(fù)雜,這就需要擴充維和度量的定義,以便更有效地處理這樣的維和度量。目前空間數(shù)據(jù)倉庫主要研究內(nèi)容§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前24頁,總共81頁。(2)海量空間數(shù)據(jù)的存儲:空間數(shù)據(jù)倉庫通常以空間數(shù)據(jù)庫為基礎(chǔ),由于空間數(shù)據(jù)倉庫涉及海量的空間信息,同時空間信息計算耗費的資源較多,確定空間信息的合理存儲策略(如數(shù)據(jù)分片等),以便計算和顯示,也是當(dāng)前許多專家關(guān)注的焦點。
目前空間數(shù)據(jù)倉庫主要研究內(nèi)容§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前25頁,總共81頁。(3)異構(gòu)空間數(shù)據(jù)源的有效集成:空間數(shù)據(jù)倉庫所要集成的數(shù)據(jù)分布于各個企業(yè)或各個政府部門,這些數(shù)據(jù)源通常具有不同的數(shù)據(jù)格式;此外,空間數(shù)據(jù)的表示、存儲和訪問方式目前還沒有統(tǒng)一的標準,空間數(shù)據(jù)的語義也往往比較復(fù)雜。這就給空間數(shù)據(jù)的集成和共享帶來了極大的困難,如何實現(xiàn)空間數(shù)據(jù)的有效集成是國內(nèi)外空間數(shù)據(jù)倉庫工程的一個重點和難點。
目前空間數(shù)據(jù)倉庫主要研究內(nèi)容§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前26頁,總共81頁。(4)空間數(shù)據(jù)倉庫的索引機制:空間數(shù)據(jù)庫的索引方法主要包括:z-序索引、四叉樹索引、kd-樹索引、R樹索引、R+樹索引等。由于空間數(shù)據(jù)倉庫中的數(shù)據(jù)具有海量的、極少更新的、隨時間變化的特點,其主要的操作是數(shù)據(jù)的追加和查詢,因此要求針對空間數(shù)據(jù)倉庫的特點設(shè)計更加合適的空間數(shù)據(jù)倉庫索引機制是空間數(shù)據(jù)倉庫機制的重要組成部分,也是目前許多專家關(guān)注的焦點。目前空間數(shù)據(jù)倉庫主要研究內(nèi)容§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前27頁,總共81頁。(5)空間數(shù)據(jù)倉庫元數(shù)據(jù)機制:空間數(shù)據(jù)倉庫的元數(shù)據(jù)是確定空間數(shù)據(jù)倉庫的邏輯結(jié)構(gòu)、存儲策略的重要組成部分。從數(shù)據(jù)倉庫建設(shè)者的角度來看,空間數(shù)據(jù)倉庫元數(shù)據(jù)是數(shù)據(jù)倉庫的描述,是關(guān)于數(shù)據(jù)加載方法和數(shù)據(jù)加載頻率、數(shù)據(jù)存儲和應(yīng)用的描述信息。從用戶的角度來看,它是用戶理解和使用數(shù)據(jù)倉庫的向?qū)???臻g數(shù)據(jù)倉庫元數(shù)據(jù)的主要內(nèi)容包括:數(shù)據(jù)倉庫的描述信息、數(shù)據(jù)倉庫的信息源描述、數(shù)據(jù)轉(zhuǎn)換方法描述信息、數(shù)據(jù)加載方法的描述信息、業(yè)務(wù)術(shù)語的定義、業(yè)務(wù)處理的規(guī)則的描述信息。因此要求建立合理的空間數(shù)據(jù)倉庫元數(shù)據(jù)的機制,確??臻g數(shù)據(jù)倉庫的合理性和高可用性。目前空間數(shù)據(jù)倉庫主要研究內(nèi)容§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前28頁,總共81頁。按照關(guān)系數(shù)據(jù)庫之父E.F.Codd的定義,OLAP是大量多維數(shù)據(jù)的動態(tài)綜合(synthesis)、分析(analysis)與合并(consolidation),它是能夠快速交互地,方便地獲取它們所需信息的一些技術(shù)(多維數(shù)據(jù)分析,神經(jīng)網(wǎng)絡(luò)等)的綜合,它通過快速、一致、交互地訪問各種可能的信息,試圖幫助數(shù)據(jù)分析人員、管理人員、決策者洞察數(shù)據(jù)顯示,掌握隱藏其中地規(guī)律。
OLAP(聯(lián)機處理分析)
OLAP(OnlineAnalysisProcessing)的概念§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前29頁,總共81頁。關(guān)于OLAP地詳細定義,Codd曾給出了十二條準則,其后,還對其進行了擴充。根據(jù)OLAP產(chǎn)品的實際應(yīng)用情況和用戶對OLAP產(chǎn)品的需求,人們提出了一種對OLAP更簡單明確的定義,即共享多維信息的快速分析(FastAnalysisofSharedMultidimensionalInformation,簡稱FASMI)。目前,常見的OLAP有基于多維數(shù)據(jù)庫的MOLAP(Multi-dementionOLAP)、基于關(guān)系數(shù)據(jù)庫ROLAP(RelationOLAP)以及混合的HOLAP(HybridOLAP)。
OLAP(聯(lián)機處理分析)
OLAP的概念§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前30頁,總共81頁。
OLTP和OLAP有很大的差別,在傳統(tǒng)的OLTP技術(shù)中,所依賴的是實體、聯(lián)系、功能分解、狀態(tài)轉(zhuǎn)換分析和事務(wù)處理等概念和方法;而在OLAP技術(shù)中,主要使用的是事實表、維表、層次(hierarchies)、稀疏性(sparsity)、指標聚集等概念和方法。
OLAP與OLTP的區(qū)別
OLAP(聯(lián)機處理分析)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前31頁,總共81頁。
OLAP與OLTP的區(qū)別
OLAP(聯(lián)機處理分析)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫OLTPOLAP時間短時間框架長時間框架狀態(tài)迅速變化的靜態(tài)的數(shù)據(jù)類型細節(jié)的、操作性數(shù)據(jù)綜合的、提煉的分析性數(shù)據(jù)查詢標準的事務(wù)隨機的、動態(tài)的查詢穩(wěn)定性實時更新周期性刷新功能支持日常操作支持管理要求設(shè)計事件驅(qū)動面向應(yīng)用數(shù)據(jù)驅(qū)動面向分析當(dāng)前32頁,總共81頁。多維空間數(shù)據(jù)模型空間數(shù)據(jù)Cube的構(gòu)造和維護空間Cube數(shù)據(jù)的多維顯示
OLAP目前主要研究內(nèi)容
OLAP(聯(lián)機處理分析)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前33頁,總共81頁。支持cube構(gòu)造的多維數(shù)據(jù)存儲模型;空間數(shù)據(jù)cube實例化視圖選擇方法研究;空間數(shù)據(jù)cube的構(gòu)造算法;在二級存儲中高效構(gòu)造高維的cube和空間數(shù)據(jù)cube;
OLAP關(guān)鍵技術(shù)
OLAP(聯(lián)機處理分析)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前34頁,總共81頁。空間數(shù)據(jù)倉庫系統(tǒng)是引入數(shù)據(jù)倉庫后的計算機系統(tǒng)。其目標是支持用戶利用存儲地信息進行分析、處理和決策??臻g數(shù)據(jù)倉庫由四部分組成:數(shù)據(jù)、計算機硬件、軟件、用戶??臻g數(shù)據(jù)倉庫系統(tǒng)§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前35頁,總共81頁。在操作上,GIS源數(shù)據(jù)由異構(gòu)變?yōu)橥瑯?gòu),消除了數(shù)據(jù)模型及語法、語義的差異,數(shù)據(jù)庫可直接被DBMS訪問,加快了查詢和分析處理的速度。訪問倉庫的數(shù)據(jù)不需要占用信息源的系統(tǒng)資源,不會像直接訪問信息源那樣增加開銷。在功能上,除了便于管理、維護外,GIS空間數(shù)據(jù)倉庫為其數(shù)據(jù)挖掘準備了條件。如果數(shù)據(jù)挖掘技術(shù)利用得當(dāng),還可擴充GIS的功能,當(dāng)然,數(shù)據(jù)倉庫及其技術(shù)并未拋棄關(guān)系型數(shù)據(jù)庫和DBMS的一系列功能。使用空間數(shù)據(jù)倉庫的優(yōu)勢§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前36頁,總共81頁。有望解決OPENGIS在數(shù)據(jù)上不一致的問題。具有明顯的社會意義,有利于加強商業(yè)、資源、環(huán)境等的宏觀決策??梢哉f,數(shù)據(jù)倉庫是伴隨著C/S技術(shù)和并行數(shù)據(jù)庫的發(fā)展孕育而生的,大型GIS要處理多源的、多變量的、異構(gòu)的、海量的地理數(shù)據(jù),就要采用能解決這些問題的技術(shù)。數(shù)據(jù)倉庫技術(shù)可以解決其中的一些問題。
GIS中使用空間數(shù)據(jù)倉庫的優(yōu)勢§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前37頁,總共81頁。空間數(shù)據(jù)粒度的劃分;空間數(shù)據(jù)的分割(面向圖幅、面向圖層、面向?qū)n}要素);空間元數(shù)據(jù)的設(shè)計、管理及其標準化。開發(fā)數(shù)據(jù)倉庫應(yīng)注意的問題§10.1數(shù)據(jù)倉庫與空間數(shù)據(jù)倉庫當(dāng)前38頁,總共81頁?!?0.2空間數(shù)據(jù)基礎(chǔ)設(shè)施空間信息基礎(chǔ)設(shè)施的定義
空間信息基礎(chǔ)設(shè)施的目標
空間信息基礎(chǔ)設(shè)施組成
空間信息基礎(chǔ)設(shè)施體系結(jié)構(gòu)
NII&NSIISDW&NSII
當(dāng)前39頁,總共81頁。美國于1994年頒布了總統(tǒng)行政令,實施國家空間數(shù)據(jù)基礎(chǔ)設(shè)施NSDI計劃。國家空間信息基礎(chǔ)設(shè)施(NationalSpatialInformationInfrastructure,簡稱NSII)的定義為:“一個國家內(nèi)描述地球上地理要素和現(xiàn)象的分布及其屬性的所有地理信息的組合,以及對這些信息的獲取、處理、存儲、分發(fā)和提高使用所需的技術(shù)、政策、標準和人力資源”。NSII是為使用、生產(chǎn)和管理與地理空間信息有關(guān)的社會各部門以及個人提供基礎(chǔ)信息環(huán)境和支持,是國家信息基礎(chǔ)設(shè)施的子集。一、國家空間信息基礎(chǔ)設(shè)施定義§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前40頁,總共81頁。在今天的信息社會和網(wǎng)絡(luò)環(huán)境下,它是一個分布式異構(gòu)的地理空間信息資源網(wǎng)絡(luò)??臻g信息基礎(chǔ)設(shè)施的體系結(jié)構(gòu)是實施地理空間信息基礎(chǔ)設(shè)施概念的邏輯模型??臻g信息基礎(chǔ)設(shè)施在區(qū)域?qū)哟紊戏譃槿蚩臻g信息基礎(chǔ)設(shè)施(GSII)、區(qū)域空間信息基礎(chǔ)設(shè)施(RSII)和國家空間信息基礎(chǔ)設(shè)施(NSII)。一、國家空間信息基礎(chǔ)設(shè)施定義§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前41頁,總共81頁??臻g信息具有區(qū)域性、綜合性和共享性,NSII旨在建立作為各部門共同使用的基礎(chǔ)信息,避免部門重復(fù)建設(shè)問題,提高信息標準化程度,為信息共享和網(wǎng)絡(luò)上的協(xié)作掃除障礙??臻g信息基礎(chǔ)設(shè)施的目標是建立、維護和使用一個空間信息框架??臻g信息框架包括兩方面的內(nèi)容:一是空間信息內(nèi)容,即框架的基礎(chǔ)空間數(shù)據(jù)和專題數(shù)據(jù);二是空間信息服務(wù),即提供對空間信息的共享、集成和互操作的功能和接口。二、NSII的目標§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前42頁,總共81頁??臻g信息基礎(chǔ)設(shè)施提供兩種服務(wù):一是為廣大社會群眾提供普通服務(wù),回答普通群眾關(guān)心的環(huán)境、交通、旅游、新聞、房地產(chǎn)、商業(yè)、公共設(shè)施建設(shè)以及其它社會問題,用戶通過簡單的個人計算機瀏覽界面,查詢空間信息;二是為各個專用部門的特殊應(yīng)用服務(wù),包括資源開發(fā)、環(huán)境管理、生態(tài)監(jiān)測、區(qū)域規(guī)劃等制圖和空間分析,并為可持續(xù)發(fā)展提供信息和決策支持。二、NSII的目標§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前43頁,總共81頁。信息網(wǎng)絡(luò):主要包括由國內(nèi)外各種空間數(shù)據(jù)與信息的生產(chǎn)者、經(jīng)營者和用戶所構(gòu)成的網(wǎng)絡(luò)及其相應(yīng)的管理系統(tǒng)、軟硬件設(shè)備等內(nèi)容。數(shù)據(jù)獲取:主要包括各專業(yè)部門和地方的第一手數(shù)據(jù)的獲取系統(tǒng)及其產(chǎn)品(包括各種類型的數(shù)字空間信息和有空間參考的信息)信息服務(wù):主要包括持續(xù)地對地理空間數(shù)據(jù)產(chǎn)品進行各種增值加工處理,即信息提取;完成客戶提出的各種信息分析應(yīng)用任務(wù);為各級政府提供規(guī)劃、管理和決策支持方面的服務(wù)內(nèi)容。三、NSII的組成§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前44頁,總共81頁。技術(shù)工具:主要包括能夠高效、持續(xù)地對來自數(shù)據(jù)獲取部分的地理空間數(shù)據(jù)產(chǎn)品(也包括遙感數(shù)據(jù)產(chǎn)品)進行信息提取、分析應(yīng)用與咨詢服務(wù)的各種軟、硬件技術(shù)、方法與工具。政策、規(guī)劃、標準
伙伴關(guān)系:包括從事空間數(shù)據(jù)、信息及其服務(wù)的各種機構(gòu)、人員及其之間的關(guān)系。三、NSII的組成§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前45頁,總共81頁。四、NSII體系結(jié)構(gòu)
政策、規(guī)劃、標準數(shù)據(jù)獲取信息網(wǎng)絡(luò)信息服務(wù)技術(shù)工具伙伴關(guān)系地理空間數(shù)據(jù)獲取系統(tǒng)地理空間信息共享應(yīng)用網(wǎng)絡(luò)§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前46頁,總共81頁。五、NII和NSII§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施國家發(fā)展、社會進步、生活改善地理空間信息服務(wù)(資源調(diào)查、生態(tài)檢測、環(huán)境保護、防災(zāi)減災(zāi)、衛(wèi)生健康以及城市/區(qū)域規(guī)劃、管理和決策等)…國家空間基礎(chǔ)設(shè)施(NSII)國家信息基礎(chǔ)設(shè)施(NII,數(shù)字通訊網(wǎng)絡(luò))電子商務(wù)數(shù)字圖書館數(shù)字通訊當(dāng)前47頁,總共81頁。一方面,SDW是NSII中的重要組成部分,它負責(zé)NSII能夠提供的空間信息的存儲和管理。另一方面,SDW的作用的最大發(fā)揮,離不開NSII的其他部分,例如通訊網(wǎng)絡(luò)為SDW提供了基本的通訊條件。六、SDW和NSII§10.2空間數(shù)據(jù)基礎(chǔ)設(shè)施當(dāng)前48頁,總共81頁。§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘(空間)數(shù)據(jù)挖掘的出現(xiàn)趨勢(空間)數(shù)據(jù)挖掘的概念(空間)數(shù)據(jù)挖掘的分類(空間)數(shù)掘挖掘的體系結(jié)構(gòu)空間數(shù)據(jù)挖掘的可挖掘的知識類型空間數(shù)據(jù)挖掘的功能空間數(shù)據(jù)挖掘的方法空間數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)空間數(shù)據(jù)挖掘近年主要研究進展空間數(shù)據(jù)挖掘的發(fā)展方向當(dāng)前49頁,總共81頁。因為需要一、(空間)數(shù)據(jù)挖掘的出現(xiàn)趨勢§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前50頁,總共81頁。由于近年來空間信息技術(shù)領(lǐng)域內(nèi)觀測技術(shù)、網(wǎng)絡(luò)技術(shù)的飛速發(fā)展以及臺站建設(shè)的普及和不斷完善,包括資源、環(huán)境、災(zāi)害的各種空間數(shù)據(jù)呈指數(shù)級數(shù)增長;一、(空間)數(shù)據(jù)挖掘的出現(xiàn)趨勢§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前51頁,總共81頁。專職處理空間數(shù)據(jù)的GIS在近十幾年來雖得到了廣泛的應(yīng)用,并在空間數(shù)據(jù)的存儲、查詢以及顯示等方面有了較快的發(fā)展,但面對數(shù)據(jù)量日益增長和種類繁多的空間數(shù)據(jù),因其空間分析多以圖形操作為主(如緩沖區(qū)操作,空間疊加,鄰近分析以及空間連接等等),故而在空間信息的深入提取和知識發(fā)現(xiàn)等方面的功能仍相對薄弱。一、(空間)數(shù)據(jù)挖掘的出現(xiàn)趨勢§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前52頁,總共81頁。二、(空間)數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘:在你的數(shù)據(jù)中搜索知識§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前53頁,總共81頁。
數(shù)據(jù)挖掘(DataMining,簡稱DM)是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的、并最終可理解的模式非平凡過程。在上述的定義中,過程通常指多階段的一個過程,涉及數(shù)據(jù)準備、模式搜索、知識評價,以及反復(fù)的修改求精;該過程要求是非平凡的,即要有一定程度的智能性、自動性(例如:僅僅給出所有數(shù)據(jù)的總和就不能算作是一個發(fā)現(xiàn)過程);數(shù)據(jù)挖掘的定義§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前54頁,總共81頁。有效性是指發(fā)現(xiàn)的模式對于新的數(shù)據(jù)仍保持有一定的可信度;新穎性要求發(fā)現(xiàn)的模式應(yīng)該是從前未知的;潛在有用性是指發(fā)現(xiàn)的知識將來有實際效用,如用于決策支持系統(tǒng)里可提高經(jīng)濟效益;最終可理解性要求發(fā)現(xiàn)的模式能被用戶理解,目前它主要是體現(xiàn)在簡潔性上。上述的有效性、新穎性、潛在有用性和最終可理解性綜合在一起可稱之為興趣性(Interestingness)。數(shù)據(jù)挖掘的定義§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前55頁,總共81頁。有時,人們常常把DM和KDD(KnowledgeDiscoveryinDatabases)等同起來。一般說來,KDD側(cè)重于目的和結(jié)果,多用于人工智能領(lǐng)域;而DM側(cè)重于處理過程和方法,多用于數(shù)據(jù)庫領(lǐng)域。也有人將兩者結(jié)合起來使用,稱為數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(DataMiningandKnowledgeDiscovery,簡稱DMKD)技術(shù)。1995年在加拿大召開的第一屆知識發(fā)現(xiàn)和數(shù)據(jù)開采(也稱數(shù)據(jù)挖掘)國際學(xué)術(shù)會議上,KDD被認為從數(shù)據(jù)中發(fā)現(xiàn)有用知識的整個過程,知識即意味著數(shù)據(jù)元素之間的關(guān)系和模式。數(shù)據(jù)開采被認為是KDD過程中的一個特定步驟,它是應(yīng)用具體算法從數(shù)據(jù)中提取模式和知識。數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的關(guān)系§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前56頁,總共81頁。DataCleaningDataIntegrationDatabasesDataWarehouseKnowledgeTask-relevantDataSelectionDataMiningPatternEvaluation數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的關(guān)系§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前57頁,總共81頁。一種觀點,認為OLAP和數(shù)據(jù)挖掘是不交的。OLAP是數(shù)據(jù)匯總/聚集工具,它幫助簡化數(shù)據(jù)分析;而數(shù)據(jù)挖掘自動發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中的隱含模式和有趣知識。OLAP工具的目標是簡化和支持交互數(shù)據(jù)分析,而數(shù)據(jù)挖掘的目標是盡可能自動處理,盡管允許用戶指導(dǎo)這一過程。數(shù)據(jù)挖掘與OLAP的關(guān)系§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前58頁,總共81頁。另一種更廣泛的觀點可能被接受:數(shù)據(jù)挖掘包含數(shù)據(jù)描述和數(shù)據(jù)建模。由于OLAP系統(tǒng)可以提供數(shù)據(jù)倉庫中數(shù)據(jù)的一般描述,OLAP的功能基本上是用戶指揮的匯總和比較。這些盡管有限,但都是數(shù)據(jù)挖掘功能。同樣根據(jù)這種觀點,數(shù)據(jù)挖掘要比簡單的OLAP操作寬得多,因為它不僅執(zhí)行數(shù)據(jù)匯總和比較,而且執(zhí)行關(guān)聯(lián),分類,預(yù)測,聚類,時間序列分析和其他數(shù)據(jù)分析任務(wù)。而且,數(shù)據(jù)挖掘不限于分析數(shù)據(jù)倉庫中得數(shù)據(jù)。它可以分析現(xiàn)存得,比數(shù)據(jù)倉庫提供得匯總數(shù)據(jù)粒度更細得數(shù)據(jù)。它也可以分析事務(wù)、文本的、空間的和多媒體數(shù)據(jù),這些數(shù)據(jù)很難用現(xiàn)有的多維數(shù)據(jù)庫技術(shù)建模。在這種意義下,數(shù)據(jù)挖掘涵蓋的數(shù)據(jù)挖掘功能和處理的數(shù)據(jù)復(fù)雜性要比OLAP大得多。數(shù)據(jù)挖掘與OLAP的關(guān)系§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前59頁,總共81頁。根據(jù)挖掘的數(shù)據(jù)庫類型分類:由于數(shù)據(jù)庫本身可以根據(jù)不同的標準(如數(shù)據(jù)模型,或數(shù)據(jù),或所涉及的應(yīng)用類型)分類,每一類可能需要自己的數(shù)據(jù)挖掘技術(shù)。這樣,數(shù)據(jù)挖掘系統(tǒng)可以有相應(yīng)分類。如根據(jù)數(shù)據(jù)模型,有關(guān)系,事務(wù),面向?qū)ο蟮?,對象-關(guān)系的或者數(shù)據(jù)倉庫的數(shù)據(jù)挖掘系統(tǒng)。如果根據(jù)所處理的數(shù)據(jù)的特定的類型分類,有空間的,時間序列的,文本的或多媒體的挖掘系統(tǒng),或WWW數(shù)據(jù)挖掘系統(tǒng)。三、(空間)數(shù)據(jù)挖掘的分類§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前60頁,總共81頁。根據(jù)數(shù)據(jù)挖掘系統(tǒng)可以根據(jù)所挖掘的知識類型分類:即根據(jù)數(shù)據(jù)挖掘的功能,如特征化,區(qū)分,關(guān)聯(lián),分類聚類,孤立點分析和演變分析,偏差分析,類似性分析等分類。一個全面的數(shù)據(jù)挖掘系統(tǒng)當(dāng)提供多種和/或集成的數(shù)據(jù)挖掘功能。按照所挖掘的知識的粒度或抽象層分類:包括概化知識(在高抽象層),原始層知識(在原始數(shù)據(jù)層),或多層知識(考慮若干抽象層)。一個高級數(shù)據(jù)挖掘應(yīng)當(dāng)支持度抽象層的知識發(fā)現(xiàn)。三、(空間)數(shù)據(jù)挖掘的分類§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前61頁,總共81頁。根據(jù)數(shù)據(jù)是否規(guī)則:還可以分類為挖掘數(shù)據(jù)規(guī)則性(通常出現(xiàn)的模式)和數(shù)據(jù)不規(guī)則性(如異?;蚬铝Ⅻc)。一般,概念描述,關(guān)聯(lián)分析,分類,預(yù)測和聚類挖掘數(shù)據(jù)規(guī)律,將孤立點作為噪音排除。這些方法也能幫助檢測孤立點。根據(jù)應(yīng)用分類:數(shù)據(jù)挖掘系統(tǒng)可以根據(jù)應(yīng)用分類。例如,金融,電信,DNA,股票市場,E-MAIL等等。三、(空間)數(shù)據(jù)挖掘的分類§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前62頁,總共81頁。根據(jù)所用的技術(shù)分類:可以根據(jù)用戶交互程度(例如自動系統(tǒng),交互探查系統(tǒng),查詢驅(qū)動系統(tǒng)),或所用的數(shù)據(jù)分析方法(例如面向數(shù)據(jù)庫或數(shù)據(jù)倉庫的技術(shù),機器學(xué)習(xí),統(tǒng)計學(xué),可視化,模式識別,神經(jīng)網(wǎng)絡(luò)等)描述。復(fù)雜的數(shù)據(jù)挖掘系統(tǒng)通常采用多種數(shù)據(jù)挖掘技術(shù),或采用有效的,集成的技術(shù),結(jié)合一些方法的優(yōu)點。三、(空間)數(shù)據(jù)挖掘的分類§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前63頁,總共81頁。四、(空間)數(shù)據(jù)挖掘的體系結(jié)構(gòu)§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘控制器DB接口空間數(shù)據(jù)結(jié)構(gòu)查詢優(yōu)化聚焦對象和屬性抽取模式抽取統(tǒng)計學(xué),機器學(xué)習(xí)和數(shù)據(jù)挖掘方法計算幾何學(xué)評估有趣程度統(tǒng)計重要性知識庫概念層元數(shù)據(jù)數(shù)據(jù)庫統(tǒng)計數(shù)據(jù)發(fā)現(xiàn)領(lǐng)域知識DBMS用戶查詢當(dāng)前64頁,總共81頁。普遍的幾何知識:指某類目標的數(shù)量、大小、形態(tài)特征等的普遍的幾何特征??臻g分布規(guī)律:指目標在地理空間的分布規(guī)律,分成在垂直向、水平向以及垂直向和水平向的聯(lián)合分布規(guī)律??臻g關(guān)聯(lián)規(guī)則:指空間目標間相鄰、相連、共生、包含等空間關(guān)聯(lián)規(guī)則。五、(空間)數(shù)據(jù)挖掘的可挖掘的知識類型§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前65頁,總共81頁??臻g聚類規(guī)則:空間聚類規(guī)則,或空間分類規(guī)則,是指特征相近的空間目標聚類成上一級類的規(guī)則,可用于GIS的空間概括和綜合??臻g特征規(guī)則:指某類或幾類空間目標的幾何的和屬性的普遍特征,即對共性的描述??臻g區(qū)分規(guī)則:指區(qū)分不同類目標的特征??臻g演變規(guī)則:指空間目標依時間的變化規(guī)則。§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘五、(空間)數(shù)據(jù)挖掘的可挖掘的知識類型當(dāng)前66頁,總共81頁。分類模式它是一分類函數(shù),能夠把數(shù)據(jù)集中的數(shù)據(jù)相項影射到某個給定的類上。分類模式往往表現(xiàn)為一棵分類樹,根據(jù)數(shù)據(jù)的值從樹根開始搜索,沿數(shù)據(jù)滿足的分支往上走。走到樹葉就能確定類別?;貧w模式回歸模式與分類模式相似,它們的差別在于分類模式的預(yù)測值是離散的,回歸模式的預(yù)測值是連續(xù)的。時間序列模式根據(jù)數(shù)據(jù)隨時間變化的趨勢預(yù)測將來的值。六、空間數(shù)據(jù)挖掘的功能§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前67頁,總共81頁。聚類模式把數(shù)據(jù)分到不同的組中,組間差別盡可能大,組內(nèi)差別盡可能小。關(guān)聯(lián)模式關(guān)聯(lián)模式是數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則。序列模式序列模式和回歸模式相仿,而把數(shù)據(jù)之間的關(guān)系與時間聯(lián)系起來。在解決實際問題時,經(jīng)常要使用各種模式。分類模式與回歸模式是最普遍的模式。六、空間數(shù)據(jù)挖掘的功能§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前68頁,總共81頁。1.空間分析方法2.統(tǒng)計分析方法3.歸納學(xué)習(xí)方法4.聚類與分類方法5.可視化方法6.粗集方法7.云理論8.空間特征和趨勢探測方法9.數(shù)字地圖圖像分析和模式識別方法10.探測性的數(shù)據(jù)分析方法11.遺傳算法12.模糊邏輯13.最近鄰技術(shù)七、空間數(shù)據(jù)挖掘的方法§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前69頁,總共81頁。八、空間數(shù)據(jù)挖掘的系統(tǒng)結(jié)構(gòu)§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘知識庫數(shù)據(jù)倉庫數(shù)據(jù)庫數(shù)據(jù)庫或數(shù)據(jù)倉庫服務(wù)器數(shù)據(jù)挖掘引擎模式評估圖形用戶界面數(shù)據(jù)清理數(shù)據(jù)集成過濾當(dāng)前70頁,總共81頁。空間知識發(fā)現(xiàn)的系統(tǒng)結(jié)構(gòu)§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘用戶界面感興趣的數(shù)據(jù)發(fā)現(xiàn)的知識空間數(shù)據(jù)庫領(lǐng)域知識數(shù)據(jù)挖掘與知識發(fā)現(xiàn)模塊空間數(shù)據(jù)管理模塊當(dāng)前71頁,總共81頁。1.針對海量數(shù)據(jù)的算法研究改變算法運行的策略:采用并行運算環(huán)境;提高數(shù)據(jù)庫查詢語言的效率;對原有算法的結(jié)構(gòu)進行改進,從而減小運算的復(fù)雜度。九、空間數(shù)據(jù)挖掘近年主要研究進展§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前72頁,總共81頁。2.以神經(jīng)網(wǎng)絡(luò)為代表的智能方法成為解決空間非線性關(guān)系的主要工具
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的發(fā)展統(tǒng)計學(xué)習(xí)領(lǐng)域的研究熱點——支撐向量機機器學(xué)習(xí)中熵標準的應(yīng)用九、空間數(shù)據(jù)挖掘近年主要研究進展§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)前73頁,總共81頁。3.尺度空間概念的應(yīng)用4.模糊集和粗集理論的應(yīng)用5.高維數(shù)據(jù)的挖掘算法6.空間數(shù)據(jù)的缺值研究九、空間數(shù)據(jù)挖掘近年主要研究進展§10.3數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘當(dāng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新教材高考地理二輪復(fù)習(xí)綜合題專項訓(xùn)練六地理過程類含答案
- 【華師】第三次月考卷
- 語文教學(xué)論教案 第三章 語文教學(xué)設(shè)計
- 調(diào)研報告:醫(yī)療保險基金管理使用中存在的問題及建議
- 金屬的腐蝕與防護-2024年高中化學(xué)講義
- 聯(lián)盟加盟合同模板
- 挖掘機租賃合同示范文本
- 房地產(chǎn)抵押合同2024年
- 銀行承兌匯票貼現(xiàn)協(xié)議模板
- 股權(quán)投資合作協(xié)議格式設(shè)計
- GB/T 42631-2023近岸海洋生態(tài)健康評價指南
- TSG特種設(shè)備安全技術(shù)規(guī)范
- 酒旅餐飲商家直播間通用話術(shù)大全10-46-16
- 中國民族民俗:白族三道茶
- 自動扶梯與自動人行道2023版自行檢測規(guī)則
- TD-T 1044-2014 生產(chǎn)項目土地復(fù)墾驗收規(guī)程
- 違法建筑處置法律解讀培訓(xùn)PPT
- 《加氫裂化工藝》加氫裂化技術(shù)講義
- Unit 1 Art 單詞默寫 高中英語人教版(2019)選擇性必修第三冊
- 初期雨水及超標廢水收集工程施工方案
- 2023年北京師范大學(xué)實驗小學(xué)教師招聘筆試備考題庫及答案解析
評論
0/150
提交評論