空間數(shù)據(jù)庫復習題_第1頁
空間數(shù)據(jù)庫復習題_第2頁
空間數(shù)據(jù)庫復習題_第3頁
空間數(shù)據(jù)庫復習題_第4頁
空間數(shù)據(jù)庫復習題_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、Chapter 1: Introduction to Spatial Databases1、舉例說明什么是空間數(shù)據(jù)、非空間數(shù)據(jù)?如何理解空間查詢(spatial queries)和非空間查詢的區(qū)別(Non-spatial queries)?答:河流的泛洪區(qū),衛(wèi)星影像數(shù)據(jù)、氣象氣候數(shù)據(jù)等都可以是空間數(shù)據(jù) 書店名稱 店員人數(shù),去年的銷售量,電話號碼等是非空間數(shù)據(jù)空間查詢是對空間數(shù)據(jù)的查詢或命令2、什么是GIS,什么是SDBMS?請闡述二者的區(qū)別和聯(lián)系。答:1、GIS是一個利用空間分析功能進行可視化和空間數(shù)據(jù)分析的軟件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空間分析/統(tǒng)計、度量 G

2、IS 可以利用SDBMS來存儲、搜索、查詢、分享大量的空間數(shù)據(jù)集 2、SDBMS是一個軟件模塊。它可以、利用一個底層的數(shù)據(jù)庫管理系統(tǒng)、支持多種空間數(shù)據(jù)模型、相應的空間抽象數(shù)據(jù)類型(ADT)以及一種能夠調(diào)用這些ADT的查詢語言、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領域規(guī)則3、區(qū)別與聯(lián)系:、利用GIS可以對某些對象和圖層進行操作,而利用SDBMS則可以對更多的對象集和圖層進行更加簡單的操作 、SDBMS可以在GIS不能使用的某些領域進行使用,例如基因組學、天文學、多媒體信息系統(tǒng)等 、GIS可以作為SDBMS的前端,利用一個高效的SDBMS可以大大提高GIS的效率和生產(chǎn)率。3、從G

3、IS這一縮寫的三種含義來理解GIS的發(fā)展歷程。答:地理信息系統(tǒng):為專業(yè)人員提供的軟件地理信息科學:為地理信息系統(tǒng)和服務提供使用和發(fā)展的定義、框架和理論地理信息服務:為普通用戶提供的網(wǎng)點和服務中心,例如PC機上的地理和空間服務4、用傳統(tǒng)數(shù)據(jù)庫系統(tǒng)管理空間數(shù)據(jù),存在什么不足之處?答:1)無法用遞歸和嵌套的方式來描述復雜關系的層次和網(wǎng)狀結(jié)構(gòu),模擬和操作復雜地理對象的能力較弱;2)用關系模型描述本身具有復雜結(jié)構(gòu)和涵義的地理對象時,需對地理實體進行不自然的分解,導致存儲模式、查詢途徑及操作等方面均顯得語義不甚合理;3)由于概念模式和存儲模式的相互獨立性,及實現(xiàn)關系之間的聯(lián)系需要執(zhí)行系統(tǒng)開銷較大的聯(lián)接操作

4、,運行效率不夠高4)空間數(shù)據(jù)通常是變長的,而一般RDBMS只允許記錄的長度設定為固定長度,此外,通用DBMS難于存儲和維護空間數(shù)據(jù)的拓撲關系。 5)一般RDBMS都難以實現(xiàn)對空間數(shù)據(jù)的關聯(lián)、連通、包含、疊加等基本操作。 6)一般DBMS不能支持GIS需要的一些復雜圖形功能。7)一般RDBMS難以支持復雜的地理信息,因為單個地理實體的表達需要多個文件、多條記錄,包括大地網(wǎng)、特征坐標、拓撲關系、屬性數(shù)據(jù)和非空間專題屬性等方面信息。 8)GIS管理的是具有高度內(nèi)部聯(lián)系的數(shù)據(jù),為了保證地理數(shù)據(jù)庫的完整性,需要復雜的安全維護系統(tǒng),而這些完整性約束條件必須與空間數(shù)據(jù)一起存儲,由地理數(shù)據(jù)庫來維護系統(tǒng)數(shù)據(jù)的完

5、整性。否則,一條記錄的改變會導致錯誤、相互矛盾的數(shù)據(jù)存在,而一般RDBMS難以實現(xiàn)這一功能。5、What is a SDBMS ?答:SDBMS是一個軟件模塊。它可以、利用一個底層的數(shù)據(jù)庫管理系統(tǒng)、支持多種空間數(shù)據(jù)模型、相應的空間抽象數(shù)據(jù)類型(ADT)以及一種能夠調(diào)用這些ADT的查詢語言、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領域規(guī)則6、什么是后關系數(shù)據(jù)庫模型?后關系數(shù)據(jù)庫模型有哪些?答:后關系數(shù)據(jù)庫模型支持用戶定義抽象數(shù)據(jù)類型,空間數(shù)據(jù)的類型可以添加。包括面向?qū)ο蟮臄?shù)據(jù)庫模式OOBDMS和面向關系ORDBMS的數(shù)據(jù)庫模式。7、SDBMS的三層體系結(jié)構(gòu)(Three Layer

6、Architecture)是什么?借此深入理解SDBMS的作用。答:空間應用空間數(shù)據(jù)庫DBMS 教材P11的圖8、空間數(shù)據(jù)庫主要涉及哪些內(nèi)容?答:數(shù)據(jù)模型、查詢語句、查詢處理與優(yōu)化、文件組織和索引、數(shù)據(jù)挖掘9、舉例說明單遍掃描查詢和多遍掃描查詢的概念。答:單邊掃描查詢中,被查詢的表(關系)中的一條記錄(元組)最多只被訪問一次;例如“列出武大周圍5km內(nèi)的書店的名字”。多遍掃描查詢是被查詢的表(關系)中的一條記錄(元組)至少被訪問一次,例如“找出其代表的選取范圍大于200公頃并且在這區(qū)擁有公司的女議員的名字”10、過濾精煉策略的作用?兩個步驟的內(nèi)容是什么? 提示:ppt : Efficient

7、algorithms to answer spatial queries Common Strategy - filter and refine(過濾精煉 ) Filter Step:Query Region overlaps with MBRs of B,C and D過濾:查詢區(qū)域與B、C、D的最小外接矩形有重疊部分,保留B、C、D,其他的舍棄 Refine Step: Query Region overlaps with B and C精煉:查詢區(qū)域與B、C有重疊,舍棄D11、平面掃描(plane sweep)技術主要解決什么問題?其主要步驟?答:主要解決的是如何在過濾階段中盡可能多的淘

8、汰不符合條件的對,從而減少幾何計算的計算代價。Step 1:從左至右移動一條掃描線(例如,垂直于x軸的線),停在RS的第一個元素處。這就是具有最小Txl值的矩形T,例子為是矩形R4 。Step2:搜索S中已排序的矩形,直到抵達第一個矩形Sf,這里有Sfxl Txu。顯然,對于所有1jf,關系Txl,TxuSjxl,Sjxu存在(非空),在本例中Sf就是S1。注意f是以圖1-9c的數(shù)組索引為序,即S1=S2、S2= S1、S3=S3。這樣S2就是一個可能與R4交疊的候選矩形。Step 3:如果對任意ljf,關系Tyl,Tyu Sjyl,Sjyu存在,則Sj與T相交。因此,這一步就確定了R4與S2

9、的確是交疊的,并且是連接結(jié)果的一部分。記錄所有這樣的信息,然后將矩形T(R4)從集合RS中去掉,它不再需要參與結(jié)果集中的其他相交對。Step 4:繼續(xù)移動掃描線來穿過集合RS,直至碰到下一個矩形,在本例中是S2。這時進行步驟2和3。Step 5:當 RS= 時,處理結(jié)束;12、從程序員的觀點和DBMS設計者的觀點看,影響系統(tǒng)效率的因素有何不同。答:在程序員看來,計算機主要包括兩個部分:CPU和無限量的內(nèi)存 在DBMS設計者看來,計算機主要包括三個部分:CPU、有限的內(nèi)存、無限的硬盤空間。訪問硬盤的速度要遠遠小于訪問內(nèi)存的速度,因此前者關注減少算法的計算時間,后者強調(diào)的是將計算時間和I/O時間的

10、總和減少到最小。13、查詢優(yōu)化和數(shù)據(jù)挖掘的概念。答:查詢優(yōu)化:基于數(shù)據(jù)集的特點對查詢中的操作進行排序,為每一步操作選擇有效策略 數(shù)據(jù)挖掘:即進行系統(tǒng)的搜索,找出隱藏在電子信息中潛在的有用信息。Chapter 2: Spatial Concepts and Data Models1、 什么是數(shù)據(jù)模型?舉例說明數(shù)據(jù)模型的重要性。答、數(shù)據(jù)模型是數(shù)據(jù)集的特定結(jié)構(gòu)和模式,是對數(shù)據(jù)的文件描述,有利于某些性質(zhì)的前期分析。 作用:、屬性的前期分析;、重利用多媒體應用中的共享數(shù)據(jù);、組織中交換數(shù)據(jù)、將數(shù)據(jù)傳遞給新軟件或環(huán)境例子:千禧年危機 正確的使用數(shù)據(jù)模式可以顯著的降低成本,如果軟件中的時間和數(shù)據(jù)被定義成抽象

11、數(shù)據(jù)模型,只有一小部分的軟件會執(zhí)行數(shù)據(jù),ADT數(shù)據(jù)要被重新修改。2、 掌握兩種常用的空間信息模型:要素模型和場模型,矢量、柵格數(shù)據(jù)結(jié)構(gòu)。答:場模型:、空間分割框架 、場函數(shù) 、場操作:并、復合森林模型中分段函數(shù)表示,區(qū)域中每個點被映射成主要樹種對應的值 要素模型:、對象:把空間信息抽象成明確的,可識別的事物或?qū)嶓w;、對象具有屬性和操作森林模型中多邊形表示(林分),每個對象有唯一的標示符、主要樹種和一塊區(qū)域。矢量數(shù)據(jù)結(jié)構(gòu)柵格數(shù)據(jù)結(jié)構(gòu):柵格結(jié)構(gòu)用密集正方形(或三角形,多邊形)將地理區(qū)域劃分為網(wǎng)格陣列。位置由行,列號定義,屬性為柵格單元的值。點:由單個柵格表達。線:由沿線走向有相同屬性取值的一組相鄰

12、柵格表達。面:由沿線走向有相同屬性取值的一片柵格表達。 3、 基于場模型的操作有哪些,舉例說明區(qū)基于場模型的局部操作、聚焦(focal)和區(qū)域操作?基于對象模型的操作有哪些?答:基于場模型:局部操作:空間框架內(nèi)一個給定位置的新場的取值只依賴于同一個位置場的輸入值。書上P31。 聚焦操作:在指定位置的結(jié)果場的值依賴于同一位置的一個假定小領域輸入場的值。 極限、高程場的梯度 區(qū)域操作:與聚集運算符或微積分中的積分運算有關。計算每個樹種的平均高度。 基于對象模型:面向集合、拓撲、方位、度量空間 4、 什么是拓撲關系,舉例說明拓撲與非拓撲特性、拓撲與非拓撲操作。答:是指滿足拓撲幾何學原理的各空間數(shù)據(jù)間

13、的相互關系。即用結(jié)點、弧段和多邊形所表示的實體之間的鄰接關聯(lián)和包含等關系。 拓撲特性:彈性變形后臨近物體之間的拓撲關系沒有發(fā)生改變 非拓撲特性:彈性變形后臨近物體之間的拓撲關系發(fā)生了改變拓撲操作與非拓撲操作 5、 OGIS提出的關于空間幾何體的基本構(gòu)件有哪些?6、 說明九交模型表達拓撲關系的原理。答:在一個平面上。兩個對象A、B之間的二元拓撲關系主要基于以下的相交情況,即分別是A和B的內(nèi)部、邊界、外部。值六部分可以構(gòu)成九交模型??紤]取值有空(0)和非空(1),可以確定有29=512種二元拓撲關系。對于R嵌在中的二維區(qū)域,有八個關系是可實現(xiàn)的,并且它們彼此互斥且完全覆蓋。:相離、相接、交疊、相等

14、、包含、在內(nèi)部、覆蓋、被覆蓋。7、 數(shù)據(jù)庫設計的三個步驟及其主要內(nèi)容。答、首先,采用高層次的概念數(shù)據(jù)模型來組織所有與應用相關的可用信息; 然后,邏輯建模階段,與概念數(shù)據(jù)模型在商用DBMS上的具體實現(xiàn)有關 最后,數(shù)據(jù)庫設計的第三個步驟是物理設計的建模,它解決數(shù)據(jù)庫營養(yǎng)在計算機中具體實現(xiàn)是方方面面的細節(jié)。8、 ER模型的作用,ER圖包括哪些要素,如何表達多值屬性?ER圖與空間信息對象模型之間的異同?答:ER圖可以以一種避開計算機隱喻的方式來表達這個微型世界,從而把應用中的概念與實現(xiàn)細節(jié)分離開來。ER圖包括實體(物理上或概念上獨立存在的事物或?qū)ο螅?、屬性和?lián)系。實體用屬性來刻畫性質(zhì),實體之間通過練習

15、相互作用和關聯(lián)。屬性可以是單值或多值。ER圖中實體用矩形表示,屬性表示為橢圓,聯(lián)系為菱形。碼屬性加下劃線,多值屬性用雙橢圓。異同:、實體是物體屬性的集合;、ER模型不允許普通用戶定義操作;、在對象模型中關系不被直接支持,但可以由操作來模仿。9、 數(shù)據(jù)庫三層約束的內(nèi)容:碼約束-實體完整性(entity integrity)約束,參照完整性(referential integrity約束和用戶參照完整性。簡述關系模式中的三種完整性。答;碼約束:每個關系必須要有一個主碼;實體完整性約束:主碼不能為空;參照完整性約束:外碼的屬性值要么是另一個關系的主碼,要么為空值。10、外碼的概念。答:外碼是一個關系

16、的屬性集,這個關系被復制到另外一個關系中。主碼與外部碼提供了一個實現(xiàn)關系間聯(lián)系的手段。11、ER圖向關系模型的轉(zhuǎn)換,注意對多值屬性的轉(zhuǎn)換。(P16)答:、實體成為關系;實體的屬性映射成為關系的屬性;多值屬性形成新的關系 、Relationships (1:1):將任一實體的碼屬性作為其他關系的一個外碼 、Relationships (M:1):將“1”側(cè)的關系的主碼作為“M”側(cè)關系的外碼。 、M:N Relationships become a relation (M:N中M和N共同形成新表的關鍵字)12、對于空間數(shù)據(jù),ER模型方法的不足之處?為表達空間概念,擴展ER模型主要增加了哪些要素?-

17、實體象形圖、關系象形圖,讀懂擴展ER模型的表示符號。(書上P51)答:1)、ER模型的最初設計隱含了基于對象模型的假設。因此,場模型無法用ER模型進行自然的映射 2)、在傳統(tǒng)的ER模型中,實體之間的聯(lián)系由所要開發(fā)的應用來導出,而在空間建模中,空間對象之間總會有內(nèi)在的聯(lián)系 3)、建??臻g對象所使用額試題聯(lián)系類型和“地圖”的比例尺有關13、舉例說明用象形符號擴展ER圖,對于空間數(shù)據(jù)建模有何好處? 用象形符號擴展ER圖,以便專門處理空間數(shù)據(jù)類型。這將減少ER圖以及所產(chǎn)生的關系模式的復雜度,同時改進空間建模的質(zhì)量??臻g聯(lián)系(例如Road-Crosses-River)就可以從ER圖中省略,用隱式的方式表

18、示。關系模式中的表達多值空間屬性的關系和M:N空間聯(lián)系也就不需要了 14、 舉例說明類、屬性、方法、聚合、泛化、和關聯(lián)等概念?答:類:是多有在應用中具有相同性質(zhì)的對象的封裝,等價于ER模型中的實體;例如設施就是一個類。 屬性:描述類的對象。屬性還有一個與之相關聯(lián)的作用域,分為公有、私有、受保護 方法:是一些函數(shù),是類定義的一部分,用來修改類的行為或狀態(tài) 關系:將一個類與另一個類或者它自己相聯(lián)系,類似于ER中的聯(lián)系。UMLCD中三種重要關系:聚合、泛化、關聯(lián)。 聚合:描述部分與整體的關系:強聚合、弱聚合 泛化:eg. 多邊形是點線面的泛化; 關聯(lián):反應不同類的對象是如何聯(lián)系的。15、 UML的作

19、用?了解UML的主要符號。答:UML是用于面向?qū)ο筌浖O計的概念層建模的新興標準之一,它是一種標準化語言,用于在概念層對結(jié)構(gòu)化模式和董濤行為進行建模。16、 比較ER與UML。答:1)、沒有方法的類就是實體;2)、屬性在兩個里都一樣;3)、UML中沒有主鍵和完整性約束;4)、ER中沒有方法;5)、ER中關系的內(nèi)容更豐富;6)、ER圖中的實體與數(shù)據(jù)集有關,但UML的類幾乎和數(shù)據(jù)集無關。Chapter 3 Spatial Query Languages1. Three Components of SQL。請列舉SQL所包含的功能,并對每種功能列舉相關的操作符(語句)。答:數(shù)據(jù)定義語言DDL:創(chuàng)建和

20、修改關系表(包括索引)數(shù)據(jù)操縱語言DML:插入,刪除,更新,查詢數(shù)據(jù)控制語言DCL:并發(fā)控制,事務處理2. SELECT specifies desired columnsFROM specifies relevant tablesWHERE specifies qualifying conditions for rows (限定條件)ORDER BY specifies sorting columns for resultsGROUP BY, HAVING specifies aggregation and statistics(要求:看懂書上例句,要求會寫語句)3. 擴展SQL以處理空間數(shù)

21、據(jù),掌握對標準SQL進行了哪些方面的擴展?提示:ppt: SQL 3 allows user defined data types and operations. Spatial data types and operations can be added to SQL3SQL3支持用戶自定義類型和操作,空間數(shù)據(jù)類型和操作被允許加入到SQL3中4. Open Geodata Interchange Standard (OGIS)支持的Spatial Data Model和空間操作有哪些答:用于所有集合類型的基本操作;用于空間對象間拓撲關系的操作謂詞;用于空間分析的一般操作5. 讀懂List o

22、f Spatial Query Examples。給語句,說明查詢目的?或者給出查詢目的,要求寫語句。6. view(視圖)的含義。視圖使用來描述導出數(shù)據(jù)或查詢結(jié)果簡化復雜網(wǎng)狀查詢的表Chapter4: Spatial Storage and Indexing1、What is a physical data model? Why learn physical data model concepts?答:1)、執(zhí)行邏輯數(shù)據(jù)模型的理論基礎,使用現(xiàn)有的構(gòu)件在一個有效容錯的方式中2)、選擇合適的DBMS,某些DBMS不支持空間索引;使DBMS運行的更加有效率。2、Is relational DBMS

23、 physical data model suitable for spatial data?如果不適合,有哪兩類解決途徑?答:不合適。關系DBMS則只能對數(shù)字進行簡單處理;排序、查詢樹對數(shù)字非常有效,但這些概念都不適合用于處理空間數(shù)據(jù)提示:ppt 途徑1)Reusing relational physical data model concepts,重新使用關系物理數(shù)據(jù)模型的概念:Space filling curves define a total order for points用空間填充曲線來定義點的排列This total order helps in using ordered f

24、iles, search trees有助于使用有序文件和查詢樹But may lead to computational inefficiency!但可能會導致計算無效率途徑2):New spatial techniques新空間技術:Spatial indices, e.g. grids, hierarchical collection of rectangles空間索引:例如網(wǎng)格Provide better computational performance能提供更好的計算表現(xiàn)3、計算機存儲設備的種類?數(shù)據(jù)庫系統(tǒng)是怎么利用各種設備的?提示:ppt:Types of storage Devi

25、ces:Main memories - fast but content is lost when power is off主存:速度快,信息斷電丟失Secondary storage - slower, retains content without power二級存儲器:慢,信息斷電不丟Tertiary storage (如磁帶驅(qū)動器 )- very slow, retains content, very large capacity脫機存儲器:非常慢,保存信息容量非常大。DBMS usually manage data on secondary storage, e.g. disks U

26、se main memory to improve performance User tertiary storage (e.g. tapes) for backup備份, archival檔案 etc.4、磁盤存儲相關概念:磁道track、扇區(qū)sector、柱面cylinder?頁面的概念?答:磁道:圓心磁盤片上向邊緣延伸的同心圓扇區(qū):每個磁道中被分成若干等份的區(qū)域柱面:是磁盤上具有相同鐳的磁道的集合頁面:又稱磁盤塊。是磁盤與主存之間的最小傳輸單位5、訪問磁盤扇區(qū)數(shù)據(jù)的過程,哪個過程花費的時間最多?提示:ppt: Accessing a sector has three major step

27、s: Seek(尋道): Move head assembly to relevant track (ts) 磁頭到達特定磁道所用的時間 Latency(延遲時間): Wait for spindle to rotate relevant sector under disk head(tl)塊旋轉(zhuǎn)到磁頭下方所用的時間 Transfer傳輸時間: Read or write the sector (tt)置于正確位置后讀寫塊中數(shù)據(jù)的實際時間 1236、如何有效利用磁盤硬件?提示:ppt : Using Disk Hardware Efficiently Size of sectors扇區(qū)面積 L

28、arger sector provide faster transfer of large data sets 數(shù)據(jù)集大時大扇區(qū)提供更快的傳輸速度 But waste storage space inside sectors for small data sets 但浪費了小數(shù)據(jù)集的存儲空間 Placement of most frequently accessed data items放置頻繁使用的數(shù)據(jù) On middle tracks rather than innermost or outermost tracks 在中間的磁道而不是最里面或最外面的磁道 Reason: minimize

29、 average seek time可以減少尋道時間 Placement of items in a large data set requiring many sectors放置一個需要很多扇區(qū)的大數(shù)據(jù)集 Choose sectors from a single cylinder盡量放在同一個柱面 Reason: Minimize seek cost in scanning the entire data set.減少掃描全集花費的時間7、 域(filed)、記錄(record)、文件(file)的概念,提示: Mapping Records and files to Disk. Recor

30、ds Often smaller than a sector Many records in a sector Files with many records文件是記錄的集合 Many sectors per file8、頁面的概念:磁盤與主存之間的最小傳輸單位。一個文件可能跨越多個頁面。一個頁面是槽的集合,一個槽包含一條記錄9、文件結(jié)構(gòu)的含義,舉例說明幾種常用文件結(jié)構(gòu)heap,Ordered、Hashed 、Clustered。答:文件結(jié)構(gòu)是指文件中記錄的組織形式。 堆:無序文件。記錄沒有特定的順序。,根據(jù)給定的關鍵碼(如name)查找一條記錄需要掃描文件中的記錄。在最壞情況下,文件的所有記

31、錄都要被檢查,所有存儲該文件數(shù)據(jù)的磁盤頁面都要被訪問。平均來說,需要檢索一半的磁盤頁面。優(yōu)點是在進行插入操作時可以很容易地在文件末尾插入一條新記錄。存儲河流表 散列文件:使用散列函數(shù)吧記錄分到一系列散列單元中??扇≈幵谟谒軌虬褦?shù)量大致相同的記錄放入每個散列單元中。對于點查詢、插入、刪除都很有效。不適合范圍查詢。按字符個數(shù)存儲城市名稱。 有序文件:根據(jù)給定的主碼與對記錄進行組織。折半法非常有效。不能直接運用在空間領域例如,除非對多維空間中的點定義一個全序,否則無法對城市的位置排序。有序文件組織方式還可以根據(jù)對空間數(shù)據(jù)集的文件組織方式而概括成空間聚類。 聚類:聚類的目的就是降低響應常見的大查詢

32、的尋道時間(ts)和等待時間(t1)。對于空間數(shù)據(jù)庫來說,這意味著在二級存儲中,空間上相鄰的和查詢上有關聯(lián)性的對象在物理上應當存儲在一起。10、使用空間填充曲線組織空間數(shù)據(jù)的意義?提示:Chapter 1 , Organizing spatial data with space filling curves Impose an ordering on the locations in a multi-dimensional space 加強了多維空間中的位置排序 Allow use of traditional efficient search methods on spatial data

33、允許在空間數(shù)據(jù)中使用傳統(tǒng)的有效搜索11、掌握Z-曲線、hilbert曲線的生成。(要求給IJ號,能夠?qū)懗鰧猌碼和Hilbert碼的計算過程)12、基于Z-曲線,如何進行區(qū)域匹配的?(匹配有效性?)答:用z1和z2分別代表兩個z值,其中z1是較短的一個,并未失去一般性;對于相應的區(qū)域(比如塊)r1和r2,只有兩種可能:1)如果z1是z2的前綴(例如,z1=l*,z2=11*或z1=*l*,z2=11*),則r1完全包含r2;2)兩個區(qū)域不相交(例如,z1=*0*,z2=11*)。13、什么是索引?索引文件的內(nèi)容。主索引和二級索引。A table can have at most one pri

34、mary index. Why?答:索引文件是用來提高數(shù)據(jù)文件查詢效率的輔助文件。記錄的只有碼值和數(shù)據(jù)文件中的頁面地址。索引記錄被排序,數(shù)據(jù)文件本身可以是不按關鍵碼排序。主索引,如果數(shù)據(jù)文件的記錄是按照主碼排列的,那么索引就只需要保存數(shù)據(jù)文件的每個磁盤頁面第一個主碼域值。每個索引記錄一個數(shù)據(jù)頁面。二級索引:堆數(shù)據(jù)文件,一個索引記錄一個數(shù)據(jù)。一個磁盤最多只有一個主索引,因為主索引決定了數(shù)據(jù)在磁盤上的存儲順序。14、什么是空間索引?有哪些空間索引方法?答:空間索引結(jié)構(gòu)用一組桶(通常對應二級存儲的頁面)來組織對象??臻g索引呢就是依據(jù)空間對象的位置和形狀或空間對象之間的某種空間關系按一定的順序排列的一

35、種數(shù)據(jù)結(jié)構(gòu),其中包含空間對象的概要信息,如對象的標識、外接矩形及指向空間對象實體的指針。方法:1)在系統(tǒng)中加入專門的外部空間數(shù)據(jù)結(jié)構(gòu),為空間屬性提供如同B樹之于線性屬性的功能。2)使用空間填充曲線(如Z序、Hilbert曲線)將空間對象映射到一維空間,以便空間對象存儲在標準的一維索引(例如B樹)中。15、網(wǎng)格文件包含哪兩部分內(nèi)容?建立格網(wǎng)索引的思路和步驟?了解R樹索引和R+樹索引的思想?答:包含n維網(wǎng)格目錄,目錄只能夠的每一項指向一個數(shù)據(jù)桶。第二部分是由稱為線性比例的一維數(shù)組組成的結(jié)構(gòu)。思路:是將研究區(qū)域用橫豎線條劃分大小相等或不等的格網(wǎng),記錄每一個格網(wǎng)所包含的空間實體。當用戶進行空間查詢時,

36、首先計算出用戶查詢對象所在格網(wǎng),然后再在該網(wǎng)格中快速查詢所選空間實體,這樣一來就大大地加速了空間索引的查詢速度。 步驟:劃分行列(M X N);計算網(wǎng)格大小及每個格網(wǎng)的矩形范圍;開辟目標空間(記錄目標穿過的網(wǎng)格)和格網(wǎng)空間(記錄格網(wǎng)內(nèi)的目標);注冊點、線、面、注記等目標,并記錄之;提取窗口所覆蓋的目標關鍵字(采用數(shù)據(jù)位方法,以降低排序時間,及避免數(shù)據(jù)的繪制順序等);提取目標所涉及的網(wǎng)格。Chapter5 Query Processing and Optimization1、 從查詢處理的角度來看,空間數(shù)據(jù)庫與關系數(shù)據(jù)庫之間有哪些主要區(qū)別?答:至少有三個主要區(qū)別:、與關系數(shù)據(jù)庫不同,空間數(shù)據(jù)庫沒

37、有固定的運算符集合可以充當查詢計算的基本構(gòu)件 、空間數(shù)據(jù)庫要處理非常大量的復雜對象,這些對象具有空間范圍,不能自然的排列成一維數(shù)組。 、檢測空間謂語要用到計算量極大的算法,所以不能再假定I/O代價在CPU的處理代價中只能主導地位2、 空間查詢的基本構(gòu)件有哪些? 提示:ppt5.1.2 Choice of building blocks,List of building blocksPoint Query,Range Query,Spatial Join,Nearest Neighbor;點查詢:給定一個查詢點P,找出所有包含它的空間對象O范圍或區(qū)域查詢:給定一個查詢多邊形P,找出所有與之相交的

38、空間對象O空間鏈接:兩個表R和S基于一個空間謂語進行連接時,該連接成為空間連接。最近鄰居:空間聚集,即給定一個對象O,找出所有距離O最近的對象P3、 空間查詢處理的“過濾-精煉模式”是什么,其目的?(對象操作的兩步查詢處理)目的:用兩步算法高效地處理復雜的數(shù)據(jù)類型 過濾:尋找Q最終結(jié)果的超集S;精煉:利用GIS處理S來找到精確的Q的答案4、 空間查詢處理中,一般是采用什么(MBR))來替代不同類型的空間實體(如線、面)?這樣做有何好處?提示:Ppt:Approximating spatial data typesMinimum orthogonal bounding rectangle (MO

39、BR or MBR)最小外接矩形approximates line string, polygon, 近似的線串,多邊形See Examples below (Black rectangle are MBRs for red objects)MBRs are used by spatial indexes, e.g. R-treeMAlgorithms for spatial operations MBRs are simple空間操作MRS的算法很簡單5、 舉例說明SDBMS是如何利用空間實體的MBRs來加快處理速度的?Ppt:Approximate Spatial Operations6、

40、 對于點查詢、區(qū)域查詢、空間連接查詢操作,各自有哪些處理算法(策略)?它們與什么因素有關?提示:Strategies for Point Queries,Strategies for Range Queries,Strategies for Spatial Joins與包含待查詢的關系的文件的組織方式有關。答:點查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語 建立空間索引:在索引中使用find操作;需要查找的磁盤扇區(qū)等于索引的深度 空間填充曲線散列:運用折半法尋找點;檢驗大約logB(n),的磁盤扇區(qū) 區(qū)域查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記

41、錄是否滿足謂語 建立空間索引:在索引中使用范圍查詢操作 空間填充曲線散列:驗證Z值滿足范圍查詢要求;使用折半查詢找到最低的Z值;掃描前面的數(shù)據(jù)文件直至滿足查詢要求的最大的Z值空間連接:嵌套循環(huán),檢驗所有可能的空間謂語對;基于空間分塊,只檢驗普通空間區(qū)域的對象對樹匹配:從每張表中找出分層的的對象組7、 什么是查詢優(yōu)化器?查詢優(yōu)化器所承擔的主要任務是什么?答:查詢優(yōu)化器是數(shù)據(jù)庫軟件中的一個模塊,它用于產(chǎn)生不同計算計劃并確定適當?shù)膱?zhí)行策略。主要任務:邏輯轉(zhuǎn)換、動態(tài)規(guī)劃。8、 查詢語言與查詢樹之間的互換? 語法分析器執(zhí)行9、 對查詢樹進行邏輯轉(zhuǎn)換的目的和一般方法是什么?答:方法:將非空間的選擇和投影操

42、作下推 目的:減少連接操作所涉及的關系大小,從而減少計算代價。10、 Distributed Environments的概念?在分布式環(huán)境下,空間數(shù)據(jù)庫系統(tǒng)面臨哪些挑戰(zhàn)?提示ppt:New issues for SDBMS)答:自治異質(zhì)計算機的集合,通過網(wǎng)絡連接,服務器框架:服務器提供定義明確的服務,用戶使用服務。 挑戰(zhàn):概念模型上:不同種類模式之間的轉(zhuǎn)換 邏輯模式上:在其他SDBMS上命名、查詢表;其他SDBMS上的表要復制原始表 查詢過程與優(yōu)化:通過網(wǎng)路的數(shù)據(jù)傳輸代價將會主導CPU和I/O代價,需要新的策略來控制數(shù)據(jù)的傳輸成本。11、 舉例說明分布式空間數(shù)據(jù)庫的半連接操作。(書上P161)

43、答:1)只將連接屬性和主碼從站點1發(fā)送到站點22)只將有關元組從站點2發(fā)送到站點1.12、了解基于Web的空間數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)。(書上P162)Chapter 6: Spatial Networks1、 舉例理解空間網(wǎng)絡、空間網(wǎng)絡查詢。鐵路網(wǎng)絡、密西西比河河網(wǎng),查詢YW線沿途車站數(shù)量,最后一個車站,密西西比河的支流名稱2、 圖及其相關概念。答:一個圖G=(V,E)是由一個有限頂點集V頂點之間的邊集E組成的。邊集E頂點集V的一個二元關系。 如果構(gòu)成邊集的各個頂點對是有序的,那么圖G就是有向的(directed);否則該圖是無向的(undirected)。頂點和邊有時也分別稱為結(jié)點(node)和鏈接(1ink)。有序頂點對的第一個頂點稱為前驅(qū)(predecessor)或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論