




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Chapter 1: Introduction to Spatial Databases1、舉例說明什么是空間數(shù)據(jù)、非空間數(shù)據(jù)?如何理解空間查詢(spatial queries)和非空間查詢的區(qū)別(Non-spatial queries)?答:河流的泛洪區(qū),衛(wèi)星影像數(shù)據(jù)、氣象氣候數(shù)據(jù)等都可以是空間數(shù)據(jù) 書店名稱 店員人數(shù),去年的銷售量,電話號(hào)碼等是非空間數(shù)據(jù)空間查詢是對(duì)空間數(shù)據(jù)的查詢或命令2、什么是GIS,什么是SDBMS?請(qǐng)闡述二者的區(qū)別和聯(lián)系。答:1、GIS是一個(gè)利用空間分析功能進(jìn)行可視化和空間數(shù)據(jù)分析的軟件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空間分析/統(tǒng)計(jì)、度量 G
2、IS 可以利用SDBMS來存儲(chǔ)、搜索、查詢、分享大量的空間數(shù)據(jù)集 2、SDBMS是一個(gè)軟件模塊。它可以、利用一個(gè)底層的數(shù)據(jù)庫管理系統(tǒng)、支持多種空間數(shù)據(jù)模型、相應(yīng)的空間抽象數(shù)據(jù)類型(ADT)以及一種能夠調(diào)用這些ADT的查詢語言、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領(lǐng)域規(guī)則3、區(qū)別與聯(lián)系:、利用GIS可以對(duì)某些對(duì)象和圖層進(jìn)行操作,而利用SDBMS則可以對(duì)更多的對(duì)象集和圖層進(jìn)行更加簡單的操作 、SDBMS可以在GIS不能使用的某些領(lǐng)域進(jìn)行使用,例如基因組學(xué)、天文學(xué)、多媒體信息系統(tǒng)等 、GIS可以作為SDBMS的前端,利用一個(gè)高效的SDBMS可以大大提高GIS的效率和生產(chǎn)率。3、從G
3、IS這一縮寫的三種含義來理解GIS的發(fā)展歷程。答:地理信息系統(tǒng):為專業(yè)人員提供的軟件地理信息科學(xué):為地理信息系統(tǒng)和服務(wù)提供使用和發(fā)展的定義、框架和理論地理信息服務(wù):為普通用戶提供的網(wǎng)點(diǎn)和服務(wù)中心,例如PC機(jī)上的地理和空間服務(wù)4、用傳統(tǒng)數(shù)據(jù)庫系統(tǒng)管理空間數(shù)據(jù),存在什么不足之處?答:1)無法用遞歸和嵌套的方式來描述復(fù)雜關(guān)系的層次和網(wǎng)狀結(jié)構(gòu),模擬和操作復(fù)雜地理對(duì)象的能力較弱;2)用關(guān)系模型描述本身具有復(fù)雜結(jié)構(gòu)和涵義的地理對(duì)象時(shí),需對(duì)地理實(shí)體進(jìn)行不自然的分解,導(dǎo)致存儲(chǔ)模式、查詢途徑及操作等方面均顯得語義不甚合理;3)由于概念模式和存儲(chǔ)模式的相互獨(dú)立性,及實(shí)現(xiàn)關(guān)系之間的聯(lián)系需要執(zhí)行系統(tǒng)開銷較大的聯(lián)接操作
4、,運(yùn)行效率不夠高4)空間數(shù)據(jù)通常是變長的,而一般RDBMS只允許記錄的長度設(shè)定為固定長度,此外,通用DBMS難于存儲(chǔ)和維護(hù)空間數(shù)據(jù)的拓?fù)潢P(guān)系。 5)一般RDBMS都難以實(shí)現(xiàn)對(duì)空間數(shù)據(jù)的關(guān)聯(lián)、連通、包含、疊加等基本操作。 6)一般DBMS不能支持GIS需要的一些復(fù)雜圖形功能。7)一般RDBMS難以支持復(fù)雜的地理信息,因?yàn)閱蝹€(gè)地理實(shí)體的表達(dá)需要多個(gè)文件、多條記錄,包括大地網(wǎng)、特征坐標(biāo)、拓?fù)潢P(guān)系、屬性數(shù)據(jù)和非空間專題屬性等方面信息。 8)GIS管理的是具有高度內(nèi)部聯(lián)系的數(shù)據(jù),為了保證地理數(shù)據(jù)庫的完整性,需要復(fù)雜的安全維護(hù)系統(tǒng),而這些完整性約束條件必須與空間數(shù)據(jù)一起存儲(chǔ),由地理數(shù)據(jù)庫來維護(hù)系統(tǒng)數(shù)據(jù)的完
5、整性。否則,一條記錄的改變會(huì)導(dǎo)致錯(cuò)誤、相互矛盾的數(shù)據(jù)存在,而一般RDBMS難以實(shí)現(xiàn)這一功能。5、What is a SDBMS ?答:SDBMS是一個(gè)軟件模塊。它可以、利用一個(gè)底層的數(shù)據(jù)庫管理系統(tǒng)、支持多種空間數(shù)據(jù)模型、相應(yīng)的空間抽象數(shù)據(jù)類型(ADT)以及一種能夠調(diào)用這些ADT的查詢語言、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領(lǐng)域規(guī)則6、什么是后關(guān)系數(shù)據(jù)庫模型?后關(guān)系數(shù)據(jù)庫模型有哪些?答:后關(guān)系數(shù)據(jù)庫模型支持用戶定義抽象數(shù)據(jù)類型,空間數(shù)據(jù)的類型可以添加。包括面向?qū)ο蟮臄?shù)據(jù)庫模式OOBDMS和面向關(guān)系ORDBMS的數(shù)據(jù)庫模式。7、SDBMS的三層體系結(jié)構(gòu)(Three Layer
6、Architecture)是什么?借此深入理解SDBMS的作用。答:空間應(yīng)用空間數(shù)據(jù)庫DBMS 教材P11的圖8、空間數(shù)據(jù)庫主要涉及哪些內(nèi)容?答:數(shù)據(jù)模型、查詢語句、查詢處理與優(yōu)化、文件組織和索引、數(shù)據(jù)挖掘9、舉例說明單遍掃描查詢和多遍掃描查詢的概念。答:單邊掃描查詢中,被查詢的表(關(guān)系)中的一條記錄(元組)最多只被訪問一次;例如“列出武大周圍5km內(nèi)的書店的名字”。多遍掃描查詢是被查詢的表(關(guān)系)中的一條記錄(元組)至少被訪問一次,例如“找出其代表的選取范圍大于200公頃并且在這區(qū)擁有公司的女議員的名字”10、過濾精煉策略的作用?兩個(gè)步驟的內(nèi)容是什么? 提示:ppt : Efficient
7、algorithms to answer spatial queries Common Strategy - filter and refine(過濾精煉 ) Filter Step:Query Region overlaps with MBRs of B,C and D過濾:查詢區(qū)域與B、C、D的最小外接矩形有重疊部分,保留B、C、D,其他的舍棄 Refine Step: Query Region overlaps with B and C精煉:查詢區(qū)域與B、C有重疊,舍棄D11、平面掃描(plane sweep)技術(shù)主要解決什么問題?其主要步驟?答:主要解決的是如何在過濾階段中盡可能多的淘
8、汰不符合條件的對(duì),從而減少幾何計(jì)算的計(jì)算代價(jià)。Step 1:從左至右移動(dòng)一條掃描線(例如,垂直于x軸的線),停在RS的第一個(gè)元素處。這就是具有最小Txl值的矩形T,例子為是矩形R4 。Step2:搜索S中已排序的矩形,直到抵達(dá)第一個(gè)矩形Sf,這里有Sfxl> Txu。顯然,對(duì)于所有1j<f,關(guān)系Txl,TxuSjxl,Sjxu存在(非空),在本例中Sf就是S1。注意f是以圖1-9c的數(shù)組索引為序,即S1=S2、S2= S1、S3=S3。這樣S2就是一個(gè)可能與R4交疊的候選矩形。Step 3:如果對(duì)任意ljf,關(guān)系Tyl,Tyu Sjyl,Sjyu存在,則Sj與T相交。因此,這一步就
9、確定了R4與S2的確是交疊的,并且< R4,S2>是連接結(jié)果的一部分。記錄所有這樣的信息,然后將矩形T(R4)從集合RS中去掉,它不再需要參與結(jié)果集中的其他相交對(duì)。Step 4:繼續(xù)移動(dòng)掃描線來穿過集合RS,直至碰到下一個(gè)矩形,在本例中是S2。這時(shí)進(jìn)行步驟2和3。Step 5:當(dāng) RS= 時(shí),處理結(jié)束;12、從程序員的觀點(diǎn)和DBMS設(shè)計(jì)者的觀點(diǎn)看,影響系統(tǒng)效率的因素有何不同。答:在程序員看來,計(jì)算機(jī)主要包括兩個(gè)部分:CPU和無限量的內(nèi)存 在DBMS設(shè)計(jì)者看來,計(jì)算機(jī)主要包括三個(gè)部分:CPU、有限的內(nèi)存、無限的硬盤空間。訪問硬盤的速度要遠(yuǎn)遠(yuǎn)小于訪問內(nèi)存的速度,因此前者關(guān)注減少算法的計(jì)
10、算時(shí)間,后者強(qiáng)調(diào)的是將計(jì)算時(shí)間和I/O時(shí)間的總和減少到最小。13、查詢優(yōu)化和數(shù)據(jù)挖掘的概念。答:查詢優(yōu)化:基于數(shù)據(jù)集的特點(diǎn)對(duì)查詢中的操作進(jìn)行排序,為每一步操作選擇有效策略 數(shù)據(jù)挖掘:即進(jìn)行系統(tǒng)的搜索,找出隱藏在電子信息中潛在的有用信息。Chapter 2: Spatial Concepts and Data Models1、 什么是數(shù)據(jù)模型?舉例說明數(shù)據(jù)模型的重要性。答、數(shù)據(jù)模型是數(shù)據(jù)集的特定結(jié)構(gòu)和模式,是對(duì)數(shù)據(jù)的文件描述,有利于某些性質(zhì)的前期分析。 作用:、屬性的前期分析;、重利用多媒體應(yīng)用中的共享數(shù)據(jù);、組織中交換數(shù)據(jù)、將數(shù)據(jù)傳遞給新軟件或環(huán)境例子:千禧年危機(jī) 正確的使用數(shù)據(jù)模式可以顯著的
11、降低成本,如果軟件中的時(shí)間和數(shù)據(jù)被定義成抽象數(shù)據(jù)模型,只有一小部分的軟件會(huì)執(zhí)行數(shù)據(jù),ADT數(shù)據(jù)要被重新修改。2、 掌握兩種常用的空間信息模型:要素模型和場(chǎng)模型,矢量、柵格數(shù)據(jù)結(jié)構(gòu)。答:場(chǎng)模型:、空間分割框架 、場(chǎng)函數(shù) 、場(chǎng)操作:并、復(fù)合森林模型中分段函數(shù)表示,區(qū)域中每個(gè)點(diǎn)被映射成主要樹種對(duì)應(yīng)的值 要素模型:、對(duì)象:把空間信息抽象成明確的,可識(shí)別的事物或?qū)嶓w;、對(duì)象具有屬性和操作森林模型中多邊形表示(林分),每個(gè)對(duì)象有唯一的標(biāo)示符、主要樹種和一塊區(qū)域。矢量數(shù)據(jù)結(jié)構(gòu)柵格數(shù)據(jù)結(jié)構(gòu):柵格結(jié)構(gòu)用密集正方形(或三角形,多邊形)將地理區(qū)域劃分為網(wǎng)格陣列。位置由行,列號(hào)定義,屬性為柵格單元的值。點(diǎn):由單個(gè)柵格
12、表達(dá)。線:由沿線走向有相同屬性取值的一組相鄰柵格表達(dá)。面:由沿線走向有相同屬性取值的一片柵格表達(dá)。 3、 基于場(chǎng)模型的操作有哪些,舉例說明區(qū)基于場(chǎng)模型的局部操作、聚焦(focal)和區(qū)域操作?基于對(duì)象模型的操作有哪些?答:基于場(chǎng)模型:局部操作:空間框架內(nèi)一個(gè)給定位置的新場(chǎng)的取值只依賴于同一個(gè)位置場(chǎng)的輸入值。書上P31。 聚焦操作:在指定位置的結(jié)果場(chǎng)的值依賴于同一位置的一個(gè)假定小領(lǐng)域輸入場(chǎng)的值。 極限、高程場(chǎng)的梯度 區(qū)域操作:與聚集運(yùn)算符或微積分中的積分運(yùn)算有關(guān)。計(jì)算每個(gè)樹種的平均高度。 基于對(duì)象模型:面向集合、拓?fù)?、方位、度量空間 4、 什么是拓?fù)潢P(guān)系,舉例說明拓?fù)渑c非拓?fù)涮匦?、拓?fù)渑c非拓?fù)洳?/p>
13、作。答:是指滿足拓?fù)鋷缀螌W(xué)原理的各空間數(shù)據(jù)間的相互關(guān)系。即用結(jié)點(diǎn)、弧段和多邊形所表示的實(shí)體之間的鄰接關(guān)聯(lián)和包含等關(guān)系。 拓?fù)涮匦裕簭椥宰冃魏笈R近物體之間的拓?fù)潢P(guān)系沒有發(fā)生改變 非拓?fù)涮匦裕簭椥宰冃魏笈R近物體之間的拓?fù)潢P(guān)系發(fā)生了改變拓?fù)洳僮髋c非拓?fù)洳僮?5、 OGIS提出的關(guān)于空間幾何體的基本構(gòu)件有哪些?6、 說明九交模型表達(dá)拓?fù)潢P(guān)系的原理。答:在一個(gè)平面上。兩個(gè)對(duì)象A、B之間的二元拓?fù)潢P(guān)系主要基于以下的相交情況,即分別是A和B的內(nèi)部、邊界、外部。值六部分可以構(gòu)成九交模型。考慮取值有空(0)和非空(1),可以確定有29=512種二元拓?fù)潢P(guān)系。對(duì)于R²嵌在中的二維區(qū)域,有八個(gè)關(guān)系是可實(shí)現(xiàn)
14、的,并且它們彼此互斥且完全覆蓋。:相離、相接、交疊、相等、包含、在內(nèi)部、覆蓋、被覆蓋。7、 數(shù)據(jù)庫設(shè)計(jì)的三個(gè)步驟及其主要內(nèi)容。答、首先,采用高層次的概念數(shù)據(jù)模型來組織所有與應(yīng)用相關(guān)的可用信息; 然后,邏輯建模階段,與概念數(shù)據(jù)模型在商用DBMS上的具體實(shí)現(xiàn)有關(guān) 最后,數(shù)據(jù)庫設(shè)計(jì)的第三個(gè)步驟是物理設(shè)計(jì)的建模,它解決數(shù)據(jù)庫營養(yǎng)在計(jì)算機(jī)中具體實(shí)現(xiàn)是方方面面的細(xì)節(jié)。8、 ER模型的作用,ER圖包括哪些要素,如何表達(dá)多值屬性?ER圖與空間信息對(duì)象模型之間的異同?答:ER圖可以以一種避開計(jì)算機(jī)隱喻的方式來表達(dá)這個(gè)微型世界,從而把應(yīng)用中的概念與實(shí)現(xiàn)細(xì)節(jié)分離開來。ER圖包括實(shí)體(物理上或概念上獨(dú)立存在的事物或?qū)?/p>
15、象)、屬性和聯(lián)系。實(shí)體用屬性來刻畫性質(zhì),實(shí)體之間通過練習(xí)相互作用和關(guān)聯(lián)。屬性可以是單值或多值。ER圖中實(shí)體用矩形表示,屬性表示為橢圓,聯(lián)系為菱形。碼屬性加下劃線,多值屬性用雙橢圓。異同:、實(shí)體是物體屬性的集合;、ER模型不允許普通用戶定義操作;、在對(duì)象模型中關(guān)系不被直接支持,但可以由操作來模仿。9、 數(shù)據(jù)庫三層約束的內(nèi)容:碼約束-實(shí)體完整性(entity integrity)約束,參照完整性(referential integrity約束和用戶參照完整性。簡述關(guān)系模式中的三種完整性。答;碼約束:每個(gè)關(guān)系必須要有一個(gè)主碼;實(shí)體完整性約束:主碼不能為空;參照完整性約束:外碼的屬性值要么是另一個(gè)關(guān)系
16、的主碼,要么為空值。10、外碼的概念。答:外碼是一個(gè)關(guān)系的屬性集,這個(gè)關(guān)系被復(fù)制到另外一個(gè)關(guān)系中。主碼與外部碼提供了一個(gè)實(shí)現(xiàn)關(guān)系間聯(lián)系的手段。11、ER圖向關(guān)系模型的轉(zhuǎn)換,注意對(duì)多值屬性的轉(zhuǎn)換。(P16)答:、實(shí)體成為關(guān)系;實(shí)體的屬性映射成為關(guān)系的屬性;多值屬性形成新的關(guān)系 、Relationships (1:1):將任一實(shí)體的碼屬性作為其他關(guān)系的一個(gè)外碼 、Relationships (M:1):將“1”側(cè)的關(guān)系的主碼作為“M”側(cè)關(guān)系的外碼。 、M:N Relationships become a relation (M:N中M和N共同形成新表的關(guān)鍵字)12、對(duì)于空間數(shù)據(jù),ER模型方法的不足
17、之處?為表達(dá)空間概念,擴(kuò)展ER模型主要增加了哪些要素?-實(shí)體象形圖、關(guān)系象形圖,讀懂?dāng)U展ER模型的表示符號(hào)。(書上P51)答:1)、ER模型的最初設(shè)計(jì)隱含了基于對(duì)象模型的假設(shè)。因此,場(chǎng)模型無法用ER模型進(jìn)行自然的映射 2)、在傳統(tǒng)的ER模型中,實(shí)體之間的聯(lián)系由所要開發(fā)的應(yīng)用來導(dǎo)出,而在空間建模中,空間對(duì)象之間總會(huì)有內(nèi)在的聯(lián)系 3)、建模空間對(duì)象所使用額試題聯(lián)系類型和“地圖”的比例尺有關(guān)13、舉例說明用象形符號(hào)擴(kuò)展ER圖,對(duì)于空間數(shù)據(jù)建模有何好處? 用象形符號(hào)擴(kuò)展ER圖,以便專門處理空間數(shù)據(jù)類型。這將減少ER圖以及所產(chǎn)生的關(guān)系模式的復(fù)雜度,同時(shí)改進(jìn)空間建模的質(zhì)量??臻g聯(lián)系(例如Road-Cros
18、ses-River)就可以從ER圖中省略,用隱式的方式表示。關(guān)系模式中的表達(dá)多值空間屬性的關(guān)系和M:N空間聯(lián)系也就不需要了 14、 舉例說明類、屬性、方法、聚合、泛化、和關(guān)聯(lián)等概念?答:類:是多有在應(yīng)用中具有相同性質(zhì)的對(duì)象的封裝,等價(jià)于ER模型中的實(shí)體;例如設(shè)施就是一個(gè)類。 屬性:描述類的對(duì)象。屬性還有一個(gè)與之相關(guān)聯(lián)的作用域,分為公有、私有、受保護(hù) 方法:是一些函數(shù),是類定義的一部分,用來修改類的行為或狀態(tài) 關(guān)系:將一個(gè)類與另一個(gè)類或者它自己相聯(lián)系,類似于ER中的聯(lián)系。UMLCD中三種重要關(guān)系:聚合、泛化、關(guān)聯(lián)。 聚合:描述部分與整體的關(guān)系:強(qiáng)聚合、弱聚合 泛化:eg. 多邊形是點(diǎn)線面的泛化;
19、 關(guān)聯(lián):反應(yīng)不同類的對(duì)象是如何聯(lián)系的。15、 UML的作用?了解UML的主要符號(hào)。答:UML是用于面向?qū)ο筌浖O(shè)計(jì)的概念層建模的新興標(biāo)準(zhǔn)之一,它是一種標(biāo)準(zhǔn)化語言,用于在概念層對(duì)結(jié)構(gòu)化模式和董濤行為進(jìn)行建模。16、 比較ER與UML。答:1)、沒有方法的類就是實(shí)體;2)、屬性在兩個(gè)里都一樣;3)、UML中沒有主鍵和完整性約束;4)、ER中沒有方法;5)、ER中關(guān)系的內(nèi)容更豐富;6)、ER圖中的實(shí)體與數(shù)據(jù)集有關(guān),但UML的類幾乎和數(shù)據(jù)集無關(guān)。Chapter 3 Spatial Query Languages1. Three Components of SQL。請(qǐng)列舉SQL所包含的功能,并對(duì)每種功能
20、列舉相關(guān)的操作符(語句)。答:數(shù)據(jù)定義語言DDL:創(chuàng)建和修改關(guān)系表(包括索引)數(shù)據(jù)操縱語言DML:插入,刪除,更新,查詢數(shù)據(jù)控制語言DCL:并發(fā)控制,事務(wù)處理2. SELECT specifies desired columnsFROM specifies relevant tablesWHERE specifies qualifying conditions for rows (限定條件)ORDER BY specifies sorting columns for resultsGROUP BY, HAVING specifies aggregation and statistics(要求:
21、看懂書上例句,要求會(huì)寫語句)3. 擴(kuò)展SQL以處理空間數(shù)據(jù),掌握對(duì)標(biāo)準(zhǔn)SQL進(jìn)行了哪些方面的擴(kuò)展?提示:ppt: SQL 3 allows user defined data types and operations. Spatial data types and operations can be added to SQL3SQL3支持用戶自定義類型和操作,空間數(shù)據(jù)類型和操作被允許加入到SQL3中4. Open Geodata Interchange Standard (OGIS)支持的Spatial Data Model和空間操作有哪些答:用于所有集合類型的基本操作;用于空間對(duì)象間拓?fù)潢P(guān)系
22、的操作謂詞;用于空間分析的一般操作5. 讀懂List of Spatial Query Examples。給語句,說明查詢目的?或者給出查詢目的,要求寫語句。6. view(視圖)的含義。視圖使用來描述導(dǎo)出數(shù)據(jù)或查詢結(jié)果簡化復(fù)雜網(wǎng)狀查詢的表Chapter4: Spatial Storage and Indexing1、What is a physical data model? Why learn physical data model concepts?答:1)、執(zhí)行邏輯數(shù)據(jù)模型的理論基礎(chǔ),使用現(xiàn)有的構(gòu)件在一個(gè)有效容錯(cuò)的方式中2)、選擇合適的DBMS,某些DBMS不支持空間索引;使DBMS運(yùn)
23、行的更加有效率。2、Is relational DBMS physical data model suitable for spatial data?如果不適合,有哪兩類解決途徑?答:不合適。關(guān)系DBMS則只能對(duì)數(shù)字進(jìn)行簡單處理;排序、查詢樹對(duì)數(shù)字非常有效,但這些概念都不適合用于處理空間數(shù)據(jù)提示:ppt 途徑1)Reusing relational physical data model concepts,重新使用關(guān)系物理數(shù)據(jù)模型的概念:Space filling curves define a total order for points用空間填充曲線來定義點(diǎn)的排列This total or
24、der helps in using ordered files, search trees有助于使用有序文件和查詢樹But may lead to computational inefficiency!但可能會(huì)導(dǎo)致計(jì)算無效率途徑2):New spatial techniques新空間技術(shù):Spatial indices, e.g. grids, hierarchical collection of rectangles空間索引:例如網(wǎng)格Provide better computational performance能提供更好的計(jì)算表現(xiàn)3、計(jì)算機(jī)存儲(chǔ)設(shè)備的種類?數(shù)據(jù)庫系統(tǒng)是怎么利用各種設(shè)備的?
25、提示:ppt:Types of storage Devices:Main memories - fast but content is lost when power is off主存:速度快,信息斷電丟失Secondary storage - slower, retains content without power二級(jí)存儲(chǔ)器:慢,信息斷電不丟Tertiary storage (如磁帶驅(qū)動(dòng)器 )- very slow, retains content, very large capacity脫機(jī)存儲(chǔ)器:非常慢,保存信息容量非常大。DBMS usually manage data on sec
26、ondary storage, e.g. disks Use main memory to improve performance User tertiary storage (e.g. tapes) for backup備份, archival檔案 etc.4、磁盤存儲(chǔ)相關(guān)概念:磁道track、扇區(qū)sector、柱面cylinder?頁面的概念?答:磁道:圓心磁盤片上向邊緣延伸的同心圓扇區(qū):每個(gè)磁道中被分成若干等份的區(qū)域柱面:是磁盤上具有相同鐳的磁道的集合頁面:又稱磁盤塊。是磁盤與主存之間的最小傳輸單位5、訪問磁盤扇區(qū)數(shù)據(jù)的過程,哪個(gè)過程花費(fèi)的時(shí)間最多?提示:ppt: Accessing a
27、 sector has three major steps: Seek(尋道): Move head assembly to relevant track (ts) 磁頭到達(dá)特定磁道所用的時(shí)間 Latency(延遲時(shí)間): Wait for spindle to rotate relevant sector under disk head(tl)塊旋轉(zhuǎn)到磁頭下方所用的時(shí)間 Transfer傳輸時(shí)間: Read or write the sector (tt)置于正確位置后讀寫塊中數(shù)據(jù)的實(shí)際時(shí)間 1>2>36、如何有效利用磁盤硬件?提示:ppt : Using Disk Hardwa
28、re Efficiently Size of sectors扇區(qū)面積 Larger sector provide faster transfer of large data sets 數(shù)據(jù)集大時(shí)大扇區(qū)提供更快的傳輸速度 But waste storage space inside sectors for small data sets 但浪費(fèi)了小數(shù)據(jù)集的存儲(chǔ)空間 Placement of most frequently accessed data items放置頻繁使用的數(shù)據(jù) On middle tracks rather than innermost or outermost tracks
29、在中間的磁道而不是最里面或最外面的磁道 Reason: minimize average seek time可以減少尋道時(shí)間 Placement of items in a large data set requiring many sectors放置一個(gè)需要很多扇區(qū)的大數(shù)據(jù)集 Choose sectors from a single cylinder盡量放在同一個(gè)柱面 Reason: Minimize seek cost in scanning the entire data set.減少掃描全集花費(fèi)的時(shí)間7、 域(filed)、記錄(record)、文件(file)的概念,提示: Mapp
30、ing Records and files to Disk. Records Often smaller than a sector Many records in a sector Files with many records文件是記錄的集合 Many sectors per file8、頁面的概念:磁盤與主存之間的最小傳輸單位。一個(gè)文件可能跨越多個(gè)頁面。一個(gè)頁面是槽的集合,一個(gè)槽包含一條記錄9、文件結(jié)構(gòu)的含義,舉例說明幾種常用文件結(jié)構(gòu)heap,Ordered、Hashed 、Clustered。答:文件結(jié)構(gòu)是指文件中記錄的組織形式。 堆:無序文件。記錄沒有特定的順序。,根據(jù)給定的關(guān)鍵碼(
31、如name)查找一條記錄需要掃描文件中的記錄。在最壞情況下,文件的所有記錄都要被檢查,所有存儲(chǔ)該文件數(shù)據(jù)的磁盤頁面都要被訪問。平均來說,需要檢索一半的磁盤頁面。優(yōu)點(diǎn)是在進(jìn)行插入操作時(shí)可以很容易地在文件末尾插入一條新記錄。存儲(chǔ)河流表 散列文件:使用散列函數(shù)吧記錄分到一系列散列單元中??扇≈幵谟谒軌虬褦?shù)量大致相同的記錄放入每個(gè)散列單元中。對(duì)于點(diǎn)查詢、插入、刪除都很有效。不適合范圍查詢。按字符個(gè)數(shù)存儲(chǔ)城市名稱。 有序文件:根據(jù)給定的主碼與對(duì)記錄進(jìn)行組織。折半法非常有效。不能直接運(yùn)用在空間領(lǐng)域例如,除非對(duì)多維空間中的點(diǎn)定義一個(gè)全序,否則無法對(duì)城市的位置排序。有序文件組織方式還可以根據(jù)對(duì)空間數(shù)據(jù)集的
32、文件組織方式而概括成空間聚類。 聚類:聚類的目的就是降低響應(yīng)常見的大查詢的尋道時(shí)間(ts)和等待時(shí)間(t1)。對(duì)于空間數(shù)據(jù)庫來說,這意味著在二級(jí)存儲(chǔ)中,空間上相鄰的和查詢上有關(guān)聯(lián)性的對(duì)象在物理上應(yīng)當(dāng)存儲(chǔ)在一起。10、使用空間填充曲線組織空間數(shù)據(jù)的意義?提示:Chapter 1 , Organizing spatial data with space filling curves Impose an ordering on the locations in a multi-dimensional space 加強(qiáng)了多維空間中的位置排序 Allow use of traditional effic
33、ient search methods on spatial data 允許在空間數(shù)據(jù)中使用傳統(tǒng)的有效搜索11、掌握Z-曲線、hilbert曲線的生成。(要求給IJ號(hào),能夠?qū)懗鰧?duì)應(yīng)Z碼和Hilbert碼的計(jì)算過程)12、基于Z-曲線,如何進(jìn)行區(qū)域匹配的?(匹配有效性?)答:用z1和z2分別代表兩個(gè)z值,其中z1是較短的一個(gè),并未失去一般性;對(duì)于相應(yīng)的區(qū)域(比如塊)r1和r2,只有兩種可能:1)如果z1是z2的前綴(例如,z1=l*,z2=11*或z1=*l*,z2=11*),則r1完全包含r2;2)兩個(gè)區(qū)域不相交(例如,z1=*0*,z2=11*)。13、什么是索引?索引文件的內(nèi)容。主索引和二
34、級(jí)索引。A table can have at most one primary index. Why?答:索引文件是用來提高數(shù)據(jù)文件查詢效率的輔助文件。記錄的只有碼值和數(shù)據(jù)文件中的頁面地址。索引記錄被排序,數(shù)據(jù)文件本身可以是不按關(guān)鍵碼排序。主索引,如果數(shù)據(jù)文件的記錄是按照主碼排列的,那么索引就只需要保存數(shù)據(jù)文件的每個(gè)磁盤頁面第一個(gè)主碼域值。每個(gè)索引記錄一個(gè)數(shù)據(jù)頁面。二級(jí)索引:堆數(shù)據(jù)文件,一個(gè)索引記錄一個(gè)數(shù)據(jù)。一個(gè)磁盤最多只有一個(gè)主索引,因?yàn)橹魉饕龥Q定了數(shù)據(jù)在磁盤上的存儲(chǔ)順序。14、什么是空間索引?有哪些空間索引方法?答:空間索引結(jié)構(gòu)用一組桶(通常對(duì)應(yīng)二級(jí)存儲(chǔ)的頁面)來組織對(duì)象??臻g索引呢就是
35、依據(jù)空間對(duì)象的位置和形狀或空間對(duì)象之間的某種空間關(guān)系按一定的順序排列的一種數(shù)據(jù)結(jié)構(gòu),其中包含空間對(duì)象的概要信息,如對(duì)象的標(biāo)識(shí)、外接矩形及指向空間對(duì)象實(shí)體的指針。方法:1)在系統(tǒng)中加入專門的外部空間數(shù)據(jù)結(jié)構(gòu),為空間屬性提供如同B樹之于線性屬性的功能。2)使用空間填充曲線(如Z序、Hilbert曲線)將空間對(duì)象映射到一維空間,以便空間對(duì)象存儲(chǔ)在標(biāo)準(zhǔn)的一維索引(例如B樹)中。15、網(wǎng)格文件包含哪兩部分內(nèi)容?建立格網(wǎng)索引的思路和步驟?了解R樹索引和R+樹索引的思想?答:包含n維網(wǎng)格目錄,目錄只能夠的每一項(xiàng)指向一個(gè)數(shù)據(jù)桶。第二部分是由稱為線性比例的一維數(shù)組組成的結(jié)構(gòu)。思路:是將研究區(qū)域用橫豎線條劃分大小
36、相等或不等的格網(wǎng),記錄每一個(gè)格網(wǎng)所包含的空間實(shí)體。當(dāng)用戶進(jìn)行空間查詢時(shí),首先計(jì)算出用戶查詢對(duì)象所在格網(wǎng),然后再在該網(wǎng)格中快速查詢所選空間實(shí)體,這樣一來就大大地加速了空間索引的查詢速度。 步驟:劃分行列(M X N);計(jì)算網(wǎng)格大小及每個(gè)格網(wǎng)的矩形范圍;開辟目標(biāo)空間(記錄目標(biāo)穿過的網(wǎng)格)和格網(wǎng)空間(記錄格網(wǎng)內(nèi)的目標(biāo));注冊(cè)點(diǎn)、線、面、注記等目標(biāo),并記錄之;提取窗口所覆蓋的目標(biāo)關(guān)鍵字(采用數(shù)據(jù)位方法,以降低排序時(shí)間,及避免數(shù)據(jù)的繪制順序等);提取目標(biāo)所涉及的網(wǎng)格。Chapter5 Query Processing and Optimization1、 從查詢處理的角度來看,空間數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫之間
37、有哪些主要區(qū)別?答:至少有三個(gè)主要區(qū)別:、與關(guān)系數(shù)據(jù)庫不同,空間數(shù)據(jù)庫沒有固定的運(yùn)算符集合可以充當(dāng)查詢計(jì)算的基本構(gòu)件 、空間數(shù)據(jù)庫要處理非常大量的復(fù)雜對(duì)象,這些對(duì)象具有空間范圍,不能自然的排列成一維數(shù)組。 、檢測(cè)空間謂語要用到計(jì)算量極大的算法,所以不能再假定I/O代價(jià)在CPU的處理代價(jià)中只能主導(dǎo)地位2、 空間查詢的基本構(gòu)件有哪些? 提示:ppt Choice of building blocks,List of building blocksPoint Query,Range Query,Spatial Join,Nearest Neighbor;點(diǎn)查詢:給定一個(gè)查詢點(diǎn)P,找出所有包含它的空間
38、對(duì)象O范圍或區(qū)域查詢:給定一個(gè)查詢多邊形P,找出所有與之相交的空間對(duì)象O空間鏈接:兩個(gè)表R和S基于一個(gè)空間謂語進(jìn)行連接時(shí),該連接成為空間連接。最近鄰居:空間聚集,即給定一個(gè)對(duì)象O,找出所有距離O最近的對(duì)象P3、 空間查詢處理的“過濾-精煉模式”是什么,其目的?(對(duì)象操作的兩步查詢處理)目的:用兩步算法高效地處理復(fù)雜的數(shù)據(jù)類型 過濾:尋找Q最終結(jié)果的超集S;精煉:利用GIS處理S來找到精確的Q的答案4、 空間查詢處理中,一般是采用什么(MBR))來替代不同類型的空間實(shí)體(如線、面)?這樣做有何好處?提示:Ppt:Approximating spatial data typesMinimum or
39、thogonal bounding rectangle (MOBR or MBR)最小外接矩形approximates line string, polygon, 近似的線串,多邊形See Examples below (Black rectangle are MBRs for red objects)MBRs are used by spatial indexes, e.g. R-treeMAlgorithms for spatial operations MBRs are simple空間操作MRS的算法很簡單5、 舉例說明SDBMS是如何利用空間實(shí)體的MBRs來加快處理速度的?Ppt:A
40、pproximate Spatial Operations6、 對(duì)于點(diǎn)查詢、區(qū)域查詢、空間連接查詢操作,各自有哪些處理算法(策略)?它們與什么因素有關(guān)?提示:Strategies for Point Queries,Strategies for Range Queries,Strategies for Spatial Joins與包含待查詢的關(guān)系的文件的組織方式有關(guān)。答:點(diǎn)查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個(gè)文件并判斷每條記錄是否滿足謂語 建立空間索引:在索引中使用find操作;需要查找的磁盤扇區(qū)等于索引的深度 空間填充曲線散列:運(yùn)用折半法尋找點(diǎn);檢驗(yàn)大約logB(n),的磁盤扇區(qū) 區(qū)
41、域查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個(gè)文件并判斷每條記錄是否滿足謂語 建立空間索引:在索引中使用范圍查詢操作 空間填充曲線散列:驗(yàn)證Z值滿足范圍查詢要求;使用折半查詢找到最低的Z值;掃描前面的數(shù)據(jù)文件直至滿足查詢要求的最大的Z值空間連接:嵌套循環(huán),檢驗(yàn)所有可能的空間謂語對(duì);基于空間分塊,只檢驗(yàn)普通空間區(qū)域的對(duì)象對(duì)樹匹配:從每張表中找出分層的的對(duì)象組7、 什么是查詢優(yōu)化器?查詢優(yōu)化器所承擔(dān)的主要任務(wù)是什么?答:查詢優(yōu)化器是數(shù)據(jù)庫軟件中的一個(gè)模塊,它用于產(chǎn)生不同計(jì)算計(jì)劃并確定適當(dāng)?shù)膱?zhí)行策略。主要任務(wù):邏輯轉(zhuǎn)換、動(dòng)態(tài)規(guī)劃。8、 查詢語言與查詢樹之間的互換? 語法分析器執(zhí)行9、 對(duì)查詢樹進(jìn)行邏
42、輯轉(zhuǎn)換的目的和一般方法是什么?答:方法:將非空間的選擇和投影操作下推 目的:減少連接操作所涉及的關(guān)系大小,從而減少計(jì)算代價(jià)。10、 Distributed Environments的概念?在分布式環(huán)境下,空間數(shù)據(jù)庫系統(tǒng)面臨哪些挑戰(zhàn)?提示ppt:New issues for SDBMS)答:自治異質(zhì)計(jì)算機(jī)的集合,通過網(wǎng)絡(luò)連接,服務(wù)器框架:服務(wù)器提供定義明確的服務(wù),用戶使用服務(wù)。 挑戰(zhàn):概念模型上:不同種類模式之間的轉(zhuǎn)換 邏輯模式上:在其他SDBMS上命名、查詢表;其他SDBMS上的表要復(fù)制原始表 查詢過程與優(yōu)化:通過網(wǎng)路的數(shù)據(jù)傳輸代價(jià)將會(huì)主導(dǎo)CPU和I/O代價(jià),需要新的策略來控制數(shù)據(jù)的傳輸成本。
43、11、 舉例說明分布式空間數(shù)據(jù)庫的半連接操作。(書上P161)答:1)只將連接屬性和主碼從站點(diǎn)1發(fā)送到站點(diǎn)22)只將有關(guān)元組從站點(diǎn)2發(fā)送到站點(diǎn)1.12、了解基于Web的空間數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)。(書上P162)Chapter 6: Spatial Networks1、 舉例理解空間網(wǎng)絡(luò)、空間網(wǎng)絡(luò)查詢。鐵路網(wǎng)絡(luò)、密西西比河河網(wǎng),查詢YW線沿途車站數(shù)量,最后一個(gè)車站,密西西比河的支流名稱2、 圖及其相關(guān)概念。答:一個(gè)圖G=(V,E)是由一個(gè)有限頂點(diǎn)集V頂點(diǎn)之間的邊集E組成的。邊集E頂點(diǎn)集V的一個(gè)二元關(guān)系。 如果構(gòu)成邊集的各個(gè)頂點(diǎn)對(duì)是有序的,那么圖G就是有向的(directed);否則該圖是無向的(undirected)。頂點(diǎn)和邊有時(shí)也分別稱為結(jié)點(diǎn)(node)和鏈接(1ink)。有序頂點(diǎn)對(duì)的第一個(gè)頂點(diǎn)稱為前驅(qū)(predecesso
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 陜西職業(yè)技術(shù)學(xué)院《影視特效》2023-2024學(xué)年第一學(xué)期期末試卷
- 錦州市黑山縣2024-2025學(xué)年三年級(jí)數(shù)學(xué)第二學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)模擬試題含解析
- 南開大學(xué)《試驗(yàn)設(shè)計(jì)與數(shù)據(jù)分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西電力職業(yè)技術(shù)學(xué)院《電視攝像基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 黔南民族醫(yī)學(xué)高等??茖W(xué)?!渡锎蠓肿与p語》2023-2024學(xué)年第二學(xué)期期末試卷
- 工程資金計(jì)劃表模板范文
- 精油美容儀問卷調(diào)查
- 激光投影施工方案范本
- 管道盲探施工方案
- 山西定向穿越施工方案
- 兩篇古典英文版成語故事畫蛇添足
- 世界現(xiàn)代設(shè)計(jì)簡史
- GB/T 21739-2008家用電梯制造與安裝規(guī)范
- 2023年杭州市余杭區(qū)事業(yè)單位招聘筆試題庫及答案解析
- 醫(yī)患溝通技巧講義課件
- 壓力管道使用單位壓力管道安全員守則
- 油桐種植項(xiàng)目可行性研究報(bào)告
- 保潔員培訓(xùn)考核試卷(答案)
- 1人類服裝的起源和人類服裝的課件
- 高血壓病例分析-課件
- 規(guī)范性文件備案實(shí)務(wù)(政)課件
評(píng)論
0/150
提交評(píng)論