




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)單選題題型:單選題客觀題分值2分難度:一般得分:21在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是()。A有放回的簡單隨機抽樣B無放回的簡單隨機抽樣C分層抽樣D漸進抽樣正確答案:D題型:單選題客觀題分值2分難度:簡單得分:22下列哪個不是專門用于可視化時間空間數(shù)據(jù)的技術(shù):()A等高線圖B餅圖C曲面圖D矢量場圖正確答案:B題型:單選題客觀題分值2分難度:簡單得分:23一所大學(xué)內(nèi)的各年紀人數(shù)分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數(shù)是()。A一年級B二年級C三年級D四年級正確答案:A題型:單選題客觀題分值2分難度:簡單得分:24下列哪一項不是數(shù)據(jù)規(guī)范化的常用方法()。A、按小數(shù)定標規(guī)范化B、最小-最大值規(guī)范化C、z-score規(guī)范化D、按整數(shù)定標規(guī)范法正確答案:D題型:單選題客觀題分值2分難度:簡單得分:25下列哪一個選項是數(shù)據(jù)立方體中的基本方體的概念()。A不同層創(chuàng)建的數(shù)據(jù)立方體B最高層抽象的立方體C最低抽象層創(chuàng)建的立方體D每一個數(shù)據(jù)立方體正確答案:C題型:單選題客觀題分值2分難度:中等得分:26考慮值集{12243324556826},其四分位數(shù)極差是()。A、31B、24C、55D、3正確答案:A題型:單選題客觀題分值2分難度:較難得分:27假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使用按箱平均值平滑方法對上述數(shù)據(jù)進行平滑,箱的深度為3。第二個箱子值為()。A、18.3B、22.6C、26.8D、27.9正確答案:A題型:單選題客觀題分值2分難度:較難得分:28假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為()。A、0.821B、1.224C、1.458D、0.716正確答案:D題型:單選題客觀題分值2分難度:一般得分:29熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是()。A、1比特B、2.6比特C、3.2比特D、3.8比特正確答案:B題型:單選題客觀題分值2分難度:一般得分:210、下面()屬于映射數(shù)據(jù)到新的空間的方法。A、傅里葉變換B、特征加權(quán)C、漸進抽樣D、維歸約正確答案:A題型:單選題客觀題分值2分難度:簡單得分:211、OLAP技術(shù)的核心是()。A、在線性B、對用戶的快速響應(yīng)C、互操作性D、多維分析正確答案:D題型:單選題客觀題分值2分難度:簡單得分:212、在有關(guān)數(shù)據(jù)倉庫測試,下列說法不正確的是()。A、在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試.B、當數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試D、在測試之前沒必要制定詳細的測試計劃正確答案:D題型:單選題客觀題分值2分難度:簡單得分:213、有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,不正確的描述是()。A、數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)B、數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確C、數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā)D、在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式正確答案:A題型:單選題客觀題分值2分難度:簡單得分:214、下面關(guān)于數(shù)據(jù)粒度的描述不正確的是()。A、粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細程度和級別B、數(shù)據(jù)越詳細,粒度就越小,級別也就越高C、數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高D、粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量正確答案:C題型:單選題客觀題分值2分難度:一般得分:215、關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指()。A、基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉庫,數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B、基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C、基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息D、基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息正確答案:D題型:單選題客觀題分值2分難度:一般得分:216、數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的是()。A、數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容B、捕捉到的新數(shù)據(jù)會覆蓋原來的快照C、數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行重新綜合正確答案:C題型:單選題客觀題分值2分難度:簡單得分:217、數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型不包括()。A、概念模型B、邏輯模型C、物理模型D、數(shù)據(jù)模型正確答案:D題型:單選題客觀題分值2分難度:簡單得分:218、數(shù)據(jù)倉庫的三層體系結(jié)構(gòu)不包括()。A、數(shù)據(jù)倉庫服務(wù)器B、OLAP服務(wù)器C、前端工具D、SMTP服務(wù)器正確答案:D題型:單選題客觀題分值2分難度:簡單得分:219下列哪一項不是數(shù)據(jù)倉庫的關(guān)鍵性質(zhì)()。A面向主題B與時間相關(guān)C與空間相關(guān)D集成性正確答案:C題型:單選題客觀題分值2分難度:簡單得分:220將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)()。A頻繁模式挖掘B分類和預(yù)測C數(shù)據(jù)預(yù)處理D數(shù)據(jù)流挖掘正確答案:C題型:單選題客觀題分值2分難度:中等得分:221未來房價的預(yù)測,這種屬于數(shù)據(jù)挖掘的哪類問題()。A分類B聚類C關(guān)聯(lián)規(guī)則D回歸分析正確答案:D題型:單選題客觀題分值2分難度:簡單得分:222在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()。A頻繁子集挖掘B頻繁子圖挖掘C頻繁數(shù)據(jù)項挖掘D頻繁模式挖掘正確答案:B題型:單選題客觀題分值2分難度:中等得分:223考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個項,采用合并策略,由候選產(chǎn)生過程得到4-項集不包含()。A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5正確答案:C題型:單選題客觀題分值2分難度:一般得分:224、頻繁項集、頻繁閉項集、最大頻繁項集之間的關(guān)系是()A、頻繁項集頻繁閉項集=最大頻繁項集B、頻繁項集=頻繁閉項集最大頻繁項集C、頻繁項集頻繁閉項集最大頻繁項集D、頻繁項集=頻繁閉項集=最大頻繁項集正確答案:C題型:單選題客觀題分值2分難度:簡單得分:225、概念分層圖是()圖。A、無向無環(huán)B、有向無環(huán)C、有向有環(huán)D、無向有環(huán)正確答案:B題型:單選題客觀題分值2分難度:一般得分:226、設(shè)X={1,2,3}是頻繁項集,則可由X產(chǎn)生()個關(guān)聯(lián)規(guī)則。A、4B、5C、6D、7正確答案:C題型:單選題客觀題分值2分難度:簡單得分:227、關(guān)于OLAP和OLTP的說法,下列不正確的是()。A、OLAP事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高B、OLAP的最終數(shù)據(jù)來源與OLTP不一樣C、OLTP面對的是決策人員和高層管理人員D、OLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動的正確答案:A題型:單選題客觀題分值2分難度:中等得分:228、OLAM技術(shù)一般簡稱為”數(shù)據(jù)聯(lián)機分析挖掘”,下面說法正確的是()。A、OLAP和OLAM都基于客戶機/服務(wù)器模式,只有后者有與用戶的交互性B、由于OLAM的立方體和用于OLAP的立方體有本質(zhì)的區(qū)別C、基于WEB的OLAM是WEB技術(shù)與OLAM技術(shù)的結(jié)合D、OLAM服務(wù)器通過用戶圖形借口接收用戶的分析指令,在元數(shù)據(jù)的知道下,對超級立方體作一定的操作正確答案:D題型:單選題客觀題分值2分難度:簡單得分:229、關(guān)于OLAP和OLTP的區(qū)別描述,不正確的是()。A、OLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同B、與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對簡單的事務(wù)C、OLAP的特點在于事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高D、OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的,但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面對的用戶是相同的正確答案:C題型:單選題客觀題分值2分難度:簡單得分:230、關(guān)于OLAP的特性,下面正確的是()。(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性A、(1)(2)(3)B、(2)(3)(4)C、(1)(2)(3)(4)D、(1)(2)(3)(4)(5)正確答案:D填空題題型:填空題客觀題答案不允許亂序分值5分難度:簡單得分:51、相關(guān)性分析有第1空分值:2分第2空分值:2分第3空分值:2分第4空分值:2分第5空分值:2分正確答案:提升度;杠桿度;皮爾森相關(guān)系數(shù);IS度量;確信度題型:填空題客觀題答案不允許亂序分值2分難度:簡單得分:22、項集包含或_項的集合第1空分值:2分第2空分值:2分正確答案:0個;多個題型:填空題客觀題答案不允許亂序分值5分難度:簡單得分:53、回歸分析的步驟。第1空分值:2分第2空分值:2分第3空分值:2分第4空分值:2分第5空分值:2分正確答案:確定變量;建立預(yù)測模型;進行相關(guān)分析;計算預(yù)測誤差;確定預(yù)測值題型:填空題客觀題答案不允許亂序分值2分難度:簡單得分:24、變量之間的關(guān)系可分為第1空分值:2分第2空分值:2分正確答案:確定性關(guān)系;非確定性關(guān)系題型:填空題客觀題答案不允許亂序分值3分難度:簡單得分:35、多維數(shù)據(jù)模型主要分為。第1空分值:2分第2空分值:2分第3空分值:2分正確答案:星型模型;雪花模型;事實星座模型簡答題題型:簡答題主觀題分值6分難度:簡單得分:61、變量間的確定性關(guān)系和非確定性關(guān)系分別指的是什么?正確答案:①變量間的確定性關(guān)系:確定性關(guān)系是指當一些變量的值確定以后另一些變量的值也隨之完全確定的關(guān)系,這些變量間的關(guān)系完全是已知的,變量之間的關(guān)系可以用函數(shù)關(guān)系來表示。②變量間的非確定性關(guān)系:非確定性關(guān)系是指變量之間有一定的依賴關(guān)系,變量之間雖然相互影響和相互制約,但由于受到無法預(yù)計和控制的因素的影響,使得變量間的關(guān)系呈現(xiàn)不確定性,當一些變量的值確定以后,另一些變量值雖然隨之變化,卻不能完全確定,這時變量間的關(guān)系就不可以精確地用函數(shù)來表示。題型:簡答題主觀題分值7分難度:簡單得分:72、簡述數(shù)據(jù)倉庫概念模型與邏輯模型的設(shè)計步驟。正確答案:數(shù)據(jù)倉庫概念模型設(shè)計步驟:①界定系統(tǒng)邊界,即全方位了解任務(wù)和環(huán)境,充分理解需求,繪制大致的系統(tǒng)邊界。也就是完成數(shù)據(jù)倉庫系統(tǒng)設(shè)計的需求分析。②確定主要的主題域,完成對一些屬性、主題域公共碼以及主題域之間聯(lián)系的描述工作,其中的屬性能夠清楚、充分地代表主題。③細分具體內(nèi)容及確定分析維度,維元素對應(yīng)的是分析角度,通常是一些離散型的數(shù)據(jù);度量對應(yīng)的是指標,實際使用中要根據(jù)指標的存儲和查詢使用的頻度,來判斷分析指標屬于維元素還是維屬性。數(shù)據(jù)倉庫邏輯模型設(shè)計步驟:①分析主題域,確定要裝載到數(shù)據(jù)倉庫的主題;②粒度層次劃分,通過估計數(shù)據(jù)量和所需的存儲設(shè)備來確定粒度劃分方案;③確定數(shù)據(jù)分隔策略,將邏輯上整體的數(shù)據(jù)分割成較小的、可以獨立管理的物理單元進行存儲;④定義關(guān)系模式,概念設(shè)計階段時,基本的主題已經(jīng)確定,在邏輯模型設(shè)計階段,要將主題劃分成多個表,并確定表的結(jié)構(gòu)。邏輯模型設(shè)計的關(guān)鍵是細化主題劃分,并建立維度模型,主要的工作是進行事實表模型設(shè)計和維表模型設(shè)計。題型:簡答題主觀題分值10分難度:困難得分:103、【案例分析題】某公司存儲員工信息的數(shù)據(jù)庫中表示收入的字段income排序后的值(元)為:900,1000,1300,1600,1600,1900,2000,2400,2600,2900,3000,3600,4000,4600,4900,5000。1.按照等深分箱法進行分箱。2.按照等寬分箱法進行分箱。正確答案:1.等深分箱法:設(shè)定權(quán)重(箱子深度)為4,分箱后有:箱1:900,1000,1300,1600箱2:1600,1900,2000,2400箱3:2600,2900,3000,3600箱4:4000,4600,4900,5000使用平均值平滑結(jié)果為:箱1:1200,1200,1200,1200箱2:1975,19
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 光伏變壓器知識培訓(xùn)課件
- 2025年法制宣傳日普法知識競賽搶答題庫及答案(共80題)
- 新員工入職培訓(xùn)流程與要點
- 《藝術(shù)概論:西方繪畫藝術(shù)的發(fā)展歷程及特點》
- 共享經(jīng)濟與協(xié)作式消費作業(yè)指導(dǎo)書
- 福建省龍巖市2024-2025學(xué)年高二上學(xué)期1月期末生物學(xué)試題(含答案)
- 兒童繪本中的教育意義解讀
- 人力資源外包合作協(xié)議
- 小學(xué)生讀書筆記讀后感
- 水資源開發(fā)與保護聯(lián)合協(xié)議
- 北京工裝合同范本
- 建筑工地道路養(yǎng)護的進度與措施
- 加油站合作經(jīng)營協(xié)議書范本
- 《苗圃生產(chǎn)與管理》教案-第二章 園林苗木的種實生產(chǎn)
- 2025年西安鐵路職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 化工原理完整(天大版)課件
- 2025年陜西延長石油有限責(zé)任公司招聘筆試參考題庫含答案解析
- 《淞滬會戰(zhàn)》課件
- Excel辦公技巧培訓(xùn)
- 新時代大學(xué)生勞動教育 課件 第5章 勞動素養(yǎng)及其養(yǎng)成
- 2024年度英語課件容貌焦慮
評論
0/150
提交評論