2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師筆試歷年真題薈萃含答案_第1頁(yè)
2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師筆試歷年真題薈萃含答案_第2頁(yè)
2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師筆試歷年真題薈萃含答案_第3頁(yè)
2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師筆試歷年真題薈萃含答案_第4頁(yè)
2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師筆試歷年真題薈萃含答案_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師筆試歷年真題薈萃含答案(圖片大小可自由調(diào)整)第1卷一.參考題庫(kù)(共30題)1.決策樹是一種樹形結(jié)構(gòu),包括()和()三個(gè)部分。2.數(shù)據(jù)清理的目的是處理數(shù)據(jù)中的()。A、空缺值B、噪聲數(shù)據(jù)C、不一致數(shù)據(jù)D、敏感數(shù)據(jù)3.數(shù)據(jù)抽取的兩個(gè)常見類型是靜態(tài)抽取和增量抽取。靜態(tài)抽取用于()填充數(shù)據(jù)倉(cāng)庫(kù),增量抽取用于進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的維護(hù)。4.關(guān)聯(lián)知識(shí)5.在決策樹中,隨著樹中結(jié)點(diǎn)數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗(yàn)誤差開始增大,這是出現(xiàn)了模型擬合不足的問(wèn)題。6.以下哪項(xiàng)關(guān)于決策樹的說(shuō)法是錯(cuò)誤的?()A、冗余屬性不會(huì)對(duì)決策樹的準(zhǔn)確率造成不利的影響B(tài)、子樹可能在決策樹中重復(fù)多次C、決策樹算法對(duì)于噪聲的干擾非常敏感D、尋找最佳決策樹是NP完全問(wèn)題7.什么是數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)ETL過(guò)程?8.進(jìn)行數(shù)據(jù)規(guī)范化的目的是()。A、去掉數(shù)據(jù)中的噪聲B、對(duì)數(shù)據(jù)進(jìn)行匯總和聚集C、使用概念分層,用高層次概念替換低層次“原始”數(shù)據(jù)D、將屬性按比例縮放,使之落入一個(gè)小的特定區(qū)間9.數(shù)據(jù)挖掘?qū)垲惖臄?shù)據(jù)要求是什么?10.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指()A、基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B、基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C、基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息D、基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息11.為什么要進(jìn)行維歸約?12.有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)特點(diǎn),不正確的描述是:()。A、數(shù)據(jù)倉(cāng)庫(kù)開發(fā)要從數(shù)據(jù)出發(fā)B、數(shù)據(jù)倉(cāng)庫(kù)使用的需求在開發(fā)出去就要明確C、數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)是一個(gè)不斷循環(huán)的過(guò)程,是啟發(fā)式的開發(fā)D、在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式13.數(shù)據(jù)挖掘的目標(biāo)不在于數(shù)據(jù)采集策略,而在于對(duì)于已經(jīng)存在的數(shù)據(jù)進(jìn)行模式的發(fā)掘。14.數(shù)據(jù)壓縮可分為:()和()兩種類型。15.為什么樸素貝葉斯分類稱為“樸素”的?簡(jiǎn)述樸素貝葉斯分類優(yōu)缺點(diǎn)。16.以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()。A、嵌入B、過(guò)濾C、包裝D、抽樣17.簡(jiǎn)述數(shù)據(jù)倉(cāng)庫(kù)ETL軟件的主要功能和對(duì)產(chǎn)生數(shù)據(jù)的目標(biāo)要求。18.()這些數(shù)據(jù)特性都是對(duì)聚類分析具有很強(qiáng)影響的。A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)19.具有較高的支持度的項(xiàng)集具有較高的置信度。20.簡(jiǎn)述在多層關(guān)聯(lián)規(guī)則挖掘中,在不同的層使用一致的支持度的優(yōu)缺點(diǎn)。21.廣義知識(shí)22.數(shù)據(jù)倉(cāng)庫(kù)的概念模型通常采用信息包圖法來(lái)進(jìn)行設(shè)計(jì),要求將其5個(gè)組成部分()全面地描述出來(lái)。23.數(shù)據(jù)倉(cāng)庫(kù)后端工具和程序包括哪些?24.數(shù)據(jù)倉(cāng)庫(kù)就是一個(gè)面向主題的、集成的、()、反映歷史變化的數(shù)據(jù)集合。25.簡(jiǎn)述決策樹的構(gòu)建。26.簡(jiǎn)述數(shù)據(jù)的定義及類型。27.以下哪個(gè)范圍是數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)規(guī)模的一個(gè)合理范圍?()A、1-100MB、100M-10GC、10-1000GD、100GB-數(shù)TB28.什么是葉節(jié)點(diǎn)?29.已知數(shù)據(jù)元組中age的值如下(按遞增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max規(guī)范化,將age值35轉(zhuǎn)換到[0.0,1.0]區(qū)間。 (b)使用z-score規(guī)范化轉(zhuǎn)換age值35,其中,age的標(biāo)準(zhǔn)偏差為12.94年。 (c)使用小數(shù)定標(biāo)規(guī)范化轉(zhuǎn)換age值35。30.簡(jiǎn)述數(shù)據(jù)挖掘的過(guò)程。第1卷參考答案一.參考題庫(kù)1.參考答案:決策節(jié)點(diǎn),分支節(jié)點(diǎn);頁(yè)節(jié)點(diǎn)2.參考答案:A,B,C3.參考答案:最初4.參考答案:是反映一個(gè)事件和其他事件之間依賴或相互關(guān)聯(lián)的知識(shí)。如果兩項(xiàng)或多項(xiàng)屬性之間存在關(guān)聯(lián),那么其中一項(xiàng)的屬性值就可以依據(jù)其他屬性值進(jìn)行預(yù)測(cè)。5.參考答案:錯(cuò)誤6.參考答案:C7.參考答案: 數(shù)據(jù)的ETL過(guò)程就是負(fù)責(zé)將操作型數(shù)據(jù)轉(zhuǎn)換成調(diào)和數(shù)據(jù)的過(guò)程。數(shù)據(jù)調(diào)和是構(gòu)建一個(gè)數(shù)據(jù)倉(cāng)庫(kù)中最難的和最具技術(shù)挑戰(zhàn)性的部分。在為企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)填充數(shù)據(jù)的過(guò)程中,數(shù)據(jù)調(diào)和可分為兩個(gè)階段:一是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)(EDW)首次創(chuàng)建時(shí)的原始加載;二是接下來(lái)的定期修改,以保持EDW的當(dāng)前有效性和擴(kuò)展性。 整個(gè)過(guò)程由四個(gè)步驟組成:抽取、清洗、轉(zhuǎn)換、加載和索引。事實(shí)上,這些步驟可以進(jìn)行不同的組合,如,可以將數(shù)據(jù)抽取與清洗組合為一個(gè)過(guò)程,或者將清洗和轉(zhuǎn)換組合在一起。8.參考答案:D9.參考答案: (1)可伸縮性 (2)處理不同類型屬性的能力 (3)發(fā)現(xiàn)任意形狀的聚類 (4)使輸入?yún)?shù)的領(lǐng)域知識(shí)最小化 (5)處理噪聲數(shù)據(jù)的能力 (6)對(duì)于輸入順序不敏感 (7)高維性 (8)基于約束的聚類 (9)看解釋性和可利用性10.參考答案:D11.參考答案:維歸約可以去掉不重要的屬性,減少數(shù)據(jù)立方體的維數(shù),從而減少數(shù)據(jù)挖掘處理的數(shù)據(jù)量,提高挖掘效率。12.參考答案:A13.參考答案:正確14.參考答案:有損壓縮;無(wú)損壓縮15.參考答案:基于貝葉斯定理的推斷需要大量訓(xùn)練數(shù)據(jù)以覆蓋類條件概率空間,引入了很大開銷。樸素貝葉斯分類做了類條件獨(dú)立假設(shè),大幅降低了計(jì)算開銷。他的優(yōu)點(diǎn)是容易實(shí)現(xiàn)并在大多數(shù)情況下可以取得較好的結(jié)果;他的缺陷是類條件獨(dú)立在實(shí)際應(yīng)用缺乏準(zhǔn)確性,因?yàn)樽兞恐g經(jīng)常存在依賴關(guān)系,這種依賴關(guān)系影響了樸素貝葉斯分類器的準(zhǔn)確性。16.參考答案:D17.參考答案:ETL軟件的主要功能: 數(shù)據(jù)的抽取,數(shù)據(jù)的轉(zhuǎn)換,數(shù)據(jù)的加載; 對(duì)產(chǎn)生數(shù)據(jù)的目標(biāo)要求: 詳細(xì)的、歷史的、規(guī)范化的、可理解的、即時(shí)的、質(zhì)量可控制的。18.參考答案:A,B,C,D19.參考答案:錯(cuò)誤20.參考答案:優(yōu)點(diǎn):搜索是容易采用優(yōu)化策略,即一個(gè)項(xiàng)如果不滿足最小支持度,它的所有子項(xiàng)都可以不用搜索。缺點(diǎn):最小支持度設(shè)置困難,太高則將丟掉出現(xiàn)在較低抽象層中有意義的關(guān)聯(lián)規(guī)則;太低則會(huì)在較高層產(chǎn)生太多的無(wú)興趣的規(guī)則。21.參考答案:通過(guò)對(duì)大量數(shù)據(jù)的歸納、概括和抽象,提煉出帶有普遍性的、概括性的描述統(tǒng)計(jì)的知識(shí)。22.參考答案:包括名稱、維度、類別、層次和度量23.參考答案: 1,數(shù)據(jù)提取:從多個(gè)外部的異構(gòu)數(shù)據(jù)源收集數(shù)據(jù); 2,數(shù)據(jù)清理:檢測(cè)數(shù)據(jù)中的粗偶并作可能的訂正; 3,數(shù)據(jù)變換:將數(shù)據(jù)由歷史或主機(jī)的格式轉(zhuǎn)化為數(shù)據(jù)倉(cāng)庫(kù)的格式; 4,裝載:排序、匯總、合并、計(jì)算視圖、檢查完整性,并建立索引和分區(qū); 5,刷新:將數(shù)據(jù)源的更新傳播到數(shù)據(jù)倉(cāng)庫(kù)中。24.參考答案:相對(duì)穩(wěn)定的25.參考答案:1)屬性的選擇(很重要,一般要最大限度地增大樣本集純度) 2)獲得大小適合的決策樹 3)使用ID3等經(jīng)典算法構(gòu)建決策樹26.參考答案:數(shù)據(jù)及數(shù)據(jù)類型:數(shù)據(jù)是數(shù)據(jù)庫(kù)存儲(chǔ)的基本對(duì)象,數(shù)據(jù)類型:標(biāo)稱屬性,序數(shù)屬性,區(qū)間屬性,比率屬性。27.參考答案:D28.參考答案:每個(gè)葉節(jié)點(diǎn)對(duì)應(yīng)一個(gè)類標(biāo)號(hào),表示一種可能的分類結(jié)果。29.參考答案:(a)已知最大值為70,最小值為13,則可將35規(guī)范化為: (b)已知均值為30,標(biāo)準(zhǔn)差為12.94,則可將35規(guī)范化為: (c)使用小數(shù)定標(biāo)規(guī)范化可將35規(guī)范化為:35/100=0.3530.參考答案:數(shù)據(jù)清洗,數(shù)據(jù)集成(考慮數(shù)據(jù)一致性和冗余),數(shù)據(jù)選擇,數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)挖掘,模式評(píng)估,知識(shí)表示。第2卷一.參考題庫(kù)(共30題)1.通過(guò)聚集多個(gè)分類器的預(yù)測(cè)來(lái)提高分類準(zhǔn)確率的技術(shù)稱為()。A、組合(ensemble)B、聚集(aggregate)C、合并(combination)D、投票(voting)2.簡(jiǎn)述數(shù)據(jù)清理的基本內(nèi)容。3.考慮下表所示二元分類問(wèn)題的數(shù)據(jù)集。 (1)計(jì)算按照屬性A和B劃分時(shí)的信息增益。決策樹歸納算法將會(huì)選擇哪個(gè)屬性? (2)計(jì)算按照屬性A和B劃分時(shí)Gini系數(shù)。決策樹歸納算法將會(huì)選擇哪個(gè)屬性?4.下表所示的相依表匯總了超級(jí)市場(chǎng)的事務(wù)數(shù)據(jù)。其中hotdogs指包含熱狗的事務(wù),指不包含熱狗的事務(wù)。hamburgers指包含漢堡的事務(wù),指不包含漢堡的事務(wù)。 假設(shè)挖掘出的關(guān)聯(lián)規(guī)則是“hotdogs=>hamburgers”。給定最小支持度閾值25%和最小置信度閾值50%,這個(gè)關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎? 計(jì)算關(guān)聯(lián)規(guī)則“hotdogs=>hamburgers”的提升度,能夠說(shuō)明什么問(wèn)題?購(gòu)買熱狗和購(gòu)買漢堡是獨(dú)立的嗎?如果不是,兩者間存在哪種相關(guān)關(guān)系?5.連續(xù)型屬性的數(shù)據(jù)樣本之間的距離有歐氏距離、曼哈頓距離和()6.下面關(guān)于Jarvis-Patrick(JP)聚類算法的說(shuō)法不正確的是()。A、JP聚類擅長(zhǎng)處理噪聲和離群點(diǎn),并且能夠處理不同大小、形狀和密度的簇B、JP算法對(duì)高維數(shù)據(jù)效果良好,尤其擅長(zhǎng)發(fā)現(xiàn)強(qiáng)相關(guān)對(duì)象的緊致簇C、JP聚類是基于SNN相似度的概念D、JP聚類的基本時(shí)間復(fù)雜度為O(m)7.聚類分析中常見的數(shù)據(jù)類型有哪些?8.比較數(shù)據(jù)挖掘與OLAP的差異?9.什么是數(shù)據(jù)倉(cāng)庫(kù)的3層數(shù)據(jù)結(jié)構(gòu)?10.關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說(shuō)法正確的是()。A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí),混合模型也能很好地處理B、混合模型比K均值或模糊c均值更一般,因?yàn)樗梢允褂酶鞣N類型的分布C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇D、混合模型在有噪聲和離群點(diǎn)時(shí)不會(huì)存在問(wèn)題11.下面哪種數(shù)據(jù)預(yù)處理技術(shù)可以用來(lái)平滑數(shù)據(jù),消除數(shù)據(jù)噪聲?()A、數(shù)據(jù)清理B、數(shù)據(jù)集成C、數(shù)據(jù)變換D、數(shù)據(jù)歸約12.常用的數(shù)值屬性概念分層的方法有哪些?13.簡(jiǎn)述K-平均算法的輸入、輸出及聚類過(guò)程(流程)。14.關(guān)聯(lián)規(guī)則15.下列幾種數(shù)據(jù)挖掘功能中,()被廣泛的用于購(gòu)物籃分析。A、關(guān)聯(lián)分析B、分類和預(yù)測(cè)C、聚類分析D、演變分析16.ROLAP17.數(shù)據(jù)庫(kù)中的知識(shí)挖掘(KDD)包括以下七個(gè)步驟:()、()、()、()、()、()和()18.存放最低層匯總的方體稱為()。A、頂點(diǎn)方體B、方體的格C、基本方體D、維19.何謂相異度矩陣?它有什么特點(diǎn)?20.當(dāng)維表中的主鍵在事實(shí)表中沒有與外鍵關(guān)聯(lián)時(shí),這樣的維稱為()。它于事實(shí)表并無(wú)關(guān)系,但有時(shí)在查詢限制條件中需要用到。21.模式為對(duì)數(shù)據(jù)集的全局性總結(jié),它對(duì)整個(gè)測(cè)量空間的每一點(diǎn)做出描述;模型則對(duì)變量變化空間的一個(gè)有限區(qū)域做出描述。22.數(shù)據(jù)集分為三類:()。23.何謂數(shù)據(jù)倉(cāng)庫(kù)?為什么要建立數(shù)據(jù)倉(cāng)庫(kù)?24.Aprior算法包括()和()兩個(gè)基本步驟25.孤立點(diǎn)挖掘適用于下列哪種場(chǎng)合?()A、目標(biāo)市場(chǎng)分析B、購(gòu)物籃分析C、模式識(shí)別D、信用卡欺詐檢測(cè)26.典型聚類方法有哪些?27.下面屬于定量的屬性類型是:()。A、標(biāo)稱B、序數(shù)C、區(qū)間D、相異28.以下是一個(gè)商場(chǎng)所銷售商品的價(jià)格清單(按遞增順序排列,括號(hào)中的數(shù)表示前面數(shù)字出現(xiàn)次數(shù)) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 請(qǐng)分別用等寬的方法和等高的方法對(duì)上面的數(shù)據(jù)集進(jìn)行劃分。29.分別說(shuō)明利用支持度、置信度和提升度評(píng)價(jià)關(guān)聯(lián)規(guī)則的優(yōu)缺點(diǎn)。30.規(guī)則:age(X,”19-25”)∧buys(X,“popcorn”)=>buys(X,“coke”)是一個(gè)()。A、單維關(guān)聯(lián)規(guī)則B、多維關(guān)聯(lián)規(guī)則C、混合維關(guān)聯(lián)規(guī)則D、不是一個(gè)關(guān)聯(lián)規(guī)則第2卷參考答案一.參考題庫(kù)1.參考答案:A2.參考答案:①盡可能賦予屬性名和屬性值明確的含義;②統(tǒng)一多數(shù)據(jù)源的屬性值編碼;③去除無(wú)用的惟一屬性或鍵值(如自動(dòng)增長(zhǎng)的id);④去除重復(fù)屬性(在某些分析中,年齡和出生日期可能就是重復(fù)的屬性,但在某些時(shí)候它們可能又是同時(shí)需要的);⑤去除可忽略字段(大部分為空值的屬性一般是沒有什么價(jià)值的,如果不去除可能造成錯(cuò)誤的數(shù)據(jù)挖掘結(jié)果);⑥合理選擇關(guān)聯(lián)字段(對(duì)于多個(gè)關(guān)聯(lián)性較強(qiáng)的屬性,重復(fù)無(wú)益,只需選擇其中的部分用于數(shù)據(jù)挖掘即可,如價(jià)格、數(shù)據(jù)、金額);⑦去掉數(shù)據(jù)中的噪音、填充空值、丟失值和處理不一致數(shù)據(jù)。3.參考答案:按照屬性A和B劃分時(shí),數(shù)據(jù)集可分為如下兩種情況: 按照屬性A劃分樣本集分別得到的兩個(gè)子集(A取值T和A取值F)的信息熵分別為: 按照屬性B劃分樣本集分別得到的兩個(gè)子集(B取值T和B取值F)的信息熵分別為: 因此,決策樹歸納算法將會(huì)選擇屬性A。 (2) 劃分前的Gini值為G=1-0.42-0.62=0.48 按照屬性A劃分時(shí)Gini指標(biāo): 因此,決策樹歸納算法將會(huì)選擇屬性B。4.參考答案: 故這個(gè)關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則。 S({hamburgers})=2500/5000=50% 提升度=1.334?提升度大于1,表明hot?dogs和hamburgers不是互相獨(dú)立的,二者之間存在正相關(guān)關(guān)系。5.參考答案:明考斯基距離6.參考答案:D7.參考答案:常見數(shù)據(jù)類型有區(qū)間標(biāo)度變量、比例標(biāo)度型變量、二元變量、標(biāo)稱型、序數(shù)型以及混合類型等。8.參考答案: OLAP的典型應(yīng)用,通過(guò)商業(yè)活動(dòng)變化的查詢發(fā)現(xiàn)的問(wèn)題,經(jīng)過(guò)追蹤查詢找出問(wèn)題出現(xiàn)的原因,達(dá)到輔助決策的作用。 數(shù)據(jù)挖掘任務(wù)在于聚類(如神經(jīng)網(wǎng)絡(luò)聚類)、分類(如決策樹分類)、預(yù)測(cè)等。9.參考答案:數(shù)據(jù)是從企業(yè)內(nèi)外部的各業(yè)務(wù)處理系統(tǒng)(操作型數(shù)據(jù))流向企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)(EDW)或操作型數(shù)據(jù)存儲(chǔ)區(qū)(ODS),在這個(gè)過(guò)程中,要根據(jù)企業(yè)(或其他組織)的數(shù)據(jù)模型和元數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)進(jìn)行調(diào)和處理,形成一個(gè)中間數(shù)據(jù)層,然后再根據(jù)分析需求,從調(diào)和數(shù)據(jù)層(EDW、ODS)將數(shù)據(jù)引入導(dǎo)出數(shù)據(jù)層,如形成滿足各類分析需求的數(shù)據(jù)集市。10.參考答案:B11.參考答案:A12.參考答案:分箱、直方圖分析,聚類分析,基于熵的離散化和通過(guò)自然劃分分段。13.參考答案:14.參考答案:同時(shí)滿足最小支持度閾值和最小可信度閾值的規(guī)則稱之為關(guān)聯(lián)規(guī)則。15.參考答案:A16.參考答案:是基于關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)方式的,在這種結(jié)構(gòu)中,多維數(shù)據(jù)被映像成二維關(guān)系表,通常采用星型或雪花型架構(gòu),由一個(gè)事實(shí)表和多個(gè)維度表構(gòu)成。17.參考答案:數(shù)據(jù)清理;數(shù)據(jù)集成;數(shù)據(jù)選擇;數(shù)據(jù)變換;數(shù)據(jù)挖掘;模式評(píng)估;知識(shí)表示18.參考答案:C19.參考答案: 相異度矩陣是用于存儲(chǔ)所有對(duì)象兩兩之間相異度的矩陣,為一個(gè)nn維的單模矩陣。 其特點(diǎn)是d(i,j)=d(j,i),d(i,i)=0,d(j,j)=0。如下所示: 20.參考答案:退化維21.參考答案:錯(cuò)誤22.參考答案:記錄數(shù)據(jù),基于圖形的數(shù)據(jù)和有序的數(shù)據(jù)集23.參考答案:數(shù)據(jù)倉(cāng)庫(kù)是一種新的數(shù)據(jù)處理體系結(jié)構(gòu),是面向主題的、集成的、不可更新的(穩(wěn)定性)、隨時(shí)間不斷變化(不同時(shí)間)的數(shù)據(jù)集合,為企業(yè)決策支持系統(tǒng)提供所需的集成信息。 建立數(shù)據(jù)倉(cāng)庫(kù)的目的有3個(gè): 一是為了解決企業(yè)決策分析中的系統(tǒng)響應(yīng)問(wèn)題,數(shù)據(jù)倉(cāng)庫(kù)能提供比傳統(tǒng)事務(wù)數(shù)據(jù)庫(kù)更快的大規(guī)模決策分析的響應(yīng)速度。 二是解決決策分析對(duì)數(shù)據(jù)的特殊需求問(wèn)題。決策分析需要全面的、正確的集成數(shù)據(jù),這是傳統(tǒng)事務(wù)數(shù)據(jù)庫(kù)不能直接提供的。 三是解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論