2023年商業(yè)經濟行業(yè)技能考試-數(shù)據(jù)挖掘工程師考試參考題庫(含答案)_第1頁
2023年商業(yè)經濟行業(yè)技能考試-數(shù)據(jù)挖掘工程師考試參考題庫(含答案)_第2頁
2023年商業(yè)經濟行業(yè)技能考試-數(shù)據(jù)挖掘工程師考試參考題庫(含答案)_第3頁
2023年商業(yè)經濟行業(yè)技能考試-數(shù)據(jù)挖掘工程師考試參考題庫(含答案)_第4頁
2023年商業(yè)經濟行業(yè)技能考試-數(shù)據(jù)挖掘工程師考試參考題庫(含答案)_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2023年商業(yè)經濟行業(yè)技能考試-數(shù)據(jù)挖掘工程師考試參考題庫(含答案)(圖片大小可任意調節(jié))第I卷一.全考點試題庫(共20題)1.支持度

正確答案:規(guī)則A→B的支持度指的是所有事件中A與B同地發(fā)生的的概率,即P(A∪B),是AB同時發(fā)生的次數(shù)與事件總次數(shù)之比。支持度是對關聯(lián)規(guī)則重要性的衡量。2.什么是分類?分類的應用領域有哪些?

正確答案:

分類是指把數(shù)據(jù)樣本映射到一個事先定義的類中的學習過程,即給定一組輸入的屬性向量及其對應的類,用基于歸納的學習算法得出分類。

分類問題在商業(yè)、銀行業(yè)、醫(yī)療診斷、生物學、文本挖掘、因特網(wǎng)篩選等領域都有廣泛應用。例如,在銀行業(yè)中,分類方法可以輔助工作人員將正常信用卡用戶和欺詐信用卡用戶進行分類,從而采取有效措施減小銀行的損失;在醫(yī)療診斷中,分類方法可以幫助醫(yī)療人員將正常細胞和癌變細胞進行分類,從而及時制定救治方案,挽救病人的生命。3.關聯(lián)知識

正確答案:是反映一個事件和其他事件之間依賴或相互關聯(lián)的知識。如果兩項或多項屬性之間存在關聯(lián),那么其中一項的屬性值就可以依據(jù)其他屬性值進行預測。4.關于混合模型聚類算法的優(yōu)缺點,下面說法正確的是()。

A、當簇只包含少量數(shù)據(jù)點,或者數(shù)據(jù)點近似協(xié)線性時,混合模型也能很好地處理

B、混合模型比K均值或模糊c均值更一般,因為它可以使用各種類型的分布

C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇

D、混合模型在有噪聲和離群點時不會存在問題

正確答案:B5.()都屬于簇有效性的監(jiān)督度量。

A、輪廓系數(shù)

B、共性分類相關系數(shù)

C、熵

D、F度量

正確答案:C,D6.關聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則。

正確答案:錯誤7.一個典型的數(shù)據(jù)挖掘系統(tǒng)應該包括哪些組成部分?

正確答案:

1,數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫;

2,數(shù)據(jù)庫或數(shù)據(jù)倉庫服務器;

3,知識庫;

4,數(shù)據(jù)挖掘引擎;

5,模式評估模塊;

6.圖形用戶界面。8.項集的頻率是指()

正確答案:包含項集的事務數(shù)9.數(shù)據(jù)集分為三類:()。

正確答案:記錄數(shù)據(jù),基于圖形的數(shù)據(jù)和有序的數(shù)據(jù)集10.尋找模式和規(guī)則主要是對數(shù)據(jù)進行干擾,使其符合某種規(guī)則以及模式。

正確答案:錯誤11.簡述數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關系?

正確答案:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘都是決策支持新技術。但它們有著完全不同的輔助決策方式。在數(shù)據(jù)倉庫系統(tǒng)的前端的分析工具中,數(shù)據(jù)挖掘是其中重要工具之一。它可以幫助決策用戶挖掘數(shù)據(jù)倉庫的數(shù)據(jù)中隱含的規(guī)律性。12.DBSCAN在最壞情況下的時間復雜度是()。

A、O(m)

B、O(m2)

C、O(logm)

D、O(m*logm)

正確答案:B13.在數(shù)據(jù)挖掘之前為什么要對原始數(shù)據(jù)進行預處理?

正確答案:

原始業(yè)務數(shù)據(jù)來自多個數(shù)據(jù)庫或數(shù)據(jù)倉庫,它們的結構和規(guī)則可能是不同的,這將導致原始數(shù)據(jù)非常的雜亂、不可用,即使在同一個數(shù)據(jù)庫中,也可能存在重復的和不完整的數(shù)據(jù)信息,為了使這些數(shù)據(jù)能夠符合數(shù)據(jù)挖掘的要求,提高效率和得到清晰的結果,必須進行數(shù)據(jù)的預處理。

為數(shù)據(jù)挖掘算法提供完整、干凈、準確、有針對性的數(shù)據(jù),減少算法的計算量,提高挖掘效率和準確程度。14.請描述主成份分析(PCA)算法步驟

正確答案:

1.規(guī)范化輸入的數(shù)據(jù):所有屬性落在相同的區(qū)間內;

2,計算k個標準正交向量,即主成分;

3,每個數(shù)據(jù)數(shù)據(jù)的向量都是這k主成分向量的線性組合;

4,主成分按照重要程度降序排序。15.在有關數(shù)據(jù)倉庫測試,下列說法不正確的是:()。

A、在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試

B、當數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試

C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試

D、在測試之前沒必要制定詳細的測試計劃

正確答案:D16.層次聚類方法包括哪些?

正確答案:層次聚類方法包括凝聚型和分解型兩中層次聚類方法。17.以下哪些學科和數(shù)據(jù)挖掘有密切聯(lián)系?()

A、統(tǒng)計

B、計算機組成原理

C、礦產挖掘

D、人工智能

正確答案:A,D18.請列出3種數(shù)據(jù)倉庫產品,并說明其優(yōu)缺點。

正確答案:

(1)IBM提供了基于可視化數(shù)據(jù)倉庫的商業(yè)智能(BI)解決方案,包括:VisualWarehouse(VW),Essbase/DB2OLAPServer5.0、IBMDB2UDB,其中,VW是一個功能很強的集成環(huán)境,既可用于數(shù)據(jù)倉庫建模和元數(shù)據(jù)管理,又可用于數(shù)據(jù)抽取、轉換、裝載和調度。Essbase/DB2OLAPServer支持“維”的定義和數(shù)據(jù)裝載。

(2)Oracle數(shù)據(jù)倉庫解決方案主要包括OracleExpress和OracleDiscoverer兩個部分。OracleExpress由四個工具組成:OracleExpressServer是一個MOLAP(多維OLAP)服務器,它利用多維模型,存儲和管理多維數(shù)據(jù)庫或多維高速緩存,同時也能夠訪問多種關系數(shù)據(jù)庫

(3)Microsoft將OLAP功能集成到SQLServer數(shù)據(jù)庫中,其解決方案包括BI平臺、BI終端工具、BI門戶和BI應用四個部分。BI平臺是BI解決方案的基礎,包括ETL平臺SQLServer2005IntegrationService(SSIS)、數(shù)據(jù)倉庫引擎SQLServer2005RDBMS以及多維分析和數(shù)據(jù)挖掘引擎SQLServer2005AnalysisService、報表管理引擎SQLServer2005ReportingService。19.考慮如下的頻繁3-項集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根據(jù)Apriori算法的候選項集生成方法,寫出利用頻繁3-項集生成的所有候選4-項集。 (b)寫出經過剪枝后的所有候選4-項集。

正確答案:(a)利用頻繁3-項集生成的所有候選4-項集:

{1,2,3,4},{1,2,3,5},{1,2,4,5},{1,3,4,5},{2,3,4,5}

(b)經過剪枝后的所有候選4-項集:

{1,2,3,4},{1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論