2019數(shù)據(jù)挖掘測試題100_第1頁
2019數(shù)據(jù)挖掘測試題100_第2頁
2019數(shù)據(jù)挖掘測試題100_第3頁
2019數(shù)據(jù)挖掘測試題100_第4頁
2019數(shù)據(jù)挖掘測試題100_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1、(單選,4分)以下哪項(xiàng)不屬于知識發(fā)現(xiàn)的過程?()A、數(shù)據(jù)清理R數(shù)據(jù)挖掘 G知識可視化表達(dá)D數(shù)據(jù)測試答案:D 2、(單選,4分)以下哪些不屬于數(shù)據(jù)挖掘的內(nèi)容?()廣A分類廠R聚類廠G離群點(diǎn)檢測D遞歸分析答案:D3、(單選,4分) 以下哪個(gè)不是常見的屬性類型?A A.標(biāo)稱屬性R數(shù)值屬性G高維屬性D序數(shù)屬性答案:C 4、(單選,4分)以下哪個(gè)度量屬于數(shù)據(jù)散度的描述?A均值 G標(biāo)準(zhǔn)差D眾數(shù) 答案:C 5、(單選,4分)以下哪個(gè)度量不屬于數(shù)據(jù)中心趨勢度描述? ( D )A A.均值rR中位數(shù)G眾數(shù)D四分位數(shù)答案:D6、(單選,4分)對數(shù)據(jù)進(jìn)行數(shù)據(jù)清理、集成、變換、規(guī)約是數(shù)據(jù)挖掘哪個(gè)步驟的任務(wù)? A頻

2、繁模式挖掘 R分類和預(yù)測 G數(shù)據(jù)預(yù)處理D噪聲檢測答案:C7、(單選,4分)聚類分析是數(shù)據(jù)挖掘的一種重要技術(shù),以下哪個(gè)算法不屬于聚類算法?r A .A K-MeansEk DBSCANCC SVMD EM答案:C 8、(單選,4分) 建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù) 挖掘的哪一類任務(wù)?()A、根據(jù)內(nèi)容檢索R建模描述G預(yù)測建模 D尋找模式和規(guī)則答案:C9、(單選,4分) 當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí).可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他 標(biāo)簽的數(shù)據(jù)相分離?()A分類R聚類G關(guān)聯(lián)分析 D隱馬爾可夫鏈答案:B 10、(單選,4分)在構(gòu)造決策樹時(shí),以下哪種不是選擇

3、屬性的度量的方法?()A信息增益 R信息增益率G基尼指數(shù)D距離答案:D 11、(單選,4分) 知識發(fā)現(xiàn)流程最核心的步驟是什么?()A、數(shù)據(jù)挖掘 R數(shù)據(jù)預(yù)處理G模式評估廠D知識表示 答案:A 12、(單選,4分)將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)? A頻繁模式挖掘 R分類和預(yù)測 G數(shù)據(jù)預(yù)處理 D數(shù)據(jù)流挖掘答案:C 13、(單選,4分)以下哪個(gè)度量屬于數(shù)據(jù)中心性的描述?()A、均值R極差G眾數(shù)D標(biāo)準(zhǔn)差答案:A14、(單選,4分)類分析是數(shù)據(jù)挖掘的一種重要技術(shù),以下哪個(gè)算法不屬于聚類算法?()r A .A、K-MeansB DBSCANG KNN答案:C 15、(單選

4、,4分)這種屬于某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn), 買啤酒的人很大概率也會購買尿布, 數(shù)據(jù)挖掘的哪類問題?()A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)R聚類G分類 D自然語言處理答案:A 16、(單選,4分)以下哪些算法是分類算法?() A DBSCANB C4.5r 八.一C K-MeanD EM答案:B 17、(單選,4分)K-means算法的缺點(diǎn)不包括?() A K必須是事先給定的廠R選擇初始聚類中心G對于“噪聲”和孤立點(diǎn)數(shù)據(jù)是敏感的D可伸縮、高效答案:D18、(單選,4分) 機(jī)器學(xué)習(xí)中,下面哪些方法不可以避免分類中的過擬合問題?( A、增加樣本數(shù)量 R增加模型復(fù)雜度G去除噪聲D正則化答案:B 19、(單選,4分)

5、下面那個(gè)不屬于知識發(fā)現(xiàn)過程。() rA數(shù)據(jù)清理與集成廠R數(shù)據(jù)統(tǒng)計(jì)廣G數(shù)據(jù)挖掘 D模式評估和知識表示答案:B20、(單選,4分)在構(gòu)造決策樹時(shí),以下那個(gè)不屬于選擇屬性的度量?()A信息增益 R信息增益率G基尼指數(shù)D信息嫡答案:D 21、(單選,4分)關(guān)于頻繁模式,下面哪一個(gè)陳述是正確的?()A K項(xiàng)集頻繁則K-1項(xiàng)則必定不頻繁Ek K項(xiàng)集頻繁則K-1項(xiàng)則必定頻繁 G K項(xiàng)集不頻繁則K-1項(xiàng)則必定頻繁 D以上都不正確答案:B 22、(單選,4分)DBSCA策法最大的挑戰(zhàn)是?() A確定聚類個(gè)數(shù) R確定聚類形狀G 確定半徑及 MINPTS D確定評估指標(biāo)答案:C 23、(單選,4分)以下那個(gè)不屬于分類算法?()A KNN R樸素貝葉斯C K-MEANSD SVM答案:C 24、(單選,4分)以下哪些陳述是不正確的?() 廠A聚類可以發(fā)現(xiàn)數(shù)據(jù)內(nèi)部結(jié)構(gòu)廠R聚類可以作為其他任務(wù)的預(yù)處

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論