數(shù)據(jù)挖掘知到章節(jié)答案智慧樹2023年國防科技大學(xué)_第1頁
數(shù)據(jù)挖掘知到章節(jié)答案智慧樹2023年國防科技大學(xué)_第2頁
數(shù)據(jù)挖掘知到章節(jié)答案智慧樹2023年國防科技大學(xué)_第3頁
數(shù)據(jù)挖掘知到章節(jié)答案智慧樹2023年國防科技大學(xué)_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余5頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘知到章節(jié)測試答案智慧樹2023年最新國防科技大學(xué)緒論單元測試

什么是KDD?()

參考答案:

數(shù)據(jù)挖掘與知識發(fā)現(xiàn)

“8,000”和“10,000”表示:()

參考答案:

數(shù)據(jù)

人從出生到長大的過程中,是如何認(rèn)識事物的?()

參考答案:

先聚類,后分類

“8,000米是飛機(jī)飛行最大高度”與“10,000米的高山”表示:()

參考答案:

信息

“飛機(jī)無法飛過高山”表示:()

參考答案:

知識

第一章測試

下面哪個不屬于數(shù)據(jù)的屬性類型:()

參考答案:

相異

只有非零值才重要的二元屬性被稱作:()

參考答案:

非對稱的二元屬性

一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數(shù)是:()

參考答案:

一年級

杰卡德系數(shù)用來度量非對稱的二進(jìn)制屬性的相似性。()

參考答案:

歐式距離用來度量連續(xù)數(shù)值屬性數(shù)據(jù)的相似性。()

參考答案:

第二章測試

卡方測試用來度量離散標(biāo)稱屬性數(shù)據(jù)的相關(guān)性。()

參考答案:

相關(guān)系數(shù)用來度量標(biāo)稱屬性數(shù)據(jù)的相關(guān)性。()

參考答案:

所謂高維數(shù)據(jù),指的是數(shù)據(jù)屬性很多。()

參考答案:

假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為:()

參考答案:

0.716

假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內(nèi)?()

參考答案:

第二個

第三章測試

考慮兩隊(duì)之間的足球比賽:隊(duì)0和隊(duì)1。假設(shè)65%的比賽隊(duì)0勝出,剩余的比賽隊(duì)1獲勝。隊(duì)0獲勝的比賽中只有30%是在隊(duì)1的主場,而隊(duì)1取勝的比賽中75%是主場獲勝。如果下一場比賽在隊(duì)1的主場進(jìn)行隊(duì)1獲勝的概率為()

參考答案:

0.5738

Bayes法是一種在已知后驗(yàn)概率與類條件概率的情況下的模式分類方法,待分樣本的分類結(jié)果取決于各類域中樣本的全體。()

參考答案:

樸素貝葉斯分類器的樸素之處在于:()

參考答案:

屬性之間的條件獨(dú)立性假設(shè)

可以利用概率統(tǒng)計(jì)方法估計(jì)數(shù)據(jù)的分布參數(shù),再進(jìn)一步估計(jì)待測試數(shù)據(jù)的概率,以此來實(shí)現(xiàn)貝葉斯分類。()

參考答案:

貝葉斯分類器對離群點(diǎn)敏感。()

參考答案:

第四章測試

決策樹中不包含一下哪種結(jié)點(diǎn),()

參考答案:

外部結(jié)點(diǎn)(externalnode)

一個決策樹包括如下哪些要素()

參考答案:

測試節(jié)點(diǎn)

;分支

;葉子

以下哪個算法是分類算法()

參考答案:

ID3

采用決策樹分類算法,連續(xù)數(shù)據(jù)如何處理?()

參考答案:

連續(xù)數(shù)據(jù)離散化

;選擇最佳劃分點(diǎn)分裂

決策樹的父節(jié)點(diǎn)和子節(jié)點(diǎn)的熵的大小關(guān)系是什么?()

參考答案:

子節(jié)點(diǎn)的熵更大

第五章測試

當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時,可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()

參考答案:

聚類

簡單地將數(shù)據(jù)對象集劃分成不重疊的子集,使得每個數(shù)據(jù)對象恰在一個子集中,這種聚類類型稱作()

參考答案:

劃分聚類

下面說法正確的是

()

參考答案:

K-modes能夠解決離散數(shù)據(jù)的聚類問題

;K-means++能夠解決初始點(diǎn)影響聚類效果的問題

;K中心點(diǎn)能夠解決有離群點(diǎn)的聚類問題

關(guān)于k-means算法,正確的描述是:()

參考答案:

初始值不同,最終結(jié)果可能不同

K-Means算法中的初始中心點(diǎn):()

參考答案:

直接影響算法的收斂結(jié)果

第六章測試

logistic回歸對噪聲敏感。()

參考答案:

經(jīng)典的邏輯回歸可以解決非線性的分類問題。()

參考答案:

分類和回歸都可用于預(yù)測,分類的輸出是離散的類別值,而回歸的輸出是連續(xù)數(shù)值。()

參考答案:

邏輯回歸正則化主要包括L1正則化和L2正則化。()

參考答案:

數(shù)據(jù)規(guī)范化能夠提高邏輯回歸算法參數(shù)學(xué)習(xí)的效率。()

參考答案:

第七章測試

某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?()

參考答案:

關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)則,從而能更好的完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)。()

參考答案:

具有較高的支持度的項(xiàng)集具有較高的置信度。(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論