




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)挖掘——探索數(shù)據(jù)的奧秘智慧樹知到課后章節(jié)答案2023年下青島工學院青島工學院
第一章測試
數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。()
答案:
對
下面哪些是時空數(shù)據(jù)的應用()。
答案:
氣象學家使用人造衛(wèi)星和雷達觀察颶風;機動車輛管理者把GPS安裝在汽車上,以便更好地監(jiān)管和引導車輛;動物學家把遙感設(shè)備安裝在野生動物身上,以便分析生態(tài)行為
數(shù)據(jù)挖掘生命周期的數(shù)據(jù)理解階段,起于原始數(shù)據(jù)收集,止于熟悉數(shù)據(jù)、識別數(shù)據(jù)質(zhì)量問題。()
答案:
錯
以下關(guān)于數(shù)據(jù)挖掘規(guī)律的描述中,不正確的是()。
答案:
數(shù)據(jù)準備超過數(shù)據(jù)挖掘過程的3/4
關(guān)于數(shù)據(jù)挖掘生命周期的部署階段,說法正確的是()。
答案:
部署階段要完成模型的創(chuàng)建
“8,000”和“10,000”表示:()。
答案:
數(shù)據(jù)
“8,000米是飛機飛行最大高度”與“10,000米的高山”表示:()。
答案:
信息
“飛機無法飛過高山”表示:()。
答案:
知識
數(shù)據(jù)取樣時,除了要求抽樣時嚴把質(zhì)量關(guān)外,還要求抽樣數(shù)據(jù)必須在足夠范圍內(nèi)有代表性。()
答案:
對
根據(jù)顧客喜好擺放商品位置屬于數(shù)據(jù)挖掘范疇。()
答案:
對
第二章測試
使用交互式的和可視化的技術(shù),對數(shù)據(jù)進行探索屬于數(shù)據(jù)挖掘的()任務(wù)?
答案:
探索性數(shù)據(jù)分析
下列對學生相關(guān)屬性描述中,不是標稱屬性的是()。
答案:
身高
下列哪些選項能表示序數(shù)屬性的數(shù)據(jù)集中趨勢度量()。
答案:
眾數(shù)
()可以觀察從一個分布到另一分布是否有漂移。
答案:
分位數(shù)-分位數(shù)圖
考慮值集{1、2、3、4、5、90},其截斷均值(p=20%)是()
答案:
3.5
下列哪個不是專門用于可視化時間空間數(shù)據(jù)的技術(shù):()
答案:
餅圖
皮爾森相關(guān)系數(shù)取值為()時說明兩個對象最不相似。
答案:
-1
下列哪些指標可以度量數(shù)據(jù)的離散趨勢度量:()。
答案:
四分位數(shù)極差;五數(shù)概括;四分位數(shù);極差
在探索性數(shù)據(jù)分析中,認為最有代表性,最能反映數(shù)據(jù)重要特征的五數(shù)概括,包括:()。
答案:
四分位數(shù)Q3;中位數(shù)Q2;最小值;最大值
四分位數(shù)極差(IQR)是第1個和第2個四分位數(shù)之間的距離。()
答案:
錯
第三章測試
下面()不屬于數(shù)據(jù)預處理的方法?
答案:
估計遺漏值
假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在()箱子內(nèi)?
答案:
第二個
假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等寬劃分時(寬度為50),15又在()箱子里?
答案:
第一個
所謂高維數(shù)據(jù),指的是()。
答案:
數(shù)據(jù)屬性很多
結(jié)構(gòu)化的數(shù)據(jù)是指一些數(shù)據(jù)通過統(tǒng)一的()的形式存儲的,這類數(shù)據(jù)我們稱為結(jié)構(gòu)化的數(shù)據(jù)。
答案:
二維表格
假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使用按箱平均值平滑方法對上述數(shù)據(jù)進行平滑,箱的深度為3。第二個箱子值為:()
答案:
18.3
假定屬性income的均值和標準差分別為54000美元和16000美元,使用Z-score規(guī)范化值83600美元轉(zhuǎn)換為()。
答案:
1.850
下列關(guān)于數(shù)據(jù)規(guī)范化說法錯誤的是()。
答案:
數(shù)據(jù)規(guī)范化是為了給重要的屬性賦予更大的權(quán)重
缺失值處理方法中錯誤的是()。
答案:
對于所有屬性都可以使用均值
以下關(guān)于數(shù)據(jù)預處理的描述正確的是()。
答案:
需要借助領(lǐng)域知識;數(shù)據(jù)挖掘工作的基礎(chǔ)性工作
第四章測試
數(shù)據(jù)挖掘典型案例“尿不濕和啤酒”中,沃爾瑪對其顧客的購物行為進行了購物籃關(guān)聯(lián)規(guī)則分析,從而知道顧客經(jīng)常一起購買的商品有哪些。()
答案:
對
“這個消費者對我們的活動有多大的反應”屬于()這一數(shù)據(jù)挖掘任務(wù)。
答案:
分類和類概率估計
關(guān)于決策樹的描述,正確的是()。
答案:
每個節(jié)點表示一個屬性的測試;每個葉子節(jié)點代表一個分類標簽;每個分支代表測試的結(jié)果;從根到葉子的路徑代表分類規(guī)則
為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問題屬于數(shù)據(jù)挖掘的()任務(wù)?
答案:
建模描述
用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘()任務(wù)?
答案:
根據(jù)內(nèi)容檢索
下列應用場景不屬于分類的是()。
答案:
為了解用戶特點,公司將客戶分群
考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個項,采用合并策略,由候選產(chǎn)生過程得到4-項集不包含()
答案:
1,2,4,5
利用信息增益方法作為屬性選擇度量建立決策樹時,已知某訓練樣本集的4個條件屬性的信息增益分別為:G(收入)=0.940位,G(職業(yè))=0.151位,G(年齡)=0.780位,G(信譽)=0.048位,則應該選擇()屬性作為決策樹的測試屬性。
答案:
收入
以下哪些算法是分類算法()
答案:
C4.5
BIRCH是一種()。
答案:
聚類算法
第五章測試
以下哪個聚類算法不屬于基于網(wǎng)格的聚類算法()。
答案:
BIRCH
下面關(guān)于維的敘述中()是錯誤的。
答案:
“某年某月某日”是時間維的層次
根據(jù)聚類形成的簇的特點,如果有交集的簇之間必然存在包含關(guān)系,這種聚類稱為()。
答案:
層次型聚類
P(22,1,42,10),Q(20,0,36,8)為兩個向量對象,這兩個對象的曼哈頓距離是()。
答案:
11
K-Means算法中的初始中心點()。
答案:
直接影響算法的收斂結(jié)果
聚類與分類的主要區(qū)別在于()。
答案:
數(shù)據(jù)有無標簽;數(shù)據(jù)維度不同;數(shù)據(jù)類型不同
關(guān)于聚類下列說法正確的是()。
答案:
聚類有著廣泛的應用;聚類可以發(fā)現(xiàn)偏離多數(shù)數(shù)據(jù)對象的孤立點;聚類可以作為其他數(shù)據(jù)挖掘分析過程的一個基礎(chǔ)處理步驟
從研究現(xiàn)狀上看,下面不屬于云計算特點的是()
答案:
私有化
下列說法正確的是()。
答案:
K中心點能夠解決有離群點的聚類問題;K-means++能夠解決初始點影響聚類效果的問題;K-modes能夠解決離散數(shù)據(jù)的聚類問題
聚類針對有標簽的數(shù)據(jù)。()
答案:
錯
第六章測試
下面購物籃能夠提取的3-項集的最大數(shù)量是多少()
ID購買項
1牛奶,啤酒,尿布
2面包,黃油,牛奶
3牛奶,尿布,餅干
4面包,黃油,餅干
5啤酒,餅干,尿布
6牛奶,尿布,面包,黃油
7面包,黃油,尿布
8啤酒,尿布
9牛奶,尿布,面包,黃油
10啤酒,餅干
答案:
3
數(shù)據(jù)挖掘包括下面哪些方法()。
答案:
聚類;關(guān)聯(lián);分類;異常發(fā)現(xiàn)
數(shù)據(jù)挖掘和哪些學科領(lǐng)域有關(guān)系()。
答案:
機器學習;數(shù)據(jù)庫;優(yōu)化;統(tǒng)計
關(guān)聯(lián)規(guī)則的評價指標是()。
答案:
支持度、置信度
關(guān)聯(lián)分析是數(shù)據(jù)分析中常用的分析方法。()
答案:
對
數(shù)據(jù)清洗的主要目的是將數(shù)據(jù)集中存在的()和()進行處理,降低其對后續(xù)數(shù)據(jù)分析處理的影響。()
答案:
噪聲;缺失
如果一個對象不強屬于任何簇,那么該對象是基于聚類的離群點。()
答案:
對
聚類是指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的過程。()
答案:
對
歐式距離用來度量連續(xù)數(shù)值屬性數(shù)據(jù)的相似性。()
答案:
對
采用分箱方法可以進行數(shù)據(jù)離散化。()
答案:
對
第七章測試
數(shù)據(jù)挖掘生命周期的數(shù)據(jù)準備階段,包括從原始數(shù)據(jù)構(gòu)建最終數(shù)據(jù)集的所有活動(數(shù)據(jù)要輸入到建模工具中),具體任務(wù)不包括()。
答案:
數(shù)據(jù)收集
關(guān)于數(shù)據(jù)挖掘規(guī)律的描述,正確的包括()。
答案:
數(shù)據(jù)挖掘結(jié)果的價值,不取決于預測模型的準確性和穩(wěn)定性,而是促進行動、改進策略;所有的模式都會變化;數(shù)據(jù)挖掘增強了業(yè)務(wù)領(lǐng)域的感知能力
下列對學生的描述屬性中,標稱屬性的屬性是:()。
答案:
學號;婚姻狀況;頭發(fā)顏色
在matlab中,用round函數(shù)四舍五入對數(shù)組[2.486.393.938.52]取整,結(jié)果為()。
答案:
[2649]
matlab中圖形窗口(figure)顯示網(wǎng)格的命令是()。
答案:
gridon
在matlab中,已知數(shù)組A=[12;45],則A(1,:)是指()。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 健身器材用戶參與度提升策略實踐考核試卷
- 塑料鞋生產(chǎn)效率統(tǒng)計與分析考核試卷
- 數(shù)學空間想象力培養(yǎng)教具考核試卷
- 供應鏈大數(shù)據(jù)分析在供應鏈中的應用案例解析考核試卷
- 北京車牌借用合同范本
- 蔬菜購銷合同范本
- 藥店店員培訓課件
- 冷庫設(shè)備銷售合同范本
- 靜脈輸液的基本操作流程
- 數(shù)據(jù)傳輸網(wǎng)絡(luò)安全合作協(xié)議之數(shù)據(jù)傳輸保護服務(wù)合同
- 口腔科放射防護制度
- 2024年公開招聘事業(yè)單位工作人員報名登記表
- 微觀經(jīng)濟學:緒論
- 2024年全國高考數(shù)學試題及解析答案(新課標Ⅱ卷)
- 2024年中考語文滿分作文6篇(含題目)
- 2024年河南鄭州航空港經(jīng)濟綜合實驗區(qū)招考高頻500題難、易錯點模擬試題附帶答案詳解
- 風動和電動工具市場洞察報告
- 蘇教版一年級數(shù)學下冊全冊教案(完整版)教學設(shè)計含教學反思
- 10《傳統(tǒng)美德源遠流長》第2課時教學設(shè)計-2024-2025學年道德與法治五年級上冊統(tǒng)編版
- 小學奧數(shù)-經(jīng)濟問題(二).教師版
- 2024統(tǒng)編版新教材道德與法治七年級全冊內(nèi)容解讀課件(深度)
評論
0/150
提交評論