下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上數(shù)據(jù)挖掘考試題目關(guān)聯(lián)分析一、10個(gè)選擇1.以下屬于關(guān)聯(lián)分析的是( )ACPU性能預(yù)測(cè)B購(gòu)物籃分析C自動(dòng)判斷鳶尾花類別D股票趨勢(shì)建模2.維克托邁爾-舍恩伯格在大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革一書中,持續(xù)強(qiáng)調(diào)了一個(gè)觀點(diǎn):大數(shù)據(jù)時(shí)代的到來(lái),使我們無(wú)法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時(shí),我們更應(yīng)該注重?cái)?shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過(guò)以下哪個(gè)算法直接挖掘( )AK-meansBBayes NetworkCC4.5DApriori3.置信度(confidence)是衡量興趣度度量( )的指標(biāo)。A簡(jiǎn)潔性B確定性C實(shí)用性D新穎性4.Apriori
2、算法的加速過(guò)程依賴于以下哪個(gè)策略( )A抽樣B剪枝C緩沖D并行5.以下哪個(gè)會(huì)降低Apriori算法的挖掘效率( )A支持度閾值增大B項(xiàng)數(shù)減少C事務(wù)數(shù)減少D減小硬盤讀寫速率6.Apriori算法使用到以下哪些東東( )A格結(jié)構(gòu)、有向無(wú)環(huán)圖B二叉樹、哈希樹C格結(jié)構(gòu)、哈希樹D多叉樹、有向無(wú)環(huán)圖7.非頻繁模式( )A其置信度小于閾值B令人不感興趣C包含負(fù)模式和負(fù)相關(guān)模式D對(duì)異常數(shù)據(jù)項(xiàng)敏感8.對(duì)頻繁項(xiàng)集、頻繁閉項(xiàng)集、極大頻繁項(xiàng)集的關(guān)系描述正確的是( )注:分別以1、2、3代表之A3可以還原出無(wú)損的1B2可以還原出無(wú)損的1C3與2是完全等價(jià)的D2與1是完全等價(jià)的9.Hash tree在Apriori算法中
3、所起的作用是( )A存儲(chǔ)數(shù)據(jù)B查找C加速查找D剪枝10.以下不屬于數(shù)據(jù)挖掘軟件的是( )ASPSS ModelerBWekaCApache SparkDKnime二、10個(gè)填空1.關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有: 和 。2.關(guān)聯(lián)規(guī)則的評(píng)價(jià)度量主要有: 和 。3.關(guān)聯(lián)規(guī)則挖掘的算法主要有: 和 。4.購(gòu)物籃分析中,數(shù)據(jù)是以 的形式呈現(xiàn)。5.一個(gè)項(xiàng)集滿足最小支持度,我們稱之為 。6.一個(gè)關(guān)聯(lián)規(guī)則同時(shí)滿足最小支持度和最小置信度,我們稱之為 。7.在回歸與相關(guān)分析中,因變量值隨自變量值的增大(減?。┒鴾p?。ㄔ龃螅┑默F(xiàn)象叫做 。8.極大頻繁項(xiàng)集不能無(wú)損還原出頻繁項(xiàng)集,是因?yàn)樗话l繁項(xiàng)集的 信息。
4、9.經(jīng)典的Apriori算法是逐層掃描的,也就是說(shuō)它是 (選:深度/寬度)優(yōu)先的。10.數(shù)據(jù)挖掘大概步驟包括:輸入數(shù)據(jù)à預(yù)處理à挖掘à后處理à輸出知識(shí)。其中,輸出的知識(shí)可以有很多種表示形式,兩種極端的形式是:內(nèi)部結(jié)構(gòu)難以被理解的黑匣子,比如說(shuō)人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的網(wǎng)絡(luò);模式結(jié)構(gòu)清晰的匣子,這種結(jié)構(gòu)容易被人理解,比如說(shuō)決策樹產(chǎn)生的樹。那么,關(guān)聯(lián)分析中輸出的知識(shí)的表示形式主要是 (選:黑匣子/清晰結(jié)構(gòu))。三、10個(gè)判斷( )1.啤酒與尿布的故事是聚類分析的典型實(shí)例。( )2.Apriori算法是一種典型的關(guān)聯(lián)規(guī)則挖掘算法。( )3.支持度是衡量關(guān)聯(lián)規(guī)則重要性
5、的一個(gè)指標(biāo)。( )4.可信度是對(duì)關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。( )5.給定關(guān)聯(lián)規(guī)則AàB,意味著:若A發(fā)生,B也會(huì)發(fā)生。( )6.頻繁閉項(xiàng)集可用來(lái)無(wú)損壓縮頻繁項(xiàng)集。( )7.關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。( )8.Apriori算法產(chǎn)生的關(guān)聯(lián)規(guī)則總是確定的。( )9.不滿足給定評(píng)價(jià)度量的關(guān)聯(lián)規(guī)則是無(wú)趣的。( )10.對(duì)于項(xiàng)集來(lái)說(shuō),置信度沒(méi)有意義。四、5個(gè)簡(jiǎn)答1.簡(jiǎn)述關(guān)聯(lián)規(guī)則產(chǎn)生的兩個(gè)基本步驟。2.Apriori算法是從事務(wù)數(shù)據(jù)庫(kù)中挖掘布爾關(guān)聯(lián)規(guī)則的常用算法,該算法利用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),從候選項(xiàng)集中找到頻繁項(xiàng)集。請(qǐng)簡(jiǎn)述Apriori算法的基本原理。3.簡(jiǎn)述Apriori算法的優(yōu)點(diǎn)和缺
6、點(diǎn)。4.針對(duì)Apriori算法的缺點(diǎn),可以做哪些方面的改進(jìn)?5.強(qiáng)關(guān)聯(lián)規(guī)則一定是有趣的嗎?為什么?數(shù)據(jù)挖掘考試題目+參考答案一、10個(gè)選擇1.以下屬于關(guān)聯(lián)分析的是( B )ACPU性能預(yù)測(cè)B購(gòu)物籃分析C自動(dòng)判斷鳶尾花類別D股票趨勢(shì)建模2.維克托邁爾-舍恩伯格在大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革一書中,持續(xù)強(qiáng)調(diào)了一個(gè)觀點(diǎn):大數(shù)據(jù)時(shí)代的到來(lái),使我們無(wú)法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時(shí),我們更應(yīng)該注重?cái)?shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過(guò)以下哪個(gè)算法直接挖掘( D )AK-meansBBayes NetworkCC4.5DApriori3.置信度(confidence
7、)是衡量興趣度度量( B )的指標(biāo)。A簡(jiǎn)潔性B確定性C實(shí)用性D新穎性4.Apriori算法的加速過(guò)程依賴于以下哪個(gè)策略( B )A抽樣B剪枝C緩沖D并行5.以下哪個(gè)會(huì)降低Apriori算法的挖掘效率( D )A支持度閾值增大B項(xiàng)數(shù)減少C事務(wù)數(shù)減少D減小硬盤讀寫速率6.Apriori算法使用到以下哪些東東( C )A格結(jié)構(gòu)、有向無(wú)環(huán)圖B二叉樹、哈希樹C格結(jié)構(gòu)、哈希樹D多叉樹、有向無(wú)環(huán)圖7.非頻繁模式( D )A其置信度小于閾值B令人不感興趣C包含負(fù)模式和負(fù)相關(guān)模式D對(duì)異常數(shù)據(jù)項(xiàng)敏感8.對(duì)頻繁項(xiàng)集、頻繁閉項(xiàng)集、極大頻繁項(xiàng)集的關(guān)系描述正確的是( B )注:分別以1、2、3代表之A3可以還原出無(wú)損的1
8、B2可以還原出無(wú)損的1C3與2是完全等價(jià)的D2與1是完全等價(jià)的9.Hash tree在Apriori算法中所起的作用是( C )A存儲(chǔ)數(shù)據(jù)B查找C加速查找D剪枝10.以下不屬于數(shù)據(jù)挖掘軟件的是( C )ASPSS ModelerBWekaCApache SparkDKnime二、10個(gè)填空1.關(guān)聯(lián)分析中表示關(guān)聯(lián)關(guān)系的方法主要有: 項(xiàng)集 和 關(guān)聯(lián)規(guī)則 。2.關(guān)聯(lián)規(guī)則的評(píng)價(jià)度量主要有: 支持度 和 置信度 。3.關(guān)聯(lián)規(guī)則挖掘的算法主要有: Apriori 和 FP-Growth 。4.購(gòu)物籃分析中,數(shù)據(jù)是以 不對(duì)稱二元變量 的形式呈現(xiàn)。5.一個(gè)項(xiàng)集滿足最小支持度,我們稱之為 頻繁項(xiàng)集 。6.一個(gè)關(guān)
9、聯(lián)規(guī)則同時(shí)滿足最小支持度和最小置信度,我們稱之為 強(qiáng)規(guī)則 。7.在回歸與相關(guān)分析中,因變量值隨自變量值的增大(減?。┒鴾p小(增大)的現(xiàn)象叫做 負(fù)相關(guān) 。8.極大頻繁項(xiàng)集不能無(wú)損還原出頻繁項(xiàng)集,是因?yàn)樗话l繁項(xiàng)集的 支持度 信息。9.經(jīng)典的Apriori算法是逐層掃描的,也就是說(shuō)它是 寬度 (選:深度/寬度)優(yōu)先的。10.數(shù)據(jù)挖掘大概步驟包括:輸入數(shù)據(jù)à預(yù)處理à挖掘à后處理à輸出知識(shí)。其中,輸出的知識(shí)可以有很多種表示形式,兩種極端的形式是:內(nèi)部結(jié)構(gòu)難以被理解的黑匣子,比如說(shuō)人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練得出的網(wǎng)絡(luò);模式結(jié)構(gòu)清晰的匣子,這種結(jié)構(gòu)容易被人理解,比如說(shuō)決策
10、樹產(chǎn)生的樹。那么,關(guān)聯(lián)分析中輸出的知識(shí)的表示形式主要是 清晰結(jié)構(gòu) (選:黑匣子/清晰結(jié)構(gòu))。三、10個(gè)判斷( )1.啤酒與尿布的故事是聚類分析的典型實(shí)例。( )2.Apriori算法是一種典型的關(guān)聯(lián)規(guī)則挖掘算法。( )3.支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個(gè)指標(biāo)。( )4.可信度是對(duì)關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。( )5.給定關(guān)聯(lián)規(guī)則AàB,意味著:若A發(fā)生,B也會(huì)發(fā)生。( )6.頻繁閉項(xiàng)集可用來(lái)無(wú)損壓縮頻繁項(xiàng)集。( )7.關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。( )8.Apriori算法產(chǎn)生的關(guān)聯(lián)規(guī)則總是確定的。( )9.不滿足給定評(píng)價(jià)度量的關(guān)聯(lián)規(guī)則是無(wú)趣的。( )10.對(duì)于項(xiàng)集來(lái)說(shuō),置信度沒(méi)有意義
11、。四、5個(gè)簡(jiǎn)答1.簡(jiǎn)述關(guān)聯(lián)規(guī)則產(chǎn)生的兩個(gè)基本步驟。答:關(guān)聯(lián)規(guī)則產(chǎn)生的兩個(gè)基本步驟為:根據(jù)給定的支持度從項(xiàng)集中產(chǎn)生頻繁項(xiàng)集;根據(jù)給定的置信度從頻繁項(xiàng)集中產(chǎn)生關(guān)聯(lián)規(guī)則。2.Apriori算法是從事務(wù)數(shù)據(jù)庫(kù)中挖掘布爾關(guān)聯(lián)規(guī)則的常用算法,該算法利用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),從候選項(xiàng)集中找到頻繁項(xiàng)集。請(qǐng)簡(jiǎn)述Apriori算法的基本原理。答:關(guān)聯(lián)規(guī)則的產(chǎn)生并不依賴于Apriori算法,Apriori算法用來(lái)加速規(guī)則的產(chǎn)生過(guò)程。Apriori算法的加速過(guò)程依賴于這樣一個(gè)先驗(yàn)原理:“頻繁項(xiàng)集的子集是頻繁的”。3.簡(jiǎn)述Apriori算法的優(yōu)點(diǎn)和缺點(diǎn)。答:Apriori算法的優(yōu)點(diǎn):結(jié)構(gòu)簡(jiǎn)單、易于理解。Apriori算法的缺點(diǎn):產(chǎn)生大量的候選項(xiàng)集,I/O開銷較大。4.針對(duì)Apriori算法的缺點(diǎn),可以做哪些方面的改進(jìn)?答:Apriori算法的缺點(diǎn)主要是產(chǎn)生的候選項(xiàng)集較多,從而導(dǎo)致I/O開銷較
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 冷凍海水產(chǎn)品購(gòu)銷協(xié)議
- 測(cè)量不確定度
- 八年級(jí)英語(yǔ)上冊(cè) Unit 9 Can you come to my party Section B(2a-2e)教案 (新版)人教新目標(biāo)版
- 安徽省長(zhǎng)豐縣2024-2025學(xué)年高中政治 第四課 第二框 認(rèn)識(shí)運(yùn)動(dòng) 把握規(guī)律教案 新人教版必修4
- 2024年春九年級(jí)化學(xué)下冊(cè) 9 溶液 課題2 溶解度教案 (新版)新人教版
- 2024-2025學(xué)年高中數(shù)學(xué)上學(xué)期第10周 3.1.1方程的根與函數(shù)的零點(diǎn)教學(xué)設(shè)計(jì)
- 2023七年級(jí)英語(yǔ)下冊(cè) Unit 3 How do you get to school Section A 第1課時(shí)(1a-2e)教案 (新版)人教新目標(biāo)版
- 2024-2025年新教材高中生物 第6章 第3節(jié) 細(xì)胞的衰老和死亡教案 新人教版必修1
- 預(yù)制房屋采購(gòu)合同范本(2篇)
- 美味冰淇淋課件
- 循證教學(xué)評(píng)價(jià):數(shù)智化時(shí)代下高校教師教學(xué)評(píng)價(jià)的新取向
- (完整word版)兒童感覺(jué)統(tǒng)合能力發(fā)展評(píng)定量表
- 《各種管道的護(hù)理》PPT課件.ppt
- 世界500強(qiáng)企業(yè)簡(jiǎn)要情況及在華機(jī)構(gòu)聯(lián)系方式
- EDQM分析方法驗(yàn)證指導(dǎo)原則
- 專題關(guān)于同一溶質(zhì)不同濃度溶液混合的計(jì)算1
- 商城開發(fā)合同
- 220千伏變電站現(xiàn)場(chǎng)運(yùn)行通用規(guī)程
- 海綿城市建設(shè)難點(diǎn)與對(duì)策
- 幼兒園《交通工具(火車篇)家長(zhǎng)代課》PPT課件
- 我的叔叔于勒(劇本)精編版
評(píng)論
0/150
提交評(píng)論