大數(shù)據(jù)分析基礎(chǔ)試卷_第1頁
大數(shù)據(jù)分析基礎(chǔ)試卷_第2頁
大數(shù)據(jù)分析基礎(chǔ)試卷_第3頁
大數(shù)據(jù)分析基礎(chǔ)試卷_第4頁
大數(shù)據(jù)分析基礎(chǔ)試卷_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、大數(shù)據(jù)分析基礎(chǔ)一、基礎(chǔ)知識部分習(xí)題(共29題,67分)1、大數(shù)據(jù)的最顯著特征是()。(單選題,本題2分)A:數(shù)據(jù)規(guī)模大B:數(shù)據(jù)類型多樣C:數(shù)據(jù)處理速度快D:數(shù)據(jù)價(jià)值密度高2、美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()。(單選題,本題2分)A:在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B:在分析方法上更注重相關(guān)分析而不是因果分析C:在分析效果上更追究效率而不是絕對精確D:在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)3、下列對大數(shù)據(jù)特點(diǎn)的說法中,錯(cuò)誤的是()。(單選題,本題2分)A:數(shù)據(jù)規(guī)模大B:數(shù)據(jù)類型多樣C:數(shù)據(jù)處理速

2、度快D:數(shù)據(jù)價(jià)值密度高4、當(dāng)前社會中,最為突出的大數(shù)據(jù)環(huán)境是()。(單選題,本題2分)A:互聯(lián)網(wǎng)B:物聯(lián)網(wǎng)C:綜合國力D:自然資源5、下列關(guān)于計(jì)算機(jī)存儲容量單位的說法中,錯(cuò)誤的是()。(單選題,本題2分)A:1KBV1MBV1GBB:基本單位是字節(jié)(Byte)C:一個(gè)漢字需要一個(gè)字節(jié)的存儲空間D:一個(gè)字節(jié)能夠容納一個(gè)英文字符,6、下列關(guān)于聚類挖掘技術(shù)的說法中,錯(cuò)誤的是()。(單選題,本題2分)A:不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別B:要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小C:要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小D:與分類挖掘技術(shù)相似的是,都是要對數(shù)據(jù)進(jìn)行分類處理7、下列關(guān)

3、于大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的是()。(單選題,本題2分)A:在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B:在分析方法上更注重相關(guān)分析而不是因果分析C:在分析效果上更追究效率而不是絕對精確D:在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)8、大數(shù)據(jù)時(shí)代,數(shù)據(jù)使用的關(guān)鍵是()。(單選題,本題2分)A:數(shù)據(jù)收集B:數(shù)據(jù)存儲C:數(shù)據(jù)分析D:數(shù)據(jù)再利用9、數(shù)據(jù)倉庫的最終目的是()。(單選題,本題2分)A:收集業(yè)務(wù)需求B:建立數(shù)據(jù)倉庫邏輯模型C:開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析D:為用戶和業(yè)務(wù)部門提供決策支持10、支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是()。(單選題,本題2分)A:數(shù)據(jù)科學(xué)B:數(shù)據(jù)應(yīng)用C:數(shù)據(jù)硬件D:數(shù)據(jù)人才11、在網(wǎng)

4、絡(luò)爬蟲的爬行策略中,應(yīng)用最為基礎(chǔ)的是()。(多選題,本題3分)A:深度優(yōu)先遍歷策略B:廣度優(yōu)先遍歷策略C:高度優(yōu)先遍歷策略D:反向鏈接策略E:大站優(yōu)先策略12、當(dāng)前,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點(diǎn)是()。(多選題,本題3分)A:規(guī)模較大B:規(guī)模較小C:增速很快D:增速緩慢E:多產(chǎn)業(yè)交叉融合13、下列關(guān)于數(shù)據(jù)生命周期管理的核心認(rèn)識中,正確的是()。(多選題,本題3分)A:數(shù)據(jù)從產(chǎn)生到被刪除銷毀的過程中,具有多個(gè)不同的數(shù)據(jù)存在階段B:在不同的數(shù)據(jù)存在階段,數(shù)據(jù)的價(jià)值是不同的C:根據(jù)數(shù)據(jù)價(jià)值的不同應(yīng)該對數(shù)據(jù)采取不同的管理策略D:數(shù)據(jù)生命周期管理旨在產(chǎn)生效益的同時(shí),降低生產(chǎn)成本E:數(shù)據(jù)生命周期管理最終關(guān)注的是社

5、會效益14、下列關(guān)于基于大數(shù)據(jù)的營銷模式和傳統(tǒng)營銷模式的說法中,錯(cuò)誤的是()。(多選題,本題3分)A:傳統(tǒng)營銷模式比基于大數(shù)據(jù)的營銷模式投入更小B:傳統(tǒng)營銷模式比基于大數(shù)據(jù)的營銷模式針對性更強(qiáng)C:傳統(tǒng)營銷模式比基于大數(shù)據(jù)的營銷模式轉(zhuǎn)化率低D:基于大數(shù)據(jù)的營銷模式比傳統(tǒng)營銷模式實(shí)時(shí)性更強(qiáng)E:基于大數(shù)據(jù)的營銷模式比傳統(tǒng)營銷模式精準(zhǔn)性更強(qiáng)15、下列關(guān)于臟數(shù)據(jù)的說法中,正確的是()。(多選題,本題3分)A:格式不規(guī)范B:編碼不統(tǒng)一C:意義不明確D:與實(shí)際業(yè)務(wù)關(guān)系不大E:數(shù)據(jù)不完整16、數(shù)據(jù)再利用的意義在于()。(多選題,本題3分)A:挖掘數(shù)據(jù)的潛在價(jià)值B:實(shí)現(xiàn)數(shù)據(jù)重組的創(chuàng)新價(jià)值C:利用數(shù)據(jù)可擴(kuò)展性拓寬

6、業(yè)務(wù)領(lǐng)域D:優(yōu)化存儲設(shè)備,降低設(shè)備成本E:提高社會效益,優(yōu)化社會管理17、按照涉及自變量的多少,可以將回歸分析分為()。(多選題,本題3分)A:線性回歸分析B:非線性回歸分析C:一元回歸分析D:多元回歸分析E:綜合回歸分析18、大數(shù)據(jù)人才整體上需要具備()等核心知識。(多選題,本題3分)A:數(shù)學(xué)與統(tǒng)計(jì)知識B:計(jì)算機(jī)相關(guān)知識C:馬克思主義哲學(xué)知識D:市場運(yùn)營管理知識E:在特定業(yè)務(wù)領(lǐng)域的知識19、下列關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的是()。(多選題,本題3分)A:大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B:處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C:大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D:大數(shù)

7、據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析E:大數(shù)據(jù)的目的在于發(fā)現(xiàn)新的知識與洞察并進(jìn)行科學(xué)決策20、在噪聲數(shù)據(jù)中,波動數(shù)據(jù)比離群點(diǎn)數(shù)據(jù)偏離整體水平更大。(判斷題,本題2分)TOC o 1-5 h z是否21、對于大數(shù)據(jù)而言,最基本、最重要的要求就是減少錯(cuò)誤、保證質(zhì)量。因此,大數(shù)據(jù)收集的信息量要盡量精確。(判斷題,本題2分)是否22、一般而言,分布式數(shù)據(jù)庫是指物理上分散在不同地點(diǎn),但在邏輯上是統(tǒng)一的數(shù)據(jù)庫。因此分布式數(shù)據(jù)庫具有物理上的獨(dú)立性、邏輯上的一體性、性能上的可擴(kuò)展性等特點(diǎn)。(判斷題,本題2分)是否23、具備很強(qiáng)的報(bào)告撰寫能力,可以把分析結(jié)果通過文字、圖表、可視化等多種方式清晰地展現(xiàn)出來,能夠清楚

8、地論述分析結(jié)果及可能產(chǎn)生的影響,從而說服決策者信服并采納其建議,是數(shù)據(jù)分析能力對大數(shù)據(jù)人才的基本要求。(判斷題,本題2分)是否24、谷歌流感趨勢充分體現(xiàn)了數(shù)據(jù)重組和擴(kuò)展對數(shù)據(jù)價(jià)值的重要意義。(判斷題,本題2分)是否25、決策樹是一種基于樹形結(jié)構(gòu)的預(yù)測模型,每一個(gè)樹形分叉代表一個(gè)分類條件,葉子節(jié)點(diǎn)代表最終的分類結(jié)果,其優(yōu)點(diǎn)在于易于實(shí)現(xiàn),決策時(shí)間短,并且適合處理非數(shù)值型數(shù)據(jù)。(判斷題,本題2分)是否26、信息生命周期管理是據(jù)生命周期管理的來源,最早由英國企業(yè)提出。(判斷題,本題2分)是否27、簡單隨機(jī)抽樣,是從總體N個(gè)對象中任意抽取n個(gè)對象作為樣本,最終以這些樣本作為調(diào)查對象。在抽取樣本時(shí),總體中

9、每個(gè)對象被抽中為調(diào)查樣本的概率可能會有差異。(判斷題,本題2分)TOC o 1-5 h z是否28、啤酒與尿布的經(jīng)典案例,充分體現(xiàn)了實(shí)驗(yàn)思維在大數(shù)據(jù)分析理念中的重要性。(判斷題,本題2分)是否29、對于企業(yè)來說,給用戶進(jìn)行各種促銷或者實(shí)施運(yùn)營策略的時(shí)機(jī)也比較重要,而且對不同興趣偏好的用戶最好集中處理。(判斷題,本題2分)是否二、數(shù)據(jù)挖掘部分單選題(共20題,20分)()的目的縮小數(shù)據(jù)的取值范圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)相同的分析結(jié)果。數(shù)據(jù)清洗B.數(shù)據(jù)集成C.數(shù)據(jù)變換D.數(shù)據(jù)歸約某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題

10、?()關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B.聚類C.分類D.自然語言處理以下兩種描述分別對應(yīng)哪兩種對分類算法的評價(jià)標(biāo)準(zhǔn)?()警察抓小偷,描述警察抓的人中有多少個(gè)是小偷的標(biāo)準(zhǔn)。描述有多少比例的小偷給警察抓了的標(biāo)準(zhǔn)。Precision,RecallB.Recall,PrecisionA.Precision,ROCD.Recall,ROC將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?()A.頻繁模式挖掘B.分類和預(yù)測C.數(shù)據(jù)預(yù)處理D.數(shù)據(jù)流挖掘當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()A.分類C.關(guān)聯(lián)分析B.聚類D.隱馬爾可夫鏈建立一個(gè)模型,通過這個(gè)模

11、型根據(jù)已知的變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()A.根據(jù)內(nèi)容檢索B.建模描述C.預(yù)測建模D.尋找模式和規(guī)則下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()A.變量代換B.離散化C.聚集D.估計(jì)遺漏值TOC o 1-5 h z假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個(gè)箱。等頻(等深)劃分時(shí),15在第幾個(gè)箱子內(nèi)?()A.第一個(gè)B.第二個(gè)C.第三個(gè)D.第四個(gè)以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()A.嵌入B.過濾C.包裝D.抽樣下面不屬于創(chuàng)建新屬性的相關(guān)方法的是:()A.特征提取B.特征修改

12、C.映射數(shù)據(jù)到新的空間D.特征構(gòu)造假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為:()A.0.821B.1.224C.1.458D.0.716一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數(shù)是:()A.一年級B.二年級C.三年級D.四年級下列哪個(gè)不是專門用于可視化時(shí)間空間數(shù)據(jù)的技術(shù):()A.等高線圖B.餅圖C.曲面圖D.矢量場圖是否在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是:()有放回的簡單隨機(jī)抽

13、樣無放回的簡單隨機(jī)抽樣分層抽樣D漸進(jìn)抽樣以下哪些算法是分類算法()A.DBSCANB.C4.5C.K-MeanD.EM決策樹中不包含一下哪種結(jié)點(diǎn)()根結(jié)點(diǎn)(rootnode)內(nèi)部結(jié)點(diǎn)(internalnode)外部結(jié)點(diǎn)(externalnode)葉結(jié)點(diǎn)(leafnode)以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的()冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響子樹可能在決策樹中重復(fù)多次決策樹算法對于噪聲的干擾非常敏感尋找最佳決策樹是NP完全問題通過聚集多個(gè)分類器的預(yù)測來提高分類準(zhǔn)確率的技術(shù)稱為()A.組合(ensemble)B.聚集(aggregate)C.合并(combination)D.投票(voti

14、ng)在基本K均值算法里,當(dāng)鄰近度函數(shù)采用()的時(shí)候,合適的質(zhì)心是簇中各點(diǎn)的中位數(shù)。A.曼哈頓距離B.平方歐幾里德距離C.余弦距離D.Bregman散度個(gè)性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級商務(wù)智能平臺,以幫助()為其顧客購物提供完全個(gè)性化的決策支持和信息服務(wù)。A.公司B.各單位C.跨國企業(yè)D.電子商務(wù)網(wǎng)站三、計(jì)算題(共13分)1、根據(jù)下表中信用卡訓(xùn)練樣本,判斷(女性,年齡介于3145之間,不具學(xué)生身份,收入中等)者會不會辦理信用卡。請自選兩種方法進(jìn)行計(jì)算。表信用卡訓(xùn)練樣本項(xiàng)目性別年齡學(xué)生身分收入辦卡1男45否高會2女3145否高會3女2030是低會4男20是低不會5女2030是中

15、不會6女2030否中會7女3145否高會8男3145是中不會9男3145否中會10女20是低會本題可以使用多種方法,沒有固定答案。解題方式合理,計(jì)算步驟無誤即可。首先根據(jù)訓(xùn)練樣本計(jì)算各屬性相對于不同分類結(jié)果的條件機(jī)率:P(性別=女I辦卡=會)=5/7P(性別=女|辦卡=不會)=1/3P(年齡=3145|辦卡=會)=3/7P(年齡=3145|辦卡=不會)=1/3P(學(xué)生=否|辦卡=會)=5/7P(學(xué)生=否|辦卡=不會)=0/3P(收入=中|辦卡=會)=2/7P(收入=中|辦卡=不會)=2/3再應(yīng)用樸素貝葉斯分類法進(jìn)行類別預(yù)測:P(辦卡=會)=7/10P(女|會)P(31-45|會)P(否|會)P(中|會)=15/3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論