版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
階段測試[復(fù)制]您的姓名:[填空題]*_________________________________基本信息:[矩陣文本題]*班級(jí):________________________1.()是最常用的標(biāo)準(zhǔn)化方法,即每一變量值與其平均值之差除以該變量的標(biāo)準(zhǔn)差。[單選題]*A、min-max標(biāo)準(zhǔn)化B、log函數(shù)轉(zhuǎn)換C、atan函數(shù)轉(zhuǎn)換D、z-score標(biāo)準(zhǔn)化(正確答案)2.SQL語言允許使用通配符進(jìn)行字符串匹配的操作,其中‘%’可以表示()[單選題]*A、零個(gè)字符B、1個(gè)字符C、多個(gè)字符D、以上都可以(正確答案)3.要查詢book表中所有書名中以“中國”開頭的書籍的價(jià)格,可用()語句。[單選題]*A、SELECTpriceFROMbookWHEREbook_name=‘中國*’B、SELECTpriceFROMbookWHEREbook_nameLIKE‘中國*’C、SELECTpriceFROMbookWHEREbook_name=‘中國%’D、SELECTpriceFROMbookWHEREbook_nameLIKE‘中國%’(正確答案)4.錯(cuò)誤值(WrongValue)的處理是在知識(shí)發(fā)掘處理(KnowledgeDiscoveryProcess)中的哪一個(gè)階段?()[單選題]*A、數(shù)據(jù)清洗(正確答案)B、數(shù)據(jù)選擇C、數(shù)據(jù)編碼D、數(shù)據(jù)擴(kuò)充5.SQL語言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()[單選題]*A、DELETE(正確答案)B、DROPC、CLEARD、REMORE6.一個(gè)關(guān)聯(lián)規(guī)則同時(shí)滿足最小支持度和最小置信度,我們稱之為()[單選題]*A、強(qiáng)關(guān)聯(lián)規(guī)則(正確答案)B、頻繁項(xiàng)集C、有效關(guān)聯(lián)規(guī)則D、頻繁閉項(xiàng)集7.有一條關(guān)聯(lián)規(guī)則為A→B,此規(guī)則的(confidence)為60%,則代表()[單選題]*A、買B商品的顧客中,有60%的顧客會(huì)同時(shí)購買AB、同時(shí)購買A,B兩商品的顧客,占所有顧客的60%C、買A商品的顧客中,有60%的顧客會(huì)同時(shí)購買B(正確答案)D、兩商品A,B在交易數(shù)據(jù)庫中同時(shí)被購買的機(jī)率為60%8.某同學(xué)由x與y之間的一組數(shù)據(jù)求得兩個(gè)變量間的線性回歸方程為y=bx+a,已知:數(shù)據(jù)x的平均值為2,數(shù)據(jù)y的平均值為3,則()。[單選題]*A、回歸直線必過點(diǎn)(2,3)(正確答案)B、回歸直線一定不過點(diǎn)(2,3)C、點(diǎn)(2,3)在回歸直線上方D、點(diǎn)(2,3)在回歸直線下方9.美國海軍軍官莫里通過對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()[單選題]*A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析(正確答案)C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)10.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?()
[單選題]*A.關(guān)聯(lián)規(guī)則(正確答案)B.聚類C.分類D.自然語言處理11.()是一個(gè)觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機(jī)制產(chǎn)生的。[單選題]*A.邊界點(diǎn)B.質(zhì)心C.離群點(diǎn)(正確答案)D.核心點(diǎn)12.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()
[單選題]*A變量代換B離散化C聚集D估計(jì)遺漏值(正確答案)13.大數(shù)據(jù)應(yīng)用需依托的新技術(shù)有()[單選題]*A、大規(guī)模儲(chǔ)存與計(jì)算B、數(shù)據(jù)分析處理C、智能化D、三個(gè)選項(xiàng)都是(正確答案)14.大數(shù)據(jù)之父是()[單選題]*A、彼得德魯克B、舍恩伯格(正確答案)C、蒂姆伯納斯李D、斯科特布朗15.下面哪個(gè)不屬于數(shù)據(jù)的屬性類型()。[單選題]*A.標(biāo)稱B.序數(shù)C.區(qū)間D.相異(正確答案)16.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)()[單選題]*A、數(shù)據(jù)獲取B、分類和預(yù)測C、數(shù)據(jù)預(yù)處理(正確答案)D、數(shù)據(jù)可視化17.某省發(fā)布年度全省職工平均工資為66560元,月平均工資為6320元。眾多網(wǎng)友直呼“被平均”,你認(rèn)為下面哪種統(tǒng)計(jì)量測度平均工資會(huì)更被信服()[單選題]*A、幾何平均數(shù)B、眾數(shù)C、極差D、中位數(shù)(正確答案)18.主成分分析的主要作用有()[單選題]*A、對(duì)變量進(jìn)行降維(正確答案)B、對(duì)變量進(jìn)行判別C、對(duì)變量進(jìn)行聚類D、以上都不對(duì)19.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問題,比如虛擬化技術(shù)、并行計(jì)算、海量存儲(chǔ)和海量管理等。[單選題]*A、點(diǎn)計(jì)算B、線計(jì)算C、云計(jì)算(正確答案)D、面計(jì)算20.欲比較兩地30年來肺癌和胃癌死亡率的上升速度,最好選用()[單選題]*A、折線圖(正確答案)B、條形圖C、雷達(dá)圖D、餅圖21.()的目的在于縮小數(shù)據(jù)的取值范圍,使其更適合數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)相同的分析結(jié)果。[單選題]*A、數(shù)據(jù)清洗B、數(shù)據(jù)集成C、數(shù)據(jù)歸約(正確答案)D、數(shù)據(jù)變換22.數(shù)據(jù)清洗的方法不包括()[單選題]*A、缺失值處理B、噪聲數(shù)據(jù)清除C、一致性檢查D、重復(fù)數(shù)據(jù)記錄處理(正確答案)23.做聚類分析,若數(shù)據(jù)量較大,下面哪種方式比較合適?()[單選題]*A、系統(tǒng)聚類B、快速聚類(k-means)(正確答案)C、A和B都可以D、A和B都不可以24.下面的問題中,是連續(xù)型隨機(jī)變量的是()[單選題]*A、某座大橋,一天之內(nèi)經(jīng)過的汽車的數(shù)量B、某網(wǎng)站,一首歌在一天內(nèi)被點(diǎn)擊的次數(shù)C、北京市,某一天內(nèi)的溫度(正確答案)D、射手對(duì)目標(biāo)進(jìn)行射擊,擊中得1分,未擊中得0分,該射手在一次射擊中的得分。25.一組數(shù)據(jù)排序后處于25%和75%位置上的值稱為()[單選題]*A、主體數(shù)B、中位數(shù)C、四分位數(shù)(正確答案)D、均衡數(shù)26.當(dāng)一個(gè)連續(xù)變量的缺失值占比在75%左右時(shí),以下哪種方式最合理()[單選題]*A、直接使用該變量B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量(正確答案)C、使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)D、直接刪除該變量27.錄入數(shù)據(jù)時(shí)誤將“456”錄入為了“3456”,那么當(dāng)數(shù)據(jù)均為()左右的數(shù)據(jù)時(shí),“3456”就會(huì)被識(shí)別為異常值。[單選題]*A、200B、300C、400(正確答案)D、50028.關(guān)于大數(shù)據(jù)的來源,以下理解不正確的是()[單選題]*A、大數(shù)據(jù)是數(shù)據(jù)量變積累達(dá)到質(zhì)變的結(jié)果B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長時(shí)間(正確答案)C、我們每個(gè)人都是數(shù)據(jù)的制造者D、當(dāng)今的世界,基本上一切都可以用數(shù)字表達(dá),所以叫數(shù)字化的世界29.關(guān)于算術(shù)平均數(shù)的描述不正確的是()[單選題]*A、容易受到異常值影響B(tài)、綜合反映全部數(shù)據(jù)的信息C、既適用于連續(xù)型數(shù)據(jù),也適用于離散型數(shù)據(jù)(正確答案)D、可用于推算總體中的總量指標(biāo)30.阿里巴巴的電子商務(wù)模式屬于()。[單選題]*A.B2B(正確答案)B.B2CC.C2CD.C2B31.在網(wǎng)上輸入關(guān)鍵字查詢信息的方式屬于()技術(shù)。[單選題]*A.推送B.?dāng)?shù)據(jù)挖掘C.廣播D.檢索(正確答案)32.下面有關(guān)HAVING子句描述錯(cuò)誤的是()[單選題]*A、HAVING子句必須與GROUPBY子句同時(shí)使用,不能單獨(dú)使用B、使用HAVING子句的同時(shí)不能使用WHERE子句(正確答案)C、使用HAVING子句的同時(shí)可以使用WHERE子句D、使用HAVING子句的作用是限定分組的條件33.價(jià)格(X,元)與需求量(Y,噸)之間的回歸方程為:Y=356-1.5Xi,說明價(jià)格每上漲一元,需求量減少()噸。[單選題]*A、1.5(正確答案)B、0.5C、-1.5D、-0.534.在電子商務(wù)分類中,CtoC是指()[單選題]*A、消費(fèi)者-消費(fèi)者電子商務(wù)(正確答案)B、企業(yè)-企業(yè)電子商務(wù)C、企業(yè)-消費(fèi)者電子商務(wù)D、企業(yè)內(nèi)部電子商務(wù)35.建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()[單選題]*A.根據(jù)內(nèi)容檢索B.建模描述C.預(yù)測建模(正確答案)D.尋找模式和規(guī)則36.MECE原則是能夠讓人思路清晰、思維縝密的原則,其中ME的意思是:[單選題]*A相互獨(dú)立(正確答案)B完全窮盡C無遺漏D分凈37.假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性income的73600元將被轉(zhuǎn)化為(
)[單選題]*A、0.716(正確答案)B、1.224C、1.458D、0.82138.AARRR模型不包括以下哪個(gè)()[單選題]*A、referB、revenueC、retentionD、requirement(正確答案)39.什么是KDD?()[單選題]*A.知識(shí)發(fā)現(xiàn)(正確答案)B.領(lǐng)域知識(shí)發(fā)現(xiàn)C.文檔知識(shí)發(fā)現(xiàn)D.動(dòng)態(tài)知識(shí)發(fā)現(xiàn)40.作為國家制定政策和規(guī)劃長期發(fā)展的依據(jù),通常所做的搜集數(shù)據(jù)的方式為()[單選題]*A、普查(正確答案)B、統(tǒng)計(jì)報(bào)表C、重點(diǎn)調(diào)查D、抽樣41.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()[單選題]*A.分類B.聚類(正確答案)C.關(guān)聯(lián)分析D.隱馬爾可夫鏈42.約有()的客戶由頁面ICON位進(jìn)入[單選題]*A、5%B、10%C、30%(正確答案)D、60%43.SQL語言是()語言。[單選題]*A、層次數(shù)據(jù)庫B、網(wǎng)絡(luò)數(shù)據(jù)庫C、關(guān)系數(shù)據(jù)庫(正確答案)D、系統(tǒng)數(shù)據(jù)庫44.把雞蛋放在一只籃子里的做法是什么戰(zhàn)略的形象表述()[單選題]*A、集中化戰(zhàn)略(正確答案)B、一體化戰(zhàn)略C、差異性戰(zhàn)略D、多元化戰(zhàn)略45.對(duì)于大批量的數(shù)據(jù),最適合描述其分布的圖形是()[單選題]*A、條形圖B、莖葉圖C、直方圖(正確答案)D、餅圖46.現(xiàn)在有越來越多的消費(fèi)者通過互聯(lián)網(wǎng)來訂購車船機(jī)票和購買產(chǎn)品,這要求企業(yè)在制定市場營銷組合戰(zhàn)略時(shí)還應(yīng)當(dāng)著重考慮()[單選題]*A、人口環(huán)境B、技術(shù)環(huán)境(正確答案)C、經(jīng)濟(jì)環(huán)境D、社會(huì)文化環(huán)境47.Apriori算法的加速過程依賴于以下哪個(gè)策略()[單選題]*A、抽樣B、剪枝(正確答案)C、緩沖D、并行48.下列關(guān)于舍恩伯格對(duì)大數(shù)據(jù)特點(diǎn)的說法中,錯(cuò)誤的是()[單選題]*A、數(shù)據(jù)規(guī)模大B、數(shù)據(jù)類型多C、數(shù)據(jù)處理速度快D、數(shù)據(jù)價(jià)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國成人電動(dòng)踏板車行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 2025-2030全球聚酯樹脂行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025年全球及中國中心供氧站行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 大數(shù)據(jù)分析服務(wù)項(xiàng)目合同
- 2025合同模板股權(quán)合作協(xié)議范本
- 2025企業(yè)管理資料勞務(wù)合同樣本頁文檔范本
- 鋼質(zhì)防火門制作安裝合同
- 中介公司房產(chǎn)交易合同范本
- 奶牛場承包經(jīng)營合同
- 銷售回購合同
- 多圖中華民族共同體概論課件第十三講先鋒隊(duì)與中華民族獨(dú)立解放(1919-1949)根據(jù)高等教育出版社教材制作
- 高考英語單詞3500(亂序版)
- 《社區(qū)康復(fù)》課件-第五章 脊髓損傷患者的社區(qū)康復(fù)實(shí)踐
- 北方、南方戲劇圈的雜劇文檔
- 燈謎大全及答案1000個(gè)
- 白酒銷售經(jīng)理述職報(bào)告
- 部編小學(xué)語文(6年級(jí)下冊(cè)第6單元)作業(yè)設(shè)計(jì)
- 洗衣機(jī)事業(yè)部精益降本總結(jié)及規(guī)劃 -美的集團(tuán)制造年會(huì)
- 2015-2022年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招語文/數(shù)學(xué)/英語筆試參考題庫含答案解析
- 2023年菏澤醫(yī)學(xué)專科學(xué)校單招綜合素質(zhì)模擬試題及答案解析
- 鋁合金門窗設(shè)計(jì)說明
評(píng)論
0/150
提交評(píng)論