大數(shù)據(jù)挖掘分析專(zhuān)業(yè)考試題及答案_第1頁(yè)
大數(shù)據(jù)挖掘分析專(zhuān)業(yè)考試題及答案_第2頁(yè)
大數(shù)據(jù)挖掘分析專(zhuān)業(yè)考試題及答案_第3頁(yè)
大數(shù)據(jù)挖掘分析專(zhuān)業(yè)考試題及答案_第4頁(yè)
大數(shù)據(jù)挖掘分析專(zhuān)業(yè)考試題及答案_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)挖掘分析專(zhuān)業(yè)考試題及答案單選題1.通過(guò)(),計(jì)算頻數(shù)、眾數(shù)、中位數(shù)等一個(gè)或多個(gè)數(shù)據(jù)指標(biāo),探索數(shù)據(jù)的分布結(jié)構(gòu)。A、概率統(tǒng)計(jì)法B、匯總統(tǒng)計(jì)法C、可視化法D、分類(lèi)統(tǒng)計(jì)法參考答案:B2.MapReduce是一種()計(jì)算模型A、集中式;B、分布式C、離散式D、放射式參考答案:B3.一種商品價(jià)格變動(dòng)與由此引起另外一種商品需求量相對(duì)變動(dòng)的比率稱(chēng)為()A、需求價(jià)格彈性B、供給價(jià)格彈性C、需求交叉彈性D、供給交叉彈性參考答案:C4.請(qǐng)問(wèn)以下何者屬于時(shí)間序列的問(wèn)題?A、信用卡發(fā)卡銀行偵測(cè)潛在的卡奴B、基金經(jīng)理人針對(duì)個(gè)股做出未來(lái)價(jià)格預(yù)測(cè)C、電信公司將人戶(hù)區(qū)分為數(shù)個(gè)群體D、以上均不是參考答案:B5.非參數(shù)檢驗(yàn)是針對(duì)()分布情況做的假設(shè)。A、總體B、局部C、個(gè)體參考答案:A6.分類(lèi)器效果檢驗(yàn)中的準(zhǔn)確率是指()A、預(yù)測(cè)正確的數(shù)據(jù)在總數(shù)據(jù)中的比例B、預(yù)測(cè)為正的數(shù)據(jù)在總數(shù)據(jù)中的比例C、預(yù)測(cè)為正的數(shù)據(jù)中實(shí)際為正的數(shù)據(jù)所占比例D、實(shí)際為正的數(shù)據(jù)中被預(yù)測(cè)為正的數(shù)據(jù)所占比例參考答案:C7.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時(shí)間()。A、2021年9月1日;B、2021年10月1日;C、2021年11月1日D、2021年12月1日參考答案:A8.實(shí)際接入的指標(biāo)數(shù)占應(yīng)接指標(biāo)總數(shù)的比例,統(tǒng)計(jì)時(shí)又分線(xiàn)上和線(xiàn)下接入率稱(chēng)為()A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案:B9.關(guān)于回歸分析,下列說(shuō)法中錯(cuò)誤的是()A、作回歸分析的變量之間要有實(shí)際意義,不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象隨意進(jìn)行回歸分析,要結(jié)合專(zhuān)業(yè)知識(shí)對(duì)兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。B、在進(jìn)行線(xiàn)性回歸分析進(jìn)行的數(shù)據(jù)準(zhǔn)備的時(shí)候,要求因變量y和自變量x都是符合總體正態(tài)的隨機(jī)變量。C、回歸直線(xiàn)不要隨意外延D、所有非線(xiàn)性回歸都可以轉(zhuǎn)化為線(xiàn)性回歸參考答案:D10.凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標(biāo)之間的數(shù)量關(guān)系()NPV>0A、當(dāng)PI<1,時(shí),IRR>iNPV>0B、當(dāng)PI>1,時(shí),IRR>iNPV<0C、當(dāng)PI<1時(shí),IRR>i,NPV<0、當(dāng)DPI>1IRR>i,時(shí),參考答案:B11.關(guān)于K均值和DBSCAN的比較,以下說(shuō)法不正確的是()A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類(lèi)所有對(duì)象。B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇。D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并有重疊的簇。參考答案:A12.人們購(gòu)買(mǎi)制冷用空調(diào)主要是為了在夏天獲得涼爽空氣,這屬于空調(diào)產(chǎn)品整體概念中的()A、有形產(chǎn)品B、直接產(chǎn)品C、核心產(chǎn)品D、主要產(chǎn)品參考答案:C13.某牙膏廠(chǎng)原來(lái)生產(chǎn)兩面針?biāo)幬镅栏啵F(xiàn)在又增加牙刷生產(chǎn),這屬于()A、同心多元化B、水平多元化C、集團(tuán)多元化D、相關(guān)多元化參考答案:B14.在發(fā)生或者可能發(fā)生個(gè)人信息泄露、毀損、丟失的情況時(shí),應(yīng)當(dāng)立即采取()措施,按照規(guī)定及時(shí)告知用戶(hù)并向有關(guān)主管部門(mén)報(bào)告。()A、彌補(bǔ)B、補(bǔ)救C、救援D、相關(guān)參考答案:B15.回歸分析的第一步是()A、確定解釋量和被解釋變量B、確定回歸模型C、建立回歸方程D、進(jìn)行檢驗(yàn)參考答案:A16.當(dāng)所有觀(guān)測(cè)值都落在回歸直線(xiàn)上,則這兩個(gè)變量之間的相關(guān)系數(shù)為()A、1B、-1C、+1或-1D、0參考答案:C17.()是進(jìn)行項(xiàng)目投資效益評(píng)價(jià)的最終依據(jù)。A、現(xiàn)金流量B、盈虧平衡點(diǎn)C、凈現(xiàn)金流量D、現(xiàn)金流入量參考答案:C18.被廣泛用于購(gòu)物籃分析的是()。A、關(guān)聯(lián)分析;B、分類(lèi)和預(yù)測(cè)C、聚類(lèi)分析D、演變分析參考答案:A19.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()A、變量代換B、離散化C、聚集D、估計(jì)遺漏值參考答案:D20.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()A、支持度B、置信度C、滿(mǎn)意度D、提升度參考答案:C21.NoSQL含義是指()A、NO!SQL;B、NomberSQL;C、NotOnlySQLD、NOLLSQL參考答案:C22.資金的時(shí)間價(jià)值是()A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額參考答案:B23.以下哪種方法不屬于于監(jiān)督學(xué)習(xí)模型()A、決策樹(shù)B、線(xiàn)性回歸C、關(guān)聯(lián)分析D、判別分析參考答案:C24.在多元回歸模型的檢驗(yàn)中,目的是檢驗(yàn)每一個(gè)自變量與因變量在指定顯著性水平上是否存在線(xiàn)性相關(guān)關(guān)系的檢驗(yàn)是()A、r檢驗(yàn)B、t檢驗(yàn)C、f檢驗(yàn)D、DW檢驗(yàn)參考答案:B25.關(guān)于混合模型聚類(lèi)算法的優(yōu)缺點(diǎn),下面說(shuō)法正確的是()A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線(xiàn)性時(shí),混合模型也能很好地處理。B、混合模型比K均值或模糊C均值更一般,因?yàn)樗梢允褂酶鞣N類(lèi)型的分布。C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。D、混合模型在有噪聲和離群點(diǎn)時(shí)不會(huì)存在問(wèn)題。參考答案:B26.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()A、建立數(shù)據(jù)科學(xué)B、完成數(shù)據(jù)應(yīng)用C、配備數(shù)據(jù)硬件D、吸納數(shù)據(jù)人才參考答案:B27.下面關(guān)于因子分析的說(shuō)法正確的是()A、因子分析就是主成分分析B、因子之間可相關(guān)也可不相關(guān)C、因子受量綱的影響D、可以對(duì)因子進(jìn)行旋轉(zhuǎn),使其意義更明顯參考答案:D28.快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),不必開(kāi)發(fā)專(zhuān)門(mén)的MapReduce應(yīng)用,十分適合數(shù)據(jù)倉(cāng)庫(kù)的統(tǒng)計(jì)分析的是()。A、Map;B、ReduceC、H.iveD、SQL語(yǔ)句參考答案:D29.企業(yè)要建立預(yù)測(cè)模型,需準(zhǔn)備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是()A、數(shù)據(jù)越多越好B、盡可能多的適合的數(shù)據(jù)C、數(shù)據(jù)越少越好D、以上三條都不正確參考答案:B30.以下哪個(gè)類(lèi)型的變量在作預(yù)測(cè)客戶(hù)流失的模型中最有解釋力度?A、人口基本數(shù)據(jù),比如年齡和性別B、基本社會(huì)狀態(tài)數(shù)據(jù),比如收入和職業(yè)C、業(yè)務(wù)數(shù)據(jù),比如消費(fèi)頻次D、業(yè)務(wù)數(shù)據(jù)的衍生變量,比如最近3個(gè)月消費(fèi)頻次的變化情況參考答案:D31.將復(fù)雜的地址簡(jiǎn)化成北、中、南、東四區(qū),是在進(jìn)行?A、數(shù)據(jù)正規(guī)化B、數(shù)據(jù)一般化C、數(shù)據(jù)離散化D、數(shù)據(jù)整合參考答案:B32.Hadoop是一個(gè)開(kāi)發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺(tái),是Appach的一個(gè)用()語(yǔ)言實(shí)現(xiàn)開(kāi)源軟件框架。A、javaB、C.++C、R語(yǔ)言參考答案:A33.大數(shù)據(jù)特征錯(cuò)誤的是()。A、容量大;B、類(lèi)型多C、價(jià)值高D、系統(tǒng)多參考答案:D34.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法,它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻繁項(xiàng)集的算法,利用()搜索的方法挖掘頻繁項(xiàng)集。A、逐層B、逐級(jí)C、自底向上D、自上而下參考答案:A35.分類(lèi)算法以()定理為基礎(chǔ),采用概率方法對(duì)數(shù)據(jù)進(jìn)行建模A、決策樹(shù)B、K-最鄰近C、SVMD、貝葉斯參考答案:D36.自然界中某種事物發(fā)生時(shí)其他事物也會(huì)發(fā)生,則這種聯(lián)系稱(chēng)之為()。A、連接B、聯(lián)絡(luò)C、關(guān)聯(lián)D、聯(lián)系參考答案:C37.源業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中心的方式主要有:JDBCESB和()。A、D.XP;B、E.SPC、0GGD、E.TL參考答案:C38.下列哪個(gè)不屬于個(gè)人信息影響評(píng)估原則()A、個(gè)人信息的處理目的、處理方式等是否合法、正當(dāng)、必要B、對(duì)個(gè)人的影響及風(fēng)險(xiǎn)程度C、誰(shuí)主管誰(shuí)負(fù)責(zé)D、所采取的安全保護(hù)措施是否合法、有效并與風(fēng)險(xiǎn)程度相適應(yīng)。參考答案:C39.以下哪項(xiàng)關(guān)于決策樹(shù)的說(shuō)法是錯(cuò)誤的()A、冗余屬性不會(huì)對(duì)決策樹(shù)的準(zhǔn)確率造成不利的影響B(tài)、子樹(shù)可能在決策樹(shù)中重復(fù)多次C、決策樹(shù)算法對(duì)于噪聲的干擾非常敏感D、尋找最佳決策樹(shù)是NP完全問(wèn)題參考答案:C40.Hadoop框架中兩大核心是:()和MapReducEA、H.CFS;B、H.DFSC、H.EFSD、H.FFS參考答案:B41.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式,便于直觀(guān)快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律。的數(shù)據(jù)探索方法是()。A、匯總統(tǒng)計(jì)法B、概率統(tǒng)計(jì)法C、可視化法參考答案:C42.矩估計(jì)的基本原理是()A、用樣本矩估計(jì)總體矩B、使得似然函數(shù)達(dá)到最大C、使得似然函數(shù)達(dá)到最小D、小概率事件在一次試驗(yàn)中是不可能發(fā)生的參考答案:A43.數(shù)據(jù)預(yù)處理目前常用的異常數(shù)據(jù)識(shí)別方法包括業(yè)務(wù)判別法、()、箱線(xiàn)圖判別法、統(tǒng)計(jì)判別法A、聚類(lèi)判別法;B、回歸判別法C、抽樣判別法參考答案:A44.算法的核心思想是()逐層構(gòu)造一個(gè)樹(shù)。A、自上而下B、自下而上C、自左向右D、自右向左參考答案:A45.下列關(guān)于大數(shù)據(jù)的分析理念的說(shuō)法中,錯(cuò)誤的是()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)參考答案:D46.什么是KDD?()A、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)B、領(lǐng)域知識(shí)發(fā)現(xiàn)C、文檔知識(shí)發(fā)現(xiàn)D、動(dòng)態(tài)知識(shí)發(fā)現(xiàn)參考答案:A47.某家長(zhǎng)為了使孩子在第3-6年上大學(xué)的4年中,每年年初得到10000元助學(xué)基金,他應(yīng)在2年前在銀行存入多少錢(qián)?(年利率按5%計(jì)算)()A、33771B、30291C、32163D、45256參考答案:A48.關(guān)于K均值和DBSCAN的比較,以下說(shuō)法不正確的是()。A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類(lèi)所有對(duì)象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并有重疊的簇參考答案:A49.SQL查詢(xún)語(yǔ)句中HAVING子句的作用是()A、指出分組查詢(xún)的范圍B、指出分組查詢(xún)的值C、指出分組查詢(xún)的條件D、指出分組查詢(xún)的內(nèi)容參考答案:C50.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱(chēng)為()。A、分位數(shù)B、中位數(shù)C、眾數(shù)參考答案:C51.JSON中的中括號(hào)一般來(lái)表示()。A、數(shù)組;B、標(biāo)點(diǎn)符號(hào)C、對(duì)象D、注釋參考答案:C52.模型構(gòu)建指基于()數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型。A、線(xiàn)上B、線(xiàn)下C、實(shí)時(shí)D、歷史參考答案:D53.Tableau在處理離線(xiàn)地圖時(shí),需要將標(biāo)記設(shè)置為()。A、路徑;B、區(qū)域C、邊形D、已填充地圖參考答案:A54.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯(cuò)誤的有()A、神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒B、可以處理冗余特征C、訓(xùn)練ANN是一個(gè)很耗時(shí)的過(guò)程D、至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)參考答案:A55.美國(guó)海軍軍官莫里通過(guò)對(duì)前人航海日志的分析,繪制了新的航海路線(xiàn)圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)參考答案:B56.當(dāng)時(shí)間序列的環(huán)比增長(zhǎng)速度大體相同時(shí),適宜擬合()A、指數(shù)曲線(xiàn)B、拋物線(xiàn)C、直線(xiàn)D、對(duì)數(shù)曲線(xiàn)參考答案:A57.將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)指標(biāo)的一種統(tǒng)計(jì)分析方法是()。A、數(shù)據(jù)預(yù)處理;B、數(shù)據(jù)降維C、主成分分析D、假設(shè)檢驗(yàn)參考答案:C58.設(shè)X={1,2,3}是頻繁項(xiàng)集,則可由X可產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。A、3B、4C、5D、6參考答案:D59.當(dāng)一個(gè)連續(xù)變量的缺失值占比在85%左右時(shí),以下哪種方式最合理()A、直接使用該變量B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量C、使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)D、直接刪除該變量參考答案:B60.大數(shù)據(jù)分析挖掘流程正確的是()。A、業(yè)務(wù)理解→數(shù)據(jù)理解→數(shù)據(jù)準(zhǔn)備→建立模型→模型評(píng)估;B、業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→數(shù)據(jù)理解→建立模型→模型評(píng)估;C、業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→數(shù)據(jù)理解→模型評(píng)估→建立模型;D、業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→模型評(píng)估→數(shù)據(jù)理解→建立模型參考答案:A61.()是統(tǒng)計(jì)學(xué)的基礎(chǔ),是統(tǒng)計(jì)學(xué)里面最重要的概率分布A、正態(tài)分布;B、靜態(tài)分布C、動(dòng)態(tài)分布D、穩(wěn)態(tài)分布參考答案:A62.因子分析的主要作用有()A、對(duì)變量進(jìn)行降維B、對(duì)變量進(jìn)行判別C、對(duì)變量進(jìn)行聚類(lèi)D、以上都不對(duì)參考答案:A63.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為()A、D.XP;B、E.SPC、0GGD、E.TL參考答案:D64.給定歷史時(shí)間數(shù)據(jù),通過(guò)擬合時(shí)序模型,分析研究時(shí)序數(shù)據(jù)的發(fā)展變化規(guī)律,得出觀(guān)測(cè)數(shù)據(jù)的歷史統(tǒng)計(jì)特征,再據(jù)此進(jìn)行外推預(yù)測(cè)目標(biāo)的分析方法是()。A、聚類(lèi);B、回歸C、時(shí)間序列D、匯總統(tǒng)計(jì)參考答案:C65.智能健康手環(huán)的應(yīng)用開(kāi)發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)。A、統(tǒng)計(jì)報(bào)表B、網(wǎng)絡(luò)爬蟲(chóng)C、API接口D、傳感器參考答案:D66.假設(shè)檢驗(yàn)中顯著性水平是()A、推斷時(shí)犯取偽錯(cuò)誤的概率B、推斷時(shí)取偽棄真的概率C、正確推斷的概率D、是推斷的可信度參考答案:B67.以下哪些算法是分類(lèi)算法()A、DBSCANB、C4.5C、K-MeanD、EM參考答案:B68.以下關(guān)于大數(shù)據(jù)應(yīng)用說(shuō)法錯(cuò)誤的是()。A、大數(shù)據(jù)起源互聯(lián)網(wǎng),目前處于成熟期;B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù);C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地;D、互聯(lián)網(wǎng)上形成了多種相對(duì)成熟的應(yīng)用模式。參考答案:A69.下列關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說(shuō)法中,錯(cuò)誤的是()A、1KB<1MB<1GBB、基本單位是字節(jié)(Byte)C、一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間D、一個(gè)字節(jié)能夠容納一個(gè)英文字符參考答案:C70.當(dāng)置信水平一定時(shí),置信區(qū)間的寬度()A、隨著樣本量的增大而減小B、隨著樣本量的增大而增大C、與樣本量的大小無(wú)關(guān)D、先隨著樣本量的增大而減小,到一定程度后會(huì)隨著樣本量的增大而增大。參考答案:A71.倒傳遞神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))的訓(xùn)練順序?yàn)楹?(A:調(diào)整權(quán)重;B:計(jì)算誤差值;C:利用隨機(jī)的權(quán)重產(chǎn)生輸出的結(jié)果)A、BCAB、CABC、BACD、CBA參考答案:D72.個(gè)人信息保護(hù)影響評(píng)估報(bào)告和處理情況記錄應(yīng)當(dāng)至少保存()年。A、一B、十C、五D、三參考答案:D73.資金的時(shí)間價(jià)值是()A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額參考答案:B74.有一條關(guān)聯(lián)規(guī)則為A→B,此規(guī)則的信心水平(confidence)為60%,則代表()A、買(mǎi)B商品的顧客中,有60%的顧客會(huì)同時(shí)購(gòu)買(mǎi)AB、同時(shí)購(gòu)買(mǎi)A,B兩商品的顧客,占所有顧客的60%C、買(mǎi)A商品的顧客中,有60%的顧客會(huì)同時(shí)購(gòu)買(mǎi)BD、兩商品A,B在交易數(shù)據(jù)庫(kù)中同時(shí)被購(gòu)買(mǎi)的機(jī)率為60%參考答案:C75.有一組數(shù)據(jù)其均值是20,對(duì)其中的每一個(gè)數(shù)據(jù)都加上10,那么得到的這組新數(shù)據(jù)的均值是()。A、20B、10C、15D、30參考答案:D76.與大數(shù)據(jù)密切相關(guān)的技術(shù)是()。A、藍(lán)牙;B、云計(jì)算C、Wi-FiD、博弈論參考答案:B77.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展強(qiáng)、數(shù)據(jù)挖掘能力強(qiáng)等特點(diǎn)的分析工具是()。A、WekaB、SPSSC、SASD、R參考答案:D78.用于分類(lèi)與回歸應(yīng)用的主要算法有:()A、Apriori算法、HotSpot算法B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹(shù)C、K均值法、SOM神經(jīng)網(wǎng)絡(luò)D、決策樹(shù)、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯參考答案:D79.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問(wèn)題,比如虛擬化技術(shù)、并行計(jì)算、海量存儲(chǔ)和海量管理等。A、點(diǎn)計(jì)算B、線(xiàn)計(jì)算C、云計(jì)算D、面計(jì)算參考答案:C80.描述一組對(duì)稱(chēng)(或正態(tài))分布數(shù)據(jù)的離散程度時(shí),最適宜選擇的指標(biāo)是()A、極差B、標(biāo)準(zhǔn)差C、均值D、變異系數(shù)參考答案:B81.考慮下面的頻繁3-項(xiàng)集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),若采用合并策略,則由候選產(chǎn)生過(guò)程得到4-項(xiàng)集不包含()A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5參考答案:C82.相關(guān)分析與回歸分析的一個(gè)重要區(qū)別是()A、前者研究變量之間關(guān)系的密切程度,后者研究變量間的變動(dòng)關(guān)系,并用方程式表示B、前者研究變量之間的變動(dòng)關(guān)系,后者研究變量間關(guān)系的密切程度C、兩者都研究變量間的變動(dòng)關(guān)系D、兩者都不研究變量間的變動(dòng)關(guān)系參考答案:A83.SQL語(yǔ)句中刪除表的命令是()A、DROPTABLEB、DELETETABLEC、ERASETABLED、DELETEDBF參考答案:A84.已知事件A的概率P(A)=0.6,U為必然事件,則P(A+U)=1,P(AU)=A、0.4B、0.6C、0D、1參考答案:B85.邁克爾·波特的“五力模型”中,五種競(jìng)爭(zhēng)力量中不包括()A、新進(jìn)入者B、供應(yīng)商議價(jià)能力C、其他利益相關(guān)者力量D、行業(yè)中現(xiàn)有競(jìng)爭(zhēng)者參考答案:C86.假設(shè)12個(gè)銷(xiāo)售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)方法將它們劃分成四個(gè)箱,求15在哪個(gè)箱子?()A、第1個(gè)B、第2個(gè)C、第3個(gè)D、第4個(gè)參考答案:A87.()是研究一種或者多種因素的變化對(duì)試驗(yàn)結(jié)果的觀(guān)測(cè)值是否有顯著影響的統(tǒng)計(jì)方法。A、因子分析;B、數(shù)據(jù)降維C、方差分析D、假設(shè)檢驗(yàn)參考答案:C88.某超市研究銷(xiāo)售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買(mǎi)啤酒的人很大概率也會(huì)購(gòu)買(mǎi)尿布,這種屬于數(shù)據(jù)挖掘的哪類(lèi)問(wèn)題?()A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B、聚類(lèi)C、分類(lèi)D、自然語(yǔ)言處理參考答案:A89.以下哪個(gè)指標(biāo)不能用于線(xiàn)性回歸中的模型比較()A、R方B、調(diào)整R方C、AICD、BIC參考答案:A90.下面關(guān)于聚類(lèi)分析說(shuō)法錯(cuò)誤的是()A、一定存在一個(gè)最優(yōu)的分類(lèi)B、聚類(lèi)分析是無(wú)監(jiān)督學(xué)習(xí)C、聚類(lèi)分析可以用于判斷異常值D、聚類(lèi)分析即:物以類(lèi)聚,人以群分參考答案:A91.分類(lèi)變量使用以下哪個(gè)統(tǒng)計(jì)量進(jìn)行缺失值填補(bǔ)較合適A、均值B、最大值C、眾數(shù)D、中位數(shù)參考答案:C92.若數(shù)據(jù)量較大,下面哪種方式比較適合()A、系統(tǒng)聚類(lèi)B、快速聚類(lèi)(k-means)C、A和B都可以D、A和B都不可以參考答案:B93.在對(duì)歷史數(shù)據(jù)集進(jìn)行分區(qū)之前進(jìn)行數(shù)據(jù)清洗(缺失值填補(bǔ)等)的缺點(diǎn)是什么A、違反了建模的假設(shè)條件B、加大了處理的難度C、無(wú)法針對(duì)分區(qū)后各個(gè)數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗D、無(wú)法對(duì)不同數(shù)據(jù)清理的方法進(jìn)行比較,以選擇最優(yōu)方法參考答案:D94.數(shù)據(jù)倉(cāng)庫(kù)是隨著時(shí)間變化的,下面的描述不正確的是()A、數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容B、捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照C、數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容D、數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合參考答案:C95.SQL語(yǔ)言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()A、DELETEB、DROPC、CLEARD、REMORE參考答案:A96.依照《中華人民共和國(guó)數(shù)據(jù)安全法》和有關(guān)法律、行政法規(guī)的規(guī)定,()負(fù)責(zé)統(tǒng)籌協(xié)調(diào)網(wǎng)絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。A、工業(yè)和信息化部B、國(guó)家安全部門(mén)C、國(guó)家網(wǎng)信部門(mén)D、通信主管部門(mén)參考答案:C97.假設(shè)屬性ine的最大最小值分別是12000元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性ine的73600元將被轉(zhuǎn)化為()A、0.751B、0.163C、0.457D、0.716參考答案:D98.建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類(lèi)任務(wù)?()A、根據(jù)內(nèi)容檢索B、建模描述C、預(yù)測(cè)建模D、尋找模式和規(guī)則參考答案:C99.自動(dòng)化高級(jí)分析實(shí)驗(yàn)室,實(shí)現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫(kù)互聯(lián),實(shí)現(xiàn)數(shù)據(jù)的自助組表、自助分析功能,滿(mǎn)足不同層級(jí)、不同水平的用戶(hù)需求的是()A、初級(jí)分析;B、綜合分析C、系統(tǒng)聚類(lèi)C、典型分析D、高級(jí)分析參考答案:D100.下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是()A、所得稅B、建設(shè)投資C、經(jīng)營(yíng)成本D、營(yíng)業(yè)收入?yún)⒖即鸢福篋101.一組N個(gè)觀(guān)測(cè)值按數(shù)值大小排列,分成100份,處于X%位置的值稱(chēng)第X個(gè)百分位數(shù)稱(chēng)為()。A、分位數(shù)B、中位數(shù)C、眾數(shù)參考答案:A102.開(kāi)始將N個(gè)樣品各自作為一類(lèi),將規(guī)定樣品之間的距離和類(lèi)與類(lèi)之間的距離,然后將距離最近的兩類(lèi)合并成一個(gè)新類(lèi),計(jì)算新類(lèi)與其他類(lèi)的距離,重復(fù)進(jìn)行兩個(gè)最近類(lèi)的合并,每次減少一類(lèi),直至所有的樣品合并為一類(lèi),此種聚類(lèi)方法是()A、K-meansB、SOM聚類(lèi)D、有序聚類(lèi)參考答案:C103.指數(shù)平滑法可以用以下哪種指標(biāo)來(lái)反映對(duì)時(shí)間序列資料的修正程度()A、平滑常數(shù)B、指數(shù)平滑數(shù)初始值C、跨越期D、季節(jié)指數(shù)參考答案:A104.變量的量綱比如以厘米或者米為單位對(duì)下面哪種方法會(huì)有影響()A、方差分析B、回歸分析C、聚類(lèi)分析D、主成分分析參考答案:C105.關(guān)于Tableau的特點(diǎn),以下說(shuō)法錯(cuò)誤的是()A、學(xué)習(xí)成本低,簡(jiǎn)單易用;B、圖表精美;C、開(kāi)發(fā)快速,分享便捷;D、需要IT大量人員參與參考答案:D106.在ID3算法中信息增益是指()A、信息的溢出程度B、信息的增加效益C、熵增加的程度最大D、熵減少的程度最大參考答案:D107.一組數(shù)據(jù)中最大值與最小值的差值稱(chēng)為(),也稱(chēng)全距。A、極差B、極距C、距離D、方差參考答案:A108.()是一種開(kāi)源軟件編程語(yǔ)言,主要用于統(tǒng)計(jì)分析,繪圖和數(shù)據(jù)挖掘,內(nèi)置多種統(tǒng)計(jì)及分析功能。A、H.IVE;B、H.ADOOPC、R;D、H.FDS參考答案:C109.決策樹(shù)中的InformationGain的計(jì)算是用來(lái)?A、剪枝B、使樹(shù)成長(zhǎng)C、處理缺失值和異常值D、砍樹(shù)參考答案:B110.泊松回歸是一種廣泛應(yīng)用的()回歸模型。A、線(xiàn)性B、非線(xiàn)性C、預(yù)測(cè)D、估算參考答案:B111.數(shù)據(jù)庫(kù)系統(tǒng)是由()組成的A、數(shù)據(jù)庫(kù)、數(shù)據(jù)庫(kù)管理系統(tǒng)和用戶(hù)B、數(shù)據(jù)文件、命令文件和報(bào)表C、數(shù)據(jù)庫(kù)文件結(jié)構(gòu)和數(shù)據(jù)D、常量、變量和函數(shù)參考答案:A112.下列四項(xiàng)中,不屬于數(shù)據(jù)庫(kù)特點(diǎn)的是()A、數(shù)據(jù)共享B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨(dú)立性高參考答案:C113.某小區(qū)60%居民訂晚報(bào),45%訂青年報(bào),30%兩報(bào)均訂,隨機(jī)抽一戶(hù)。則至少訂一種報(bào)的概率為()A、0.82B、0.85C、0.80D、0.75參考答案:D114.關(guān)于統(tǒng)計(jì)學(xué)和大數(shù)據(jù)之間的關(guān)系,一下說(shuō)法錯(cuò)誤的是()。A、面臨大數(shù)據(jù),統(tǒng)計(jì)學(xué)的研究對(duì)象有所改變;B、在大數(shù)據(jù)環(huán)境中,需要首先將未知的問(wèn)題轉(zhuǎn)化為可用的統(tǒng)計(jì)方法;C、在大數(shù)據(jù)分析過(guò)程中,傳統(tǒng)的統(tǒng)計(jì)分析過(guò)程“定量一定位一再定性”轉(zhuǎn)變?yōu)椤岸恳欢ㄐ浴?D、在大數(shù)據(jù)環(huán)境中,需要將統(tǒng)計(jì)研究的對(duì)象范圍擴(kuò)展到一切數(shù)據(jù)。參考答案:A115.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展差、數(shù)據(jù)挖掘能力強(qiáng)等特點(diǎn)的分析工具是()。A、WekaB、SPSSC、SASD、R參考答案:B116.下列說(shuō)明錯(cuò)誤的是()A、性別=“男”=>職業(yè)=“司機(jī)”,是布爾型關(guān)聯(lián)規(guī)則B、性別=“女”=>avg(收入)=2300,是一個(gè)數(shù)值型關(guān)聯(lián)規(guī)則C、肝炎=>ALT(丙氨酸轉(zhuǎn)氨酶)升高,是一個(gè)單層關(guān)聯(lián)規(guī)則D、性別=“女”=>職業(yè)=“秘書(shū)”,是多維關(guān)聯(lián)規(guī)則參考答案:C117.Hive是基于Hadoop的一個(gè)數(shù)據(jù)()工具A、分析;B、倉(cāng)庫(kù)C、制圖D、可視化參考答案:B118.數(shù)據(jù)記錄內(nèi)容完整比例,包括指標(biāo)單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整,指標(biāo)字段值完整稱(chēng)為()A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案:D119.EXCEL中,求標(biāo)準(zhǔn)差的函數(shù)是()A、AVERAGEB、MEDIANC、MODED、STDEV參考答案:D120.對(duì)于下列實(shí)驗(yàn)數(shù)據(jù):1,108,11,8,5,6,8,8,7,11,描述其集中趨勢(shì)用()最為適宜,其值是()。A、平均數(shù),14.4B、中位數(shù),8.5C、眾數(shù),8D、以上都可以參考答案:C121.《個(gè)人信息保護(hù)法》發(fā)布執(zhí)行時(shí)間()。A、2021年9月1日;B、2021年10月1日;C、2021年11月1日D、2021年12月1日參考答案:C122.檢測(cè)一元正態(tài)分布中的離群點(diǎn),屬于異常檢測(cè)中的基于()的離群點(diǎn)檢測(cè)A、統(tǒng)計(jì)方法B、鄰近度C、密度D、聚類(lèi)技術(shù)參考答案:A123.下列關(guān)于聚類(lèi)挖掘技術(shù)的說(shuō)法中,錯(cuò)誤的是()A、不預(yù)先設(shè)定數(shù)據(jù)歸類(lèi)類(lèi)目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不B、要求同類(lèi)數(shù)據(jù)的內(nèi)容相似度盡可能C、要求不同類(lèi)數(shù)據(jù)的內(nèi)容相似度盡可能D、與分類(lèi)挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類(lèi)處理參考答案:B124.按數(shù)據(jù)的結(jié)構(gòu)程度來(lái)劃分,分為()A、結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)B、強(qiáng)結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)C、截面數(shù)據(jù)、面板數(shù)據(jù)D、一級(jí)數(shù)據(jù)、二級(jí)數(shù)據(jù)、三級(jí)數(shù)據(jù)參考答案:A125.當(dāng)前國(guó)內(nèi)社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()A、互聯(lián)網(wǎng)B、物聯(lián)網(wǎng)C、綜合國(guó)力D、自然資源參考答案:A126.()是一種松散耦合的服務(wù)和應(yīng)用之間標(biāo)準(zhǔn)的集成方式。A、E.SB;B、D.MC、ODSD、E.TL同類(lèi)別參考答案:A127.在建立線(xiàn)性回歸(LinearRegression)之前我們可以利用何種方法挑選重要屬性,以降低模型的復(fù)雜度?A、皮爾森相關(guān)系數(shù)B、卡方檢定C、T-檢定D、Z-Score參考答案:A128.給定一個(gè)置信概率和置信區(qū)域,若誤差超過(guò)置信區(qū)域,則認(rèn)為誤差不是隨機(jī)誤差引起,視為異常值的判別方法()。A、聚類(lèi)判別法;B、回歸判別法C、抽樣判別法D、統(tǒng)計(jì)判別法參考答案:D129.ROC曲線(xiàn)凸向哪個(gè)角,代表模型越理想?A、左上角B、右上角C、左下角D、右下角參考答案:A130..給出下列結(jié)論:1)在回歸分析中,可用指數(shù)系數(shù)R方的值判斷模型的擬合效果,R方越大,模型的擬合效果越好;2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的擬合效果越好;(3)在回歸分析中,可用相關(guān)系數(shù)r的值判斷模型的擬合效果,r越小,模型的擬合效果越好;(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明這樣的模型比較合適.帶狀區(qū)域的寬度越寬,說(shuō)明模型的擬合精度越高.以上結(jié)論中,正確的有()個(gè).A、1B、2C、3D、4參考答案:A131.回歸是一種預(yù)測(cè)建模技術(shù),研究()和()的依存關(guān)系。A、預(yù)測(cè)值、實(shí)際值B、自變量、因變量C、絕對(duì)誤差、平方誤差D、測(cè)試樣本、集合參考答案:B132.0DS是指()A、企業(yè)數(shù)據(jù)中心;B、數(shù)據(jù)倉(cāng)庫(kù)C、操作型存儲(chǔ)D、總線(xiàn)參考答案:B133.用簡(jiǎn)單隨機(jī)重復(fù)抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,則樣本容量需要擴(kuò)大到原來(lái)的()A、2倍B、3倍C、4倍D、5倍參考答案:C134.假設(shè){BCE}為一頻繁項(xiàng)目集(FrequentItemset),則根據(jù)AprioriPrinciple以下何者不是子頻繁項(xiàng)目?A、BCC、CB、CED、CD參考答案:D135.假如學(xué)生考試成績(jī)以“優(yōu)”.“良”.“及格”和“不及格”來(lái)記錄,為了說(shuō)明全班同學(xué)考試成績(jī)的水平高低,其集中趨勢(shì)的測(cè)度()A、可以采用算術(shù)平均數(shù)B、可以采用眾數(shù)或中位數(shù)C、只能采用眾數(shù)D、只能采用四分位數(shù)參考答案:C136.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?()A、數(shù)據(jù)獲取B、分類(lèi)和預(yù)測(cè)C、數(shù)據(jù)預(yù)處理D、數(shù)據(jù)可視化參考答案:C137.在有指導(dǎo)的數(shù)據(jù)挖掘中,有關(guān)測(cè)試集的說(shuō)法錯(cuò)誤的是()A、測(cè)試集和訓(xùn)練集是相互聯(lián)系的B、測(cè)試集是用以測(cè)試模型的數(shù)據(jù)集C、通常測(cè)試集大約占總樣本的三分之一D、K-次交叉驗(yàn)證中,測(cè)試集只有1個(gè),訓(xùn)練集有K-1個(gè)參考答案:A138.以下那一項(xiàng)不是大數(shù)據(jù)提供的用戶(hù)交互方式是()。A、企業(yè)報(bào)表;B、查詢(xún)C、大數(shù)據(jù)分析挖掘D、可視化參考答案:A139.表示職稱(chēng)為副教授、性別為男的表達(dá)式為()A、職稱(chēng)=’副教授’OR性別=’男’B、職稱(chēng)=’副教授’AND性別=’男’C、BETWEEN'副教授’AND'男’D、IN('副教授’,’男’)參考答案:B140.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測(cè)模型,常用于()分類(lèi)變量預(yù)測(cè)和概率預(yù)測(cè)。A、四值B、三值C、二值D、一值參考答案:C141.檢查異常值常用的統(tǒng)計(jì)圖形是()A、柱狀圖B、箱線(xiàn)圖C、帕累托圖D、氣泡圖參考答案:B142.以下哪條屬于個(gè)人信息影響的評(píng)估場(chǎng)景:()A、處理敏感個(gè)人信息,利用個(gè)人信息進(jìn)行自動(dòng)化決策B、委托處理個(gè)人信息、向第三方提供個(gè)人信息、公開(kāi)個(gè)人信息C、向境外提供個(gè)人信息D、以上皆是參考答案:D143.《個(gè)人信息保護(hù)法》對(duì)于企業(yè)的影響不包括()A、需要強(qiáng)化個(gè)人信息處理這主體責(zé)任B、明確了可以量化的中國(guó)版執(zhí)行罰則C、需要設(shè)立負(fù)責(zé)處理個(gè)人信息保護(hù)相關(guān)事務(wù)的專(zhuān)門(mén)機(jī)構(gòu)和指定代表D、收集和處理數(shù)據(jù)時(shí)可以不遵循“最小化”原則參考答案:D144.實(shí)際由源業(yè)務(wù)系統(tǒng)自動(dòng)接入的指標(biāo)數(shù)據(jù)占指標(biāo)體系中應(yīng)接指標(biāo)總數(shù)的比例稱(chēng)為()A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案:A145.假設(shè)檢驗(yàn)中,拒絕域的邊界稱(chēng)為()A、臨界值B、臨界點(diǎn)C、置信水平D、邊際值參考答案:A146.以下關(guān)于大數(shù)據(jù)的概念和理解不正確的是()A、大數(shù)據(jù)是指無(wú)法再容許的時(shí)間內(nèi)用常規(guī)的軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合,大數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)是持續(xù)變化的,當(dāng)前泛指單一的數(shù)據(jù)集的大小在幾十TB和PB之間;B、大數(shù)據(jù)是一項(xiàng)技術(shù),能夠?qū)?fù)雜海量數(shù)據(jù)進(jìn)行實(shí)時(shí)獲取、傳輸、存儲(chǔ)、加工和利用的高薪技術(shù);C、大數(shù)據(jù)是一種挑戰(zhàn),現(xiàn)有的數(shù)據(jù)采集、傳輸、存儲(chǔ)、處理和分析技術(shù)已無(wú)法適用于現(xiàn)有的需要;D、大數(shù)據(jù)是一個(gè)時(shí)代,擁有大數(shù)據(jù)是時(shí)代的特征、解讀大數(shù)據(jù)是時(shí)代的任務(wù)、應(yīng)用大數(shù)據(jù)是時(shí)代的機(jī)遇。參考答案:A147.數(shù)據(jù)收集的標(biāo)準(zhǔn)為()而非動(dòng)用企業(yè)全部數(shù)據(jù)。A、一致性、可靠性、時(shí)效性B、相同性、可靠性、時(shí)效性C、C相關(guān)性、可靠性、時(shí)效性D、一致性、可靠性、實(shí)際性參考答案:C148.MySQL是()A、操作系統(tǒng);B、數(shù)據(jù)庫(kù)C、聊天軟件D、瀏覽器參考答案:B149.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類(lèi)標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()A、分類(lèi)B、聚類(lèi)C、關(guān)聯(lián)分析D、主成分分析參考答案:B150.某超市研究銷(xiāo)售記錄發(fā)現(xiàn),購(gòu)買(mǎi)奶的很概率會(huì)購(gòu)買(mǎi)包,這種屬于數(shù)據(jù)挖掘的哪類(lèi)問(wèn)題?()A、聚類(lèi)分析B、關(guān)聯(lián)規(guī)則C、分類(lèi)分析D、自然語(yǔ)言處理參考答案:B151.蘋(píng)果公司對(duì)IPHONE的降價(jià)行為屬于()A、地域性差別定價(jià)B、時(shí)間性差別定價(jià)C、非線(xiàn)性定價(jià)或數(shù)量折扣定價(jià)D、其他形式的定價(jià)參考答案:B152.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類(lèi)標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?A、分類(lèi)B、聚類(lèi)C、關(guān)聯(lián)分析D、隱馬爾可夫鏈參考答案:B153.NaiveBayes是屬于數(shù)據(jù)挖掘中的什么方法?A、聚類(lèi)B、分類(lèi)C、時(shí)間序列D、關(guān)聯(lián)規(guī)則參考答案:B154.《中華人民共和國(guó)數(shù)據(jù)安全法》中的數(shù)據(jù),是指任何以電子或者其他方式對(duì)()的記錄。A、數(shù)據(jù)B、信息C、文件D、知識(shí)參考答案:B155.下列不屬于原始數(shù)據(jù)來(lái)源的是()A、行政記錄B、統(tǒng)計(jì)調(diào)查C、統(tǒng)計(jì)年鑒D、實(shí)驗(yàn)參考答案:C156.數(shù)據(jù)挖掘技術(shù)包括三個(gè)主要的部分()A、數(shù)據(jù)、模型、技術(shù)B、算法、技術(shù)、領(lǐng)域知識(shí)C、數(shù)據(jù)、建模能力、算法與技術(shù)D、建模能力、算法與技術(shù)、領(lǐng)域知識(shí)參考答案:C157.(),用于顯示樹(shù)狀結(jié)構(gòu)數(shù)據(jù)。A、矩形式樹(shù)狀結(jié)構(gòu)圖;B、平行結(jié)構(gòu)樹(shù)C、垂直結(jié)構(gòu)樹(shù)參考答案:A158.在Excel工作表中,在某單元格內(nèi)輸入數(shù)值123,不正確的輸入形式是()A、123B、=123C、+123D、*123參考答案:D159.分析顧客消費(fèi)行業(yè),以便有針對(duì)性的向其推薦感興趣的服務(wù),屬于()問(wèn)題。A、關(guān)聯(lián)規(guī)則挖掘B、分類(lèi)與回歸C、聚類(lèi)分析D、時(shí)序預(yù)測(cè)參考答案:A160.在有關(guān)數(shù)據(jù)倉(cāng)庫(kù)測(cè)試,下列說(shuō)法不正確的是()A、在完成數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行各種測(cè)試.測(cè)試工作中要包括單元測(cè)試和系統(tǒng)測(cè)試B、當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試D、在測(cè)試之前沒(méi)必要制定詳細(xì)的測(cè)試計(jì)劃參考答案:D161.Byte代表一個(gè)字節(jié),及()的數(shù)值范圍。A、0~100B、0~155C、0~200D、0~255參考答案:D162.目前常用的識(shí)別異常數(shù)據(jù)的方法有物理判別法和()。A、化學(xué)判別法B、統(tǒng)計(jì)判別法C、靜態(tài)判別法D、動(dòng)態(tài)判別法參考答案:B163.下列有關(guān)Apriori算法的說(shuō)法中不正確的是()A、Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。B、應(yīng)用Apriori算法時(shí),需要先設(shè)定模型的最小支持度、最小置信度等閾值。C、應(yīng)用Apriori算法時(shí),輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是離散型數(shù)據(jù)。D、Apriori算法掃描數(shù)據(jù)庫(kù)的次數(shù)依賴(lài)于最大頻繁項(xiàng)集中項(xiàng)的數(shù)量。參考答案:C164.VBA語(yǔ)言中,聲明變量的關(guān)鍵字是()。A、SET;B、C.ONSTC、PRIVATED、IM參考答案:D165.下列四項(xiàng)中,不屬于數(shù)據(jù)庫(kù)特點(diǎn)的是()A、數(shù)據(jù)共享B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨(dú)立性高參考答案:C166.維度規(guī)約是在以下哪個(gè)步驟的任務(wù)?()A、頻繁模式挖掘B、降維C、數(shù)據(jù)預(yù)處理D、數(shù)據(jù)流挖掘參考答案:C167.屬于財(cái)務(wù)專(zhuān)業(yè)明細(xì)數(shù)據(jù)表的是()A、客戶(hù)收費(fèi)流水表;B、應(yīng)收票據(jù)信息表;C、公司分壓線(xiàn)損統(tǒng)計(jì)表;D、供應(yīng)計(jì)劃表參考答案:B168.以下哪個(gè)變量可以反映客戶(hù)的忠誠(chéng)度?()A、購(gòu)買(mǎi)頻次B、購(gòu)買(mǎi)金額C、最后一次購(gòu)買(mǎi)時(shí)間D、購(gòu)買(mǎi)金額波動(dòng)率參考答案:A169.某項(xiàng)目預(yù)計(jì)運(yùn)行5年后的凈現(xiàn)值為4500萬(wàn)元,如折現(xiàn)率為16%,其終值應(yīng)為()萬(wàn)元(說(shuō)明:結(jié)果保留兩位小數(shù))A、8045.86B、6996.21C、9451.54D、7000.02參考答案:C170.數(shù)據(jù)在規(guī)定的時(shí)間前和頻度周期內(nèi)接入系統(tǒng)的比例稱(chēng)為()A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;B、指標(biāo)數(shù)據(jù)接入率C、指標(biāo)數(shù)據(jù)接入及時(shí)率;D、指標(biāo)數(shù)據(jù)完整率參考答案:C171.數(shù)據(jù)正規(guī)化(DataNormalization)是在知識(shí)發(fā)掘處理(KnowledgeDiscoveryProcess)中的哪一個(gè)階段進(jìn)行?A、數(shù)據(jù)清洗B、數(shù)據(jù)選擇C、數(shù)據(jù)編碼D、數(shù)據(jù)擴(kuò)充參考答案:C172.東北人養(yǎng)了一只雞和一頭豬。一天雞問(wèn)豬:“主人呢?”豬說(shuō):“出去買(mǎi)蘑菇了。"雞聽(tīng)了撒丫子就跑。豬說(shuō):“你跑什么?”雞叫道:“有本事主人買(mǎi)粉條的時(shí)候你小子別跑!"以上對(duì)話(huà)體現(xiàn)了數(shù)據(jù)分析方法中的()A、關(guān)聯(lián)B、聚類(lèi)C、分類(lèi)D、自然語(yǔ)言處理參考答案:A173.以下敘述正確的是()A、極差較少受異常值的影響B(tài)、四分位差較少受異常值的影響C、方差較少受異常值的影響D、標(biāo)準(zhǔn)差較少受異常值的影響參考答案:B174.大數(shù)據(jù)應(yīng)用需求分為年度需求和()兩類(lèi)。A、季度需求B、月度需求C、周需求D、即時(shí)需求參考答案:D175.關(guān)聯(lián)規(guī)則是反映事物之間的依賴(lài)關(guān)系,典型例子是購(gòu)物籃分析,常見(jiàn)算法有Apriori關(guān)聯(lián)算法和()算法。A、貝葉斯算法B、線(xiàn)性回歸C、F.P-growth關(guān)聯(lián)算法D、聚類(lèi)算法參考答案:C176.無(wú)監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法A、聚類(lèi)算法;B、降維算法;C、關(guān)聯(lián)規(guī)則算法;D、文本挖掘參考答案:A177.以下哪些分類(lèi)方法可以較好地避免樣本的不平衡問(wèn)題?()A、KNNB、SVMC、BayesD、神經(jīng)網(wǎng)絡(luò)參考答案:A178.數(shù)據(jù)倉(cāng)庫(kù)的最終目的是()A、收集業(yè)務(wù)需求B、建立數(shù)據(jù)倉(cāng)庫(kù)邏輯模型C、開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用分析D、為用戶(hù)和業(yè)務(wù)部門(mén)提供決策支持參考答案:D179.下列不屬于分類(lèi)算法的是()A、C4.5算法B、邏輯回歸C、KNN算法D、TF-TDF算法參考答案:D180.如下哪個(gè)不是最近鄰分類(lèi)器的特點(diǎn)()A、它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),不必維護(hù)源自數(shù)據(jù)的模型B、分類(lèi)一個(gè)測(cè)試樣例開(kāi)銷(xiāo)很大C、最近鄰分類(lèi)器基于全局信息進(jìn)行預(yù)測(cè)D、可以生產(chǎn)任意形狀的決策邊界參考答案:C181.個(gè)人信息的收集、處理和利用應(yīng)當(dāng)遵循()的原則,不得違反法律、法規(guī)的規(guī)定和雙方的約定收集、處理和利用個(gè)人信息。()A、正規(guī)、合法、必要B、合法、正當(dāng)、必要C、合法、合規(guī)、正當(dāng)D、合法、合理、合規(guī)參考答案:B182.Tableau能夠?qū)?shù)據(jù)進(jìn)行處理包括()。A、將多個(gè)數(shù)據(jù)源數(shù)據(jù)拼接為一個(gè)寬表;B、修改、刪除、新增數(shù)據(jù)行;C、對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換、重命名、格式修改;D、對(duì)數(shù)據(jù)進(jìn)行計(jì)算、合并生成新的數(shù)據(jù)列參考答案:A183.()是數(shù)據(jù)倉(cāng)庫(kù)體系架構(gòu)的重要組成部分,具備數(shù)據(jù)倉(cāng)庫(kù)的部分特征和OLTP系統(tǒng)的部分特征。A、E.SB;B、D.MC、ODSD、E.TL參考答案:C184.RFM方法中的F說(shuō)明客戶(hù)的()A、興趣度B、粘性C、當(dāng)前價(jià)值D、未來(lái)價(jià)值參考答案:A185.關(guān)于主成分?jǐn)?shù)目的選取,正確的是()A、保留多少個(gè)主成分取決于累計(jì)方差在方差總和中所占百分比B、一般選擇50%以上C、選擇前兩個(gè)就可以D、選擇的數(shù)目和變量的個(gè)數(shù)一致參考答案:A186.下列關(guān)于數(shù)據(jù)重組的說(shuō)法中,錯(cuò)誤的是()A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒C、數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D、數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新參考答案:A187.在SQL中,創(chuàng)建數(shù)據(jù)庫(kù)用的命令是()A、CREATESCHEMAB、CREATETABLEC、CREATEVIEWD、CREATEDATABASE參考答案:D188.當(dāng)時(shí)間序列數(shù)據(jù)點(diǎn)的一階差分近似為一常數(shù),可配合以下哪種預(yù)測(cè)模型()A、直線(xiàn)B、二次拋物線(xiàn)C、三次拋物線(xiàn)D、指數(shù)曲線(xiàn)參考答案:A189.對(duì)于企業(yè)來(lái)說(shuō),數(shù)據(jù)使用的關(guān)鍵是()A、數(shù)據(jù)收集B、數(shù)據(jù)存儲(chǔ)C、數(shù)據(jù)分析D、數(shù)據(jù)再利用參考答案:D190.線(xiàn)性回歸算法尋找()與預(yù)測(cè)目標(biāo)之間的線(xiàn)性關(guān)系。A、屬性B、根因C、表象參考答案:A191.下面不屬于明細(xì)數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)的是()。A、接入率;B、自動(dòng)采集率C、及時(shí)率D、完整率參考答案:B192.以下哪些分類(lèi)方法可以較好地避免樣本的不平衡問(wèn)題?()A、KNNB、SVMC、BayesD、神經(jīng)網(wǎng)絡(luò)參考答案:A193.()算法是最廣泛使用的聚類(lèi)算法,算法簡(jiǎn)單,易于理解和操作。A、gglomerativeB、C.UREC、K-meansD、k-中心點(diǎn)算法參考答案:C194貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。A、極大似然概率B、先驗(yàn)概率C、邊際概率D、后驗(yàn)概率參考答案:D多選題1.下列何種算法可以幫助我們做數(shù)值的預(yù)測(cè)(Prediction)?A、AprioriB、DecisionTreeC、NaiveBayesD、LinearRegression參考答案:BD2.層次聚類(lèi)的聚類(lèi)方式有()A、凝聚方式聚類(lèi)B、分解方式聚類(lèi)C、Q型聚類(lèi)D、R型聚類(lèi)參考答案:AB3.有下列情形之一的,個(gè)人信息處理者應(yīng)當(dāng)事前進(jìn)行個(gè)人信息保護(hù)影響評(píng)估,并對(duì)處理情況進(jìn)行記錄:A、處理敏感個(gè)人信息;B、利用個(gè)人信息進(jìn)行自動(dòng)化決策;C、委托處理個(gè)人信息.向其他個(gè)人信息處理者提供個(gè)人信息.公開(kāi)個(gè)人信息;D、向境外提供個(gè)人信息;E、其他對(duì)個(gè)人權(quán)益有重大影響的個(gè)人信息處理活動(dòng)。參考答案:ABCDE4.以下有關(guān)隨機(jī)森林算法的說(shuō)法正確的是()A、隨機(jī)森林算法的分類(lèi)精度不會(huì)隨著決策樹(shù)數(shù)量的增加而提高。B、隨機(jī)森林算法對(duì)異常值和缺失值不敏感。C、隨機(jī)森林算法不需要考慮過(guò)擬合問(wèn)題。D、決策樹(shù)之間相關(guān)系數(shù)越低.每棵決策樹(shù)分類(lèi)精度越高的隨機(jī)森林模型的分類(lèi)效果越好。參考答案:ABD5.數(shù)據(jù)開(kāi)放需求分類(lèi)A、政府監(jiān)管類(lèi)B、公益服務(wù)類(lèi)C、商務(wù)增值類(lèi)D、公開(kāi)開(kāi)放類(lèi)參考答案:ABCD6.敏感性分析的計(jì)算指標(biāo)有()A、盈虧平衡點(diǎn)B、敏感度系數(shù)C、臨界點(diǎn)D、凈現(xiàn)值參考答案:BCD7.描述變量離期望值大小的指標(biāo)是()A、方差B、變異系數(shù)C、標(biāo)準(zhǔn)差D、期望參考答案:ABC8.以下哪個(gè)分布是右偏分布()A、均勻分布B、卡方分布C、F分布D、對(duì)數(shù)正態(tài)分布參考答案:BCD9.天貓分析人員希望通過(guò)聚類(lèi)方法定位代商家刷信用級(jí)別的違規(guī)者,以下那種操作不應(yīng)該進(jìn)行()A、對(duì)變量進(jìn)行標(biāo)準(zhǔn)化B、對(duì)變量進(jìn)行百分位秩或Turkey正態(tài)性轉(zhuǎn)換C、對(duì)變量進(jìn)行因子分析或聚類(lèi)分析D、對(duì)變量進(jìn)行分箱處理參考答案:BD10.完全競(jìng)爭(zhēng)性的市場(chǎng)具有()等特點(diǎn)。A、任一企業(yè)無(wú)法操縱市場(chǎng)B、少數(shù)企業(yè)可以影響交易數(shù)量C、多個(gè)競(jìng)爭(zhēng)企業(yè)同時(shí)存在D、企業(yè)必須采取隨行就市定價(jià)法參考答案:ACD11.數(shù)據(jù)結(jié)構(gòu):A、結(jié)構(gòu)化B、半結(jié)構(gòu)化C、非結(jié)構(gòu)化參考答案:ABC12.關(guān)于大數(shù)據(jù)的來(lái)源,以下理解正確的是()A、大數(shù)據(jù)是數(shù)據(jù)量變積累達(dá)到質(zhì)變的結(jié)果B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長(zhǎng)時(shí)間C、我們每個(gè)人都是數(shù)據(jù)的制造者D、當(dāng)今的世界,基本上一切都可以用數(shù)字表達(dá),所以叫數(shù)字化的世界參考答案:ACD13.對(duì)于計(jì)算期不等的項(xiàng)目(方案)比選,可采納的決策方法有()A、最小公倍數(shù)法B、內(nèi)部收益率法C、等年值法D、獲利指數(shù)法參考答案:AC14.隨機(jī)對(duì)比實(shí)驗(yàn)的調(diào)查方法的優(yōu)點(diǎn)是()A、能夠測(cè)算實(shí)驗(yàn)誤差B、可以提高實(shí)驗(yàn)結(jié)果的可靠性C、可以節(jié)省分析過(guò)程和時(shí)間D、費(fèi)用開(kāi)支小參考答案:AB15.NoSQL數(shù)據(jù)庫(kù)采用“數(shù)據(jù)分布技術(shù)”主要是為了實(shí)現(xiàn)()A、復(fù)雜查詢(xún)能力B、負(fù)載均衡C、提升服務(wù)器端的數(shù)據(jù)處理能力D、提高故障恢復(fù)能力及保障服務(wù)質(zhì)量參考答案:BCD16.相關(guān)分析的任務(wù)有()A、判定現(xiàn)象之間有無(wú)關(guān)系B、判定現(xiàn)象之間關(guān)系的方向C、判定相關(guān)關(guān)系的緊密程度D、說(shuō)明現(xiàn)象之間聯(lián)系的具體形式參考答案:ABCD17.元組在某些屬性上缺少值是常有的。在實(shí)際數(shù)據(jù)中,描述處理該問(wèn)題的各種方法有()A、直接刪除B、.使用屬性的平均值填充空缺值C、使用一個(gè)全局常量填充空缺D、使用與給定元組屬同一類(lèi)的所有樣本的平均值參考答案:ABC18.如下表student中,如何篩選type為包含數(shù)學(xué)或語(yǔ)文的記錄?IDtypescoreA01數(shù)學(xué)78A02語(yǔ)文76AO3英語(yǔ)90A04數(shù)學(xué)68A05英語(yǔ)84數(shù)學(xué)"andtype="語(yǔ)文"數(shù)學(xué)"ortype="語(yǔ)文"數(shù)學(xué)","語(yǔ)文")數(shù)學(xué)”?”語(yǔ)文")A、select*fromstudentwheretype=”B、select*fromstudentwheretype="C、select*fromstudentwheretypein("D、select*fromstudentwheretypein(”參考答案:BC19.以下哪些變量使用RFM方法構(gòu)造出來(lái)的?()A、最近3期境外消費(fèi)金額B、最近6期網(wǎng)銀消費(fèi)交易筆數(shù)C、信用額度D、距最近一次逾期的月數(shù)參考答案:ABD20.以下關(guān)于邏輯回歸的說(shuō)法正確的是()A、應(yīng)用邏輯回歸時(shí),異常值會(huì)對(duì)模型造成很大的干擾。B、邏輯回歸的自變量必須是分類(lèi)變量,因此要對(duì)連續(xù)型變量進(jìn)行離散化處理。C、邏輯回歸對(duì)模型中自變量的多重共線(xiàn)性較為敏感。D、邏輯回歸屬于分類(lèi)算法。參考答案:ACD21.主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的致原則包括()A、特征根值大于1B、特征根值大于3C、累積特征根值加總占總特征根值的80%以上D、累積特征根值加總占總特征根值的90%以上參考答案:AC22.大數(shù)據(jù)應(yīng)用建設(shè)及運(yùn)營(yíng)過(guò)程中如發(fā)生數(shù)據(jù)安全問(wèn)題,應(yīng)立即暫停大數(shù)據(jù)應(yīng)用建設(shè)或運(yùn)營(yíng)工作,向()部門(mén)匯報(bào)。A、互聯(lián)網(wǎng)部B、安監(jiān)部C、法規(guī)部D、相關(guān)專(zhuān)業(yè)管理部門(mén)參考答案:ABCD23.下列關(guān)于統(tǒng)計(jì)量的表述中,正確的有()A、估計(jì)同一個(gè)總體參數(shù)可以用多個(gè)不同的統(tǒng)計(jì)量B、統(tǒng)計(jì)量是樣本的函數(shù)C、.統(tǒng)計(jì)量不含有總體的參數(shù)D、統(tǒng)計(jì)量是隨機(jī)變量參考答案:ABD24.下列對(duì)ID3算法的描述,正確的是()A、每個(gè)節(jié)點(diǎn)的分支度都不相同B、使用InformationGain作為節(jié)點(diǎn)分割的依據(jù)C、可以處理數(shù)值型態(tài)的字段D、方法處理空值的字段參考答案:ABD25.數(shù)據(jù)科學(xué)中的主流語(yǔ)音工具()A、RB、C++C、JavaD、Python參考答案:AD26.定基發(fā)展速度與環(huán)比發(fā)展速度的關(guān)系有()。A、各環(huán)比發(fā)展速度之和等于相應(yīng)的定基發(fā)展速度B、各環(huán)比發(fā)展速度之積等于相應(yīng)的定基發(fā)展速度C、兩個(gè)環(huán)比發(fā)展速度之商等于相應(yīng)的定基發(fā)展速度D、兩個(gè)定基發(fā)展速度之商等于相應(yīng)的環(huán)比發(fā)展速度參考答案:BD27.處理噪聲數(shù)據(jù)的常用方法。A、分箱B、聚類(lèi)C、回歸D、對(duì)比參考答案:ABC28.行業(yè)分析數(shù)據(jù)采集方法有()。A、一手資料B、實(shí)地考察法C、專(zhuān)家訪(fǎng)談法D、收集媒體信息參考答案:ABCD29.貨幣時(shí)間價(jià)值用相對(duì)值來(lái)表示時(shí),在數(shù)量上應(yīng)當(dāng)理解為扣除()后的社會(huì)平均利潤(rùn)率。A、時(shí)間因素B、通貨膨脹因素C、純粹利率D、風(fēng)險(xiǎn)因素參考答案:BD30.商業(yè)模式描述正確的是:A、B2B--商家對(duì)商家B、B2C--商家對(duì)人C、020--線(xiàn)上對(duì)線(xiàn)下D、C2C--人對(duì)人參考答案:ABCD31.以下屬于聚類(lèi)算法的是()A、K均值B、DBSCANC、AprioriD、knn參考答案:AB32.KANO模型定義的顧客需求層次有()A、興奮型需求B、喜愛(ài)型需求C、基本型需求D、期望型需求參考答案:ACD33.根據(jù)分析內(nèi)容和側(cè)重面不同,風(fēng)險(xiǎn)分析的方法有()A、敏感性分析B、概率分析C、經(jīng)濟(jì)效益分析D、盈虧平衡分析參考答案:ABD34.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是()A、系統(tǒng)誤差B、登記性誤差C、責(zé)任心誤差D、技術(shù)性誤差參考答案:BCD35.敏感個(gè)人信息劃定依據(jù)()A、與人格尊嚴(yán)相關(guān)B、與人身.財(cái)產(chǎn)安全相關(guān)C、不滿(mǎn)十四周歲未成年人的個(gè)人信息D、與公司管理要求相關(guān)參考答案:ABC36.在客戶(hù)關(guān)系管理中,客戶(hù)的生命周期都包括()階段。A、潛在客戶(hù)B、響應(yīng)客戶(hù)C、即得客戶(hù)D、流失客戶(hù)參考答案:ABCD37.以下屬于數(shù)據(jù)預(yù)處理的是()A、缺失值填充B、噪聲數(shù)據(jù)剔除C、異常值識(shí)別D、數(shù)據(jù)可視化參考答案:ABC38.我們可以用哪種方式來(lái)避免決策樹(shù)過(guò)度擬合的問(wèn)題?()A、利用修剪法來(lái)限制樹(shù)的深度B、利用盆栽法規(guī)定每個(gè)節(jié)點(diǎn)下的最小的記錄數(shù)C、利用逐步回歸法來(lái)刪除部分?jǐn)?shù)據(jù)D、目前并無(wú)適合的方法來(lái)處理這問(wèn)題參考答案:AB39.在有關(guān)數(shù)據(jù)倉(cāng)庫(kù)測(cè)試,下列說(shuō)法中正確的是()A、在完成數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行各種測(cè)試.測(cè)試工作中要包括單元測(cè)試和系統(tǒng)測(cè)試B、當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試D、在測(cè)試之前可以不制定詳細(xì)的測(cè)試計(jì)劃,測(cè)試過(guò)程中實(shí)時(shí)調(diào)整。參考答案:ABC40.關(guān)于基準(zhǔn)收益率的表述,正確的是()A、基準(zhǔn)收益率越高越好B、基準(zhǔn)收益率越低越好,但不能低于銀行貸款利率C、可以采用項(xiàng)目加權(quán)平均資金成本為基礎(chǔ)確定基準(zhǔn)收益率D、可以采用國(guó)家有關(guān)部門(mén)或行業(yè)統(tǒng)一發(fā)布的行業(yè)基準(zhǔn)收益率參考答案:CD41.分箱方法有哪些?()A、等深分箱B、等寬分箱C、數(shù)據(jù)標(biāo)準(zhǔn)化D、自定義區(qū)間法參考答案:ABD42.數(shù)據(jù)類(lèi)型:A、離散Q型B、連續(xù)性C、符號(hào)型D、文本型參考答案:ABCD43.營(yíng)銷(xiāo)觀(guān)念是營(yíng)銷(xiāo)過(guò)程中如何處理()利益關(guān)系。A、企業(yè)B、員工C、顧客D、社會(huì)參考答案:ACD44.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲(chǔ)基礎(chǔ),其特點(diǎn)為()A、支持超大文件B、基于商用硬件C、流式數(shù)據(jù)訪(fǎng)問(wèn)D、高吞吐量參考答案:ABCD45.隨機(jī)抽樣方法有()A、等距隨機(jī)抽樣B、綜合隨機(jī)抽樣C、簡(jiǎn)單隨機(jī)抽樣D、分群隨機(jī)抽樣參考答案:ACD46.能消除時(shí)間序列中的不規(guī)則變動(dòng)和季節(jié)變動(dòng)的方法是()A、移動(dòng)平均法B、指數(shù)平滑法C、時(shí)間序列乘法模型D、季節(jié)指數(shù)參考答案:AD47.關(guān)于數(shù)據(jù)范式描述準(zhǔn)確的是:A、經(jīng)驗(yàn)科學(xué)是第一范式,主要研究模型是科學(xué)實(shí)驗(yàn);B、理論科學(xué)是第二范式,主要研究模型是數(shù)學(xué)模型;C、計(jì)算科學(xué)是第三范式,主要研究模型是計(jì)算機(jī)仿真和模擬,第三范式是“人腦+電腦”,人腦是主角;D、數(shù)據(jù)密集型科學(xué)是第四范式,的主要研究模型是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),特別是機(jī)器學(xué)習(xí),第四范式是“電腦+人腦”,電腦是主角。參考答案:ABCD48.如下表student中,如何篩選type為包含數(shù)學(xué)或語(yǔ)文的記錄?()A、select*fromstudentwheretype="數(shù)學(xué)"andtype="語(yǔ)文"B、select*fromstudentwheretype="數(shù)學(xué)"ortype=“語(yǔ)文”C、select*fromstudentwheretypein(“數(shù)學(xué)”,“語(yǔ)文”)D、select*fromstudentwheretypein(“數(shù)學(xué)”?“語(yǔ)文”)參考答案:BC49.下列項(xiàng)目中,其變動(dòng)可以改變盈虧平衡點(diǎn)位置的因素有()A、單價(jià)B、單位變動(dòng)成本C、銷(xiāo)量D、固定成本參考答案:ABCD50.某種產(chǎn)品的生產(chǎn)總費(fèi)用2003年為50萬(wàn)元,比2002年多2萬(wàn)元,而單位產(chǎn)品成本2003年比2002年降低5%,則()A、生產(chǎn)費(fèi)用總指數(shù)為104.17%B、生產(chǎn)費(fèi)用指數(shù)為108.56%C、單位成本指數(shù)為95%D、產(chǎn)量指數(shù)為109.65%E、由于成本降低而節(jié)約的生產(chǎn)費(fèi)用為2.63萬(wàn)元參考答案:ACDE51.按照性質(zhì),預(yù)測(cè)方法大致可分為()。A、定性預(yù)測(cè)B、情景預(yù)測(cè)C、時(shí)間序列預(yù)測(cè)D、回歸預(yù)測(cè)參考答案:ACD52.以下屬于分類(lèi)器評(píng)價(jià)或比較尺度的有()A、預(yù)測(cè)準(zhǔn)確度B、召回率C、模型描述的簡(jiǎn)潔度D、F1-Score參考答案:ABD53.如下哪些不是基于規(guī)則的分類(lèi)器的特點(diǎn)()A、規(guī)則集的表達(dá)能力遠(yuǎn)不如決策樹(shù)好B、基于規(guī)則的分類(lèi)器都對(duì)屬性空間進(jìn)行直線(xiàn)劃分,并將類(lèi)指派到每個(gè)劃分C、無(wú)法被用來(lái)產(chǎn)生更易于解釋的描述性模型D、非常適合處理類(lèi)分布不平衡的數(shù)據(jù)集參考答案:AC54.數(shù)據(jù)離散化是指為了數(shù)據(jù)分析的需要,將連續(xù)數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù)的過(guò)程。數(shù)據(jù)離散化的方法有()A、隨機(jī)取值B、等距離散法C、數(shù)值規(guī)約D、等頻離散法參考答案:BD55.缺失值的處理方法有哪些?()A、用平均值填充B、忽略缺失記錄C、以任意數(shù)據(jù)填充D、用默認(rèn)值填充參考答案:ABD56.()這些數(shù)據(jù)特性都是對(duì)聚類(lèi)分析具有很強(qiáng)影響的。A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點(diǎn)參考答案:ABCD57.以下屬于數(shù)據(jù)規(guī)約方法的是()A、數(shù)據(jù)離散化B、數(shù)據(jù)標(biāo)準(zhǔn)化C、噪聲數(shù)據(jù)識(shí)別D、數(shù)據(jù)壓縮參考答案:AD58.在假設(shè)檢驗(yàn)中,當(dāng)我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時(shí),表示()A、有充足的理由否定原假設(shè)B、原假設(shè)必定是錯(cuò)誤的C、犯錯(cuò)誤的概率不大于aD、犯錯(cuò)誤的概率不大于bE、在H。成立的情況下發(fā)生了小概率事件參考答案:ACE59.電子元器件:A、電子管B、晶體管C、小規(guī)模中規(guī)模集成電路D、大規(guī)?;虺笠?guī)模集成電路參考答案:ABCD60.若檢驗(yàn)統(tǒng)計(jì)量F近似等于1,說(shuō)明()A、組間方差中不包含系統(tǒng)因素的影響B(tài)、組內(nèi)方差中不包含系統(tǒng)因素的影響C、組間方差中包含系統(tǒng)因素的影響D、方差分析中不應(yīng)拒絕原假設(shè)參考答案:AD61.統(tǒng)計(jì)決策的基本原則是()A、可行性B、發(fā)展性C、合理性D、經(jīng)濟(jì)性參考答案:ACD62.促銷(xiāo)預(yù)算的方法主要有()。A、量入為出法B、競(jìng)爭(zhēng)對(duì)等法C、銷(xiāo)售比例法D、目標(biāo)任務(wù)法參考答案:ABCD63.以下哪個(gè)分布是右偏分布?()A、均勻分布B、卡方分布C、F分布D、對(duì)數(shù)正態(tài)分布參考答案:BCD64.大數(shù)據(jù)在今天這個(gè)時(shí)間點(diǎn)上爆發(fā)的原因有哪些?()A、各種傳感器無(wú)時(shí)無(wú)刻不在為我們提供大量的數(shù)據(jù)B、各種監(jiān)控設(shè)備無(wú)時(shí)無(wú)刻不在為我們提供大量的數(shù)據(jù)C、各種智能設(shè)備無(wú)時(shí)無(wú)刻不在為我們提供大量的數(shù)據(jù)D、互聯(lián)網(wǎng)的收集和積累參考答案:ABCD65.數(shù)據(jù)挖掘的預(yù)測(cè)建模任務(wù)主要包括哪幾大類(lèi)問(wèn)題?()A、分類(lèi)B、回歸C、模式發(fā)現(xiàn)D、模式匹配參考答案:AB66.從復(fù)雜度及價(jià)值高低兩個(gè)維度,可以將數(shù)據(jù)分析分為()A、描述性分析(DescriptiveAnalytics)B、診斷性分析(DiagnosticAnalytics)C、預(yù)測(cè)性分析(PredictiveAnalytics)D、規(guī)范性分析(PrescriptiveAnalytics)參考答案:ABCD67.下面有關(guān)HAVING子句的說(shuō)法中正確的是()A、HAVING子句必須與GROUPBY子句同時(shí)使用,不能單獨(dú)使用B、使用HAVING子句的同時(shí)不能使用WHERE子句C、使用HAVING子句的同時(shí)可以使用WHERE子句D、使用HAVING子句的作用是限定分組的條件參考答案:ACD68.在作邏輯回歸時(shí),如果區(qū)域這個(gè)變量,當(dāng)Region=A時(shí)Y取值均為1,無(wú)法確定是否出現(xiàn)的是哪個(gè)問(wèn)題?A、共線(xiàn)性B、異常值C、擬完全分離(Quasi-pleteseparation)D、缺失值參考答案:ABD69.以下哪個(gè)聚類(lèi)分析的方法是利用統(tǒng)計(jì)學(xué)定義的距離進(jìn)行度量()A、層次聚類(lèi)法B、快速聚類(lèi)法(K-Means)C、基于密度的聚類(lèi)法D、基于網(wǎng)格的聚類(lèi)法參考答案:AB70.方差分析的基本假設(shè)前提包括()A、各處理?xiàng)l件下的樣本均來(lái)自正態(tài)總體B、各處理?xiàng)l件下的樣本相互獨(dú)立C、各處理?xiàng)l件下樣本的方差都相等D、各處理?xiàng)l件下樣本均值相等,方差可以不等參考答案:ABC71.季節(jié)變動(dòng)主要是由()引起的。A、自然災(zāi)害B、政治事件C、制度.法律.習(xí)俗D、自然界的季節(jié)變化參考答案:CD72.以下說(shuō)法正確的有哪些?()A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大B、大數(shù)據(jù)對(duì)傳統(tǒng)行業(yè)有幫助C、大數(shù)據(jù)會(huì)帶來(lái)機(jī)器智能D、大數(shù)據(jù)是一種思維方式參考答案:BCD73.下列公式正確的是()A、流動(dòng)資金=流動(dòng)資產(chǎn)-流動(dòng)負(fù)債B、流動(dòng)資產(chǎn)=應(yīng)收賬款+存貨C、流動(dòng)負(fù)債=應(yīng)付賬款+預(yù)收賬款D、流動(dòng)資金本年增加額=本年流動(dòng)資金-上年流動(dòng)資金參考答案:ACD74.決策樹(shù)法分析問(wèn)題的主要步驟包括()。A、結(jié)構(gòu)化問(wèn)題B、設(shè)計(jì)可能結(jié)果發(fā)生的概率C、設(shè)計(jì)結(jié)果的得益D、分析問(wèn)題參考答案:ABCD75.下列說(shuō)法中不正確的是()A、任何兩個(gè)變量都具有相關(guān)關(guān)系B、人的知識(shí)與其年齡具有相關(guān)關(guān)系C、散點(diǎn)圖中的各點(diǎn)是分散的沒(méi)有規(guī)律D、根據(jù)散點(diǎn)圖求得的回歸直線(xiàn)方程都是有意義的參考答案:ACD76.投資項(xiàng)目的現(xiàn)金流量中經(jīng)營(yíng)成本與會(huì)計(jì)中的“總成本費(fèi)用”概念有根本的不同,不包括A、利息支出B、攤銷(xiāo)費(fèi)C、折舊費(fèi)D、維修費(fèi)參考答案:ABC77.符合下列情形之一的,個(gè)人信息處理者方可處理個(gè)人信息A、取得個(gè)人的同意;B、為訂立.履行個(gè)人作為一方當(dāng)事人的合同所必需,或者按照依法制定的勞動(dòng)規(guī)章制度和依法簽訂的集體合同實(shí)施人力資源管理所必需;C、為履行法定職責(zé)或者法定義務(wù)所必需;D、為應(yīng)對(duì)突發(fā)公共衛(wèi)生事件,或者緊急情況下為保護(hù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論