




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
試卷科目:大數(shù)據(jù)挖掘技術(shù)練習(xí)大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷5)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術(shù)練習(xí)第1部分:單項選擇題,共144題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.SAEGateway的功能包括?A)數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密B)數(shù)據(jù)的路由和傳播、用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送C)用戶面數(shù)據(jù)的加密、尋呼消息的發(fā)送、NAC層信令的加密[單選題]2.Hadoop是一個開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺,是Appach的一個用()語言實現(xiàn)開源軟件框架。A)javaB)C.++C)R語言[單選題]3.以下______函數(shù)不是字符串裁剪函數(shù)?A)lpad()B)left()C)ltrim()D)right()[單選題]4.()用于文本分類A)高斯樸素貝葉斯B)伯努利樸素貝葉斯C)多項式樸素貝葉斯D)半樸素貝葉斯[單選題]5.算法的核心思想是()逐層構(gòu)造一個樹。A)自上而下B)自下而上C)自左向右D)自右向左[單選題]6.在計算時,取其中,是()A)一個學(xué)習(xí)率,取值為0~1B)一個學(xué)習(xí)率,取值為-1~1C)一個閾值,取值為0~1D)一個閾值,取值為一1~1[單選題]7.貝葉斯信念網(wǎng)絡(luò)由兩部分組成,分別是網(wǎng)絡(luò)結(jié)構(gòu)和()。A)條件概率B)先驗概率C)后驗概率D)條件概率表[單選題]8.無監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法A)聚類算法;B)降維算法;C)關(guān)聯(lián)規(guī)則算法;D)文本挖掘[單選題]9.容量估算與()互相影響A)鏈路預(yù)算B)PCI規(guī)劃C)建網(wǎng)成本D)網(wǎng)絡(luò)優(yōu)化[單選題]10.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?A)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B)聚類C)分類D)自然語言處理[單選題]11.下列selenium庫的方法中,通過元素名稱進(jìn)行多元素定位的是()A)find_element_by_nameB)find_elements_by_nameC)find_elements_by_idD)find_elements_by_class_name[單選題]12.以下敘述中正確的是()A)OLAP是針對特定事務(wù)聯(lián)機(jī)數(shù)據(jù)訪問B)如果一個維是多層次的,那么該維的維成員就是相同維層次的取值的組合C)OLTP存儲的是歷史數(shù)據(jù),不可更新,但可周期性地刷新D)OLAP的特點是能夠?qū)Χ嗑S信息進(jìn)行快速分析[單選題]13.附著流程中若創(chuàng)建默認(rèn)承載流程失敗給終端的錯誤碼是A)Nosuitablecellsintrackingarea#15B)EPSservicesnotallowed#7C)Implicitlydetached#10D)ESMfailure#19[單選題]14.要查詢所有課程中,各門課程的最低分,下面SQL語句正確的是______。A)SELCET課程號,MIN(成績)FROM選課表GROUPBY課程號;B)SELCET課程號,SUM(成績),FROM選課表GROUPBY課程號;C)SELCET課程號,MAX(成績),MIN(成績),AVERAGE(成績)FROM選課表GROUPBY課程號;D)SELCET課程號,MAX(成績),FROM選課表GROUPBY課程號;[單選題]15.下列()不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A)與同一時期其他數(shù)據(jù)對比B)可視化C)基于模板的方法D)主觀興趣度量[單選題]16.若I={a,b,c,d},D中含有10個事務(wù),{a,b)和{a,c}是一個頻繁項集,則以下敘述中正確的是()A){a,b,d}一定是頻繁項集B){a,b,c}一定是頻繁項集C){b,c}一定是頻繁項集D)以上都不對[單選題]17.一般,k-NN最近鄰方法在()的情況下效果較好A)樣本較多但典型性不好B)樣本較少但典型性好C)樣本呈團(tuán)狀分布D)樣本呈鏈狀分布[單選題]18.下列關(guān)于等距離分箱的說法中錯誤的是()。A)等距離分箱能使每個區(qū)間內(nèi)包含的取值個數(shù)大致相同B)若區(qū)間個數(shù)為k,每個區(qū)間的間距為I=(max-min)/kC)等距離分箱可能導(dǎo)致屬于某些的取值非常多,而某些又非常少D)又稱為等寬度分箱[單選題]19.已知某企業(yè)第20期的模型參數(shù)a=91856-105,用二次指數(shù)平滑法預(yù)測第25期的銷售量是()。A)1023.5B)1443.5C)4697.5D)5117.5[單選題]20.只有非零值才重要的二元屬性被稱作A)計數(shù)屬性B)離散屬性C)非對稱的二元屬性D)對稱屬性[單選題]21.關(guān)于數(shù)據(jù)挖據(jù)工具,下列說法不正確的是()A)Weka是機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘的庫與工具B)Tableau是廣義數(shù)據(jù)挖掘中可視化工具C)Orange可通過Java編程和命令行來調(diào)用其分析組件D)OracleDarwin是企業(yè)數(shù)據(jù)挖據(jù)工具[單選題]22.居民區(qū)4G&寬帶網(wǎng)絡(luò)能力全景分析的指標(biāo)采集最小粒度不包括A)月粒度B)地市粒度C)居民區(qū)粒度D)SAEGW網(wǎng)元粒度[單選題]23.下述算法中不屬于聚類算法的是A)K-MeansB)DBSCANC)AprioriD)Jarvis-Patrick[單選題]24.下列關(guān)于頁面顯示總時長說法正確的是?A)TRANS_RSP_CODE<400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為0,最后一個HTTP內(nèi)容包的時延(MS)B)TRANS_RSP_CODE<400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為1,最后一個HTTP內(nèi)容包的時延(MS)C)TRANS_RSP_CODE>400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為1,最后一個HTTP內(nèi)容包的時延(MS)D)TRANS_RSP_CODE>400的記錄數(shù)且業(yè)務(wù)完成標(biāo)識為0,最后一個HTTP內(nèi)容包的時延(MS)[單選題]25.屬于財務(wù)專業(yè)明細(xì)數(shù)據(jù)表的是()A)客戶收費流水表;B)應(yīng)收票據(jù)信息表;C)公司分壓線損統(tǒng)計表;D)供應(yīng)計劃表[單選題]26.下列哪些選項能表示序數(shù)屬性的數(shù)據(jù)集中趨勢度量()。A)四分位數(shù)B)標(biāo)準(zhǔn)差C)眾數(shù)D)均值[單選題]27.通用人工智能面對大型即時策略游戲,面臨很多亟待解決的問題,不包括()A)通用人工智能需要平衡價值目標(biāo)和策略目標(biāo),價值目標(biāo)服務(wù)于長期目標(biāo),策略目標(biāo)服務(wù)于短期目標(biāo)。這就需要通用人工智能,掌握博弈論的精髓B)通用人工智能,需要能夠主動挖掘游戲情報,并通過局部信息或不完美的信息做出游戲決策C)像許多現(xiàn)實世界的問題一樣,因果關(guān)系不是即時的。這意味著游戲早期采取的行動可能無法在很長一段時間內(nèi)獲得回報。這就需要通用人工智能,具有長期規(guī)劃能力D)智能匹配隊友[單選題]28.()可以觀察從一個分布到另一分布是否有漂移。A)直方圖B)散點圖C)盒圖D)分位數(shù)-分位數(shù)圖[單選題]29.SSH工作的端口號是(),當(dāng)然可以通過它來配置,是默認(rèn)的端口號。A)No.21B)No.22C)No.23D)No.24[單選題]30.下面不屬于創(chuàng)建新屬性的相關(guān)方法的是:A)特征提取B)特征修改C)映射數(shù)據(jù)到新的空間D)特征構(gòu)造[單選題]31.當(dāng)用戶發(fā)起附著時,如該用戶的imsi號段信息在MME上并沒有制作相應(yīng)數(shù)據(jù),則MME將A)拒絕該用戶附著請求B)仍允許該用戶附著請求C)轉(zhuǎn)發(fā)該用戶附著請求至HLR/HSS進(jìn)行鑒權(quán)D)匹配默認(rèn)規(guī)則[單選題]32.將兩個簇的鄰近度定義為不同簇中任意兩點的最短距離,它是一種()連接方式。A)單鏈接B)全鏈接C)組平均D)質(zhì)心距離[單選題]33.研究顧客購買手機(jī)價格與年齡,性別,收入和工作地點的關(guān)系可以使用()A)回歸方法B)分類方法C)聚類方法D)關(guān)聯(lián)分析[單選題]34.GY口通過什么消息進(jìn)行能力協(xié)商A)CER/CEAB)CER/CCAC)DWR/DWAD)RAR/RAA[單選題]35.分布式存儲框架的配置信息在哪個文件中A)core-site.xmlB)hdfs-site.xmlC)mapred-site.xmlD)hadoop-env.sh[單選題]36.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B)在分析方法上更注重相關(guān)分析而不是因果分析C)在分析效果上更追究效率而不是絕對精確D)在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)[單選題]37.hadoop關(guān)閉分布式計算框架命令是?A)stop-yarn.shB)stop-yan.shC)stop-hbase.shD)stop-dfs.sh[單選題]38.噪聲數(shù)據(jù)主要是包含錯誤數(shù)據(jù)、假數(shù)據(jù)和()A)異常數(shù)據(jù)B)真實數(shù)據(jù)C)污染數(shù)據(jù)D)缺失數(shù)據(jù)[單選題]39.下列錯誤的是()A)查準(zhǔn)率/準(zhǔn)確率(precision):P=TP/(TP-FP)B)查準(zhǔn)率(precision):被認(rèn)定為正例的里面,判斷正確的比例C)查全率/召回率/靈敏度(recall):R=TP/(TP+FN)D)查全率(recall):真實正例里,被判斷出為正例的比例[單選題]40.下列解析技術(shù)中,用于解析JSON文檔的是____。A)XPathB)JSONPathC)BeautifulSoupD)正則表達(dá)式[單選題]41.下列關(guān)于TCP握手成功率說法正確的是A)TCP握手成功率指標(biāo)屬于連接建立評價指標(biāo)B)TCP握手成功率指標(biāo)屬于承載建立評價指標(biāo)C)TCP握手成功率指標(biāo)屬于TAU更新評價指標(biāo)D)TCP握手成功率指標(biāo)屬于網(wǎng)絡(luò)附著評價指標(biāo)[單選題]42.以下哪項關(guān)于決策樹的說法是錯誤的A)決策樹算法對于噪聲的干擾非常敏感B)冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響C)子樹可能在決策樹中重復(fù)多次D)尋找最佳決策樹是NP完全問題[單選題]43.下述算法中屬于基于規(guī)則的分類器的是A)C4.5B)KNNC)DBSCAND)ANN[單選題]44.()是數(shù)據(jù)倉庫體系架構(gòu)的重要組成部分,具備數(shù)據(jù)倉庫的部分特征和OLTP系統(tǒng)的部分特征。A)E.SB;B)D.MC)ODSD)E.TL[單選題]45.下列四項中,不屬于數(shù)據(jù)庫特點的是()A)數(shù)據(jù)共享B)數(shù)據(jù)完整性C)數(shù)據(jù)冗余很高D)數(shù)據(jù)獨立性高[單選題]46.咪咕視頻業(yè)務(wù)的端到端感知評價指標(biāo)中感知最相關(guān)且DPI可以精準(zhǔn)建模的指標(biāo)是A)初緩時長B)下載速率C)卡頓時長D)播放成功率[單選題]47.小概率事件和假設(shè)檢驗的基本思想:小概率事件通常指發(fā)生概率小于5%的事件,認(rèn)為在一次試驗中幾乎不可能發(fā)生。A)1%B)3%C)5%D)10%[單選題]48.最小-最大法中,假設(shè)需要映射到目標(biāo)區(qū)間為[L,R],原來的取值范圍為[l,r]。一個值x映射到新區(qū)間后的值v的計算方法是()。A)v=(r-l)(x-L)/(x-l)+LB)v=(x-l)(R-L)/(r-l)+LC)v=(x-l)(x-L)/(r-l)+LD)v=(r-l)(R-L)/(x-l)+L[單選題]49.HTTP響應(yīng)中500代碼指的是()A)服務(wù)器內(nèi)部錯誤B)代理服務(wù)器從上級收到了一條偽響應(yīng)C)服務(wù)器此時無法提供服務(wù);但是將來可能可用D)不允許使用此方法請求相應(yīng)的URL[單選題]50.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:A)基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉庫,數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息;B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息;C)基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息;D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息.[單選題]51.LTE為了解決深度覆蓋的問題,以下哪些措施是不可取的A)降低LTE工作頻點,采用低頻段組網(wǎng)B)采用分層組網(wǎng)C)增加LTE系統(tǒng)帶寬D)采用家庭基站等新型設(shè)備[單選題]52.給定df是一個DataFrame對象,對df所有字段進(jìn)行描述性統(tǒng)計,可以利用的方法為()。A)df.mean()B)df.statistics()C)df.summary()D)df.describe()[單選題]53.Tableau在處理離線地圖時,需要將標(biāo)記設(shè)置為()。A)路徑;B)區(qū)域C)邊形D)已填充地圖[單選題]54.一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數(shù)是:A)一年級B)二年級C)三年級D)四年級[單選題]55.在有指導(dǎo)的數(shù)據(jù)挖掘中,有關(guān)測試集的說法錯誤的是()A)測試集和訓(xùn)練集是相互聯(lián)系的B)測試集是用以測試模型的數(shù)據(jù)集C)通常測試集大約占總樣本的三分之一D)K-次交叉驗證中,測試集只有1個,訓(xùn)練集有K-1個[單選題]56.已知x=[1,2,3],那么x*3的值為?A)6B)18C)[3,6,9]D)[1,2,3,1,2,3,1,2,3][單選題]57.設(shè)X={1,2,3}是頻繁項集,則可由X可產(chǎn)生()個關(guān)聯(lián)規(guī)則。A)3B)4C)5D)6[單選題]58.Hive通常被稱作()。A)數(shù)據(jù)地圖B)數(shù)據(jù)能力C)數(shù)據(jù)倉庫D)數(shù)據(jù)應(yīng)用[單選題]59.社交網(wǎng)絡(luò)產(chǎn)生了海量用戶以及實時和完整的數(shù)據(jù),同時社交網(wǎng)絡(luò)也記錄了用戶群體的(),通過深入挖掘這些數(shù)據(jù)來了解用戶,然后將這些分析后的數(shù)據(jù)信息推給需要的品牌商家或是微博營銷公司。A)地址B)行為C)情緒D)來源[單選題]60.兩臺路由器成為OSPF鄰居關(guān)系的必要條件不包括A)兩臺路由器的Hello時間一致B)兩臺路由器的Dead時間一致C)兩臺路由器的RouterID一致D)兩臺路由器所屬區(qū)域一致[單選題]61.決策樹分類方法中,CART算法使用的分裂準(zhǔn)則是:()A)信息增益B)增益比率C)基尼指數(shù)D)分類錯誤率[單選題]62.當(dāng)時間序列的環(huán)比增長速度大體相同時,適宜擬合()A)指數(shù)曲線B)拋物線C)直線D)對數(shù)曲線[單選題]63.Python科學(xué)計算的基本包是()。A)MatplotlibB)PandasC)NumpyD)Scikit-learn[單選題]64.神經(jīng)元模型輸出節(jié)點有()個A)1B)2C)3D)可自己設(shè)定[單選題]65.可以最全面反映整個網(wǎng)絡(luò)缺省EPS承載的建立成功率的指標(biāo)是A)PDN連接建立成功率B)缺省承載激活成功率C)MME建立缺省S5S8承載成功率D)位置更新的成功率[單選題]66.獲取網(wǎng)絡(luò)上某個URL對應(yīng)的圖片或視頻等二進(jìn)制資源,應(yīng)該采用Response類的哪個屬性?A)status_codeB)headC)textD)content[單選題]67.HDFS存儲數(shù)據(jù)時,默認(rèn)存儲為()份A)1B)2C)3D)4[單選題]68.在Requests庫的get()方法中,能夠定制向服務(wù)器提交HTTP請求頭的參數(shù)是什么?A)dataB)jsonC)cookiesD)headers[單選題]69.以下哪個不是VoLTE終端與LTECSFB終端共有的性能指標(biāo)()A)掉話率B)呼叫時延C)IMS注冊成功率D)接通率[單選題]70.IMEI中的TypeAllocationCode字段可以確定哪些信息A)裝配號B)終端型號C)出廠序號D)檢驗碼[單選題]71.bootstrap數(shù)據(jù)是什么意思?()A)有放回地從總共M個特征中抽樣m個特征B)無放回地從總共M個特征中抽樣m個特征C)有放回地從總共N個樣本中抽樣n個樣本D)無放回地從總共N個樣本中抽樣n個樣本[單選題]72.維度規(guī)約是在以下哪個步驟的任務(wù)?()A)頻繁模式挖掘B)降維C)數(shù)據(jù)預(yù)處理D)數(shù)據(jù)流挖掘[單選題]73.如下哪個不是最近鄰分類器的特點()A)它使用具體的訓(xùn)練實例進(jìn)行預(yù)測,不必維護(hù)源自數(shù)據(jù)的模型B)分類一個測試樣例開銷很大C)最近鄰分類器基于全局信息進(jìn)行預(yù)測D)可以生產(chǎn)任意形狀的決策邊界[單選題]74.時間序列的類型分為()。A)平穩(wěn)序列和非平穩(wěn)序列B)大序列和小序列C)有趨勢序列和無趨勢序列D)隨機(jī)序列和非隨機(jī)序列[單選題]75.下列哪項不可以用于評價視頻業(yè)務(wù)的體驗()A)流媒體播放成功次數(shù)B)流媒體包下載時長C)初始緩沖平均時長D)ATTACH成功率[單選題]76.高維數(shù)據(jù)可視化可以采用哪種方式A)莖葉圖B)直方圖C)散步圖D)平行坐標(biāo)系[單選題]77.以下關(guān)于字典類型的描述,正確的是()A)字典類型可迭代,即字典的值還可以是字典類型的對象//不可B)表達(dá)式forxind:中,假設(shè)d是字典,則x是字典中的鍵值對//鍵C)字典類型的鍵可以是列表和其他數(shù)據(jù)類型//不可為列表D)字典類型的值可以是任意數(shù)據(jù)類型的對象[單選題]78.某終端換機(jī)用戶識別的需求中,需對使用體驗和用戶使用需求不匹配的用戶進(jìn)行識別,挖掘重度游戲迷等用戶畫像,使用哪類算法最合適A)決策樹B)最小二乘法C)時間序列D)貝葉斯判別[單選題]79.若P(H)=0.5,P(x)=0.8,P(X|H)=0.7,則P(H|X)為()A)0.475B)0.57C)0.4375D)0.5[單選題]80.對于雙路的室分系統(tǒng)來說,影響性能的因素有那些()A)雙路功率的平衡度B)雙路天線間距C)A&BD)以上都不影響[單選題]81.終端支持的頻段,在下列哪個流程中會得以體現(xiàn)A)ATTACHB)DETACHC)切換流程D)呼叫流程[單選題]82.JSON中的中括號一般來表示()。A)數(shù)組;B)標(biāo)點符號C)對象D)注釋[單選題]83.波士頓房價數(shù)據(jù)集(BostonHousePriceDataset)包含對房價的預(yù)測,以千美元計,給定的條件是房屋及其相鄰房屋的詳細(xì)信息。該數(shù)據(jù)集是一個()A)統(tǒng)計數(shù)據(jù)B)回歸問題C)預(yù)測模型D)評估公式[單選題]84.自然界中某種事物發(fā)生時其他事物也會發(fā)生,則這種聯(lián)系稱之為()。A)連接B)聯(lián)絡(luò)C)關(guān)聯(lián)D)聯(lián)系[單選題]85.決策樹中不包含一下哪種結(jié)點,A)根結(jié)點(rootnode)B)內(nèi)部結(jié)點(internalnode)C)外部結(jié)點(externalnode)D)葉結(jié)點(leafnode)[單選題]86.分版本分芯片落地手冊,關(guān)于版本信息庫建設(shè)描述錯誤的是()A)提取XDR用戶面單據(jù)USER-AGENT字段中的版本信息B)提取XDR用戶面單據(jù)及數(shù)據(jù)業(yè)務(wù)CDR話單IMEI-SV字段中的版本信息C)需終端廠家提供的SV信息D)建立IMEI和版本對應(yīng)關(guān)系[單選題]87.考慮值集{12,24,33,2,4,55,68,26},其四分位數(shù)極差是:()A)31B)24C)55D)3[單選題]88.哪個選項是使用PyInstaller庫對Python源文件打包的基本使用方法()A)pip-hB)pipinstall<擬安裝庫名>C)pipdownload<擬下載庫名>D)pyinstaller需要在命令行運行:>pyinstaller<Python源程序文件名>[單選題]89.《客戶投訴溯源及主動預(yù)警》落地手冊中,對用戶上網(wǎng)速度慢問題溯源至TCP連接問題時,第1、2次握手成功率、時延等指標(biāo)異常,則應(yīng)排查:A)核心網(wǎng)和內(nèi)容源問題B)終端問題C)E-UTRAN無線網(wǎng)問題D)DNS問題[單選題]90.以下哪種算法是關(guān)聯(lián)規(guī)則挖掘()A)SVCB)KNNC)AprioriD)PCA[單選題]91.在比較模型的擬合效果時,甲、乙、丙、丁四個模型的決定系數(shù)R^2的值分別約為0.96、0.85、0.80和0.7,則擬合效果好的模型是()。A)丁B)乙C)甲D)丙[單選題]92.SELECT語句中?GROUPBY學(xué)號?表示______。A)修改學(xué)號B)過濾學(xué)號C)對學(xué)號排序D)對學(xué)號分組[單選題]93.weka系統(tǒng)匯集了最前沿的機(jī)器學(xué)習(xí)算法和數(shù)據(jù)預(yù)處理工具,提供的主要應(yīng)用程序不包括A)ExplorerB)KnowledgeFlowC)ExperimenterD)Conclusion[單選題]94.利用tree.DecisionTreeClassifier()訓(xùn)練模型時調(diào)用.fit()方法需要傳遞的第二個參數(shù)是()。A)樣本特征XB)樣本標(biāo)簽YC)判斷標(biāo)準(zhǔn)D)設(shè)置結(jié)點的最小樣本數(shù)量[單選題]95.下列()不屬于人工智能新突破取得的產(chǎn)品A)科大訊飛的翻譯器、記錄儀B)天貓精靈等智能AI音箱C)佳能相機(jī)D)某酒店通過人臉識別認(rèn)證身份信息[單選題]96.使用零均值規(guī)范化方法,年收入屬性的均值為65,標(biāo)準(zhǔn)差為12,則年收入59萬元規(guī)范化后為()。A)-0.2B)-0.5C)0.3D)0.5[單選題]97.在FP-growth構(gòu)建頻繁模式樹中,每個()(除根結(jié)點外)代表一個單項,樹中的每條()代表原數(shù)據(jù)中每一個條目的各個項。如果把條目內(nèi)的項組合在一起看成一個字符串,則字符串前綴相同時共享相同的()。A)結(jié)點;路徑;結(jié)點B)結(jié)點;路徑;路徑C)路徑;路徑;結(jié)點D)路徑;路徑;路徑[單選題]98.以下哪項關(guān)于決策樹的說法是錯誤的A)冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響B(tài))子樹可能在決策樹中重復(fù)多次C)決策樹算法對于噪聲的干擾非常敏感D)尋找最佳決策樹是NP完全問題[單選題]99.利用tree.DecisionTreeClassifier()訓(xùn)練模型時調(diào)用.fit()方法需要傳遞的第一個參數(shù)是()。A)樣本特征XB)樣本標(biāo)簽YC)判斷標(biāo)準(zhǔn)D)設(shè)置結(jié)點的最小樣本數(shù)量[單選題]100.下列方法,用于向文件寫入內(nèi)容的是()A)writeB)readC)openD)close[單選題]101.熵表示為消除不確定性所需要的信息量,投擲均勻正六面體骰子的熵是()比特。A)1B)2.6C)3.2D)3.8[單選題]102.用戶面分析包括A)DNS查詢B)網(wǎng)絡(luò)附著C)承載建立D)TAU更新[單選題]103.哪個是在后續(xù)平行節(jié)點中返回一個a標(biāo)簽的方法?A)find('a')B)find_previous_sibling(a)C)find_next_siblings('a')D)find_next_sibling('a')[單選題]104.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是()。A)KB)KC)KD)K[單選題]105.下列不是金融科技公司的是()A)諾亞財富B)高盛公司C)文藝復(fù)興公司D)中國平安[單選題]106.支持向量機(jī)是一種二分類模型,其基本模型定義為特征空間上的間隔最大的(),其學(xué)習(xí)策略便是間隔最大化,最終可轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解。A)環(huán)形分類器B)線性分類器C)回歸分類器D)非線性分類器[單選題]107.sum([i*iforiinrange(3)])的計算結(jié)果是?A)3B)5C)2D)4[單選題]108.對原始數(shù)據(jù)進(jìn)行聚集、抽樣、違歸約等是哪個步驟的任務(wù)A)數(shù)據(jù)預(yù)處理B)業(yè)務(wù)理解C)數(shù)據(jù)理解D)數(shù)據(jù)量挖掘[單選題]109.在DPI規(guī)范中,HTTP版本字段等于0x05代表()A)HTTP2.0B)HTTP1.1C)WAP1.0D)WAP1.1[單選題]110.數(shù)據(jù)正規(guī)化(DataNormalization)是在知識發(fā)掘處理(KnowledgeDiscoveryProcess)中的哪一個階段進(jìn)行?A)數(shù)據(jù)清洗B)數(shù)據(jù)選擇C)數(shù)據(jù)編碼D)數(shù)據(jù)擴(kuò)充[單選題]111.Requests庫中,下面哪個屬性代表了從服務(wù)器返回HTTP協(xié)議內(nèi)容部分猜測的編碼方式?A)apparent_encodingB)encodingC)textD)headers[單選題]112.下列train_test_split參數(shù)解釋錯誤的是()A)train_data:所要劃分的樣本結(jié)果B)test_size:樣本占比,如果是整數(shù)的話就是樣本的數(shù)量C)random_state:是隨機(jī)數(shù)的種子D)隨機(jī)數(shù)種子:其實就是該組隨機(jī)數(shù)的編號,在需要重復(fù)試驗的時候,保證得到一組一樣的隨機(jī)數(shù)。比如你每次都填1,其他參數(shù)一樣的情況下你得到的隨機(jī)數(shù)組是一樣的。但填0或不填,每次都會不一樣[單選題]113.字典對象的______________方法返回字典的?值?列表A)keys()B)key()C)values()D)items()[單選題]114.開始將N個樣品各自作為一類,將規(guī)定樣品之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個新類,計算新類與其他類的距離,重復(fù)進(jìn)行兩個最近類的合并,每次減少一類,直至所有的樣品合并為一類,此種聚類方法是()A)K-meansB)SOM聚類C)系統(tǒng)聚類D)有序聚類[單選題]115.下列函數(shù)中,用于返回元組中元素最小值的是()A)lenB)maxC)minD)tuple[單選題]116.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是()。A)K均值丟棄被它識別為噪聲的對象,而BSCAN一般聚類所有對象。B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。C)K均值很難處理非球形的簇和不同大小的,DBSCAN可以處理不同大小和不同形狀的簇。D)K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇。[單選題]117.使用python處理缺失值的方法中敘述錯誤的是()。A)fillna()填充缺失值B)dropna()刪除缺失值C)isnull()判斷缺失值D)interpolate()使用中位數(shù)填充缺失值[單選題]118.多維空間中最適合的異常點檢測方法是A)正態(tài)分布圖B)等價圖C)馬氏距離D)散點圖[單選題]119.P-R圖一般為()曲線A)光滑非單調(diào)B)非光滑非單調(diào)C)非光滑單調(diào)D)光滑單調(diào)[單選題]120.在數(shù)據(jù)挖掘過程中,()可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。A)云平臺B)物聯(lián)網(wǎng)C)SPSSD)WEKA[單選題]121.矩估計的基本原理是()A)用樣本矩估計總體矩B)使得似然函數(shù)達(dá)到最大C)使得似然函數(shù)達(dá)到最小D)小概率事件在一次試驗中是不可能發(fā)生的[單選題]122.邏輯回歸(LogisticRegression)是對數(shù)幾率回歸,屬于廣義線性模型(GLM),它的因變量()A)不確定B)為非負(fù)數(shù)C)隨機(jī)自然數(shù)D)一般只有0或1[單選題]123.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是()。A)K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類所有對象。B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。C)K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇。D)K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇[單選題]124.神經(jīng)網(wǎng)絡(luò)就是模擬人的大腦的神經(jīng)單元的工作方式,但進(jìn)行了很大的簡化,神經(jīng)網(wǎng)絡(luò)由很多神經(jīng)網(wǎng)絡(luò)層構(gòu)成,而每一層又由許多單元組成,第一層叫輸入層,最后一層叫輸出層,中間的各層叫()A)中間層B)簡略層C)過渡層D)隱藏層[單選題]125.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()A)建立數(shù)據(jù)科學(xué)B)完成數(shù)據(jù)應(yīng)用C)配備數(shù)據(jù)硬件D)吸納數(shù)據(jù)人才[單選題]126.以下哪個指標(biāo)不是家客數(shù)據(jù)端到端指標(biāo)A)網(wǎng)頁首屏?xí)r延B)網(wǎng)頁打開成功率C)視頻平均播放卡頓次數(shù)D)4G占網(wǎng)時長占比[單選題]127.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過以下三個步驟:連接數(shù)據(jù),作數(shù)據(jù)準(zhǔn)備;給定最小支持度和(),利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則;可視化顯示、理解、評估關(guān)聯(lián)規(guī)則A)最小興趣度B)最小置信度C)最大支持度D)最小可信度[單選題]128.使用交互式的和可視化的技術(shù),對數(shù)據(jù)進(jìn)行探索屬于數(shù)據(jù)挖掘的哪一類任務(wù)?A)探索性數(shù)據(jù)分析B)建模描述C)預(yù)測建模D)尋找模式和規(guī)則[單選題]129.根據(jù)聚類形成的簇的特點,如果有交集的簇之間必然存在包含關(guān)系,這種聚類稱為()。A)層次型聚類B)重疊聚類C)劃分型聚類D)以上均不是[單選題]130.如果懷疑GPS跑偏,哪些說法是不對的?A)當(dāng)UE工作在故障基站時,其測量得到的鄰小區(qū)的PCCPCHRSCP都比實際值低很多;UE在正常站測故障站的PCCPCHRSCP值也比實際值低。B)當(dāng)故障GPS前偏時,周圍基站與故障站主頻點相同頻點的UpPTS時隙都受到比較大的干擾C)可以通過進(jìn)行站點的切換統(tǒng)計進(jìn)行定位,對于故障站點,其特征是基站內(nèi)部各小區(qū)之間切換正常,但是UE無法從該基站的小區(qū)切換到其它基站所屬的小區(qū)上,也無法從其他基站的小區(qū)切換到故障基站包含的小區(qū)上。D)通過將OMC-R統(tǒng)計的ISCP值導(dǎo)入MAPINFO地圖,進(jìn)行排查[單選題]131.()的目的是縮小數(shù)據(jù)的取值范圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)相同的分析結(jié)果。A)數(shù)據(jù)清洗B)數(shù)據(jù)集成C)數(shù)據(jù)變換D)數(shù)據(jù)歸約[單選題]132.利用?linear_model.LinearRegression()?訓(xùn)練模型時調(diào)用.fit()方法需要傳遞的,第二個參數(shù)是()。A)是否考慮計算截距B)樣本權(quán)重C)樣本特征XD)樣本標(biāo)簽Y[單選題]133.IP地址表示什么A)本地broadcastB)直接multicastC)本地networkD)本地loopback[單選題]134.下列屬于區(qū)間標(biāo)度屬性的是()。A)日期B)頭發(fā)顏色C)學(xué)歷D)職稱[單選題]135.設(shè)置hadoop啟動環(huán)境變量的文件是?A)core-site.xmlB)hdfs-site.xmlC)mapred-site.xmlD)hadoop-env.sh[單選題]136.頻繁項集、頻繁閉項集、最大頻繁項集之間的關(guān)系是:A)頻繁項集頻繁閉項集=最大頻繁項集B)頻繁項集=頻繁閉項集最大頻繁項集C)頻繁項集頻繁閉項集最大頻繁項集D)頻繁項集=頻繁閉項集=最大頻繁項集[單選題]137.第三次人工智能浪潮區(qū)別前兩次在于()A)理論的革新B)思維的轉(zhuǎn)變C)人工智能戰(zhàn)勝了人類國際象棋世界冠軍D)人工智能的產(chǎn)品打破了人們的預(yù)期,真正做到了在識別方面比人類本身更智能更高效,是真正可以用的東西[單選題]138.下列選項中,不屬于請求報頭的是()。A)User-AgentB)CookieC)RefererD)Content-Type[單選題]139.分析判斷PGW是否存在業(yè)務(wù)受限的情況采用哪個指標(biāo)A)PGW承載容量平均利用率B)PGW承載容量峰值利用率C)PGW平均負(fù)荷D)PGW數(shù)據(jù)吞吐容量利用率[單選題]140.對回歸問題和分類問題的評價最常用的指標(biāo)是A)準(zhǔn)確率B)召回率C)誤差D)方差[單選題]141.如果允許一條記錄觸發(fā)多條分類規(guī)則,把每條被觸發(fā)規(guī)則的后件看作是對相應(yīng)類的一次投票,然后計票確定測試記錄的類標(biāo)號,稱為A)無序規(guī)則B)窮舉規(guī)則C)互斥規(guī)則D)有序規(guī)則[單選題]142.下面哪個Python庫不能用于提取網(wǎng)頁信息?A)BeautifulSoupB)lxmlC)requestsD)re[單選題]143.下列選取節(jié)點的表達(dá)式中,代表著從根節(jié)點開始選取的是____。A)/B)//C)nameD)@[單選題]144.使用最小-最大法進(jìn)行數(shù)據(jù)規(guī)范化,需要映射的目標(biāo)區(qū)間為[0,100],原來的取值范圍是[-10,10]。根據(jù)等比映射的原理,一個值8映射到新區(qū)間后的值是()。A)95B)90C)85D)80第2部分:多項選擇題,共47題,每題至少兩個正確答案,多選或少選均不得分。[多選題]145.為建立基于DPI的終端版本識別算法的終端版本信息庫,需要哪些信息A)用戶面單據(jù)USER-AGENT字段B)CDR話單IMEI-SV字段C)終端廠家提供的SV信息D)信令面單據(jù)PROCTYPE信息[多選題]146.中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范,LTE網(wǎng)絡(luò)中,無線側(cè)軟采需要生成以下哪幾種XDR?()A)Uu_XDRB)X2_XDRC)CELL_MR_XDRD)UE_MR_XDR[多選題]147.中國移動目前4G網(wǎng)絡(luò)下的語音通話解決方案有?A)CSFBB)單卡雙待C)VOLTED)RCS[多選題]148.數(shù)據(jù)科學(xué)中的主流語音工具()A)RB)C++C)JavaD)Python[多選題]149.以下可以創(chuàng)建一個1到9的一維數(shù)組的是()A)np.arange(1,10)B)np.arange(1,9)C)np.array(range(1,10))D)np.array(range(1,9))[多選題]150.關(guān)于Python中的復(fù)數(shù),下列說法錯誤的是()A)表示復(fù)數(shù)得語法時real+imagejB)實部和虛部都是浮點數(shù)C)虛部必須后綴j,且必須時小寫D)方法conjugate返回復(fù)數(shù)得共軛復(fù)數(shù)[多選題]151.視頻播放準(zhǔn)備階段的KQI指標(biāo)包含______A)視頻播放成功率B)視頻首幀顯示時長C)初始緩沖成功率D)視頻首次卡頓時長[多選題]152.Apriori算法的計算復(fù)雜度受____影響。A)支持度閥值B)項數(shù)(維度)C)事務(wù)數(shù)D)事務(wù)平均寬度[多選題]153.Hadoop的核心配置是什么?A)Hadoop的核心配置通過修改配置文件來完成B)hadoop-default.xmlC)hadoop-site.xmlD)hadoop-env.sh(啟動環(huán)境變量)[多選題]154.常用的聚類算法有()A)w-K算法B)K-均值聚類C)K-中心點聚類D)層次聚類[多選題]155.預(yù)測性能的優(yōu)劣需要一定的度量來衡量,常用的度量是()。A)RAE(相對絕對誤差)B)MAE(平均絕對誤差)C)MSE(均方誤差)D)RSE(相對平方誤差)[多選題]156.網(wǎng)絡(luò)大數(shù)據(jù)支撐規(guī)劃進(jìn)而實現(xiàn)最大化發(fā)揮網(wǎng)絡(luò)資源價值并滿足不同業(yè)務(wù)目標(biāo)訴求的建模關(guān)鍵點是A)價值熱點區(qū)域識別B)用戶行為及收益分析C)覆蓋評估D)體驗評估[多選題]157.大數(shù)據(jù)的主要特征()A)數(shù)據(jù)量大B)類型繁多C)價值密度低D)速度快時效高[多選題]158.營銷觀念是營銷過程中如何處理()利益關(guān)系。A)企業(yè)B)員工C)顧客D)社會[多選題]159.一下哪些終端是需要進(jìn)行識別的A)智能家居B)智能穿戴(電話手表)C)手機(jī)D)物聯(lián)網(wǎng)終端[多選題]160.處理噪聲數(shù)據(jù)的常用方法。A)分箱B)聚類C)回歸D)對比[多選題]161.投資項目的現(xiàn)金流量中經(jīng)營成本與會計中的?總成本費用?概念有根本的不同,不包括A)利息支出B)攤銷費C)折舊費D)維修費[多選題]162.層次聚類的聚類方式有()A)凝聚方式聚類B)分解方式聚類C)Q型聚類D)R型聚類[多選題]163.在PTN構(gòu)建的承載網(wǎng)絡(luò)中,經(jīng)常會用到鏈路聚合技術(shù)來實現(xiàn)對端口的保護(hù)和擴(kuò)大鏈路帶寬。使用U2000網(wǎng)管進(jìn)行監(jiān)控工作時,經(jīng)常會發(fā)現(xiàn)有LAG_MEMBER_DOWN告警上報,則觸發(fā)該告警上報的原因有A)端口的物理連接不可用B)聚合組端口運行了LACP,但LACP報文收發(fā)不正常C)端口誤碼越限D(zhuǎn))聚合組端口有環(huán)回設(shè)置[多選題]164.季節(jié)變動主要是由()引起的。A)自然災(zāi)害B)政治事件C)制度.法律.習(xí)俗D)自然界的季節(jié)變化[多選題]165.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述正確的有A)神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒B)可以處理冗余特征C)訓(xùn)練ANN是一個很耗時的過程D)至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)[多選題]166.影響基本K-均值算法的主要因素包括()A)初始類中心的選取B)樣本相似性的度量C)樣本輸入順序D)K值的設(shè)定[多選題]167.以下屬于分類器評價或比較尺度的有()A)預(yù)測準(zhǔn)確度B)召回率C)模型描述的簡潔度D)F1-Score[多選題]168.如下表student中,如何篩選type為包含數(shù)學(xué)或語文的記錄?IDtypescoreA01數(shù)學(xué)78A02語文76A03英語90A04數(shù)學(xué)68A05英語84A)select*fromstudentwheretype=?數(shù)學(xué)?andtype=?語文?B)select*fromstudentwheretype=?數(shù)學(xué)?ortype=?語文?C)select*fromstudentwheretypein(?數(shù)學(xué)?,?語文?)D)select*fromstudentwheretypein(?數(shù)學(xué)???語文?)[多選題]169.在比較不同預(yù)測方法的精確度時,通常采用()等誤差指標(biāo)來衡量預(yù)測誤差的大小。A)絕對誤差B)相對誤差C)平均誤差D)隨機(jī)誤差[多選題]170.電子元器件:A)電子管B)晶體管C)小規(guī)模中規(guī)模集成電路D)大規(guī)模或超大規(guī)模集成電路[多選題]171.根據(jù)《中國移動統(tǒng)一DPI設(shè)備規(guī)范》,移動網(wǎng)數(shù)據(jù)XDR包含那幾個部分()A)特定業(yè)務(wù)信息B)移動網(wǎng)通用信息C)通用業(yè)務(wù)信息D)公共信息[多選題]172.()這些數(shù)據(jù)特性都是對聚類分析具有很強(qiáng)影響的。A)高維性B)規(guī)模C)稀疏性D)噪聲和離群點[多選題]173.以下哪個分布是右偏分布()A)均勻分布B)卡方分布C)F分布D)對數(shù)正態(tài)分布[多選題]174.不屬于貝葉斯信念網(wǎng)絡(luò)特點的是A)構(gòu)造網(wǎng)絡(luò)比較復(fù)雜B)模型過分問題的魯棒性好C)不適合處理不完整的數(shù)據(jù)D)網(wǎng)絡(luò)結(jié)構(gòu)確定后無法添加變量[多選題]175.關(guān)于DPI采集的xDRID,下面說法不正確的是?()A)一個信令流程或業(yè)務(wù)傳輸過程生成一個XDR_IDB)不同接口的xDRID不同C)一個XDR_ID可能對應(yīng)同一信令流程中的多條原始消息記錄D)同一用戶的XDRID永遠(yuǎn)相同[多選題]176.關(guān)于基準(zhǔn)收益率的表述,正確的是()A)基準(zhǔn)收益率越高越好B)基準(zhǔn)收益率越低越好,但不能低于銀行貸款利率C)可以采用項目加權(quán)平均資金成本為基礎(chǔ)確定基準(zhǔn)收益率D)可以采用國家有關(guān)部門或行業(yè)統(tǒng)一發(fā)布的行業(yè)基準(zhǔn)收益率[多選題]177.根據(jù)XDR類型的不同,原始碼流的內(nèi)容不同,如果是業(yè)務(wù)XDR,原始碼流則包含原始業(yè)務(wù)數(shù)據(jù)中的哪些部分A)LinkTypeB)CardTypeC)CardIDD)payload[多選題]178.我們可以用哪種方式來避免決策樹過度擬合的問題?()A)利用修剪法來限制樹的深度B)利用盆栽法規(guī)定每個節(jié)點下的最小的記錄數(shù)C)利用逐步回歸法來刪除部分?jǐn)?shù)據(jù)D)目前并無適合的方法來處理這問題[多選題]179.下面描述正確的有()A)人工智能也稱為機(jī)器智能,是指由人工創(chuàng)造出來的系統(tǒng)所表現(xiàn)的智能B)機(jī)器學(xué)習(xí)是實現(xiàn)人工智能的一種方法C)深度學(xué)習(xí)是實現(xiàn)機(jī)器學(xué)習(xí)的一種技術(shù)D)人工智能技術(shù)指的是使用機(jī)器學(xué)習(xí)算法實現(xiàn)的技術(shù)[多選題]180.常見的特征選擇方式包括()A)過濾法B)嵌入法C)包裝法D)主成分分析[多選題]181.以下哪個聚類分析的方法是利用統(tǒng)計學(xué)定義的距離進(jìn)行度量()A)層次聚類法B)快速聚類法(K-Means)C)基于密度的聚類法D)基于網(wǎng)格的聚類法[多選題]182.數(shù)據(jù)挖掘(DataMining)就是從()實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。A)大量的B)不完全的C)有噪聲的D)模糊的[多選題]183.下列關(guān)于機(jī)器學(xué)習(xí)中L1正則化和L2正則化的描述正確的是?()A)使用L1可以得到稀疏的權(quán)值B)使用L1可以得到平滑的權(quán)值C)使用L2可以得到稀疏的權(quán)值D)使用L2可以得到平滑的權(quán)值[多選題]184.如下那些不是基于規(guī)則分類器的特點A)規(guī)則集的表達(dá)能力遠(yuǎn)不如決策樹好B)基于規(guī)則的分類器都正確屬性空間進(jìn)行直線劃分,并將類指派到每個劃分C)無法被用來產(chǎn)生更易于解釋的描述性模型D)非常適合處理類分布不平衡的數(shù)據(jù)集[多選題]185.下面那個TCP/IP傳輸層協(xié)議提供了端到端面向事務(wù)的高效連接服務(wù)A)IPB)TCPC)UDPD)ICMP[多選題]186.diameter基本協(xié)議運行在()傳輸協(xié)議上A)SNMPB)SCTPC)TCPD)UDP[多選題]187.可以應(yīng)用失敗碼定界法的指標(biāo)包括A)附著成功率B)HTTP響應(yīng)成功率C)TAU成功率D)TCP建立成功率[多選題]188.在聚類分析當(dāng)中,()等技術(shù)可以處理任意形狀的簇。A)MIN(單鏈)B)MAX(全鏈)C)組平均D)Chameleon[多選題]189.正確于數(shù)據(jù)挖掘中的原始數(shù)據(jù),存在的問題有?A)不一致B)重復(fù)C)不完整D)含噪聲E)維度高[多選題]190.下面哪些屬于可視化高維數(shù)據(jù)技術(shù)()A)矩陣B)平行坐標(biāo)系C)星形坐標(biāo)D)散布圖E)Chernoff臉[多選題]191.數(shù)據(jù)挖掘算法按挖掘目的分類可分為哪幾種()A)概念描述B)強(qiáng)化學(xué)習(xí)C)關(guān)聯(lián)規(guī)則分析D)分類與預(yù)測E)異常分析第3部分:判斷題,共55題,請判斷題目是否正確。[判斷題]192.文件對象的tell()方法用來返回文件指針的當(dāng)前位置。A)正確B)錯誤[判斷題]193.多種屬性相似度的綜合度量,可以先對單個屬性進(jìn)行相似度度量,然后求所有屬性相似度的均值作為整個對象相似度。A)正確B)錯誤[判斷題]194.二進(jìn)制文件不能使用記事本程序打開。A)正確B)錯誤[判斷題]195.在模型樹的構(gòu)建過程中,分裂屬性的選擇以分裂后的各個子數(shù)據(jù)集中目標(biāo)屬性取值的標(biāo)準(zhǔn)差為依據(jù),將標(biāo)準(zhǔn)差作為一種誤差度量,將分裂前后標(biāo)準(zhǔn)差的減少量作為誤差的期望減少,稱為SDR。A)正確B)錯誤[判斷題]196.Python內(nèi)置字典是無序的,如果需要一個可以記住元素插入順序的字典,可以使用Collections.OrderedDict。A)正確B)錯誤[判斷題]197.在K-中心點聚類算法中,非中心對象可以替代中心對象的條件是替代后總代價大于零。A)正確B)錯誤[判斷題]198.聚類(clustering)是這樣的過程:它找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測類標(biāo)記未知的對象類。()A)正確B)錯誤[判斷題]199.輪廓系數(shù)是將凝聚度和分離度相結(jié)合的一種度量,越大聚類效果越好。A)正確B)錯誤[判斷題]200.在一元線性回歸模型中,變量顯著性檢驗與方程顯著性檢驗都要進(jìn)行,不能相互替代。A)正確B)錯誤[判斷題]201.通過數(shù)據(jù)離散化,可以實現(xiàn)縮減數(shù)據(jù)量的效果。A)正確B)錯誤[判斷題]202.當(dāng)以指定?鍵?為下標(biāo)給字典對象賦值時,若該?鍵?存在則表示修改該?鍵?對應(yīng)的?值?,若不存在則表示為字典對象添加一個新的?鍵-值對?。A)正確B)錯誤[判斷題]203.如果某產(chǎn)品的生產(chǎn)和銷售正處于市場成長期,其營銷重點應(yīng)該是延長產(chǎn)品壽命。A)正確B)錯誤[判斷題]204.通用爬蟲可以選擇性地爬取與預(yù)先定義好的主題相關(guān)的頁面。A)正確B)錯誤[判斷題]205.可信度是對關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。()A)正確B)錯誤[判斷題]206.大數(shù)據(jù)的4V特點是Volume、Velocity、Variety、Veracity。()A)正確B)錯誤[判斷題]207.天氣屬性值中?晴天?和?多云?可以用不同的數(shù)字來表示,它們沒有前后次序關(guān)系A(chǔ))正確B)錯誤[判斷題]208.調(diào)用函數(shù)時傳遞的實參個數(shù)必須與函數(shù)形參個數(shù)相等才行。A)正確B)錯誤[判斷題]209.數(shù)據(jù)預(yù)處理可能是整個知識發(fā)現(xiàn)過程中最耗時的步驟。()A)正確B)錯誤[判斷題]210.商業(yè)智能系統(tǒng)與一般交易系統(tǒng)之間在系統(tǒng)設(shè)計上的主要區(qū)別在于:后者把結(jié)構(gòu)強(qiáng)加于商務(wù)之上,一旦系統(tǒng)設(shè)計完畢,其程序和規(guī)則不會輕易改變;而前者則是一個學(xué)習(xí)型系統(tǒng),能自動適應(yīng)商務(wù)不斷變化的要求。A)正確B)錯誤[判斷題]211.在決策樹中,隨著樹中結(jié)點數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗誤差開始增大,這是出現(xiàn)了模型擬合不足的問題。()A)正確B)錯誤[判斷題]212.內(nèi)部收益率考慮了資金時間價值,受折現(xiàn)率高低的影響。A)正確B)錯誤[判斷題]213.OLAP技術(shù)側(cè)重于把數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析、轉(zhuǎn)換成輔助決策信息,是繼數(shù)據(jù)庫技術(shù)發(fā)展之后迅猛發(fā)展起來的一種新技術(shù)。A)正確B)錯誤[判斷題]214.模型樹構(gòu)建之后,為了避免過度擬合,需要對模型樹進(jìn)行剪枝。A)正確B)錯誤[判斷題]215.擴(kuò)展庫numpy中的append()函數(shù)和insert()函數(shù)是在原數(shù)組的基礎(chǔ)上追加或插入元素,沒有返回值。A)正確B)錯誤[判斷題]216.回歸分析與分類都屬于有監(jiān)督學(xué)習(xí),解決問題的過程相同,都是先通過訓(xùn)練數(shù)據(jù)集進(jìn)行學(xué)習(xí),以得到一個模型然后利用模型進(jìn)行預(yù)測。A)正確B)錯誤[判斷題]217.表達(dá)式(i**2foriinrange(100))的結(jié)果是個元組。A)正確B)錯誤[判斷題]218.回歸分析主要確定變量之間是否存在相關(guān)關(guān)系,而相關(guān)關(guān)系是一種確定性的關(guān)系。A)正確B)錯誤[判斷題]219.凝聚度是用于衡量簇間相似程度的,凝聚度越大越好。A)正確B)錯誤[判斷題]220.read方法可以按字節(jié)讀取數(shù)據(jù)A)正確B)錯誤[判斷題]221.決策樹中基于信息增益分裂準(zhǔn)則的一個缺陷是它趨向于多值屬性。()A)正確B)錯誤[判斷題]222.二元類屬性值通常用0或1表示,可進(jìn)行大小比較A)正確B)錯誤[判斷題]223.通過driver的get()方法可以將頁面的內(nèi)容加載到瀏覽器的對象中,如果頁面沒有加載完,此方法會一直阻塞等待。A)正確B)錯誤[判斷題]224.數(shù)據(jù)規(guī)范化指將數(shù)據(jù)按比例縮放(如更換大單位),使之落入一個特定的區(qū)域(如0-1)以提高數(shù)據(jù)挖掘效率的方法。規(guī)范化的常用方法有:最大-最小規(guī)范化、零-均值規(guī)范化、小數(shù)定標(biāo)規(guī)范化。()A)正確B)錯誤[判斷題]225.一元線性回歸的步驟:構(gòu)建包含因變量和自變量的訓(xùn)練集;通過散點圖確認(rèn)因變量和自變量之前的近似線性關(guān)系;計算系數(shù)和構(gòu)建模型;模型檢驗;利用模型進(jìn)行預(yù)測。A)正確B)錯誤[判斷題]226.正則表達(dá)式?^\d{18}|\d{15}$?只能檢查給定字符串是否為18位或15位數(shù)字字符,并不能保證一定是合法的身份證號。A)正確B)錯誤[判斷題]227.resquests庫中的get()方法可以只有一個參數(shù)A)正確B)錯誤[判斷題]228.噪聲數(shù)據(jù)就是錯誤的數(shù)據(jù)。A)正確B)錯誤[判斷題]229.JSONPath是一種信息抽取類庫,用于從JSON文檔中抽取指定信息。A)正確B)錯誤[判斷題]230.K近鄰方法的核心思想是對一個預(yù)測樣本A,從訓(xùn)練數(shù)據(jù)集中找到與其最相似的k個樣本,利用這個k個樣本的類別來決策該樣本A的類別。A)正確B)錯誤[判斷題]231.回歸系數(shù)的檢驗可以采用t檢驗。A)正確B)錯誤[判斷題]232.DBSCAN是相對抗噪聲的,并且能夠處理任意形狀和大小的簇。()A)正確B)錯誤[判斷題]233.分別是用戶給定的最小支持度和最小置信度的閾值。A)正確B)錯誤[判斷題]234.列表對象的排序方法sort()只能按元素從小到大排列,不支持別的排序方式。A)正確B)錯誤[判斷題]235.一般而言,定量預(yù)測方法在滿足下列三個條件時才能使用:一是能夠知道待測變量的過去值,二是信息可以量化,三是過去的變動形式將持續(xù)到未來是一個合理的假設(shè)。A)正確B)錯誤[判斷題]236.假設(shè)有非空列表x,那么x.append(3)、x=x+[3]與x.insert(0,3)在執(zhí)行時間上基本沒有太大區(qū)別。A)正確B)錯誤[判斷題]237.在使用bs4庫調(diào)用find()方法查找節(jié)點時,只能將字符串作為參數(shù)。A)正確B)錯誤[判斷題]238.Python字典和集合支持雙向索引。A)正確B)錯誤[判斷題]239.k均值算法對于離群點不敏感。()A)正確B)錯誤[判斷題]240.已知列表x=[1,2,3,4],那么表達(dá)式x.find(5)的值應(yīng)為-1。A)正確B)錯誤[判斷題]241.先驗原理可以表述為:如果一個項集是頻繁的,那包含它的所有項集也是頻繁的。A)正確B)錯誤[判斷題]242.聚類分析中,各變量的取值在數(shù)量級上不能有過大的差異。A)正確B)錯誤[判斷題]243.K近鄰數(shù)值預(yù)測是利用一個樣本的K個最相似的鄰居的目標(biāo)屬性的取值來進(jìn)行預(yù)測。A)正確B)錯誤[判斷題]244.同一個列表對象中的元素類型可以各不相同。A)正確B)錯誤[判斷題]245.維歸約可以去掉不重要的屬性,減少數(shù)據(jù)立方體的維數(shù),從而減少數(shù)據(jù)挖掘處理的數(shù)據(jù)量,提高挖掘效率。()A)正確B)錯誤[判斷題]246.數(shù)據(jù)根據(jù)計量尺度不同可以分為分類數(shù)據(jù)和數(shù)值型數(shù)據(jù)。A)正確B)錯誤第4部分:問答題,共14題,請在空白處填寫正確答案。[問答題]247.BIRCH算法利用()來實現(xiàn)快速的聚類。這棵樹的每一個節(jié)點是由若干個()組成。[問答題]248.表達(dá)式set([1,1,2,3])的值為__________。[問答題]249.已知x=list(range(10)),則表達(dá)式x[-4:]的值為____。[問答題]250.常見的組合方法有裝袋、()和()。[問答題]251.在K-中心點算法中,如果某樣本點成為____后,絕對誤差能小于____所造成的絕對誤差,那么K-中心點算法認(rèn)為該樣本點是可以取代____的。[問答題]252.一組數(shù)據(jù):20,40,50,58,65,80,80,82,86,90,96,105,120,200。使用最大-最小法進(jìn)行數(shù)據(jù)規(guī)范化,目標(biāo)區(qū)間為[0,1],則80映射到新區(qū)間后的值為()。(四舍五入保留小數(shù)點后兩位)[問答題]253.已知列表x=[1,2],那么表達(dá)式list(enumerate(x))的值為_____。[問答題]254.如果要獲取Response類中字符串形式的響應(yīng)內(nèi)容,可以訪問____屬性獲取。[問答題]255.假設(shè)re模塊已導(dǎo)入,那么表達(dá)式re.findall(?(\d)\1+?,?33abcd112?)的值為_________。[問答題]256.5.常用的評估分類方法準(zhǔn)確率的技術(shù)有()和()。[問答題]257.數(shù)據(jù)挖掘是從數(shù)據(jù)中發(fā)掘知識的過程,在這個過程中___和____可以作為挖掘工具,____可以被看作是土壤,_____可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。[問答題]258.在分類算法中score()用來計算____集的準(zhǔn)確率,len(Z[Z==0])/len(Z)用來計算____集的準(zhǔn)確率。[問答題]259.在設(shè)計正則表達(dá)式時,字符_緊隨任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后時,匹配模式是?非貪心的?,匹配搜索到的、盡可能短的字符串。[問答題]260.數(shù)據(jù)挖掘是從___的、有____的、不____的、模糊和隨機(jī)的數(shù)據(jù)中,提取出隱含在其中的、人們事先不知道的、具有潛在_____的信息和知識的過程。1.答案:A解析:2.答案:A解析:3.答案:A解析:4.答案:C解析:5.答案:A解析:6.答案:A解析:7.答案:D解析:8.答案:A解析:9.答案:A解析:10.答案:A解析:11.答案:B解析:12.答案:D解析:13.答案:D解析:14.答案:A解析:15.答案:A解析:16.答案:D解析:17.答案:B解析:18.答案:A解析:19.答案:B解析:20.答案:C解析:21.答案:C解析:22.答案:D解析:23.答案:C解析:24.答案:A解析:25.答案:B解析:26.答案:C解析:27.答案:D解析:28.答案:D解析:29.答案:B解析:30.答案:B解析:31.答案:A解析:32.答案:A解析:33.答案:A解析:34.答案:A解析:35.答案:B解析:36.答案:B解析:37.答案:A解析:38.答案:A解析:39.答案:A解析:40.答案:B解析:41.答案:A解析:42.答案:A解析:43.答案:A解析:44.答案:C解析:45.答案:C解析:46.答案:A解析:47.答案:C解析:48.答案:B解析:49.答案:A解析:50.答案:D解析:51.答案:C解析:52.答案:D解析:53.答案:A解析:54.答案:A解析:55.答案:A解析:56.答案:D解析:57.答案:D解析:58.答案:C解析:59.答案:C解析:60.答案:C解析:61.答案:C解析:62.答案:A解析:63.答案:C解析:64.答案:A解析:65.答案:A解析:66.答案:D解析:題型:67.答案:C解析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 入股買賣合同范本
- 分包合同范例電工
- 借款委托合同范例
- 公司舊廠房租賃合同范例
- 兒童家庭服務(wù)合同范例
- 專家集體跳槽合同范例
- 農(nóng)場租憑合同范例
- 出租大塊土地合同范例
- 崔炳元鋼琴曲《秦俑》中的民族化特征分析及演奏實踐
- 借款不還抵押合同范例
- 2024機(jī)械車間裝配作業(yè)指導(dǎo)書
- 城市污水處理廠改造施工方案
- 八項規(guī)定解讀
- 2024年高等教育法學(xué)類自考-00369警察倫理學(xué)考試近5年真題集錦(頻考類試題)帶答案
- 礦山開采居間合作協(xié)議書范文
- 社交媒體對消費者行為的影響調(diào)研報告
- 人防工程管理制度范本(三篇)
- GB/T 15822.1-2024無損檢測磁粉檢測第1部分:總則
- 計算機(jī)一級考試WPS試題及答案
- 快樂讀書吧《孤獨的小螃蟹》整本書閱讀指導(dǎo)課教學(xué)設(shè)計-2023-2024學(xué)年語文二年級上冊統(tǒng)編版
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗人員理論考試題庫及答案
評論
0/150
提交評論