大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷4)_第1頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷4)_第2頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷4)_第3頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷4)_第4頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷4)_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)挖掘技術(shù)練習(xí)大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷4)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術(shù)練習(xí)第1部分:單項選擇題,共144題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱為()。A)分位數(shù)B)中位數(shù)C)眾數(shù)[單選題]2.MGW與RNC的連接介質(zhì)采用A)IP傳輸B)PCM傳輸C)ATM傳輸[單選題]3.已知:d={123:'Tom','age':18,'score':[91,92,93]}print(d[123][1],d['age'],d['score'][-1])輸出的結(jié)果是:A)T,18,91B)o,18,91C)T,18,92D)o,18,93[單選題]4.k均值聚類的目標(biāo)是()。A)最大化簇間距離B)最大化質(zhì)心距離C)簇的大小基本一致D)最小化簇內(nèi)距離的平方和[單選題]5.在TDLTE網(wǎng)絡(luò)中,用戶的業(yè)務(wù)屬性數(shù)據(jù)是在哪個網(wǎng)元上配置?A)MMEB)PDNGatewayC)HSSD)eNodeB[單選題]6.為了簡化條件概率的計算,樸素貝葉斯算法提出條件假設(shè)(用于分類的特征在類別確定的條件下相互獨(dú)立)即()的意義A)簡化B)樸素C)分類D)統(tǒng)計[單選題]7.下列哪項不是物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量關(guān)鍵性能指標(biāo)()A)業(yè)務(wù)傳輸速率B)TCP重傳率C)TCP亂序率D)http首包響應(yīng)時延[單選題]8.連續(xù)屬性離散化的問題本質(zhì)是:決定選擇多少個分割點和確定分割點位置。任務(wù)可分為兩個步驟完成。首先將連續(xù)屬性排序,并通過指定n-1個分割點把它們分成n個區(qū)間。然后,將一個區(qū)間中的所有值映射到相同的()。A)分類值B)平均值C)特征值D)最大值[單選題]9.有關(guān)強(qiáng)關(guān)聯(lián)規(guī)則的敘述中正確的是()。A)強(qiáng)關(guān)聯(lián)規(guī)則是同時滿足最小支持度閾值和最小置信度閾值的規(guī)則B)強(qiáng)關(guān)聯(lián)規(guī)則是滿足最小支持度閾值的規(guī)則C)強(qiáng)關(guān)聯(lián)規(guī)則是滿足最小置信度閾值的規(guī)則D)所有的規(guī)則都是強(qiáng)關(guān)聯(lián)規(guī)則[單選題]10.Lasso回歸與傳統(tǒng)的線性回歸最主要的區(qū)別是()A)增加L1正則項B)增加L2正則項C)無區(qū)別D)Lasso回歸是線性方程在sigmoid函數(shù)上的嵌套[單選題]11.網(wǎng)管側(cè)從愛立信MME取走統(tǒng)計的路徑是A)/Tmp/log/OSS_filesB)/Tmp/OSS_filesC)/Core/log/OSS_filesD)/log/OSS_files[單選題]12.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯誤的是()A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B)在分析方法上更注重相關(guān)分析而不是因果分析C)在分析效果上更追究效率而不是絕對精確D)在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)[單選題]13.提升決策樹法訓(xùn)練效率的措施包括A)增加樹的深度B)減少數(shù)的深度C)增加學(xué)習(xí)率D)減少樹的個數(shù)[單選題]14.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?A)變量代換B)離散化C)聚集D)估計遺漏值[單選題]15.以下關(guān)于Python語言中?縮進(jìn)?說法正確的是:A)縮進(jìn)統(tǒng)一為4個空格B)縮進(jìn)在程序中長度統(tǒng)一且強(qiáng)制使用C)縮進(jìn)是非強(qiáng)制的,僅為了提高代碼可讀性D)縮進(jìn)可以用在任何語句之后,表示語句間的包含關(guān)系[單選題]16.直播類視頻APP中,哪類用戶滲透率最高A)男性B)女性C)學(xué)生D)白領(lǐng)[單選題]17.KNN算法流程中不正確的有()A)計算已知類別數(shù)據(jù)集中的點與當(dāng)前點之間的距離,按照距離遞增次序排序;B)選取與當(dāng)前點距離最小的k個點;C)確定前k個點所在類別對應(yīng)的出現(xiàn)頻率;D)返回前k個點出現(xiàn)頻率最低的類別作為當(dāng)前點的預(yù)測分類。[單選題]18.如果要在網(wǎng)管上建立GE級別的業(yè)務(wù)路徑,下面哪一個不是必需的A)完整的Och路徑B)完整的ODU1路徑C)完整的OMS路徑D)完整的OSC路徑[單選題]19.有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,下列說法()是不正確的。A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)B)數(shù)據(jù)倉庫使用的需求在開發(fā)出來后才會明確C)數(shù)據(jù)倉庫開發(fā)是一個不斷循環(huán)的過程D)數(shù)據(jù)倉庫中數(shù)據(jù)的分析和處理十分靈活,沒有固定的開發(fā)模式[單選題]20.下面不屬于人工智能研究基本內(nèi)容是()A)機(jī)器感知B)機(jī)器學(xué)習(xí)C)自動化D)機(jī)器思維[單選題]21.OnRetDW系統(tǒng)建模采用的是()。A)星形模型B)雪花模型C)事實星座模型D)關(guān)系數(shù)據(jù)庫模型[單選題]22.關(guān)于OLAP的特性,下面正確的是:()(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性A)(1)B)(2)C)(1)D)(1)[單選題]23.在CBD商圈,以下哪款手機(jī)的滲透率最高A)華為B)小米C)三星D)蘋果[單選題]24.在抽樣方法中,當(dāng)合適的樣本容量很難確定時,可以使用的抽樣方法是:A)有放回的簡單隨機(jī)抽樣B)無放回的簡單隨機(jī)抽樣C)分層抽樣D)漸進(jìn)抽樣[單選題]25.決策樹中不包含()A)根結(jié)點B)內(nèi)部結(jié)點C)外部結(jié)點D)葉子結(jié)點[單選題]26.列表對象的sort()方法用來對列表元素進(jìn)行原地排序,該函數(shù)返回值為()A)errorB)1C)0D)None[單選題]27.0.5)能夠計算x的平方根,計算負(fù)數(shù)的平方根將產(chǎn)生:A)程序崩潰B)復(fù)數(shù)C)ValueError錯誤D)無輸出[單選題]28.假設(shè)所分析的的數(shù)據(jù)包括屬性age,它在數(shù)據(jù)元組中的值(以遞增序)為13,15,16,16,19,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70,它的中位數(shù)是多少A)25B)30C)29.963D)35[單選題]29.用信息增益方法作為屬性選擇度量建立決策樹時,已知某訓(xùn)練樣本集的4個條件屬性的信息增益分別為:G(收人)=0.940位,G(職業(yè))=0.151位,G(年齡)0.780位,G(信譽(yù))=0.048位,則應(yīng)該選擇()屬性作為決策樹的測試屬性。A)收入B)職業(yè)C)年齡D)信譽(yù)[單選題]30.為了比較利用不同分類算法構(gòu)建的分類模型的性能,可以利用圖形進(jìn)行比較,常用的圖形包括()。A)條形圖B)ROC曲線C)餅圖D)直方圖[單選題]31.下列關(guān)于人工智能敘述不正確的有()A)人工智能是科學(xué)技術(shù)發(fā)展趨勢B)人工智能有力的促進(jìn)了社會發(fā)展C)AI沒有真的到來D)人工智能技術(shù)與其他科學(xué)技術(shù)相結(jié)合極大提高應(yīng)用技術(shù)的智能化水平[單選題]32.在基于規(guī)則分類器的中,依據(jù)規(guī)則質(zhì)量的某種度量對規(guī)則排序,保證每一個測試記錄都是由覆蓋它的?最好的?規(guī)格來分類,這種方案稱為A)基于類的排序方案B)基于規(guī)則的排序方案C)基于度量的排序方案D)基于規(guī)格的排序方案。[單選題]33.余弦相似度適用于()情況。A)屬性類型多B)屬性數(shù)量多C)距離相近D)有大量零值維度[單選題]34.Python在調(diào)用efficient-apriori包中的apriori函數(shù)進(jìn)行挖掘關(guān)聯(lián)規(guī)則時,第二個返回值是()。A)最小支持度B)關(guān)聯(lián)規(guī)則C)頻繁項集D)最小置信度[單選題]35.交叉驗證如果設(shè)置K=5,會訓(xùn)練幾次?()A)4B)5C)6D)7[單選題]36.大數(shù)據(jù)分析挖掘流程正確的是()。A)業(yè)務(wù)理解→數(shù)據(jù)理解→數(shù)據(jù)準(zhǔn)備→建立模型→模型評估;B)業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→數(shù)據(jù)理解→建立模型→模型評估;C)業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→數(shù)據(jù)理解→模型評估→建立模型;D)業(yè)務(wù)理解→數(shù)據(jù)準(zhǔn)備→模型評估→數(shù)據(jù)理解→建立模型[單選題]37.從購物籃商品集中找出商品與商品之間的關(guān)系,有助于發(fā)現(xiàn)同商品之間的聯(lián)系()A)聚類B)分類C)預(yù)測D)關(guān)聯(lián)[單選題]38.Requests庫中,下面哪個是檢查Response對象返回是否成功的狀態(tài)屬性?A)raise_for_statusB)headersC)status_codeD)status[單選題]39.以下OLAP操作中()的作用是改變維的層次,變換分析的粒度。A)切塊B)平移C)鉆取D)切片[單選題]40.下列哪個不是專門用于可視化時間空間數(shù)據(jù)的技術(shù):A)等高線圖B)餅圖C)曲面圖D)矢量場圖[單選題]41.變量y與x之間的回歸方程()。A)表示y與x之間的函數(shù)關(guān)系B)表示y與x之間的不確定性關(guān)系C)反映y與x之間真實關(guān)系的形式D)反映y與x之間的真實關(guān)系達(dá)到最大限度的吻合[單選題]42.以下指標(biāo)中,與終端性能無關(guān)的指標(biāo)是A)http響應(yīng)時延B)TCP2、3次握手成功率C)4G用戶附著成功率D)視頻緩沖時長[單選題]43.人工智能時代來臨,新競技將更加殘酷,在商場上可行的是()A)不放棄既原有市場,寄望通過專利保護(hù)來阻擋新技術(shù)B)面對革命性的技術(shù)出現(xiàn),依然固守傳統(tǒng)思維與產(chǎn)品C)退出商場D)開放的心態(tài)迎接人工智能的到來,積極適應(yīng)新市場,學(xué)習(xí)創(chuàng)造新技術(shù)[單選題]44.主成分分析方法PCA屬于屬于python中的哪個包()。A)sklearnB)numpyC)pandasD)scipy[單選題]45.下列___不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A)與同一時期其他數(shù)據(jù)對比B)可視化C)基于模板的方法D)主觀興趣度量[單選題]46.在sklearn中,下面哪個類或方法,位于preprocessing模塊()A)train_test_splitB)LabelEncoderC)accuracy_scoreD)DecisionTreeClassifier[單選題]47.720P視頻源分辨率為()A)4096*2304B)1920*1080C)720*576D)1280*720[單選題]48.Zookeeper是A)集群協(xié)調(diào)服務(wù)B)分布式應(yīng)用C)AB都不對D)AB都對[單選題]49.以下不屬于開源的數(shù)據(jù)挖掘工具是()A)RapidMinerB)NLTKC)KNIMED)WEKA[單選題]50.考慮這么一種情況:一個對象碰巧與另一個對象相對接近,但屬于不同的類,因為這兩個對象一般不會共享許多近鄰,所以應(yīng)該選擇()的相似度計算方法。A)平方歐幾里德距離B)余弦距離C)直接相似度D)共享最近鄰[單選題]51.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯誤的有A)神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒B)可以處理冗余特征C)訓(xùn)練ANN是一個很耗時的過程D)至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)[單選題]52.谷歌瀏覽器開發(fā)者模式打開方式不正確的為()A)F12B)F11C)鼠標(biāo)右擊,點?檢查?D)Ctrl+Shift+I[單選題]53.對于客戶信息操作的日志應(yīng)完整準(zhǔn)確記錄,確保所有操作可追溯到具體的操作人和操作依據(jù),杜絕擅自篡改、刪除記錄等違規(guī)行為。屬于《中國移動客戶信息安全保護(hù)管理規(guī)定》中的那種原則A)敏感數(shù)據(jù)不出網(wǎng)原則B)質(zhì)量保證原則C)可追溯原則D)最少夠用原則[單選題]54.貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。A)極大似然概率B)先驗概率C)邊際概率D)后驗概率[單選題]55.關(guān)于OLAP和OLTP的區(qū)別描述,不正確的是:()A)OLAPB)與C)OLAPD)OLAP[單選題]56.在發(fā)生或者可能發(fā)生個人信息泄露、毀損、丟失的情況時,應(yīng)當(dāng)立即采取()措施,按照規(guī)定及時告知用戶并向有關(guān)主管部門報告。()A)彌補(bǔ)B)補(bǔ)救C)救援D)相關(guān)[單選題]57.OLAP技術(shù)的核心是:()A)在線性;B)對用戶的快速響應(yīng);C)互操作性.D)多維分析[單選題]58.檢查省公司統(tǒng)一DPI系統(tǒng)設(shè)備安全配置合規(guī)率情況,安全配置合規(guī)率應(yīng)不低于()A)99%B)95%C)90%D)85%[單選題]59.以下敘述中()是正確的。A)在聚類中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差B)聚類通常是無指導(dǎo)的C)k-均值是一種基于密度的聚類算法,簇的個數(shù)由算法自動地確定D)給定由兩次運(yùn)行k-均值產(chǎn)生的兩個不同的簇集,誤差的平方和最大的那個應(yīng)該被視為較優(yōu)[單選題]60.MR數(shù)據(jù)引入對基站建設(shè)規(guī)劃的主要增益在于A)弱覆蓋區(qū)域識別B)網(wǎng)速慢區(qū)域識別C)高干擾區(qū)域識別D)高價值區(qū)域識別[單選題]61.以下哪個算法是無監(jiān)督學(xué)習(xí)算法()A)DBSCANB)RandomForestRegressorC)KNND)SVC[單選題]62.BIRCH是一種(B)。A)分類器B)聚類算法C)關(guān)聯(lián)分析算法D)特征選擇算法[單選題]63.決策樹的葉子結(jié)點對應(yīng)()。A)一個數(shù)值B)以上都可以C)某個類別D)一個線性回歸方程[單選題]64.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測模型,常用于()分類變量預(yù)測和概率預(yù)測。A)四值B)三值C)二值D)一值[單選題]65.KNN的英文全寫為()A)k-NearerNeighborB)k-NearestNeighborC)k-NearNeighborsD)k-NearestNeighbors[單選題]66.k均值聚類的目標(biāo)是()。A)最大化質(zhì)心距離B)最小化簇內(nèi)距離的平方和C)最大化簇間距離D)簇的大小基本一致[單選題]67.以下哪種算法是分類算法()。A)EMB)C4.5C)DBSCAND)K-Mean[單選題]68.5G時代來臨,萬物互聯(lián)互通將不再只是紙上談兵,互聯(lián)網(wǎng)即將消失,進(jìn)入()時代A)數(shù)據(jù)B)物聯(lián)網(wǎng)C)信息D)共享[單選題]69.有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,不正確的描述是:A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā);B)數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確;C)數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā);D)在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式[單選題]70.面對人工智能存在的諸多倫理道德問題,下列不應(yīng)當(dāng)采取的行動為()A)思考如何將人類的價值觀和規(guī)范嵌入人工智能系統(tǒng),賦予AI以人性的光輝B)開展人工智能倫理的研究和頂層設(shè)計,促進(jìn)民生福祉改善,推進(jìn)行業(yè)健康發(fā)展,掌握新一輪技術(shù)革命的主動權(quán)C)人工智能的倫理,實際上是人的問題。國家和機(jī)構(gòu)需要重視,共同做出更多的努力D)發(fā)展人工智能時面對有問題的地方不去發(fā)展[單選題]71.LTE中采用CP(CyclicPrefix)的主要目的是()A)可以抵抗多徑帶來的ISI和ICIB)可以提高峰值速率C)可以降低PARD)可以減小系統(tǒng)時延[單選題]72.有關(guān)維表中數(shù)據(jù)和維層次設(shè)計的敘述中正確的是()A)維表中數(shù)據(jù)和維層次是開發(fā)人員任意設(shè)計的B)維表中數(shù)據(jù)和維層次是開發(fā)人員根據(jù)項目需求分析來設(shè)計的C)維表中數(shù)據(jù)和維層次是由用戶任意指定的D)以上都不對[單選題]73.通過聚集多個分類器的預(yù)測來提高分類準(zhǔn)確率的技術(shù)稱為A)組合(ensemble)B)聚集(aggregate)C)合并(combination)D)投票(voting)[單選題]74.云計算是對()技術(shù)的發(fā)展與運(yùn)用A)并行計算B)網(wǎng)格計算C)分布式計算D)三個選項都是[單選題]75.Hadoop框架中兩大核心是:()和MapReducEA)H.CFS;B)H.DFSC)H.EFSD)H.FFS[單選題]76.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?A)頻繁模式挖掘B)分類和預(yù)測C)數(shù)據(jù)預(yù)處理D)數(shù)據(jù)流挖掘[單選題]77.當(dāng)前MME測量上報周期為多少()A)5分鐘B)10分鐘C)15分鐘D)1小時[單選題]78.將多個指標(biāo)轉(zhuǎn)化為少數(shù)幾個指標(biāo)的一種統(tǒng)計分析方法是()。A)數(shù)據(jù)預(yù)處理;B)數(shù)據(jù)降維C)主成分分析D)假設(shè)檢驗[單選題]79.MapReduce是一種()計算模型A)集中式;B)分布式C)離散式D)放射式[單選題]80.Mapreduce適用于()A)任意可在windowsservet2008上運(yùn)行的程序B)任意應(yīng)用程序C)可以串行處理的應(yīng)用程序D)可以并行處理的應(yīng)用程序[單選題]81.Python語句A=[1,2,3,None,[[]],[]]Print(len(a))以上代碼的運(yùn)行結(jié)果是()A)4B)5C)6D)7[單選題]82.如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為();A)無序規(guī)則B)窮舉規(guī)則C)互斥規(guī)則D)有序規(guī)則[單選題]83.?點擊率問題?是這樣一個預(yù)測問題,99%的人是不會點擊的,而1%的人是會點擊進(jìn)去的,所以這是一個非常不平衡的數(shù)據(jù)集.假設(shè),現(xiàn)在我們已經(jīng)建了一個模型來分類,而且有了99%的預(yù)測準(zhǔn)確率,我們可以下的結(jié)論是()A)模型預(yù)測準(zhǔn)確率已經(jīng)很高了,我們不需要做什么了B)模型預(yù)測準(zhǔn)確率不高,我們需要做點什么改進(jìn)模型C)無法下結(jié)論D)以上都不對[單選題]84.下列屬于數(shù)據(jù)挖掘任務(wù)的是()。A)根據(jù)年齡對顧客進(jìn)行分組B)統(tǒng)計每個學(xué)生的平均成績C)協(xié)調(diào)公司各部門工作D)利用歷史記錄預(yù)測公司的未來股價[單選題]85.Hadoop擅長支撐hive進(jìn)行()A)數(shù)據(jù)采集B)數(shù)據(jù)計算C)日志存儲D)日志搜索[單選題]86.準(zhǔn)備好數(shù)據(jù),進(jìn)行深度學(xué)習(xí)建模時,第一步需要做的是()A)確定激活函數(shù)B)選擇網(wǎng)絡(luò)結(jié)構(gòu)C)定義學(xué)習(xí)目標(biāo)D)選擇優(yōu)化算法[單選題]87.假設(shè)某屬性的最大值和最小值分別為8000和15000,要將其映射到[0,1],按照最小-最大規(guī)范化方法對屬性進(jìn)行縮放,則12600將變換為:A)0.748B)0.767C)0.715D)0.725[單選題]88.與大數(shù)據(jù)密切相關(guān)的技術(shù)是()。A)藍(lán)牙;B)云計算C)Wi-FiD)博弈論[單選題]89.邁克爾·波特的?五力模型?中,五種競爭力量中不包括()A)新進(jìn)入者B)供應(yīng)商議價能力C)其他利益相關(guān)者力量D)行業(yè)中現(xiàn)有競爭者[單選題]90.eNodeB和SGW之間使用哪種協(xié)議?()A)S1APB)X2APC)GTP-CD)GTP-U[單選題]91.SASEnterpriseMiner的優(yōu)點不包括A)可伸縮性B)良好預(yù)測準(zhǔn)確性C)高處理效率D)有效節(jié)省資源[單選題]92.()是統(tǒng)計學(xué)的基礎(chǔ),是統(tǒng)計學(xué)里面最重要的概率分布A)正態(tài)分布;B)靜態(tài)分布C)動態(tài)分布D)穩(wěn)態(tài)分布[單選題]93.根據(jù)《中國移動集中性能管理應(yīng)用落地手冊-有線寬帶端到端業(yè)務(wù)質(zhì)量分析》,家客業(yè)務(wù)XDR話單不包括以下哪部分?A)DPI話單B)Radius話單C)網(wǎng)絡(luò)資源數(shù)據(jù)D)用戶位置話單[單選題]94.os.path模塊的下列方法,哪個是用來判斷指定路徑是否存在的?A)exists()B)exist()C)getsize()D)isfile()[單選題]95.考慮值集{12243324556826},其四分位數(shù)極差是:A)31B)24C)55D)3[單選題]96.終端分版本指標(biāo)量化分析中,萬終端用戶投訴次數(shù)的定義為A)終端時間業(yè)務(wù)范圍內(nèi)投訴量÷查詢終端總用戶數(shù)×10000B)終端時間范圍內(nèi)投訴量÷查詢終端總用戶數(shù)×10000C)終端時間業(yè)務(wù)范圍內(nèi)重復(fù)投訴用戶數(shù)÷查詢終端總投訴用戶數(shù)D)投訴用戶數(shù)÷終端用戶數(shù)×10000[單選題]97.OLAP的含義是()A)面向?qū)ο蠓治鎏幚鞡)面向過程分析處理C)聯(lián)機(jī)事務(wù)處理D)聯(lián)機(jī)分析處理[單選題]98.文件重命名的方法為()A)writeB)renameC)readD)open[單選題]99.以下不是數(shù)據(jù)挖掘工具的是()A)WEKAB)KNIMEC)ComnosD)Matlab[單選題]100.線性回歸并沒有對數(shù)據(jù)的分布進(jìn)行任何假設(shè),而邏輯回歸隱含了一個基本假設(shè):每個樣本均獨(dú)立服從于()A)泊松分布B)伯努利分布(0-1分布)C)高斯(正態(tài))分布D)伽馬分布[單選題]101.通常,我們可通過實驗測試來對學(xué)習(xí)器的泛化誤差進(jìn)行評估并進(jìn)而做出選擇。為此,需使用一個()來測試學(xué)習(xí)期對新樣本的判別能力A)數(shù)據(jù)集B)測試集C)模型集D)訓(xùn)練集[單選題]102.DHCP支持哪種類型的地址分配()A)自動分配B)動態(tài)分配C)手工分配D)以上[單選題]103.能夠完全匹配字符串?back?和?back-end?的正則表達(dá)式包括()A)r?\w{4}-\w{3}|\w{4}?B)r?\w{4}|\w{4}-\w{3}?C)r?\S±\S+|\S+?D)r?\w*\b-\b\w*|\w*?[單選題]104.數(shù)據(jù)在規(guī)定的時間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為()A)指標(biāo)數(shù)據(jù)自動采集率;B)指標(biāo)數(shù)據(jù)接入率C)指標(biāo)數(shù)據(jù)接入及時率;D)指標(biāo)數(shù)據(jù)完整率[單選題]105.有關(guān)OnRetDw系統(tǒng)的敘述中正確的是()A)OnRetDW系統(tǒng)是一個實現(xiàn)在線交易的系統(tǒng)B)OnRetDW系統(tǒng)是一個可以完成任意商品信息分析的系統(tǒng)C)OnRetDW系統(tǒng)是一個面向特定主題的數(shù)據(jù)倉庫系統(tǒng)D)以上都不對[單選題]106.在某文章很多話中部分或全部提到了顧客的年齡,性別,收入和工作地點,想查找這四個詞之間的聯(lián)系以及聯(lián)系的強(qiáng)弱,可以用()A)回歸方法B)分類方法C)聚類方法D)關(guān)聯(lián)分析[單選題]107.從研究現(xiàn)狀上看,下面不屬于云計算特點的是()A)超大規(guī)模B)虛擬化C)私有化D)高可靠性[單選題]108.以下哪條屬于個人信息影響的評估場景:()A)處理敏感個人信息,利用個人信息進(jìn)行自動化決策B)委托處理個人信息、向第三方提供個人信息、公開個人信息C)向境外提供個人信息D)以上皆是[單選題]109.數(shù)據(jù)倉庫是隨時間變化的,以下敘述中錯誤的是()A)數(shù)據(jù)倉庫隨時間變化不斷增加新的數(shù)據(jù)內(nèi)容B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照C)數(shù)據(jù)倉庫隨時間變化不斷刪去舊的數(shù)據(jù)內(nèi)容D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進(jìn)行重新綜合[單選題]110.下面選項中t不是s的子序列的是()A)S=<{2,4},{3,5,6},{8}>t=<{2},{3,6},{8}>B)S=<{2,4},{3,5,6},{8}>t=<{2},{8}>C)S=<{1,2},{3,4}>t=<{1},{2}>D)S=<{2,4},{2,4}>t=<{2},{4}>[單選題]111.對于任一個頻繁項集X和它的一個非空真子集Y,S=X-Y,規(guī)則S→Y成立的條件是()。A)confidence(→S)≥minconfB)confidence(→Y)<minconfC)confidence(→S)<minconfD)confidence(S→Y)≥minconf[單選題]112.以下哪個指標(biāo)不是用來評估回歸模型()A)R2B)MSE(MeanSquaredError)C)MAE(MeanAbsoluteError)D)Recall[單選題]113.下列度量不具有反演性的是A)系數(shù)B)幾率C)Cohen度量D)興趣因子[單選題]114.人們購買制冷用空調(diào)主要是為了在夏天獲得涼爽空氣,這屬于空調(diào)產(chǎn)品整體概念中的()A)有形產(chǎn)品B)直接產(chǎn)品C)核心產(chǎn)品D)主要產(chǎn)品[單選題]115.若數(shù)據(jù)量較大,下面哪種方式比較適合()A)系統(tǒng)聚類B)快速聚類(k-means)C)A和B都可以D)A和B都不可以[單選題]116.()是一類機(jī)器學(xué)習(xí)技術(shù),在學(xué)習(xí)模型時,它使用標(biāo)記的和未標(biāo)記的實例。A)監(jiān)督學(xué)習(xí)B)無監(jiān)督學(xué)習(xí)C)半監(jiān)督學(xué)習(xí)D)主動學(xué)習(xí)[單選題]117.通過代碼?fromsklearnimportlinear_model?引入線性模型模塊,并通過代碼?reg=linear_model.LinearRegression()?構(gòu)造回歸器對象后,在訓(xùn)練時要調(diào)用的方法是()。A)reg.learn()B)reg.predict()C)reg.train()D)reg.fit()[單選題]118.關(guān)于方差的描述錯誤的是()A)用于兩個或兩個以上樣本均數(shù)差異的顯著性檢驗。B)原假設(shè)是無差異。C)對立假設(shè)是無差異D)在概率論和統(tǒng)計方差衡量隨機(jī)變量或一組數(shù)據(jù)時離散程度的度量[單選題]119.針對非數(shù)值數(shù)據(jù)類型的分類數(shù)據(jù)在Scikit-Learn中分類特征選取的最佳方式是A)映射關(guān)系編碼B)使用DictVectorizer類C)使用dict類D)特征分類編碼[單選題]120.HDFS的數(shù)據(jù)塊大小通常為()A)1MB)64MC)12MD)8M[單選題]121.SQL語句中進(jìn)行空值運(yùn)算時,需要用到的短語是______。A)NULLB)ISNULLC)=NULLD)=ISNULL[單選題]122.決策樹中的InformationGain的計算是用來?A)剪枝B)使樹成長C)處理缺失值和異常值D)砍樹[單選題]123.關(guān)于頻繁模式,下面哪一個陳述是正確的()A)K項集頻繁則K-1項則必定不頻繁B)K項集不頻繁則K-1項則必定不頻繁C)K項集頻繁則K-1項則必定頻繁D)以上說法都不正確[單選題]124.能夠在字符串中匹配?aab?,而不能匹配?aaab?和?aaaab?的正則表達(dá)式()A)r?a*?b?B)r?a{,2}b?C)r?aab?D)r?aaab?[單選題]125.關(guān)于python說法錯誤的是()A)python字典中的?健?可以是元組B)python集合中元素不允許重復(fù)C)python字典中的?值?不允許重復(fù)D)python集合中的元素可以是列表[單選題]126.時間序列與一般的有序變量數(shù)列()A)都是根據(jù)時間順序排列的B)都是根據(jù)變量值大小排列的C)前者是根據(jù)時間順序排列的,后者是根據(jù)變量值大小排列的D)前者是根據(jù)變量值大小排列的,后者是根據(jù)時間順序排列的[單選題]127.設(shè)X={1,2,3}是頻繁項集,則可由X產(chǎn)生____個關(guān)聯(lián)規(guī)則。A)4B)5C)6D)7[單選題]128.NLTK最適用于哪種類型的任務(wù)A)語言處理B)圖像處理C)聲音處理D)文字處理[單選題]129.下列基本術(shù)語描述錯誤的是()A)學(xué)習(xí)(訓(xùn)練):從數(shù)據(jù)中學(xué)得模型的過程B)測試:學(xué)得模型后,使用其樣本進(jìn)行預(yù)測的過程C)分類:輸出結(jié)果是連續(xù)值D)回歸:輸出結(jié)果是連續(xù)值[單選題]130.關(guān)于神經(jīng)網(wǎng)絡(luò)算法,下列描述錯誤的是()A)可以建構(gòu)非線性的模型,模型的準(zhǔn)確度高B)可應(yīng)用的領(lǐng)域相當(dāng)廣泛,模型建構(gòu)能力強(qiáng)。C)計算速度最快的算法D)允許輸出入變量具模糊性,歸納學(xué)習(xí)較難具備此能力。[單選題]131.若有頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},(2,3,4),(2,3,5},{3,4,5},假定數(shù)據(jù)集中只有5個項,則產(chǎn)生的候選4-項集不包含()。A){1,2,3,4}B){1,2,3,5}C){1,2,4,5}D)以上都不是[單選題]132.關(guān)于隨機(jī)森林,錯誤的是()A)隨機(jī)森林是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定B)隨機(jī)森林應(yīng)用非常廣泛,根據(jù)目標(biāo)變量的取值類型大致可分為分類和回歸兩類C)隨機(jī)森林優(yōu)點:可以產(chǎn)生高準(zhǔn)確度的分類器D)隨機(jī)森林在bagging基礎(chǔ)上做了修改,先從樣本集中用bagging采樣選出n個樣本[單選題]133.給定一個置信概率和置信區(qū)域,若誤差超過置信區(qū)域,則認(rèn)為誤差不是隨機(jī)誤差引起,視為異常值的判別方法()。A)聚類判別法;B)回歸判別法C)抽樣判別法D)統(tǒng)計判別法[單選題]134.連續(xù)屬性()的問題本質(zhì)是:決定選擇多少個分割點和確定分割點位置。任務(wù)可分為兩個步驟完成。首先將連續(xù)屬性排序,并通過指定n-1個分割點把它們分成n個區(qū)間。然后,將一個區(qū)間中的所有值映射到相同的分類值。A)離散化B)特征化C)多樣化D)線性化[單選題]135.MapReduce能把()個應(yīng)用程序分解為()個并行計算機(jī)指令,在()臺計算機(jī)上執(zhí)行。A)1,1,1,B)1,多,1C)多,多,1D)1,多,多[單選題]136.業(yè)務(wù)請求次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下,ProcedureType為()的S1-MME接口XDR的個數(shù)A)2B)3C)4D)5[單選題]137.在中移動的集中性能管理應(yīng)用落地-居民區(qū)4G&寬帶網(wǎng)絡(luò)能力全景分析手冊中,建立居民區(qū)與無線基站的關(guān)聯(lián)模型,推薦使用的方案是:A)基于基站經(jīng)緯度與居民區(qū)經(jīng)緯度B)基于MR數(shù)據(jù)獲得居民小區(qū)與無線小區(qū)的對應(yīng)關(guān)系C)基于晚間用戶常駐小區(qū)D)基于長期不移動的手機(jī)對應(yīng)的基站[單選題]138.假定屬性age的值如下:10,20,20,30,30,30,40。則該組數(shù)據(jù)的眾數(shù)是()。A)10B)20C)30D)40[單選題]139.模型把數(shù)據(jù)學(xué)習(xí)的太徹底,以至于把噪聲數(shù)據(jù)的特征也學(xué)習(xí)到了,這樣就會導(dǎo)致在后期測試的時候不能夠很好地識別數(shù)據(jù),模型泛化能力太差,這是()的原因A)欠擬合B)泛化誤差C)過擬合D)經(jīng)驗誤差[單選題]140.下面哪個不屬于數(shù)據(jù)的屬性類型:A)標(biāo)稱B)序數(shù)C)區(qū)間D)相異[單選題]141.已知:則s的取值是A)10B)12C)13D)15[單選題]142.人工智能是一種()A)讓人覺得不可思議的計算機(jī)程序B)與人類思考方式相似、行為相似的計算機(jī)程序C)會學(xué)習(xí)的計算機(jī)程序D)根據(jù)對環(huán)境的感知,做出合理的行動,并獲得最大收益的計算機(jī)程序[單選題]143.哪個選項不是Python語言的整數(shù)類型?A)0B1010B)0E99C)0x9aD)88[單選題]144.如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為A)無序規(guī)則B)窮舉規(guī)則C)互斥規(guī)則D)有序規(guī)則第2部分:多項選擇題,共47題,每題至少兩個正確答案,多選或少選均不得分。[多選題]145.為了比較利用不同分類算法構(gòu)建的分類模型的性能,可以利用圖形進(jìn)行比較,常用的圖形包括()。A)直方圖B)增益圖C)ROC曲線D)條形圖[多選題]146.統(tǒng)計學(xué)和數(shù)據(jù)挖掘區(qū)別在()A)兩者沒有區(qū)別B)數(shù)據(jù)挖掘經(jīng)常會面對尺度為GB甚至TB數(shù)量級的數(shù)據(jù)庫,而用傳統(tǒng)的統(tǒng)計方法很難處理這么大尺度的數(shù)據(jù)集C)兩者采用的模型有區(qū)別,數(shù)據(jù)挖掘往往需要采用各種相應(yīng)的數(shù)學(xué)模型和應(yīng)用傳統(tǒng)統(tǒng)計學(xué)以外的數(shù)學(xué)工具,才能建立最適合描述對象的模型或規(guī)則D)統(tǒng)計學(xué)和數(shù)據(jù)挖掘完全沒有聯(lián)系[多選題]147.人工網(wǎng)絡(luò)學(xué)習(xí)的兩個相似的算法:()A)梯度下降法則B)感知器訓(xùn)練法則C)遺傳算法D)連接分析[多選題]148.常見的評估方法有()A)留出法B)交叉驗證法C)采樣法D)自助法[多選題]149.在聚類分析當(dāng)中,()等技術(shù)可以處理任意形狀的簇。A)MIN(單鏈)B)MAX(全鏈)C)組平均D)Chameleon[多選題]150.在進(jìn)行容量估算中需要明確的因素有()A)確定規(guī)劃區(qū)的人員流量及發(fā)展趨勢B)移動用戶滲透率C)TDL用戶占比D)業(yè)務(wù)話務(wù)模型[多選題]151.回歸變差(或回歸平方和)是指()A)被解釋變量的實際值與平均值的離差平方和B)被解釋變量的回歸值與平均值的離差平方和C)被解釋變量的總變差與剩余變差之差D)解釋變量變動所引起的被解釋變量的變差[多選題]152.在Excel中,要選定A到E列單元格,操作正確的是()A)用鼠標(biāo)左鍵單擊列號A,然后向右拖動鼠標(biāo)至列號E,再釋放鼠標(biāo)左鍵B)左鍵單擊列號A,再按下shift鍵不放并用鼠標(biāo)左鍵單擊列號E,最后釋放shift鍵C)單擊列號A,然后先按下Ctrl鍵不放,再用鼠標(biāo)單擊B,C,D,E列號,最后釋放Ctrl鍵D)按shift鍵不放,用鼠標(biāo)左鍵單擊A,B,C,D,E的每個列號[多選題]153.()都屬于簇有效性的監(jiān)督度量A)輪廓系數(shù)B)共性分類相關(guān)系數(shù)C)熵D)F度量[多選題]154.TD-LTE終端形態(tài)包括()A)手機(jī)B)數(shù)據(jù)卡C)MiFiD)CPE[多選題]155.非頻繁模式__()__A)其支持度小于閾值B)都是不讓人感興趣的C)包含負(fù)模式和負(fù)相關(guān)模式D)對異常數(shù)據(jù)項敏感[多選題]156.界面整體規(guī)劃設(shè)計時涉及的工作包括A)確定主題B)選擇合適制作工具C)收集材料D)制作DEMO[多選題]157.以下關(guān)于非頻繁模式說法,正確的是()A)都是不讓人感興趣的B)其支持度小于閾值C)對異常數(shù)據(jù)項敏感D)包含負(fù)模式和負(fù)相關(guān)模式[多選題]158.在《居民區(qū)4G&寬帶網(wǎng)絡(luò)能力全景分析》應(yīng)用中,建立常駐用戶與居民區(qū)的關(guān)聯(lián)模型方法有()A)基于信令識別用戶常駐居民區(qū)B)基于MR打點法識別用戶常駐居民區(qū)C)基于語音話單識別用戶常駐居民區(qū)D)基于用戶寬帶開戶信息識別[多選題]159.以下哪些指標(biāo)可以判斷出劣化問題可能出現(xiàn)在核心網(wǎng)元?A)TCP握手時延B)服務(wù)器側(cè)上行RTTC)服務(wù)器側(cè)下行RTTD)HTTP響應(yīng)成功率[多選題]160.for變量in序列:執(zhí)行語句塊中序列可以是()A)數(shù)組B)列表C)元組D)字典[多選題]161.TAU請求成功次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下,滿足以下哪兩個條件()的S1-MME接口XDR的個數(shù)A)ProcedureType=5B)ProcedureStatus=0C)ProcedureType=1D)ProcedureStatus=1[多選題]162.關(guān)于數(shù)據(jù)范式描述準(zhǔn)確的是:A)經(jīng)驗科學(xué)是第一范式,主要研究模型是科學(xué)實驗;B)理論科學(xué)是第二范式,主要研究模型是數(shù)學(xué)模型;C)計算科學(xué)是第三范式,主要研究模型是計算機(jī)仿真和模擬,第三范式是?人腦+電腦?,人腦是主角;D)數(shù)據(jù)密集型科學(xué)是第四范式,的主要研究模型是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),特別是機(jī)器學(xué)習(xí),第四范式是?電腦+人腦?,電腦是主角。[多選題]163.以下哪些是抖音的競品A)虎牙B)YYC)快手D)微視[多選題]164.PCRF支持的邏輯接口包括A)RxB)GxcC)GxD)X2[多選題]165.Hive數(shù)據(jù)倉庫有什么特點?A)hive能夠使用類SQL語言完成一定的數(shù)據(jù)分析需求B)hive的元數(shù)據(jù)可以存儲在mysql中C)hive的數(shù)據(jù)存儲在hdfs上能夠利用分布式存儲的優(yōu)勢D)hive支持隨機(jī)查詢[多選題]166.以下選項能成為子查詢返回結(jié)果的是______。A)一個表B)一個值C)一列數(shù)據(jù)D)一個表達(dá)式#[多選題]167.VoLTE網(wǎng)絡(luò)接通率的取數(shù)方法為()A)VoLTE語音網(wǎng)絡(luò)接通次數(shù):xDR中字段?Interface?=Mw,且?ServiceType?=1,且?ProcedureType?=5,且?CALL_SIDE?=1,且?ALERTING_TIME?≠全F,或RESPONSE_CODE=403、或RESPONSE_CODE=404、RESPONSE_CODE=405、RESPONSE_CODE=413、RESPONSE_CODE=414、RESPONSE_CODE=415、RESPONSE_CODE=416、RESPONSE_CODE=422、RESPONSE_CODE=423、RESPONSE_CODE=480、RESPONSE_CODE=486、RESPONSE_CODE=488、RESPONSE_CODE=600、RESPONSE_CODE=603、RESPONSE_CODE=604、RESPONSE_CODE=606)的xDR個數(shù)。B)VoLTE語音始呼用戶原因早釋總次數(shù):若:?SOURCE_ACCESS_TYPE?=1/2,且?DEST_ACCESS_TYPE?=1/2,則:xDR中字段?Interface?=Mw,且?ServiceType?=1,且?ProcedureType?=5,且?CALL_SIDE?=1,且?SOURCE_ACCESS_TYPE?=1/2,且?DEST_ACCESS_TYPE?=1/2,且?ProcedureEndTime?-?ProcedureStartTime?<8s,且?FIRST_FAIL_NE_IP?為SCSCFIP且?RESPONSE_CODE?=487的xDR個數(shù)。C)VoLTE語音呼叫總次數(shù):xDR中字段?Interface?=Mw,且?ServiceType?=1,且?ProcedureType?=5,且?CALL_SIDE?=1的xDR個數(shù)D)根據(jù)MwXDR。[多選題]168.數(shù)據(jù)挖掘的預(yù)測建模任務(wù)主要包括哪幾大類問題?()A)分類B)回歸C)模式發(fā)現(xiàn)D)模式匹配[多選題]169.下列哪些指標(biāo)用于聚類模型的估計()A)silhouette_scoreB)calinski_harabaszC)R2D)F1[多選題]170.自動駕駛技術(shù)在以下()領(lǐng)域?qū)崿F(xiàn)A)大型客機(jī)B)戰(zhàn)斗機(jī)C)高鐵列車D)民用汽車[多選題]171.以下哪些指標(biāo)可以通過網(wǎng)優(yōu)平臺獲取?()A)無線接通率B)IMS初始注冊成功率C)空口上下行流量D)E-RAB建立成功率[多選題]172.市場需求分析包含幾個要素A)產(chǎn)品定位B)市場需求C)目標(biāo)人群D)推廣策略[多選題]173.C4.5克服了ID3的哪兩個缺點()A)不能直接使用信息增益B)只能使用增益率選擇最優(yōu)分支標(biāo)準(zhǔn)C)不能處理連續(xù)屬性D)用信息增益選擇屬性時偏向于選擇分枝比較多的屬性值[多選題]174.若檢驗統(tǒng)計量F近似等于1,說明()A)組間方差中不包含系統(tǒng)因素的影響B(tài))組內(nèi)方差中不包含系統(tǒng)因素的影響C)組間方差中包含系統(tǒng)因素的影響D)方差分析中不應(yīng)拒絕原假設(shè)[多選題]175.根據(jù)《中國移動VOLTE終端技術(shù)規(guī)范書》,可通過Ut接口設(shè)置的補(bǔ)充業(yè)務(wù)有()A)閉鎖所有入呼叫B)閉鎖所有出呼叫C)呼叫前傳D)呼叫保持[多選題]176.統(tǒng)一DPI的復(fù)用方式包括()A)分光復(fù)用B)原始報文鏡像復(fù)用C)會話級數(shù)據(jù)復(fù)用D)統(tǒng)計級數(shù)據(jù)復(fù)用[多選題]177.通過數(shù)據(jù)挖掘過程所推倒出的關(guān)系和摘要經(jīng)常被稱為:()A)模型B)模式C)模范D)模具[多選題]178.關(guān)于Axure的功能描述準(zhǔn)確的是()A)Axure可以實現(xiàn)頁面的跳轉(zhuǎn)B)Axure可以實現(xiàn)頁面間數(shù)據(jù)的傳遞C)Axure可以模擬用戶的日常操作D)Axure無法實現(xiàn)頁面和元件的變量傳遞[多選題]179.產(chǎn)生過度擬合數(shù)據(jù)問題的原因有()A)樣本里的噪音數(shù)據(jù)干擾過大,大到模型過分記住了噪音特征,反而忽略了真實的輸入輸出間的關(guān)系B)樣本抽取錯誤,包括樣本數(shù)量太少,抽樣方法錯誤,抽樣時沒有足夠正確考慮業(yè)務(wù)場景或業(yè)務(wù)特點等C)建模時使用了樣本中太多無關(guān)的輸入變量D)在決策樹模型搭建中,使用的算法對于決策樹的生長沒有合理的限制和修剪,決策樹的自由生長有可能每片葉子里只包含單純的事件數(shù)據(jù)[多選題]180.利Apriori算法計算頻繁項集可以有效降低計算頻繁集的時間復(fù)雜度。在以下的購物籃中產(chǎn)生支持度不小于3的候選3-項集,在候選2-項集中需要剪枝的是()ID項集。1面包.牛奶2面包.尿布.啤酒.雞蛋3牛奶.尿布.啤酒.可樂4面包.牛奶.尿布.啤酒5面包.牛奶.尿布.可樂A)啤酒.尿布B)啤酒.面包C)面包.尿布D)啤酒.牛奶[多選題]181.關(guān)于PGW的數(shù)據(jù)配置哪些說法是錯誤的?A)SGW與PGW可以合設(shè)B)不可以配置與APN對應(yīng)的地址池用于動態(tài)分配用戶地址C)只能配置1個相連接的PCRFD)PGW不能獨(dú)立部署[多選題]182.物聯(lián)網(wǎng)端到端定界分析?七元四階?法中四階包括()A)網(wǎng)絡(luò)接入B)業(yè)務(wù)接入C)網(wǎng)絡(luò)切換D)業(yè)務(wù)使用質(zhì)量[多選題]183.兩步聚類算法特點包括()A)適合于大型數(shù)據(jù)集的聚類研究B)同時處理數(shù)值型聚類變量和分類型聚類變量C)通過兩步實現(xiàn)數(shù)據(jù)聚類D)根據(jù)一定準(zhǔn)則確定聚類數(shù)目[多選題]184.在SNMP協(xié)議中,NMS(NetworkManagementStation)向代理(Agent)發(fā)出的報文有哪些A)GETB)GETNEXTC)SETD)REQUEST[多選題]185.以下哪些指標(biāo)維度可能為影響網(wǎng)絡(luò)滿意度指標(biāo)維度A)經(jīng)分特性B)上網(wǎng)感知C)行為偏好D)覆蓋質(zhì)量[多選題]186.()這些數(shù)據(jù)特性都是正確聚類分析具有很強(qiáng)影響的。A)高維性B)規(guī)模C)稀疏性D)噪聲和離群點[多選題]187.大數(shù)據(jù)四大特征:A)速度快B)數(shù)據(jù)量大C)價值密度低D)類型多[多選題]188.統(tǒng)計決策的基本原則是()A)可行性B)發(fā)展性C)合理性D)經(jīng)濟(jì)性[多選題]189.在中移動的集中性能管理應(yīng)用落地-物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量分析手冊中,對于業(yè)務(wù)接入成功率,定界流程為:A)身份識別環(huán)節(jié)B)默認(rèn)承載建立環(huán)節(jié)C)DNS解析環(huán)節(jié)D)TCP建鏈環(huán)節(jié)E)業(yè)務(wù)環(huán)節(jié)[多選題]190.以下各項均是針對數(shù)據(jù)倉庫的不同說法,你認(rèn)為正確的有()。A)數(shù)據(jù)倉庫就是數(shù)據(jù)庫B)數(shù)據(jù)倉庫是一切商業(yè)智能系統(tǒng)的基礎(chǔ)C)數(shù)據(jù)倉庫是面向業(yè)務(wù)的,支持聯(lián)機(jī)事務(wù)處理(OLTP)D)數(shù)據(jù)倉庫支持決策而非事務(wù)處理E)數(shù)據(jù)倉庫的主要目標(biāo)就是幫助分析,做長期性的戰(zhàn)略制定[多選題]191.DPI設(shè)備應(yīng)遵循的協(xié)議識別能力要求中,屬于必選協(xié)議的有()A)HTTPSB)H.323C)TelnetD)SNMPE)TSL第3部分:判斷題,共55題,請判斷題目是否正確。[判斷題]192.預(yù)測性分析是數(shù)據(jù)分析的最高階段,可以直接產(chǎn)生商業(yè)價值。A)正確B)錯誤[判斷題]193.對文件進(jìn)行讀寫操作之后必須顯式關(guān)閉文件以確保所有內(nèi)容都得到保存。A)正確B)錯誤[判斷題]194.內(nèi)連接查詢INNERJOIN可以獲得兩個表中連接字段值相等的所有記錄。A)正確B)錯誤[判斷題]195.Python變量使用前必須先聲明,并且一旦聲明就不能在當(dāng)前作用域內(nèi)改變其類型了。A)正確B)錯誤[判斷題]196.k-means聚類算法無論對離散型屬性,還是對連續(xù)型屬性具有較好的聚類效果。A)正確B)錯誤[判斷題]197.盈虧平衡分析是靜態(tài)分析,不考慮資金的時間價值和項目壽命周期內(nèi)的現(xiàn)金流量的變化。A)正確B)錯誤[判斷題]198.定量屬性可以是整數(shù)值或者是連續(xù)值。A)正確B)錯誤[判斷題]199.數(shù)據(jù)分類由兩步過程組成:第一步,建立一個聚類模型,描述指定的數(shù)據(jù)類集或概念集;第二步,使用模型進(jìn)行分類。()A)正確B)錯誤[判斷題]200.分類是預(yù)測數(shù)據(jù)對象的離散類別,預(yù)測是用于數(shù)據(jù)對象的連續(xù)取值。()A)正確B)錯誤[判斷題]201.如果URL中包含了中文,則可以使用urlencode()方法進(jìn)行編碼。A)正確B)錯誤[判斷題]202.使用resquests庫向網(wǎng)站發(fā)送HTTP請求時,如果網(wǎng)站限制了python程序的爬取,可以通過添加Headers參數(shù)將其偽裝為瀏覽器訪問。A)正確B)錯誤[判斷題]203.數(shù)據(jù)倉庫中間層OLAP服務(wù)器只能采用關(guān)系型OLAPA)正確B)錯誤[判斷題]204.定義Python函數(shù)時必須指定函數(shù)返回值類型。A)正確B)錯誤[判斷題]205.登錄網(wǎng)站時,只有瀏覽器發(fā)送的請求才能獲得響應(yīng)內(nèi)容。A)正確B)錯誤[判斷題]206.逐層發(fā)現(xiàn)算法Apriori發(fā)現(xiàn)頻繁項集的過程是按照項集的長度由大到小逐級進(jìn)行的。A)正確B)錯誤[判斷題]207.?ID3的分裂屬性選擇條件是選擇信息增益最大的作為分裂屬性。A)正確B)錯誤[判斷題]208.分類和回歸都可用于預(yù)測,分類的輸出是離散的類別值,而回歸的輸出是連續(xù)數(shù)值。A)正確B)錯誤[判斷題]209.相同內(nèi)容的字符串使用不同的編碼格式進(jìn)行編碼得到的結(jié)果并不完全相同。A)正確B)錯誤[判斷題]210.爬蟲爬取的是網(wǎng)站后臺的數(shù)據(jù)。A)正確B)錯誤[判斷題]211.爬蟲是手動請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。A)正確B)錯誤[判斷題]212.使用del命令或者列表對象的remove()方法刪除列表中元素時會影響列表中部分元素的索引。A)正確B)錯誤[判斷題]213.使用列表對象的remove()方法可以刪除列表中首次出現(xiàn)的指定元素,如果列中不存在要刪除的指定元素則拋出異常。A)正確B)錯誤[判斷題]214.聚類分析的過程中,聚類效果較好時屬于同一個簇的對象相似度很高,而屬于不同簇的對象相似度很低。A)正確B)錯誤[判斷題]215.已知x=list(range(20)),那么語句delx[::2]可以正常執(zhí)行。A)正確B)錯誤[判斷題]216.線性回歸模型的擬合優(yōu)度可采用可決系數(shù)進(jìn)行評判??蓻Q系數(shù)越高,模型擬合效果越好;可決系數(shù)越小,模型擬合效果越差。A)正確B)錯誤[判斷題]217.對于大量列表的連接,extend()方法比運(yùn)算符+具有更高的效率。A)正確B)錯誤[判斷題]218.DSS主要是基于數(shù)據(jù)倉庫.聯(lián)機(jī)數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的應(yīng)用。()A)正確B)錯誤[判斷題]219.給定由兩次運(yùn)行K均值產(chǎn)生的兩個不同的簇集,誤差的平方和最大的那個應(yīng)該被視為較優(yōu)。A)正確B)錯誤[判斷題]220.數(shù)據(jù)分析往往有比較明確的目標(biāo)。()A)正確B)錯誤[判斷題]221.反爬蟲主要有以下幾種方式:通過UA判斷、通過單IP頻繁訪問判斷、通過Cookie判斷、動態(tài)頁面加載、采用驗證碼。A)正確B)錯誤[判斷題]222.在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。A)正確B)錯誤[判斷題]223.特征提取技術(shù)并不依賴于特定的領(lǐng)域。A)正確B)錯誤[判斷題]224.小項目集的任一非空子集可能是小的也可能是大的A)正確B)錯誤[判斷題]225.如果屬性不是離散的,則它是連續(xù)的。A)正確B)錯誤[判斷題]226.統(tǒng)計選修各門課程人數(shù)的SELECT語句為:SELECT課程號,SUM(學(xué)號)FROM成績GROUPBY課程號;。A)正確B)錯誤[判斷題]227.已知x是一個足夠大的numpy二維數(shù)組,那么語句x[0,2]=4的作用是把行下標(biāo)為0、列下標(biāo)為2的元素值改為4。A)正確B)錯誤[判斷題]228.數(shù)據(jù)挖掘主要構(gòu)建四大類模型包括:分類、聚類、預(yù)測和關(guān)聯(lián)()A)正確B)錯誤[判斷題]229.文本挖掘又稱信息檢索,是從大量文本數(shù)據(jù)中提取以前未知的、有用的、可理解的、可操作的知識的過程。()A)正確B)錯誤[判斷題]230.回歸分析預(yù)測的值是連續(xù)的A)正確B)錯誤[判斷題]231.多次拋一枚硬幣,正面朝上的頻率是1/2。A)正確B)錯誤[判斷題]232.可視化技術(shù)正確于分析的數(shù)據(jù)類型通常不是專用性的。A)正確B)錯誤[判斷題]233.Python標(biāo)準(zhǔn)庫os中的方法startfile()可以啟動任何已關(guān)聯(lián)應(yīng)用程序的文件,并自動調(diào)用關(guān)聯(lián)的程序。A)正確B)錯誤[判斷題]234.對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,移去或者減少這些樣本對分類結(jié)果沒有影響。()A)正確B)錯誤[判斷題]235.如果訪問某網(wǎng)站的頻率太高,則這個網(wǎng)站可能會禁止訪問。A)正確B)錯誤[判斷題]236.召回率反映的是預(yù)測為正中的樣本中正例的概率。()A)正確B)錯誤[判斷題]237.提取聲波的頻率,是數(shù)據(jù)挖掘任務(wù)。A)正確B)錯誤[判斷題]238.標(biāo)準(zhǔn)差越小,表示離散程度越小,風(fēng)險越大;反之離散程度越大,風(fēng)險越小。A)正確B)錯誤[判斷題]239.已知x為非空字符串,那么表達(dá)式?,?.join(x.split(?,?))==x的值一定為True。A)正確B)錯誤[判斷題]240.以讀模式打開文件時,文件指針指向文件開始處。A)正確B)錯誤[判斷題]241.Web數(shù)據(jù)挖掘是通過數(shù)據(jù)庫仲的一些屬性來預(yù)測另一個屬性,它在驗證用戶提出的假設(shè)過程中提取信息.A)正確B)錯誤[判斷題]242.具體來講,若一個項集X的支持度大于用戶給定的一個最小支持度閾值,則X被稱為頻繁項集(或頻繁模式)。A)正確B)錯誤[判斷題]243.數(shù)據(jù)取樣時,除了要求抽樣時嚴(yán)把質(zhì)量關(guān)外,還要求抽樣數(shù)據(jù)必須在足夠范圍內(nèi)有代表性。()A)正確B)錯誤[判斷題]244.在一元回歸分析中,用r表示因變量對自變量的相關(guān)系數(shù),當(dāng)|r|接近0時,說明因變量與自變量之間的線性關(guān)系就好。A)正確B)錯誤[判斷題]245.數(shù)據(jù)倉庫中間層OLAP服務(wù)器只能采用關(guān)系型OLAP()A)正確B)錯誤[判斷題]246.無法刪除集合中指定位置的元素,只能刪除特定值的元素。A)正確B)錯誤第4部分:問答題,共14題,請在空白處填寫正確答案。[問答題]247.數(shù)據(jù)挖掘的兩大基本目標(biāo)是______和______。[問答題]248.選取最前面的兩個屬于bookstore元素的子元素的book元素[問答題]249.8.屬性A的()定義為屬性A的信息增益與獲取A信息所付出代價的比值。[問答題]250.數(shù)據(jù)集成的核心任務(wù)是要將____的分布式異構(gòu)____集成到一起,使用戶能夠以透明的方式訪問這些數(shù)據(jù)源。[問答題]251.在進(jìn)行模型訓(xùn)練時,很容易出現(xiàn)過擬合和欠擬合問題。一般地,模型越復(fù)雜,越容易出現(xiàn)______。[問答題]252.字典對象的_方法可以獲取指定?鍵?對應(yīng)的?值?,并且可以在指定?鍵?不存在的時候返回指定值,如果不指定則返回None。[問答題]253.假定某課程的分?jǐn)?shù)的值如下:(按遞增順序)32,52,56,66,70,70,72,75,75,78,80,81,85,85,85,88,88,90,92,95試回答以下問題:(1)使用最小-最大規(guī)范化,將score值72轉(zhuǎn)換到[0.0,1.0]區(qū)間.(2)使用z-score規(guī)范化轉(zhuǎn)換score值72,其中score的平均分為75.75,標(biāo)準(zhǔn)差為15.37.[問答題]254.數(shù)據(jù)分類過程有()階段和()階段兩個階段,其中()階段負(fù)責(zé)構(gòu)建分類模型,()階段負(fù)責(zé)使用模型預(yù)測給定數(shù)據(jù)的類標(biāo)號。[問答題]255.決策樹的剪枝一般通過____決策樹整體的損失函數(shù)或代價函數(shù)來實現(xiàn)。[問答題]256.____是一個用于處理字符串的強(qiáng)大工具。[問答題]257.數(shù)據(jù)規(guī)范化主要包括____處理和____處理兩個方面。[問答題]258.通過____方法,可以對預(yù)定義的空字典進(jìn)行賦值[問答題]259.關(guān)聯(lián)規(guī)則的挖掘過程主要包含兩個階段:______和______。[問答題]260.列表對象的sort()方法用來對列表元素進(jìn)行原地排序,該函數(shù)返回值為。1.答案:C解析:2.答案:C解析:3.答案:D解析:4.答案:D解析:5.答案:C解析:6.答案:B解析:7.答案:D解析:8.答案:A解析:9.答案:A解析:10.答案:A解析:11.答案:C解析:12.答案:D解析:13.答案:B解析:14.答案:D解析:15.答案:B解析:Python語言的縮進(jìn)只要統(tǒng)一即可,不一定是4個空格(盡管這是慣例)。16.答案:A解析:17.答案:D解析:18.答案:D解析:19.答案:B解析:20.答案:C解析:21.答案:A解析:22.答案:D解析:23.答案:D解析:24.答案:D解析:25.答案:C解析:26.答案:D解析:27.答案:B解析:28.答案:A解析:29.答案:A解析:30.答案:B解析:31.答案:C解析:32.答案:B解析:33.答案:D解析:34.答案:B解析:35.答案:B解析:36.答案:A解析:37.答案:D解析:38.答案:C解析:題型:39.答案:C解析:40.答案:B解析:41.答案:D解析:42.答案:A解析:43.答案:D解析:44.答案:A解析:45.答案:A解析:46.答案:B解析:47.答案:D解析:48.答案:D解析:49.答案:B解析:50.答案:D解析:51.答案:A解析:52.答案:B解析:f11無法打開53.答案:C解析:54.答案:D解析:55.答案:C解析:56.答案:B解析:57.答案:D解析:58.答案:D解析:59.答案:B解析:60.答案:A解析:61.答案:A解析:62.答案:B解析:63.答案:C解析:64.答案:C解析:65.答案:B解析:66.答案:B解析:67.答案:B解析:68.答案:B解析:69.答案:A解析:70.答案:D解析:71.答案:A解析:72.答案:B解析:73.答案:A解析:74.答案:D解析:75.答案:B解析:76.答案:C解析:77.答案:C解析:78.答案:C解析:79.答案:B解析:80.答案:C解析:81.答案:C解析:82.答案:C解析:83.答案:C解析:84.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論