大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷31)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷31)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷31)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷31)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷31)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷31)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.請選出程序的正確結(jié)果()print("我叫%s今年%d歲!"%('小明',10))A)我叫%s小明今年%d10歲!B)我叫小明今年10歲!C)我叫10今年小明歲D)小明我叫10歲今年答案:B解析:[單選題]2.我們在做實驗時,會經(jīng)常用到?日期?轉(zhuǎn)換器,下列不屬于?日期?轉(zhuǎn)換器的一項是()A)ChoiceB)DateFormatC)DatePartD)StringToDateTime答案:A解析:[單選題]3.在HBase中,啟用表的命令是()A)go'my_ns:my_table'B)use'my_ns:my_table'C)start'my_ns:my_table'D)enable'my_ns:my_table'答案:D解析:[單選題]4.下列選項中,屬于數(shù)值類型的是()。A)0B)1C)2+3jD)以上都是答案:D解析:[單選題]5.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合效果最好的模型是()A)模型1的相關(guān)指數(shù)R2為0.98B)模型2的相關(guān)指數(shù)R2為0.80C)模型3的相關(guān)指數(shù)R2為0.50D)模型4的相關(guān)指數(shù)R2為0.25答案:A解析:[單選題]6.關(guān)于Hive在FusionInsightHD中的架構(gòu)描述錯誤的是?A)只要有一個HiveServer不可用,整個Hive集群便不可用B)MotaStore用于提供元數(shù)據(jù)服務(wù),依賴于DBServiceC)在同一時間點,HiveServer只要一個處于Active狀態(tài),另一個則處于Standby狀態(tài)D)HiveServer負(fù)責(zé)接收客戶端請求.解析.執(zhí)行HQL命令并返回查詢結(jié)果答案:A解析:[單選題]7.傳統(tǒng)數(shù)據(jù)處理的數(shù)據(jù)規(guī)模的單位是?A)TBB)EBC)PBD)GB答案:D解析:[單選題]8.唯一值約束和主鍵約束的區(qū)別是A)唯一值約束建立唯一索引、主鍵約束建立非唯一索引B)主鍵列可以為空、唯一值約束的列不可以為空C)主鍵約束可以使用已有的索引、唯一值約束總是創(chuàng)建索引D)唯一值約束的列可以為空、主鍵列不可以為空答案:D解析:[單選題]9.不屬于循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出模式是()A)單輸出B)多輸出C)同步多輸出D)異步多輸出答案:C解析:[單選題]10.數(shù)據(jù)抽取是從數(shù)據(jù)源中抽取數(shù)據(jù)的過程,數(shù)據(jù)抽取的方式有全量抽取和()。A)重點抽取B)個別抽取C)抽樣抽取D)增量抽取答案:D解析:[單選題]11.以下()不屬于?加強人才隊伍建設(shè)?的范疇。A)加強數(shù)據(jù)管理崗位培訓(xùn),重點開展數(shù)據(jù)管理體系、數(shù)據(jù)管理理論、數(shù)據(jù)管理實踐等知識培訓(xùn)。B)搭建數(shù)據(jù)管理交流平臺,根據(jù)工作推進情況定期舉辦數(shù)據(jù)管理工作交流座談。C)充分發(fā)揮大數(shù)據(jù)中心、科研產(chǎn)業(yè)單位作用,構(gòu)建數(shù)據(jù)專業(yè)支撐團隊。D)組織各種形式的數(shù)據(jù)知識競賽等活動。答案:D解析:[單選題]12.關(guān)于彈性負(fù)載均衡描述不對的是()A)支持內(nèi)網(wǎng)負(fù)載均衡、外網(wǎng)負(fù)載均衡B)支持HTTP、HTTPS、TCP協(xié)議C)支持健康檢查D)支持會話保持答案:B解析:[單選題]13.真正率是指(__)。A)正樣本預(yù)測結(jié)果數(shù)/正樣本實際數(shù)B)被預(yù)測為負(fù)的正樣本結(jié)果數(shù)/正樣本實際數(shù)C)被預(yù)測為正的負(fù)樣本結(jié)果數(shù)/負(fù)樣本實際數(shù)D)負(fù)樣本預(yù)測結(jié)果數(shù)/負(fù)樣本實際數(shù)答案:A解析:[單選題]14.當(dāng)()時,可以不考慮RDD序列化處理。A)完成成本比較高的操作后B)執(zhí)行容易失敗的操作之前C)RDD被重復(fù)使用D)實時性要求高答案:D解析:[單選題]15.()不是專門用于可視化時間空間數(shù)據(jù)的技術(shù)A)等高線圖B)餅圈C)曲面圖D)矢量場圈答案:B解析:[單選題]16.離線批處理常用的組件不包括()。A)SparkB)HiveC)FlumeD)Storm答案:D解析:[單選題]17.以下說法中:①一個機器學(xué)習(xí)模型,如果有較高準(zhǔn)確率,總是說明這個分類器是好的;②如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低;③如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯誤率總是會降低,正確的是()。A)1B)2C)3D)1、3答案:C解析:如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低,訓(xùn)練錯誤率可能降低,也可能增高。[單選題]18.在(__)特征選擇中,特征選擇算法本身作為組成部分嵌入到學(xué)習(xí)算法中,最典型的就是決策樹算法。A)過濾式B)嵌入式C)包裹式D)隨機答案:B解析:[單選題]19.字符串的strip方法的作用是()。A)刪除字符串頭尾指定的字符B)刪除字符串末尾的指定字符C)刪除字符串頭部的指定字符D)通過指定分隔符對字符串切片答案:A解析:[單選題]20.在Spark中()負(fù)責(zé)初始化和關(guān)閉SparkContextA)RDDB)Driver進程C)SparkContextD)ClusterManager答案:B解析:[單選題]21.下面對屬性進行離散化的方法為()A)preprocessing.scale()B)pd.qcut()C)pd.shapeD)pgroupby()答案:B解析:[單選題]22.下列哪一項不是經(jīng)典的社區(qū)研究案例()A)空手道俱樂部B)科學(xué)家合作網(wǎng)絡(luò)C)斑馬群體的社交行為研究D)芽殖酵母基因調(diào)控網(wǎng)絡(luò)答案:D解析:[單選題]23.以下代碼的執(zhí)行結(jié)果a,b,c分別是()a=[[]]*5a[0].append(1)b=[[]foriinrange(5)]b[0].append(1)c=[[]*5]c[0].append(1)A)a:[[1],[],[],[],[]]b:[[1],[1],[1],[1],[1]]c:[[1]]B)a:[[1],[1],[1],[1],[1]]b:[[1],[],[],[],[]]c:[[1]]C)a:[[1],[],[],[],[]]b:[[1],[1],[1],[1],[1]]c:[[1],[],[],[],[]]D)a:[[1],[],[],[],[]]b:[[1],[1],[1],[1],[1]]c:[[1],[1],[1],[1],[1]]答案:B解析:[單選題]24.RDD有Transformation和Action算子,下列屬于Action算子的是:()。A)mapB)saveAsTextFileC)FilterD)reduceByKey答案:B解析:[單選題]25.對數(shù)據(jù)可視化的作用說法不正確的一項是()A)數(shù)據(jù)分析B)數(shù)據(jù)過濾C)信息記錄D)橫縱對比答案:B解析:[單選題]26.Flume傳輸數(shù)據(jù)過程中,為了防止數(shù)據(jù)不丟失,使用的Channel類型是?A)MemoryChannelB)FileChanneC)JDBCChanneD)HDESChannel答案:B解析:[單選題]27.Spark的技術(shù)架構(gòu)中,Spark核心層的作用是什么?A)資源管理B)提供內(nèi)存計算框架C)提供面向特定類型的計算服務(wù)D)分布式數(shù)據(jù)存取答案:B解析:[單選題]28.變量就像一個存放數(shù)據(jù)的?盒子?,若要在?盒子?中存放數(shù)據(jù),必須使用賦值語句,賦值語句的格式為?變量名=表達(dá)式?。下列能正確進行變量賦值的語句是()。A)6=lengthB)360/8=eC)x=x+1D)[(9+6)5]=y答案:C解析:[單選題]29.()負(fù)責(zé)HDFS數(shù)據(jù)存儲。A)NameNodeB)JobTrackerC)DataNodeD)SecondaryNameNode答案:C解析:DataNode負(fù)責(zé)HDFS的數(shù)據(jù)塊存儲。[單選題]30.以下表述正確的是?A)if語句總是與else成對出現(xiàn);B)if語句總是與elif成對出現(xiàn);C)if語句分支嵌套實現(xiàn)多分支;D)if語句只能實現(xiàn)二分支。答案:C解析:[單選題]31.執(zhí)行以下代碼段my_tuple=(1,2,3,4)my_tuple.append((5,6,7))print(len(my_tuple))時,輸出為()。A)4B)5C)7D)Error答案:D解析:[單選題]32.一個關(guān)系數(shù)據(jù)庫文件中的各條記錄()A)前后順序不能任意顛倒,一定要按照輸入的順序排列B)前后順序可以任意顛倒,不影響庫中的數(shù)據(jù)關(guān)系C)前后順序可以任意顛倒,但排列順序不同,統(tǒng)計處理的結(jié)果就可能不同D)前后順序不能任意顛倒,一定要按照關(guān)鍵字段值的順序排列答案:B解析:[單選題]33.關(guān)閉Spark集群,需要cd到spark目錄下的sbin目錄,然后執(zhí)行(__)腳本即可。A)all-stop.shB)stopall.shC)stop.shD)stop-all.sh答案:D解析:[單選題]34.()算法要求基學(xué)習(xí)器能對特定的數(shù)據(jù)分布進行學(xué)習(xí),在訓(xùn)練過程的每一輪中,根據(jù)樣本分布為每個訓(xùn)練樣本重新賦予一個權(quán)重。A)BoostingB)支持向量機C)貝葉斯分類器D)神經(jīng)網(wǎng)絡(luò)答案:A解析:[單選題]35.語句np.random.randn(5,4)的運算結(jié)果是()。A)生成一個5行4列的隨機矩陣B)將矩陣的第5行第4列改成一個隨機值C)將矩陣的第4行第3列改成一個隨機值D)將矩陣的第5列和第4列都用隨機值代替答案:A解析:rand()和randn()是簡化的隨機函數(shù),傳遞形狀參數(shù)不需要元組,傳入的所有參數(shù)構(gòu)成數(shù)組的形狀元組,此題中就用(5,4)作為數(shù)組的形狀參數(shù)。[單選題]36.根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險預(yù)警信號管理辦法(試行)》,大數(shù)據(jù)貸后預(yù)警處置全流程共包含客戶經(jīng)理崗、支行預(yù)警審批崗、分行預(yù)警分發(fā)崗、分行預(yù)警審批崗、總行公司預(yù)警分發(fā)崗、總行公司預(yù)警審批崗等()類崗位。A)3B)5C)9D)15答案:C解析:[單選題]37.隨機森林是在(__)上的一個擴展變體。A)BoostingB)AdaBoostC)RFD)Bagging答案:D解析:[單選題]38.下列選項中,用于向文件中寫入數(shù)據(jù)的是()A)open()B)write()C)close()D)read()答案:B解析:[單選題]39.下列哪-項是HBase不適合的應(yīng)用場景?A)海量數(shù)據(jù)(TB,PB)應(yīng)用場景。B)半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場景。C)要求具有完全ACID特性的應(yīng)用場景。D)高吞吐率應(yīng)用場景。答案:C解析:[單選題]40.下面哪項操作能實現(xiàn)跟神經(jīng)網(wǎng)絡(luò)中Dropout的類似效果?A)BoostingB)baggingC)StackingD)Mapping答案:B解析:[單選題]41.(__)可看做用坐標(biāo)下降法來最大化對數(shù)似然下界的過程。A)EM算法B)貝葉斯決策C)貝葉斯分類器D)邊際似然答案:A解析:[單選題]42.下列哪個選項對批量數(shù)據(jù)處理組件的描述是不正確的?A)Hive:傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理速度較慢。B)MapReduce:傳統(tǒng)批處理引擎,用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學(xué)習(xí)類批處理作業(yè),使用廣泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。C)SparkSQL:新型SQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù).處理速度高效。D)Spark:新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學(xué)習(xí)類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。答案:B解析:[單選題]43.在Zookeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResourceManager產(chǎn)生故障時,StandbyResourceManager會從以下哪些目錄中獲取Application相關(guān)信息?A)metastoreB)StatestoreC)StoreageD)Warehouse答案:B解析:[單選題]44.Matplotlib設(shè)置好圖表元素后,以下哪個代碼可以使圖表自動調(diào)整格式()A)fig.fit()B)fig.tight()C)fig.fit_layout()D)fig.tight_layout()答案:D解析:[單選題]45.某銀行規(guī)劃的FusionlnsightHD集群有90個節(jié)點,如果控制節(jié)點規(guī)劃了3個,那集群中數(shù)據(jù)節(jié)點推薦規(guī)劃多少最為合理A)87B)85C)90D)86答案:A解析:[單選題]46.在編寫程序時經(jīng)常要對某一個條件進行判斷,?條件?只有?成立?或?不成立?兩種結(jié)果。成立用?True?表示,不成立用?False?表示。下列關(guān)系表達(dá)式中,結(jié)果為?True?的是()A)2>5B)3>=3C)1!=1D)6==5答案:B解析:[單選題]47.對于集群計算來說,下面哪個是數(shù)據(jù)處理引擎()A)DrillB)OozieC)SparkD)HBase答案:C解析:[單選題]48.內(nèi)部用戶有作業(yè)層、管理層、()A)執(zhí)行層B)決策層C)建議層D)推送層答案:B解析:[單選題]49.當(dāng)用戶選擇的列是集合數(shù)據(jù)類型時,Hive會使用()格式應(yīng)用于輸出A)stringB)mapC)jsonD)list答案:C解析:[單選題]50.Adaboost的核心思想是()A)給定一個弱學(xué)習(xí)算法和一個訓(xùn)練集,將該學(xué)習(xí)算法使用多次,得出預(yù)測函數(shù)序列,進行投票B)針對同一個訓(xùn)練集訓(xùn)練不同的弱分類器集合起來,構(gòu)成一個強分類器C)利用多棵樹對樣本進行訓(xùn)練并預(yù)測的一種分類器D)基于前向策略的加法模型,每階段使用一個基模型去擬合上一階段基模型的殘差答案:B解析:[單選題]51.利用到每個聚類中心和的遠(yuǎn)近判斷離群值的方法,可以基于的算法為()。A)K-meansB)KNNC)SVMD)LinearRegression答案:A解析:K-means算法又名K均值算法。其算法思想大致為先從樣本集中隨機選取k個樣本作為簇中心,并計算所有樣本與這k個"簇中心"的距離,對于每一個樣本,將其劃分到與其距離最近的"簇中心"所在的簇中,對于新的簇計算各個簇的新的"簇中心"。[單選題]52.下面關(guān)于數(shù)據(jù)權(quán)的描述,錯誤的是:()A)數(shù)據(jù)權(quán)的概念發(fā)起于英國,主要將其視為信息社會的一項基木公民權(quán)利B)數(shù)據(jù)權(quán)包括兩個方面:數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)利C)數(shù)據(jù)主權(quán)的主體是國家,是一個國家獨立自主對本國數(shù)據(jù)進行管理和利用的權(quán)力D)數(shù)據(jù)主權(quán)的主體是公民,是相對應(yīng)于公民數(shù)據(jù)采集義務(wù)而形成的對數(shù)據(jù)利用的權(quán)利答案:D解析:[單選題]53.以下關(guān)于大數(shù)據(jù)的敘述中,()是不恰當(dāng)?shù)?。A)大數(shù)據(jù)是僅靠現(xiàn)有數(shù)據(jù)庫管理工具或傳統(tǒng)數(shù)據(jù)處理系統(tǒng)很難處理的大型而復(fù)雜的數(shù)據(jù)集B)大數(shù)據(jù)具有數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、處理速度快等特性C)大數(shù)據(jù)的戰(zhàn)略意義是實現(xiàn)數(shù)據(jù)的增值D)大數(shù)據(jù)研究中,數(shù)據(jù)之間的因果關(guān)系比關(guān)聯(lián)關(guān)系更重要答案:D解析:[單選題]54.要想讓機器具有智能,必須讓機器具有知識。因此,在人工智能中有一個研究領(lǐng)域,主要研究計算機如何自動獲取知識與技能,實現(xiàn)自我完善,這門研究分支學(xué)科叫()。A)專家系統(tǒng)B)機器學(xué)習(xí)C)神經(jīng)網(wǎng)絡(luò)D)模式識別答案:B解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.MapReduce過程中,以下屬于Shuffle機制的是?A)CopyB)PartitionC)CombineD)Sort/Merge答案:AD解析:[多選題]56.若a=np.array([0,1,2,3]),b=a,且a[0]=9,則發(fā)生改變的值有(__)。A)aB)a[0]C)bD)a[1]答案:ABC解析:[多選題]57.以下()場景可以使用MaxcomputeMR實現(xiàn)。A)Web訪問日志分析:分析用戶訪問行為,個性化推薦等B)搜索,比如pagerank、網(wǎng)頁爬取等C)機器學(xué)習(xí):監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、分類算法等D)廣告推薦:用戶點擊購買行為預(yù)測答案:ABCD解析:[多選題]58.下列關(guān)于sigmoid函數(shù)描述正確的是()A)取值范圍為(0,1),他可以將一個實數(shù)映射到(0,1)的區(qū)間,看做概率值B)只能做二分類C)閾值一般設(shè)置在0.5,大于該值的概率表示正例D)只有該函數(shù)能將實數(shù)映射到(0,1)區(qū)間答案:ABC解析:[多選題]59.OTS以()的形式組織數(shù)據(jù)。A)schemaB)表組C)表D)實例答案:CD解析:[多選題]60.以下哪些是Spark可以提供的功能?A)分布式內(nèi)存計算引擎B)分布式文件系統(tǒng)C)集群資源的統(tǒng)一管理D)流處理功能答案:AD解析:[多選題]61.Hadoopfs中的-get和-put命令操作對象是()A)文件B)目錄C)文本文件D)程序代碼答案:AB解析:[多選題]62.一個FlumeAgent內(nèi)部通常包含有哪三個模塊?A)SourceB)DestinationC)ChannelD)Sink答案:ACD解析:[多選題]63.項目空間(project)是大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)的基本組織單元,它類似于傳統(tǒng)數(shù)據(jù)庫的Database。以下關(guān)于項目空間的說法中正確的有:()。A)所有的對象都會屬于某個項目空間B)一個帳號可以擁有多個項目空間的權(quán)限C)一個帳號可以創(chuàng)建多個項目空間,最多不能超過10個D)通過安全授權(quán),可以在一個項目空間中訪問另一個項目空間中的數(shù)據(jù)答案:ABD解析:[多選題]64.下列與Python有關(guān)的環(huán)境變量是()。A)PYTHONPATHB)PYTHONUPDATEC)PYTHONRESETD)PYTHONHOME答案:AD解析:[多選題]65.下列關(guān)于貝葉斯分類器說法正確的是(__)。A)貝葉斯分類算法是一大類分類算法的總稱B)貝葉斯分類算法以樣本可能屬于某類的概率作為分類依據(jù)C)樸素貝葉斯分類算法是貝葉斯分類算法中最簡單的一種D)樸素貝葉斯分類算法采用了屬性條件獨立性假設(shè)答案:ABCD解析:[多選題]66.HadoopMapReduce主要文件輸入格式有()A)TextInputFormatB)InputFormatC)SequenceFormatD)KeyValueFormat答案:ACD解析:[多選題]67.大數(shù)據(jù)對推動經(jīng)濟的重要意義包括()。A)大數(shù)據(jù)成為提升政府治理能力的新途徑B)大數(shù)據(jù)成為推動經(jīng)濟轉(zhuǎn)型發(fā)展的新動力C)大數(shù)據(jù)成為企業(yè)轉(zhuǎn)型升級的新常態(tài)D)大數(shù)據(jù)成為重塑國家競爭優(yōu)勢的新機遇答案:ABD解析:[多選題]68.數(shù)據(jù)的故事化的特點包括()A)易于記憶B)易于認(rèn)知C)易于體驗D)易于感知答案:ABC解析:[多選題]69.下列關(guān)于密度聚類說法,錯誤的是()。A)DBSCAN是一種著名的密度聚類算法B)密度聚類從樣本數(shù)量的角度來考察樣本之間的可連接性C)密度聚類基于不可連接樣本不斷擴展聚類簇,以獲得最終的聚類結(jié)果D)密度直達(dá)關(guān)系通常滿足對稱性答案:BCD解析:密度聚類從樣本密度的角度來考察樣本之間的可連接性;密度聚類基于可連接樣本不斷擴展聚類簇,以獲得最終的聚類結(jié)果;密度直達(dá)關(guān)系通常不滿足對稱性;密度可達(dá)關(guān)系滿足直遞性,但不滿足對稱性;密度相連關(guān)系滿足對稱性。[多選題]70.數(shù)據(jù)安全管理是通過制定和實施相關(guān)安全策略和措施,按照?(___)?的總體原則,明確職責(zé)分工,落實數(shù)據(jù)安全責(zé)任。A)誰使用誰負(fù)責(zé)B)誰運維誰負(fù)責(zé)C)誰主管誰負(fù)責(zé)D)誰保障誰負(fù)責(zé)答案:AC解析:[多選題]71.以下描述錯誤的是?A)SVM是這樣一個分類器,他尋找具有最小邊緣的超平面,因此它也經(jīng)常被稱為最小邊緣分類器(minimalmarginclassifier)B)在聚類解析中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果越好C)在決策樹中,隨著樹中節(jié)點變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗誤差開始增大,這是出現(xiàn)了模型擬合不足的問題D)聚類解析可以看作是一種非監(jiān)督的分類答案:AC解析:[多選題]72.下列Python語句正確的是()()A)min=xifxB)max=x>y?x:yC)if(x>y):print(x)D)whileTrue:pass答案:CD解析:[多選題]73.F1參數(shù)由(__)和(__)綜合獲得A)查全率B)查準(zhǔn)率C)誤差D)精度答案:AB解析:[多選題]74.Spark是一種類MapReduce計算框架,相比較MapReduce有何優(yōu)勢A)內(nèi)存計算,速度快B)架構(gòu)支持廣泛,可多平臺運行C)融合流計算、算法等功能于一體D)分布式計算架構(gòu)答案:ABCD解析:[多選題]75.下列關(guān)于HDFS文件寫入的描述正確的有()。A)不支持多用戶對同一文件的寫操作B)用戶不可以在文件任意位置進行修改C)默認(rèn)將文件復(fù)制成三份存放D)復(fù)制的文件塊默認(rèn)不存在同一機架上答案:ABCD解析:根據(jù)HDFS定義。[多選題]76.下面關(guān)于L1范式正則化描述正確的是(__)。A)壓縮感知問題可以通過L1范數(shù)最小化問題求解B)L1范數(shù)正則化有助于降低過擬合風(fēng)險C)采用L1范數(shù)時平方誤差項等值線與正則化項等值線的交點常出現(xiàn)在坐標(biāo)軸上D)L1范數(shù)正則化比L2范數(shù)正則化更有易于獲得稀疏解答案:ABCD解析:[多選題]77.某餐飲O2O公司,立足于分析簽約餐廳的用戶用餐數(shù)據(jù),提供用戶菜品推薦,以下說法正確的有:()。A)可以利用Maxcompute的海量數(shù)據(jù)處理能力,對簽約餐廳的用戶用餐數(shù)據(jù)進行離線分析B)可以使用ADS的多值列,可以在一條用餐記錄中包含多個菜品,減少join的次數(shù),提供處理效率C)可以使用ADS的實時插入特性的表,可以支持一些OLTP類的場景D)可以利用OTS的高并發(fā)低延時的特性,支持一些在線分析,即將產(chǎn)生的業(yè)務(wù)數(shù)據(jù)存入OTS中,進行一些簡單的join和計算答案:AB解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.在采集數(shù)據(jù)的過程中,通過在滾動完文件的名稱后添加一個標(biāo)識的策略,不能避免因日志文件過大而導(dǎo)致上傳效率低的問題。A)正確B)錯誤答案:錯解析:[判斷題]79.由于Spark是基于內(nèi)存的計算引擎,因此,一個Spars應(yīng)用可以處理的數(shù)據(jù)量不能超過分給這個Spark應(yīng)用的內(nèi)存總和。A)正確B)錯誤答案:錯解析:[判斷題]80.包裹式特征選擇針對給定學(xué)習(xí)器進行優(yōu)化,從最終學(xué)習(xí)器性能來看,該方法比過濾式選擇更好,但由于需多次訓(xùn)練學(xué)習(xí)器,它的特征選擇的計算開銷通常比前者要大得多。()A)正確B)錯誤答案:對解析:[判斷題]81.回歸任務(wù)是預(yù)測連續(xù)值A(chǔ))正確B)錯誤答案:對解析:[判斷題]82.對于PCA處理后的特征,其樸素貝葉斯特征相互獨立的假設(shè)一定成立,因為所有主成分都是正交的,所以不相關(guān)A)正確B)錯誤答案:錯解析:[判斷題]83.python中集合不支持使用下標(biāo)來訪問其中的元素。A)正確B)錯誤答案:對解析:[判斷題]84.OVR是一種多分類方法。A)正確B)錯誤答案:對解析:[判斷題]85.已知x='hellowworldA)正確B)錯誤答案:對解析:[判斷題]86.誤差逆?zhèn)鞑ニ惴?BP)僅可用于多層前饋神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法。A)正確B)錯誤答案:錯解析:[判斷題]87.Oracle存儲過程可以使用阿里云流計算替換。A)正確B)錯誤答案:錯解析:[判斷題]88.數(shù)據(jù)化就是數(shù)字化,是相互等同的關(guān)系。A)正確B)錯誤答案:錯解析:[判斷題]89.大數(shù)據(jù)場景中對于數(shù)據(jù)的大小而言指的是數(shù)據(jù)的總量需要大,對于數(shù)據(jù)的數(shù)量要求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論