版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、I.Scala中合并兩個數(shù)組的方法是()A.line B.add C.append D.concat【參考答案】:D2.以下哪個函數(shù)可以對RDDS行排序()A.sortBy B.filter C.distinct D.intersection【參考答案】:A3. Graph類中如果要直接通過邊數(shù)據(jù)文件創(chuàng)建圖,要求數(shù)據(jù)按空格分隔,應該用()方法A.Graph(vertices,edges,defaultVertexAttr) B.Graph.fromEdges(RDDEdgeED,defaultValue) C.Graph.fromEdgeTuples(rawEdges: RDD(VertexI
2、d,VertexId),defaultValue,) D.GraphLoader.edgeListFile(sc,filename)【參考答案】:D4.下列Scala代碼應輸出():var a=0; var b=0 var sum=0; for(a-1 until 3; b-1until 3) sum+=a+b; println(sum);A.36B.35C.11D.12【參考答案】:D5. GraphX中()是提供頂點的各種操作方法的對象A.RDDEdge B.EdgeRDD C.RDD(VertexId,VD) D.VertexRDD【參考答案】:D6.Scala列表方法中返回所有元素,除
3、了最后一個的方法是()【參考答案】:D7. Dstream輸出操作中()方法在Driver中打印出DStream中數(shù)據(jù)的前12個元素。A.print B.saveAsTextFiles C.saveAsObjectFiles D.saveAsHadoop Files【參考答案】:C8.()是Spark的核心,提供底層框架及核心支持A.Spark Core B.Spark SQL C.Spark Streaming D.Mllib【參考答案】:A9.如果numPartitions是分區(qū)個數(shù), 那么Spark每個RDD勺分區(qū)ID范圍是()A.0,numPartitions B.0,numParti
4、tions-1 C.1,numPartitions-1D.1,numPartitions【參考答案】:B10. PairRDD中()函數(shù)可以對具有相同鍵的值進行分組A.mapValues B.groupBy C.groupByKey D.reduceByKey【參考答案】:CA.dropB.headC.filterD.init11. GraphX中()方法可以緩存整個圖,并指定存儲級別A.cache B.presist C.unpersistVertices D.edges.unpersist【參考答案】:B12.當需要將一個普通的RDD?;癁橐粋€PairRDD時可以使用()函數(shù) 來進行操作A
5、.transfer B.change C.map D.build【參考答案】:C13. Dstream窗口操作中()方法基于滑動窗口對(K, V)鍵值對類型 的DStream中的值按K使用聚合函數(shù)func進行聚合操作,得到一個新 的DstreamA.window B.countByWindow C.reduceByWindow D.reduceByKeyAndWi ndow【參考答案】:D14. spark-submit配置項中()表示executor使用的總核數(shù)A.-num-executors NUM B.-executor-memoryMEMC.-total-executor-cores
6、NUMD.-executor-coures NUM【參考答案】:C15.圖結(jié)構(gòu)中如果任意兩個頂點之間都存在邊,那么稱之為()A.完全圖B.有向完全圖C.無向圖D.簡單圖【參考答案】:A16.以下哪個函數(shù)可以求兩個RDD勺笛卡爾積()A.union B.substract C.intersection D.cartesian17.Scala類通過子類化和基于靈活的混合類來進行擴展,作為#的一個可靠性解決方案A.多態(tài)B.虛函數(shù)C.派生D.多重繼承【參考答案】:D18. MLlib中可以調(diào)用mllib.tree.DecisionTree類中的靜態(tài)方法()訓練分類樹A.trainClassifierB
7、.trainRegressor C.LogisticRegressionModelD.LabeledPoint【參考答案】:A19.以下哪個不是Scala的數(shù)據(jù)類型()A.Int B.Short Int C.Long D.Any【參考答案】:B20. Mllib中metrics.precisionByThreshold表示()指標A.準確度B.召回率C.F值D.ROC線【參考答案】:A21. PairRDD可以通過()獲得僅包含鍵的RDDA.key B.keys C.value D.values【參考答案】:B22. RDD的()操作通常用來劃分單詞A.filter B.union C.fla
8、tmap D.mapPartitions23.請問RDD勺()操作作用于K-V類型的RDD,返回指定K的所有V值A.search B.find C.findByKey D.lookup【參考答案】:D24.圖的結(jié)構(gòu)通常表示為:G(V,E),其中,V是圖G中()A.頂點B.頂點的集合C.邊D.邊的集合【參考答案】:B25.一般情況下,對于迭代次數(shù)較多的應用程序,Spark程序在內(nèi)存中的運行速度是Hadoop MapReducei!行速度的()多倍A.2B.10C.100D.1000【參考答案】:C26. PairRDD中()函數(shù)可以進行分組A.mapValues B.groupBy C.grou
9、pByKey D.reduceByKey【參考答案】:BC27.Spark創(chuàng)建DataFrame對象方式有()A.結(jié)構(gòu)化數(shù)據(jù)文件B.外部數(shù)據(jù)庫C.RDD D.Hive中的表【參考答案】:ABCD28.Spark DataFrame中()方法可以返回一個Array對象A.collect B.take C.takeAsList D.collectAsList【參考答案】:AB29.Spark Core包含的功能有()A.任務調(diào)度B.內(nèi)存管理C.SQL查詢D.容錯機制【參考答案】:ABD30.Spark Streaming能夠和()無縫集成A.Hadoop B.Spark SQL C.Mllib D
10、.GraphX【參考答案】:BCD31.以下是機器學習的常用算法的是()A.回歸算法B.聚類算法C.降維算法D.分類算法【參考答案】:ABCD32.Scala支持()A.匿名函數(shù)B.高階函數(shù)C.函數(shù)嵌套D.柯里化【參考答案】:ABCD33.Spark中DataFrame的()方法是查詢指定字段的數(shù)據(jù)信息A.select B.selectExpr C.col D.apply【參考答案】:ABCD34.Spark可以通過哪些外部存儲創(chuàng)建RDD()A.文本文件B.目錄C.壓縮文件D.通配符匹配的文件【參考答案】:ABCDA.appendB.C.concatD.Set.()35.Scala中使用()方
11、法來連接兩個集合【參考答案】:BD36.Scala可以通過“val ”來定義變景,通過“var ”關鍵字來定義常景T.對F.錯【參考答案】:F37.Scala中列表是可變的T.對F.錯【參考答案】:F38. MLlib由一些通用的學習算法和工具組成,包括分類、回歸、聚類、協(xié)同過濾、降維等,同時還包括底層的優(yōu)化原語和高層的管道API。T.對F.錯【參考答案】:T39. RDD的union函數(shù)會將兩個RD阮素合并成一個并且去處重復元素T.對F.錯【參考答案】:F40.聚類是一種無監(jiān)督學習的方法,用于將高度相似的數(shù)據(jù)分到一類中T.對F.錯【參考答案】:T41.Spark SQL包括基本的SQL語法和HiveQL語法T.對F.錯【參考答案】:T42.Scala函數(shù)組合器中flatten可以把嵌套的結(jié)構(gòu)展開T.對F.錯【參考答案】:T43.Scala中默認情況下使用的是可變的MapT.對F.錯【參考答案】:F44.Scala在子類中重寫超類的抽象方法時,需要使用override關鍵字T.對F.錯【參考答案】:F45.Scala是Scalable Language的簡寫,是一門多范式的編程語言, 設計初衷是不包括函數(shù)式編程的特性。T.對F.錯【參考答案】:F46.Scala語言中提供的數(shù)組是用來存儲動態(tài)大小的同類型元素T.對F.錯【參考答案】:F47.RD D的行動操作通過某種函
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 利用大數(shù)據(jù)分析預測消費趨勢
- 高一化學教案:專題第一單元第二課時化學反應速率與可逆反應
- 2024高中化學第二章化學反應速率和化學平衡第三章第3課時化學平衡常數(shù)達標訓練含解析新人教版選修4
- 2024高中地理課時作業(yè)2地理信息技術(shù)在區(qū)域地理環(huán)境研究中的應用含解析新人教版必修3
- 2024高中生物第五章生態(tài)系統(tǒng)及其穩(wěn)定性第2節(jié)生態(tài)系統(tǒng)的能量流動訓練含解析新人教版必修3
- 2024高中語文第二課千言萬語總關“音”第4節(jié)聲情并茂-押韻和平仄練習含解析新人教版選修語言文字應用
- DB42-T 2352-2024 道路瀝青紅外光譜法快速識別技術(shù)規(guī)程
- 《豆角趣事》幼兒園班本課程課件
- (2篇)2024 年幼兒園保健工作總結(jié)
- 監(jiān)督檢查施工安全防護措施
- 信號分析與處理-教學大綱
- 氣藏提高采收率技術(shù)與方法綜述
- 河道整治工程運營維護方案
- 國家醫(yī)療保障疾病診斷相關分組(CHS-DRG)分組與付費技術(shù)規(guī)范(可編輯)
- 新高考普通高中生物人教版教材目錄
- 喜家德水餃合伙人協(xié)議書
- 中考數(shù)學計算題100道
- 高壓變頻器整流變壓器
- 質(zhì)量總監(jiān)煉成記
- 學校突發(fā)安全事件應急預案目錄
- 《新唯識論》儒佛會通思想研究
評論
0/150
提交評論