奧鵬南開20春學(xué)期1709、1803、1809、1903、1909、2003大數(shù)據(jù)開發(fā)技術(shù)二在線作業(yè)_2隨機_第1頁
奧鵬南開20春學(xué)期1709、1803、1809、1903、1909、2003大數(shù)據(jù)開發(fā)技術(shù)二在線作業(yè)_2隨機_第2頁
奧鵬南開20春學(xué)期1709、1803、1809、1903、1909、2003大數(shù)據(jù)開發(fā)技術(shù)二在線作業(yè)_2隨機_第3頁
奧鵬南開20春學(xué)期1709、1803、1809、1903、1909、2003大數(shù)據(jù)開發(fā)技術(shù)二在線作業(yè)_2隨機_第4頁
奧鵬南開20春學(xué)期1709、1803、1809、1903、1909、2003大數(shù)據(jù)開發(fā)技術(shù)二在線作業(yè)_2隨機_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、I.Spark 中 DataFrame 的()方法是進行條件查詢【參考答案】:A2.Dstream 輸出操作中 print 方法在 Driver 中打印出 DStream 中數(shù)據(jù)的()元素。A.第一個B.所有C.前10個D.前100個【參考答案】:C3.Scala 元組的值是通過將單個的值包含在()中構(gòu)成的A.小括號B.中括號C.大括號D.尖括號【參考答案】:A4.當(dāng)需要將一個普通的 RDD ?;癁橐粋€ PairRDD 時可以使用()函數(shù)來進行操作A.whereB.joinC.limitD.apply7.spark-submit配置項中()表示 executor 使用的總核數(shù)A.-num-ex

2、ecutors NUM B.-executor-memory MEM C.-total-executor-cores NUMD.-executor-coures NUM【參考答案】:C8. GraphX 中()方法可以釋放頂點緩存A.cache B.presist C.unpersistVertices D.edges.unpersist【參考答案】:C9. 以下哪個方法可以從外部存儲中創(chuàng)建RDD()A.parallelize B.makeRDD C.textFile D.loadFile【參考答案】:C10.Scala 可以使用()關(guān)鍵字實現(xiàn)單例模式A.object B.static C.p

3、rivate D.public【參考答案】:A11. 以下哪個不是 Scala 的數(shù)據(jù)類型()A.transferB.changeC.map D.build5.以下哪個函數(shù)可以求兩個RD 皎集A.unionB.substractC.intersectionD.cartesian6.以下哪個函數(shù)可以求兩個RDD 集A.unionB.substractC.intersectionD.cartesianA.Int B.Short Int C.Long D.Any【參考答案】:B12. Mllib 中 metrics.precisionByThreshold 表示()指標A.準確度B.召回率C.F值D

4、.ROCtt線【參考答案】:A13. 圖的結(jié)構(gòu)通常表示為:G(V,E),其中,E 是圖 G 中()A.頂點B.頂點的集合C.邊D.邊的集合【參考答案】:D14. 請問 RDD 勺()操作用于將相同鍵的數(shù)據(jù)聚合A.join B.zip C.combineByKey D.collect【參考答案】:C15. Mllib 中 metrics.recallByThreshold 表示()指標A.準確度B.召回率C.F值D.ROCtt線【參考答案】:B16. GraphX 中 EdgeRDD 悵承自()A.EdgeRDD B.RDDEdge C.VertexRDDVD D.RDD(VertexId ,V

5、D)【參考答案】:B17. Dstream 輸出操作中()方法將 DStream 中的內(nèi)容以文本的形式保存為文本文件A.print B.saveAsTextFiles C.saveAsObjectFiles D.saveAsHadoopFiles【參考答案】:B18. GraphX 中()方法可以查詢頂點信息A.numVertices B.numEdges C.vertices D.edges【參考答案】:C19.Scala 通過()來定義變景【參考答案】:A20.Mllib 中線性會館算法中的參數(shù) reParam 表示()A.要運行的迭代次數(shù)B.梯度下降的步長C.是否給數(shù)據(jù)加十?dāng)_特征或者偏差

6、特征D.Lasso和ridge的正規(guī)化參數(shù)【參考答案】:D21.Scala 中()方法返回 Map 所有的 valueA.key B.keys C.value D.values【參考答案】:D22.Scala 列表方法中返回所有元素,除了最后一個的方法是()A.drop B.head C.filter D.init【參考答案】:D23.Spark Streming 中()函數(shù)可以使用 func 將源 DStream 中的每個元素進行聚合操作,返回一個內(nèi)部所包含的RDDR 有一個元素的新DStreamA.union B.reduce C.join D.cogroup【參考答案】:B24.Pair

7、RDD 可以通過()獲得僅包含鍵的RDDA.key B.keys C.value D.valuesA.valB.valC.defineD.def【參考答案】:B25.Scala 中()方法返回 Map 所有的 keyA.key B.keys C.value D.values【參考答案】:B26.以下哪個是 Scala 的數(shù)據(jù)類型()A.Any B.NULL C.Nothing D.AnyRef【參考答案】:ABCD27.以下算法中屬于分類算法的是()A.KNN算法B.邏輯回歸C.隨機森林D.Kmeans【參考答案】:ABC28.Spark 的 RDD 寺久化操作有()方式A.cache B.p

8、resist C.storage D.long【參考答案】:AB29.Spark Streaming 的特點有()A.單極性B.可伸縮C.高吞吐量D.容錯能力強【參考答案】:BCD30.Spark Streaming 能夠和()無縫集成A.Hadoop B.Spark SQL C.Mllib D.GraphX【參考答案】:BCD31.Scala 系統(tǒng)支持()作為對象成員A.通用類B.內(nèi)部類C.抽象類D.復(fù)合類: ABCD32.Scala 中可以用()方法來連接兩個或多個列表A.:B.#:C.List.:()D.List.concat()【參考答案】:ABCD33.Spark DataFrame

9、 中()方法可以返回一個ListA.collect B.take C.takeAsList D.collectAsList【參考答案】:ABCD34.Spark DataFrame 中()方法可以返回一個Array 對象A.collect B.take C.takeAsList D.collectAsList【參考答案】:AB35.Spark 可以通過哪些外部存儲創(chuàng)建RDD()A.文本文件B.目錄C.壓縮文件D.通配符匹配的文件【參考答案】:ABCD36.Spark 只有鍵值對類型的 RDDt 能設(shè)置分區(qū)方式T.對F.錯【參考答案】:T37.Scala 中列表是可變的T.對F.錯【參考答案】:

10、F38.RDD 的轉(zhuǎn)換操作是用于觸發(fā)轉(zhuǎn)換操作的操作,這個時候才會真正開 始進行計算。T.對F.錯【參考答案】:F39.Spark 取代 Hadoop 僅僅是取代 MapReduc 驅(qū)種計算框架,Spark 可 以取代 HDFS 馬T.對F.錯【參考答案】:F40.Spark 在同一個應(yīng)用中不能同時使用Spark SQL 和 MllibT.對F.錯【參考答案】:F41.val 如同 Java 里面的非 final 變景,可以在它的聲明周期中被多次 賦值。T.對F.錯【參考答案】:F42.Scala 配備了一種表現(xiàn)型的系統(tǒng),它以靜態(tài)的方式進行抽象,以安 全和連貫的方式進行使用。T.對F.錯【參考答

11、案】:T43.RDD 的 mapPartitions 操作會導(dǎo)致 Partitions數(shù) H 的變化T.對F.錯【參考答案】:F44. RDD 的 flatMap 操作是將函數(shù)應(yīng)用于 RDD 之中的每一個元素,將返 回的迭代器(數(shù)組、列表等)中的所有元素構(gòu)成新的 RDD。T.對F.錯【參考答案】:T45. RDD 的 subtract 用于用于將前一個 RDD 中在后一個 RDD 出現(xiàn)的元素刪除T.對F.錯【參考答案】:T46. MLlib 中 StandardScaler 處理的對象是每一列,也就是每一維特征,將特征標準化為單位標準差或是0 均值,或是 0 均值單位標準差。T.對F.錯【參考答案】:T47. RDD 的 filter函數(shù)返回一個存儲符合過濾條件的所有元素的新RDDT.對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論