南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫(kù)帶答案_第1頁(yè)
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫(kù)帶答案_第2頁(yè)
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫(kù)帶答案_第3頁(yè)
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫(kù)帶答案_第4頁(yè)
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫(kù)帶答案_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

長(zhǎng)風(fēng)破浪會(huì)有時(shí),直掛云帆濟(jì)滄海。南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫(kù)帶答案(圖片大小可自由調(diào)整)第I卷一.綜合考核(共15題)1.Scala中高階函數(shù)經(jīng)常將只需要執(zhí)行多次的函數(shù)定義為匿名函數(shù)作為參數(shù)。()T.對(duì)F.錯(cuò)2.spark-submit配置項(xiàng)中()表示Driver程序使用的內(nèi)存大小A.--driver-memoryMEMB.--executor-memoryMEMC.--total-executor-coresNUMD.--executor-couresNUM3.Spark可以通過(guò)哪些外部存儲(chǔ)創(chuàng)建RDD()A.文本文件B.目錄C.壓縮文件D.通配符匹配的文件4.SparkDataFrame中()方法可以返回一個(gè)Array對(duì)象A.collectB.takeC.takeAsListD.collectAsList5.Spark支持使用()語(yǔ)言編寫應(yīng)用A.ScalaB.PythonC.JavaD.R6.Spark可以從()分布式文件系統(tǒng)中讀取數(shù)據(jù)A.HDFSB.HbaseC.HiveD.Tachyon7.Scala是一種純面向?qū)ο蟮恼Z(yǔ)言,每個(gè)值都是對(duì)象。()T.對(duì)F.錯(cuò)8.GraphX中()方法可以查詢度數(shù)A.degreesB.degreeC.verticesD.edges9.Dstream提供了sort方法。()A.正確B.錯(cuò)誤10.RDD的行動(dòng)操作是用于觸發(fā)轉(zhuǎn)換操作的操作,這個(gè)時(shí)候才會(huì)真正開始進(jìn)行計(jì)算。()A.正確B.錯(cuò)誤11.Spark中的RDD的說(shuō)法正確的是()A.彈性分布式數(shù)據(jù)集B.是Spark中最基本的數(shù)據(jù)抽象C.代表一個(gè)可變的集合D.代表的集合里面的元素可并行計(jì)算12.以下哪個(gè)方法可以創(chuàng)建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile13.RDD的flatMap操作是將函數(shù)應(yīng)用于RDD之中的每一個(gè)元素,將返回的迭代器(數(shù)組、列表等)中的所有元素構(gòu)成新的RDD。()A.正確B.錯(cuò)誤14.Spark創(chuàng)建DataFrame對(duì)象方式有()A.結(jié)構(gòu)化數(shù)據(jù)文件B.外部數(shù)據(jù)庫(kù)C.RDDD.Hive中的表15.Scala函數(shù)組合器可以接收一個(gè)可以處理嵌套列表的函數(shù),然后把返回結(jié)果連接起來(lái)的方法是()A.mapB.foreachC.flattenD.flatmap第II卷一.綜合考核(共15題)1.vara=10;for(aA.10B.11C.20D.192.()是AMPLab發(fā)布的一個(gè)R開發(fā)包,使得R擺脫單機(jī)運(yùn)行的命運(yùn),可以作為Spark的Job運(yùn)行在集群上A.SparkRB.BlinkDBC.GraphXD.Mllib3.Scala通過(guò)()來(lái)定義變量A.valB.valC.defineD.def4.RDD的行動(dòng)操作通過(guò)某種函數(shù)將一個(gè)RDD轉(zhuǎn)換為一個(gè)新的RDD,但是轉(zhuǎn)換操作是懶操作,不會(huì)立刻執(zhí)行計(jì)算。()A.正確B.錯(cuò)誤5.Scala列表中l(wèi)ast返回列表最后一個(gè)元素。()A.正確B.錯(cuò)誤6.RDD的sortBy函數(shù)包含參數(shù)numPartitions,該參數(shù)決定排序后的RDD的分區(qū)個(gè)數(shù),默認(rèn)排序后的分區(qū)個(gè)數(shù)和排序之前的個(gè)數(shù)相等,即為this.partitions.size。()T.對(duì)F.錯(cuò)7.Dstream輸出操作中()方法將DStream中的內(nèi)容按對(duì)象序列化并且以SequenceFile的格式保存。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles8.Scala函數(shù)組合器可以過(guò)濾移除使得傳入的函數(shù)的返回值為false的元素的方法是()A.filterB.flattenC.groubyD.flatmap9.Dstream窗口操作中()方法基于滑動(dòng)窗口對(duì)源DStream中的元素進(jìn)行聚合操作,得到一個(gè)新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow10.Scala函數(shù)支持()A.遞歸函數(shù)B.高階函數(shù)C.柯里化D.匿名函數(shù)11.GraphX中Edge邊對(duì)象存有()字段A.srcIdB.dstIdC.attrD.val12.RDD的subtract用于用于將前一個(gè)RDD中在后一個(gè)RDD出現(xiàn)的元素刪除。()T.對(duì)F.錯(cuò)13.SparkGraphX中類Graph的joinVertices方法可以()。A.收集鄰居頂點(diǎn)的頂點(diǎn)Id和頂點(diǎn)屬性B.收集鄰居頂點(diǎn)的頂點(diǎn)IdC.向指定頂點(diǎn)發(fā)送信息并聚合信息D.將頂點(diǎn)信息更新到圖中14.SparkStreming中()函數(shù)當(dāng)被調(diào)用類型分別為(K,V)和(K,W)鍵值對(duì)的2個(gè)DStream時(shí),返回類型為(K,(V,W))鍵值對(duì)的一個(gè)新DStream。A.unionB.reduceC.joinD.cogroup15.SparkStreaming能夠處理來(lái)自()的數(shù)據(jù)。A.KafkaB.FlumeC.TwitterD.ZeroMQ第III卷一.綜合考核(共15題)1.Scala列表與數(shù)組非常相似,列表的所有元素可具有不同的類型。()A.正確B.錯(cuò)誤2.MLlib中用于線性回歸算法的包主要有()A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression3.RDD的filter過(guò)濾會(huì)將返回值為true的過(guò)濾掉。()A.正確B.錯(cuò)誤4.SparkR(名詞解釋)5.用戶可以在HadoopYARN上運(yùn)行Spark。()A.正確B.錯(cuò)誤6.請(qǐng)問(wèn)RDD的()操作是根據(jù)鍵對(duì)兩個(gè)RDD進(jìn)行內(nèi)連接A.joinB.zipC.combineByKeyD.collect7.Spark中DataFrame的()方法是進(jìn)行分組查詢A.orderbyB.groupbyC.selectbyD.sortby8.RDD的cartesian函數(shù)是笛卡爾積,也就是將兩個(gè)集合的元素兩兩組合成一組。()A.正確B.錯(cuò)誤9.GraphX中g(shù)raph.triplets可以得到()A.頂點(diǎn)視圖B.邊視圖C.頂點(diǎn)與邊的三元組整體視圖D.有向圖10.MLlib中Normalizer是一個(gè)轉(zhuǎn)換器,它可以將多行向量輸入轉(zhuǎn)化為統(tǒng)一的形式。()A.正確B.錯(cuò)誤11.Scala列表方法中返回所有元素,除了最后一個(gè)的方法是()A.dropB.headC.filterD.init12.Mllib中metrics.recallByThreshold表示()指標(biāo)A.準(zhǔn)確度B.召回率C.F值D.ROC曲線13.Spark中DataFrame的()方法是查詢指定字段的數(shù)據(jù)信息A.selectB.selectExprC.colD.apply14.Scala中創(chuàng)建一個(gè)方法時(shí)經(jīng)常用void表示該方法無(wú)返回值A(chǔ).正確B.錯(cuò)誤15.Mllib中線性會(huì)館算法中的參數(shù)intercept表示()A.要運(yùn)行的迭代次數(shù)B.梯度下降的步長(zhǎng)C.是否給數(shù)據(jù)加干擾特征或者偏差特征D.Lasso和ridge的正規(guī)化參數(shù)第I卷參考答案一.綜合考核1.參考答案:F2.參考答案:A3.參考答案:ABCD4.參考答案:AB5.參考答案:ABCD6.參考答案:ABCD7.參考答案:T8.參考答案:A9.參考答案:B10.參考答案:A11.參考答案:ABD12.參考答案:ABC13.參考答案:A14.參考答案:ABCD15.參考答案:D第II卷參考答案一.綜合考核1.參考答案:D2.參考答案:A3.參考答案:A4.參考答案:B5.參考答案:A6.參考答案:T7.參考答案:D8.參考答案:A9.參考答案:C10.參考答案:ABCD11.參考答案:ABC12.參考答案:T13.參考答案:D14.參考答案:D15.參考答案:ABCD第III卷參考答案一.綜合考核1.參考答案

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論