南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫答案_第1頁
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫答案_第2頁
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫答案_第3頁
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫答案_第4頁
南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫答案_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

長風(fēng)破浪會有時(shí),直掛云帆濟(jì)滄海。南開大學(xué)23春“物聯(lián)網(wǎng)工程”《大數(shù)據(jù)開發(fā)技術(shù)(二)》考試高頻考點(diǎn)參考題庫帶答案(圖片大小可自由調(diào)整)第I卷一.綜合考核(共15題)1.GraphX中()是存放著Edg對象的RDDA.RDD[Edge]B.EdgeRDDC.RDD[(VertexId,VD)]D.VertexRDD2.Scala中創(chuàng)建一個(gè)方法時(shí)經(jīng)常用void表示該方法無返回值。()T.對F.錯(cuò)3.Mllib中metrics.fMeasureByThreshold表示()指標(biāo)A.準(zhǔn)確度B.召回率C.F值D.ROC曲線4.Spark可以從()分布式文件系統(tǒng)中讀取數(shù)據(jù)A.HDFSB.HbaseC.HiveD.Tachyon5.()是Spark的數(shù)據(jù)挖掘算法庫。A.SparkCoreB.BlinkDBC.GraphXD.Mllib6.PairRDD可以通過()獲得僅包含鍵的RDDA.keyB.keysC.valueD.values7.請闡述Spark對數(shù)據(jù)進(jìn)行持久化的特點(diǎn)8.SparkStreming中DStream代表著一系列的持續(xù)的RDDs。()A.正確B.錯(cuò)誤9.SparkSQL讀取的數(shù)據(jù)源支持()A.Hive表B.Parquent文件C.JSON數(shù)據(jù)D.關(guān)系數(shù)據(jù)庫10.以下哪個(gè)不是Scala的數(shù)據(jù)類型()A.AnyRefB.AnythingC.NULLD.Nothing11.以下哪個(gè)方法可以從集合中創(chuàng)建RDD?()A.parallelizeB.makeRDDC.textFileD.loadFile12.Spark中的每個(gè)RDD一般情況下是由()個(gè)分區(qū)組成的。A.0B.1C.多D.無數(shù)13.TF-IDF中TF指的是()A.詞頻B.詞在文檔中出現(xiàn)的次數(shù)C.逆文檔概率D.詞在文檔集中出現(xiàn)的概率E.詞在文檔集中出現(xiàn)的概率14.RDD的filter過濾會將返回值為true的過濾掉。()T.對F.錯(cuò)15.Scala中創(chuàng)建一個(gè)方法時(shí)經(jīng)常用void表示該方法無返回值A(chǔ).正確B.錯(cuò)誤第II卷一.綜合考核(共15題)1.Scala列表方法中丟棄前n個(gè)元素,并返回新列表的方法是()A.dropB.headC.filterD.init2.Scala函數(shù)組合器可以通過一個(gè)函數(shù)重新計(jì)算列表中所有元素,沒有返回值。()A.正確B.錯(cuò)誤3.SparkDataFrame中()方法可以返回一個(gè)Array對象A.collectB.takeC.takeAsListD.collectAsList4.在圖結(jié)構(gòu)中,每個(gè)元素都可以有()后繼。A.至少一個(gè)B.零個(gè)或多個(gè)C.一個(gè)D.零個(gè)5.以下哪個(gè)是Scala的數(shù)據(jù)類型()A.AnyB.NULLC.NothingD.AnyRef6.SparkStreming中()函數(shù)可以對源DStream的每個(gè)元素通過函數(shù)func返回一個(gè)新的DStreamA.mapB.flatMapC.filterD.union7.GraphX中VertexRDD[VD]繼承自()。A.EdgeRDDB.RDD[Edge]C.VertexRDD[VD]D.RDD[(VertexId,VD)]8.以下哪個(gè)函數(shù)可以求兩個(gè)RDD交集()A.unionB.substractC.intersectionD.cartesian9.RDD是一個(gè)可讀寫的數(shù)據(jù)結(jié)構(gòu)。()T.對F.錯(cuò)10.以下哪個(gè)函數(shù)可以對RDD進(jìn)行排序?()A.sortByB.filterC.distinctD.intersection11.以下哪個(gè)函數(shù)可以對兩個(gè)RDD進(jìn)行合并()A.unionB.substractC.intersectionD.cartesian12.Scala集合分為可變的和不可變的集合。()A.正確B.錯(cuò)誤13.Scala通過()來定義變量A.valB.valC.defineD.def14.Scala函數(shù)組合器中filter過濾移除使得傳入的函數(shù)的返回值為true的元素。()A.正確B.錯(cuò)誤15.RDD的map操作不會改變RDD的分區(qū)數(shù)目。()T.對F.錯(cuò)第I卷參考答案一.綜合考核1.參考答案:A2.參考答案:F3.參考答案:C4.參考答案:ABCD5.參考答案:D6.參考答案:B7.參考答案:(1)RDD\r\n的存儲級別應(yīng)該根據(jù)需要以及環(huán)境具體情況設(shè)定,在RDD參與第一次計(jì)算后,RDD就會根據(jù)設(shè)置的存儲級別保存RDD計(jì)算后的值在內(nèi)存中或磁盤上。(2)只有未曾設(shè)置存儲級別的RDD才能設(shè)置存儲級別,設(shè)置了存儲級別的RDD不能修改其存儲級別。(3)\r\n針對僅存儲數(shù)據(jù)在內(nèi)存中的存儲策略,如果內(nèi)存不足的話,Spark會使用LRU緩存策略清除最老的分區(qū),為新的RDD提供空間,所以緩存在內(nèi)存中的RDD分區(qū)是會被清除的,而不能長久保存,而緩存在磁盤上的數(shù)據(jù)則不用擔(dān)心。8.參考答案:A9.參考答案:ABCD10.參考答案:B11.參考答案:AB12.參考答案:C13.參考答案:AB14.參考答案:F15.參考答案:B第II卷參考答案一.綜合考核1.參考答案:A2.參考

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論