版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
MOOC大數(shù)據(jù)分析原理和應(yīng)用-中央財經(jīng)大學(xué)中國大學(xué)慕課答案大數(shù)據(jù)的產(chǎn)生1、問題:大數(shù)據(jù)的起源是選項:A、金融B、電信C、互聯(lián)網(wǎng)D、公共管理正確答案:【互聯(lián)網(wǎng)】2、問題:下列關(guān)于計算機存儲容量單位的說法中,錯誤的是選項:A、1KB1MB1GBB、基本單位是字節(jié)(Byte)?C、一個漢字需要一個字節(jié)的存儲空間D、一個字節(jié)能夠容納一個英文字符正確答案:【一個漢字需要一個字節(jié)的存儲空間】3、問題:下列關(guān)于計算機存貯容量單位換算關(guān)系的公式中,正確的是選項:A、1KB=1012Byte???B、1KB=1024Byte?C、1GB=1024KBD、1GB=1024MB正確答案:【1KB=1024Byte?#1GB=1024MB】大數(shù)據(jù)的特點和技術(shù)概述1、問題:下列關(guān)于舍恩伯格對大數(shù)據(jù)特點的說法中,錯誤的是()選項:A、數(shù)據(jù)規(guī)模大B、數(shù)據(jù)類型多樣C、數(shù)據(jù)處理速度快D、數(shù)據(jù)價值密度高正確答案:【數(shù)據(jù)價值密度高】2、問題:當(dāng)前大數(shù)據(jù)技術(shù)的基礎(chǔ)是由()首先提出的。選項:A、微軟B、百度C、谷歌D、阿里巴巴正確答案:【谷歌】3、問題:經(jīng)過一系列處理,在基本保持原始數(shù)據(jù)完整性的基礎(chǔ)上,減小數(shù)據(jù)規(guī)模的是()選項:A、數(shù)據(jù)清理B、數(shù)據(jù)集成C、數(shù)據(jù)規(guī)約D、數(shù)據(jù)挖掘正確答案:【數(shù)據(jù)規(guī)約】4、問題:BIRCH是一種(??)。?選項:A、分類器B、聚類算法C、關(guān)聯(lián)分析算法D、特征選擇算法正確答案:【聚類算法】5、問題:用4個V來描述大數(shù)據(jù)的四個基本特征,這4V是()選項:A、體量大B、速度快C、多樣性D、產(chǎn)生價值正確答案:【體量大#速度快#多樣性#產(chǎn)生價值】大數(shù)據(jù)的價值1、問題:大數(shù)據(jù)的價值體現(xiàn)在()。選項:A、大數(shù)據(jù)給思維方式帶來了沖擊B、大數(shù)據(jù)為政策制定提供科學(xué)依據(jù)C、大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平D、大數(shù)據(jù)實現(xiàn)了精準(zhǔn)營銷正確答案:【大數(shù)據(jù)給思維方式帶來了沖擊#大數(shù)據(jù)為政策制定提供科學(xué)依據(jù)#大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平#大數(shù)據(jù)實現(xiàn)了精準(zhǔn)營銷】2、問題:大數(shù)據(jù)預(yù)測能分析和挖掘出人們不知道或沒有注意到的模式,確定判斷某件事情必然會發(fā)生。選項:A、正確B、錯誤正確答案:【錯誤】大數(shù)據(jù)時代的思維變革1、問題:下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯誤的是()選項:A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析我不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)正確答案:【在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)】2、問題:采樣分析的精確性隨著采樣隨機性的增加而(),但與樣本數(shù)量的增加關(guān)系不大。選項:A、降低B、不變C、提高D、無關(guān)正確答案:【提高】3、問題:大數(shù)據(jù)是指不用隨機分析法這樣的捷徑,而采用()的方法。選項:A、所有數(shù)據(jù)B、絕大部分?jǐn)?shù)據(jù)C、適量數(shù)據(jù)D、少量數(shù)據(jù)正確答案:【所有數(shù)據(jù)】4、問題:大數(shù)據(jù)的簡單算法與小數(shù)據(jù)的復(fù)雜算法相比()。選項:A、更有效B、相當(dāng)C、不具備可比性D、無效正確答案:【更有效】5、問題:相比依賴于小數(shù)據(jù)和精確性的時代,大數(shù)據(jù)因為更強調(diào)數(shù)據(jù)的(),幫助我們進一步接近事實的真相。選項:A、安全性B、完整性C、混雜性D、完整性和混雜性正確答案:【完整性和混雜性】6、問題:大數(shù)據(jù)時代,我們是要讓數(shù)據(jù)自己“發(fā)聲”,沒必要知道為什么,只需要知道()。?選項:A、原因B、是什么C、關(guān)聯(lián)物D、預(yù)測的關(guān)鍵正確答案:【是什么】7、問題:啤酒與尿布的經(jīng)典案例,充分體現(xiàn)了實驗思維在大數(shù)據(jù)分析理念中的重要性。選項:A、正確B、錯誤正確答案:【錯誤】第一章單元作業(yè)第一章單元測試1、問題:美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()。選項:A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)正確答案:【在分析方法上更注重相關(guān)分析而不是因果分析】2、問題:將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?()???選項:A、頻繁模式挖掘B、分類和預(yù)測C、數(shù)據(jù)預(yù)處理??D、數(shù)據(jù)流挖掘正確答案:【數(shù)據(jù)預(yù)處理??】3、問題:可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。?選項:A、SVM算法、對數(shù)回歸、關(guān)聯(lián)模式B、K均值法、BP神經(jīng)網(wǎng)絡(luò)??C、Apriori算法、FP-Tree算法?D、樸素貝葉斯算法、K均值法、決策樹正確答案:【Apriori算法、FP-Tree算法?】4、問題:下列關(guān)于大數(shù)據(jù)的說法中,錯誤的是()。選項:A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時效性強的特征B、處理大數(shù)據(jù)需采用新型計算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析正確答案:【大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時效性強的特征#大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析】5、問題:大數(shù)據(jù)與三個重大的思維轉(zhuǎn)變有關(guān),這三個轉(zhuǎn)變是什么?()。選項:A、要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本。?B、我們樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性。?C、在數(shù)字化時代,數(shù)據(jù)處理變得更加容易、更加快速,人們能夠在瞬間處理成千上萬的數(shù)據(jù)。?D、我們的思想發(fā)生了轉(zhuǎn)變,不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。?正確答案:【要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本。?#我們樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性。?#我們的思想發(fā)生了轉(zhuǎn)變,不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。?】6、問題:下面關(guān)于大數(shù)據(jù)的解說正確的是()。選項:A、大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的。?B、大數(shù)據(jù)是人們獲得新的認知、創(chuàng)造新的價值的源泉。?C、大數(shù)據(jù)還是改變市場、組織機構(gòu),以及政府與公民關(guān)系的方法。?D、無效的數(shù)據(jù)越來越多。?正確答案:【大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的。?#大數(shù)據(jù)是人們獲得新的認知、創(chuàng)造新的價值的源泉。?#大數(shù)據(jù)還是改變市場、組織機構(gòu),以及政府與公民關(guān)系的方法。?】7、問題:大數(shù)據(jù)的科學(xué)價值和社會價值正是體現(xiàn)在()選項:A、一方面,對大數(shù)據(jù)的掌握程度可以轉(zhuǎn)化為經(jīng)濟價值的來源。?B、另一方面,大數(shù)據(jù)已經(jīng)撼動了世界的方方面面,從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟、人文以及社會的其他各個領(lǐng)域。?C、大數(shù)據(jù)的價值不再單純來源于它的基本用途,而更多源于它的二次利用。?D、大數(shù)據(jù)時代,很多數(shù)據(jù)在收集的時候并無意用作其他用途,而最終卻產(chǎn)生了很多創(chuàng)新性的用途。正確答案:【一方面,對大數(shù)據(jù)的掌握程度可以轉(zhuǎn)化為經(jīng)濟價值的來源。?#另一方面,大數(shù)據(jù)已經(jīng)撼動了世界的方方面面,從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟、人文以及社會的其他各個領(lǐng)域。?】8、問題:人們關(guān)心大數(shù)據(jù),最終是關(guān)心大數(shù)據(jù)的應(yīng)用,關(guān)心如何從業(yè)務(wù)和應(yīng)用出發(fā)讓大數(shù)據(jù)真正實現(xiàn)其所蘊含的價值,從而為人們的生產(chǎn)生活帶來有益的改變。選項:A、正確B、錯誤正確答案:【正確】9、問題:當(dāng)前,企業(yè)提供的大數(shù)據(jù)解決方案大多基于Hadoop開源項目。選項:A、正確B、錯誤正確答案:【正確】10、問題:對于大數(shù)據(jù)而言,最基本、最重要的要求就是減少錯誤、保證質(zhì)量。因此,大數(shù)據(jù)收集的信息精確。選項:A、正確B、錯誤正確答案:【錯誤】11、問題:采樣分析的精確性隨著采樣隨機性的增加而大幅提高,但與樣本數(shù)量的增加關(guān)系不大。選項:A、正確B、錯誤正確答案:【正確】12、問題:要想獲得大規(guī)模數(shù)據(jù)帶來的好處,混亂應(yīng)該是一種標(biāo)準(zhǔn)途徑,而不應(yīng)該是竭力避免的。選項:A、正確B、錯誤正確答案:【正確】開源大數(shù)據(jù)平臺:Hadoop隨堂練習(xí)1、問題:下列關(guān)于Hadoop的描述,錯誤的是()選項:A、Hadoop是基于Java語言開發(fā)的,但應(yīng)用程序開發(fā)支持C、C++、Python等多種語言B、Hadoop中分布式存儲和計算都采用Master/Slave主從架構(gòu),這種架構(gòu)最突出的問題是單點故障問題C、在二代Hadoop中對HDFS架構(gòu)進行了優(yōu)化,形成HDFSHA和HDFSFederationD、在第二代Hadoop中,MapReduce既負責(zé)計算任務(wù),又負責(zé)資源管理調(diào)度任務(wù)正確答案:【在第二代Hadoop中,MapReduce既負責(zé)計算任務(wù),又負責(zé)資源管理調(diào)度任務(wù)】2、問題:下列Hadoop生態(tài)系統(tǒng)中的組件,用來為各個組件提供分布式協(xié)調(diào)一致性服務(wù)的是()選項:A、PigB、ZookeeperC、TezD、HBase正確答案:【Zookeeper】3、問題:下列關(guān)于Hadoop特性的描述,正確的是()選項:A、可擴展性B、高可靠C、高容錯D、高效率正確答案:【可擴展性#高可靠#高容錯#高效率】4、填空題:Hadoop的核心技術(shù)包括和兩個方面,分別解決大數(shù)據(jù)的和這兩大核心問題。以上四個空格應(yīng)為(請用頓號隔開)正確答案:【HDFS、MapReduce、分布式存儲、分布式處理】5、填空題:在HDFS中,計算機節(jié)點分為、兩類,前者用于存儲分割成塊的數(shù)據(jù)文件,后者用于存儲反映數(shù)據(jù)和存儲節(jié)點映射關(guān)系的元數(shù)據(jù)。正確答案:【數(shù)據(jù)節(jié)點(Datanode)、名稱節(jié)點(Namenode)】開源大數(shù)據(jù)平臺:Spark隨堂練習(xí)1、問題:集群最主要的瓶頸是()選項:A、CPUB、磁盤IOC、網(wǎng)絡(luò)D、內(nèi)存正確答案:【磁盤IO】2、問題:下列應(yīng)用場景中適合用Hadoop實現(xiàn)的是()選項:A、個性化產(chǎn)品推薦B、精準(zhǔn)廣告投放C、銀行交易信息存儲D、社交網(wǎng)絡(luò)分析正確答案:【銀行交易信息存儲】3、填空題:Spark運行架構(gòu)包括、任務(wù)控制節(jié)點(Driver)、和執(zhí)行進程(Executor)。正確答案:【集群資源管理器、工作節(jié)點】4、填空題:用戶在開發(fā)Spark應(yīng)用程序時,需要編寫兩部分功能代碼,其中一個是實現(xiàn)功能的代碼,還有一部分是運行在集群中多個工作節(jié)點上的代碼。正確答案:【任務(wù)控制節(jié)點、執(zhí)行進程】5、填空題:Spark的核心是RDD,分為兩種,分別是RDD和RDD。正確答案:【動作、轉(zhuǎn)換】第二章單元作業(yè)第三章單元作業(yè)第三章單元測試1、問題:以下關(guān)于HDFS特點的描述錯誤的是()選項:A、提供了統(tǒng)一的訪問接口B、只能有一個NameNodeC、分塊存儲增強了數(shù)據(jù)訪問的并行性D、實現(xiàn)了數(shù)據(jù)的冗余存儲正確答案:【只能有一個NameNode】2、問題:采用客戶端讀取HDFS存儲的數(shù)據(jù)時,以下哪種描述是正確的?()選項:A、讀取文件時,其讀取的數(shù)據(jù)需來自于一個DataNode,以避免數(shù)據(jù)的不一致性B、編程接口提供了隔離性,讓用戶無需深入了解HDFS便可以進行文件數(shù)據(jù)讀寫C、客戶端需要詳細了解HDFS的文件組織結(jié)構(gòu)D、在訪問前需要了解具體文件是存儲在哪個DataNode上正確答案:【編程接口提供了隔離性,讓用戶無需深入了解HDFS便可以進行文件數(shù)據(jù)讀寫】3、問題:以下不是分布式文件系統(tǒng)的是()選項:A、FATB、GFSC、HDFSD、NFS正確答案:【FAT】4、問題:以下哪個負責(zé)HDFS的數(shù)據(jù)存儲()選項:A、NameNodeB、JobTrackerC、DataNodeD、SecondaryNameNode正確答案:【DataNode】5、問題:HDFS中每個文件塊的副本個數(shù)默認是()選項:A、3B、2C、1D、不確定正確答案:【3】6、問題:Hadoop2.X中每個文件塊的默認大小是()選項:A、16MBB、32MBC、64MBD、128MB正確答案:【128MB】7、問題:以下關(guān)于SecondaryNameNode的描述,哪項是正確的?()選項:A、它是NameNode的熱備B、它對內(nèi)存沒有要求C、它的目的是幫助NameNode合并編輯日志,減少NameNode的啟動時間D、SecondaryNameNode應(yīng)和NameNode部署到一個節(jié)點上。正確答案:【它的目的是幫助NameNode合并編輯日志,減少NameNode的啟動時間】8、問題:以下哪個不屬于NameNode的功能?()選項:A、提供文件塊定位服務(wù)B、保存文件塊并匯報文件塊信息C、保存元數(shù)據(jù)D、元數(shù)據(jù)在啟動后會加載到內(nèi)存正確答案:【保存文件塊并匯報文件塊信息】9、問題:HDFS的NameNode中,存儲的有關(guān)核心數(shù)據(jù)包括()選項:A、注冊表B、文件操作日志C、文件系統(tǒng)樹D、所有數(shù)據(jù)備份正確答案:【文件操作日志#文件系統(tǒng)樹】10、問題:以下關(guān)于客戶端上傳文件的描述哪項是正確的?()選項:A、數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端將文件以block為單位,管道方式依次傳到DataNodeC、客戶端只上傳數(shù)據(jù)到一臺DataNode,然后由NameNode復(fù)制block復(fù)制工作。D、當(dāng)某個DataNode失敗,客戶端會繼續(xù)傳給其他DataNode正確答案:【客戶端將文件以block為單位,管道方式依次傳到DataNode#當(dāng)某個DataNode失敗,客戶端會繼續(xù)傳給其他DataNode】11、問題:如果NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。選項:A、正確B、錯誤正確答案:【錯誤】12、問題:NameNode負責(zé)管理元數(shù)據(jù),客戶端每次發(fā)送讀寫請求,NameNode都會從磁盤中讀取或者寫入元數(shù)據(jù)并反饋給客戶端。選項:A、正確B、錯誤正確答案:【錯誤】13、問題:NameN
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中介抽成合同范例
- 商品購銷合同范例6
- 2024學(xué)校商店攤位租賃合同書(規(guī)定租賃合同的授權(quán)代表)
- 2024年工程居間合作合同示范文本
- 電子元器件業(yè)PTR管理辦法
- 鄉(xiāng)村建設(shè)項目建造師招聘
- 石油化工產(chǎn)品采購合同爭議管理
- 研發(fā)團隊會議制度
- 2024農(nóng)業(yè)機械設(shè)備出口貿(mào)易合同
- 圖書館樓頂廣告字安裝協(xié)議
- 2024年中級經(jīng)濟師(金融)《專業(yè)知識與實務(wù)》考前必刷必練題庫500題(含真題、必會題)
- (2024年)剪映入門教程課件
- 大班-數(shù)學(xué)-加號減號-課件(基礎(chǔ)版)
- 瓦斯抽放站施工組織設(shè)計(共23頁)
- 數(shù)學(xué)趣味小故事(課堂PPT)
- 江蘇省示范性縣級教師發(fā)展中心建設(shè)標(biāo)準(zhǔn)
- 小學(xué)低年級數(shù)棋教案
- 長鏈、中鏈脂肪乳區(qū)別
- 起重吊裝作業(yè)指導(dǎo)書
- pMD19-T載體說明書
- 快時尚服裝品牌的營銷策略分析以zara為例
評論
0/150
提交評論