【MOOC】大數(shù)據(jù)基礎(chǔ)與應(yīng)用-北京理工大學(xué) 中國(guó)大學(xué)慕課MOOC答案_第1頁(yè)
【MOOC】大數(shù)據(jù)基礎(chǔ)與應(yīng)用-北京理工大學(xué) 中國(guó)大學(xué)慕課MOOC答案_第2頁(yè)
【MOOC】大數(shù)據(jù)基礎(chǔ)與應(yīng)用-北京理工大學(xué) 中國(guó)大學(xué)慕課MOOC答案_第3頁(yè)
【MOOC】大數(shù)據(jù)基礎(chǔ)與應(yīng)用-北京理工大學(xué) 中國(guó)大學(xué)慕課MOOC答案_第4頁(yè)
【MOOC】大數(shù)據(jù)基礎(chǔ)與應(yīng)用-北京理工大學(xué) 中國(guó)大學(xué)慕課MOOC答案_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余4頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

【MOOC】大數(shù)據(jù)基礎(chǔ)與應(yīng)用-北京理工大學(xué)中國(guó)大學(xué)慕課MOOC答案【第一周】單元測(cè)試1、【單選題】大數(shù)據(jù)的特性不包括本題答案:【分布地域廣】2、【單選題】如下關(guān)于大數(shù)據(jù)分析流程的哪一項(xiàng)是正確的?本題答案:【數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)】3、【多選題】大數(shù)據(jù)分析與傳統(tǒng)的數(shù)據(jù)分析的區(qū)別主要在于:本題答案:【傳統(tǒng)數(shù)據(jù)分析主要是描述性分析和診斷性分析,而大數(shù)據(jù)分析主要是預(yù)測(cè)性分析。#大數(shù)據(jù)分析的對(duì)象是大規(guī)模類型多樣的海量數(shù)據(jù),使用的模型較為復(fù)雜;而傳統(tǒng)數(shù)據(jù)分析則作用在有限的小規(guī)模數(shù)據(jù)集上,模型較為簡(jiǎn)單。#大數(shù)據(jù)分析主要是為了發(fā)現(xiàn)新的規(guī)律和知識(shí),而傳統(tǒng)數(shù)據(jù)分析主要是為了了解正在發(fā)生的事件及其原因。】4、【判斷題】1、大數(shù)據(jù)主要是由于數(shù)據(jù)規(guī)模巨大、來(lái)源分散、格式多樣,所以需要新的體系架構(gòu)、技術(shù)、算法和分析方法來(lái)對(duì)這些數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,以期望能夠從中抽取出隱藏的有價(jià)值的信息。本題答案:【正確】5、【判斷題】數(shù)據(jù)科學(xué)家主要負(fù)責(zé)開(kāi)發(fā)、構(gòu)建、測(cè)試和維護(hù)系統(tǒng),比如數(shù)據(jù)庫(kù)和大規(guī)模處理系統(tǒng)本題答案:【錯(cuò)誤】6、【判斷題】大數(shù)據(jù)分析的目的是從類型多樣的海量數(shù)據(jù)中挖掘出隱藏的有價(jià)值的信息。本題答案:【正確】7、【填空題】大數(shù)據(jù)分析能夠應(yīng)用在哪些領(lǐng)域?本題答案:【交通醫(yī)療足球零售天文政治】【第二周】單元測(cè)試1、【單選題】Python代碼:r=5+"5"的執(zhí)行結(jié)果是本題答案:【報(bào)錯(cuò)】2、【單選題】1.m=[1,2,[3]]2.n=m[:]3.n[1]=44.n[2][0]=55.print(m)代碼的執(zhí)行結(jié)果是?本題答案:【[1,2,[5]]】3、【單選題】1.n1={'a':1,'b':2}2.n2=n13.n1['a']=54.s=n1['a']+n2['a']5.print(s)代碼的結(jié)果是?本題答案:【10】4、【單選題】用python處理本機(jī)文件時(shí),可以使用glob完成文件查找功能。下列有關(guān)glob的說(shuō)法中,錯(cuò)誤的是本題答案:【glob為內(nèi)置庫(kù),無(wú)需import即可使用】5、【單選題】1.importsqlite32.fromfakerimportFaker3.f=Faker("zh_cn")4.conn=sqlite3.connect(":memory:")5.c=conn.cursor()6.c.execute("createtableuser(idvarchar(10)primarykey,namevarchar(20))")7.foriinrange(0,100):8.c.execute("insertintouser(id,name)values('{}','{}')".format(i,()))9.c.execute("select*fromuser")10.result=c.fetchall()11.print(len(result))上述代碼執(zhí)行的結(jié)果是?本題答案:【100】6、【單選題】用戶處理numpy的ndarray對(duì)象時(shí),可以改變數(shù)組維度。下列描述中錯(cuò)誤的是本題答案:【resize方法不能修改原andarray數(shù)組】7、【判斷題】Numpy的Series對(duì)象在進(jìn)行運(yùn)算時(shí),其默認(rèn)索引值是0到n-1可以參與運(yùn)算,而自定義索引值不會(huì)參與運(yùn)算。本題答案:【錯(cuò)誤】8、【判斷題】DataFrame結(jié)構(gòu)為一個(gè)二維結(jié)構(gòu),每一列可以為不同的值類型,但一列之內(nèi)的類型必須相同。本題答案:【正確】9、【判斷題】由于Python的list列表足夠強(qiáng)大,完全可以代替ndarry這種數(shù)組。本題答案:【錯(cuò)誤】10、【判斷題】使用文件打開(kāi)命令時(shí),即使使用withas語(yǔ)句也應(yīng)該調(diào)用close()方法顯式關(guān)閉文件,以保證文件安全。本題答案:【錯(cuò)誤】【第3周】單元測(cè)試1、【單選題】使用json庫(kù)進(jìn)行Python的內(nèi)置數(shù)據(jù)類型與Json類型轉(zhuǎn)換時(shí),字典dict將被轉(zhuǎn)換為本題答案:【object】2、【單選題】某網(wǎng)站提供形式多樣的財(cái)經(jīng)大數(shù)據(jù)服務(wù):①提供一個(gè)第三方python庫(kù),調(diào)用庫(kù)中方法可以直接返回DataFrame對(duì)象;②提供一個(gè)網(wǎng)站api,可以返回json格式字符串;③提供靜態(tài)頁(yè)面,內(nèi)含表格數(shù)據(jù);④提供查詢功能,使用JavaScript動(dòng)態(tài)腳本生成查詢結(jié)果。假設(shè)上述各種服務(wù)樣式均可返回所需數(shù)據(jù),則從減少編程工作量的角度看,用戶應(yīng)選擇的方案編號(hào)是本題答案:【①】3、【單選題】對(duì)于matplotlib的plot方法原型:pyplot.plot([x],y,[format],…),下列說(shuō)法錯(cuò)誤的是本題答案:【x軸數(shù)據(jù)必須提供】4、【單選題】matplotlib提供了圖形文本顯示,下列函數(shù)可以在圖像中任意位置顯示文字的是本題答案:【text()】5、【單選題】使用Pandas處理數(shù)據(jù)的時(shí)候,經(jīng)常會(huì)遇到重復(fù)值。下列說(shuō)法中錯(cuò)誤的是本題答案:【duplicated()返回值中用1表示重復(fù),0表示不重復(fù)】6、【單選題】排序在數(shù)據(jù)處理中具有重要的作用。若df為一個(gè)DataFrame對(duì)象,則對(duì)其描述中錯(cuò)誤的是本題答案:【排序時(shí)無(wú)論是升序還是降序,NaN統(tǒng)一排到序列的開(kāi)頭部分】7、【判斷題】語(yǔ)句json.dumps({'name':'David','age':20})將一個(gè)Python對(duì)象轉(zhuǎn)為一個(gè)JSON字符串。本題答案:【正確】8、【判斷題】使用requests庫(kù)爬取回來(lái)的字符串?dāng)?shù)據(jù),可以加載到BeautifulSoup庫(kù)中,形成一個(gè)樹(shù)狀的HTML頁(yè)面結(jié)構(gòu),供用戶檢索使用。本題答案:【正確】9、【判斷題】當(dāng)在DataFrame中試圖補(bǔ)全空值時(shí),可以使用fillna,但該方法只能為整個(gè)DataFrame設(shè)置相同的補(bǔ)全值。本題答案:【錯(cuò)誤】10、【判斷題】使用matplotlib繪制多圖時(shí),可以使用subplots和subplot方法。如:1.fig,ax=subplot(rows,cols)本題答案:【錯(cuò)誤】【第4周】單元測(cè)試1、【單選題】如下關(guān)于數(shù)據(jù)分析框架的流程,哪一項(xiàng)是正確的?本題答案:【業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建立模型、模型評(píng)估】2、【判斷題】偏度是數(shù)據(jù)分布扁平程度的測(cè)度。本題答案:【錯(cuò)誤】3、【判斷題】中位數(shù)指的是任意一組數(shù)據(jù)中的中間位置的數(shù)。本題答案:【錯(cuò)誤】4、【判斷題】某組數(shù)據(jù)的峰態(tài)系數(shù)小于0,則并表明該組數(shù)據(jù)為扁平分布或者平峰分布。本題答案:【正確】5、【判斷題】預(yù)測(cè)降雨量屬于機(jī)器學(xué)習(xí)中的回歸任務(wù)的應(yīng)用場(chǎng)景。本題答案:【正確】6、【填空題】已知10個(gè)家庭的人均月收入數(shù)據(jù)分別為:660、750、780、850、960、1080、1250、1500、1630、2000,請(qǐng)計(jì)算該組數(shù)據(jù)的中位數(shù)。本題答案:【1020】7、【填空題】已知9個(gè)家庭的人均月收入數(shù)據(jù)分別為:1500、750、780、1080、850、960、2000、1250、1630,請(qǐng)計(jì)算該組數(shù)據(jù)的四分位數(shù)。(請(qǐng)使用較準(zhǔn)確的位置確定方法。)本題答案:【8151565】8、【填空題】請(qǐng)計(jì)算下列數(shù)據(jù){10,12,13,14,25,30,40,50,90,100}的p=40%的截?cái)嗑?。(保?位小數(shù))本題答案:【28.67】9、【填空題】請(qǐng)計(jì)算下列數(shù)據(jù){1,3,7,9,0,3,5}的中列數(shù)。本題答案:【4.5】10、【填空題】依據(jù)下面兩組數(shù)據(jù),分別計(jì)算兩組年收入數(shù)據(jù)的方差。第一組:99個(gè)年收入10萬(wàn)的人和1個(gè)年收入1000萬(wàn)的人,第二組:60個(gè)年收入10萬(wàn)的人和40個(gè)年收入34.75萬(wàn)的人。本題答案:【9801148.5】【第5周】單元測(cè)試1、【單選題】“二手車(chē)價(jià)格預(yù)測(cè)”場(chǎng)景屬于哪種機(jī)器學(xué)習(xí)的典型任務(wù)?本題答案:【回歸】2、【單選題】“垃圾郵件的處理”場(chǎng)景屬于哪種機(jī)器學(xué)習(xí)的典型任務(wù)?本題答案:【分類】3、【單選題】“推薦系統(tǒng)”場(chǎng)景屬于哪種機(jī)器學(xué)習(xí)的典型任務(wù)?本題答案:【聚類】4、【單選題】“尿布與啤酒”案例屬于哪種機(jī)器學(xué)習(xí)的典型任務(wù)?本題答案:【關(guān)聯(lián)】5、【判斷題】過(guò)擬合是指模型不能在訓(xùn)練集上獲得足夠低的誤差本題答案:【錯(cuò)誤】6、【判斷題】有監(jiān)督算法和無(wú)監(jiān)督算法的區(qū)別在于數(shù)據(jù)是否進(jìn)行標(biāo)注。本題答案:【正確】7、【判斷題】K-means算法屬于分類算法。本題答案:【錯(cuò)誤】8、【判斷題】KNN算法的優(yōu)點(diǎn)在于不需要指定K的個(gè)數(shù)。本題答案:【錯(cuò)誤】9、【填空題】決策樹(shù)的生成由兩個(gè)階段組成:_____、______本題答案:【判定樹(shù)構(gòu)建樹(shù)剪枝】10、【填空題】假設(shè)有四個(gè)樣本分布在坐標(biāo)系中,已知A區(qū)兩點(diǎn)分別(2,5)和(1,4),B區(qū)(8,1)和(9,2),若使用KNN算法(距離使用歐氏距離),求M(4,3)屬于哪一區(qū)?本題答案:【A】【第七周】單元測(cè)試1、【單選題】以下關(guān)于日志采集工具Flume的說(shuō)法不正確的是:本題答案:【Flume適用于大量數(shù)據(jù)的實(shí)時(shí)數(shù)據(jù)采集】2、【單選題】以下關(guān)于數(shù)據(jù)分發(fā)中間件Kafka的說(shuō)法不正確的是:本題答案:【Kafka主要是使用c++、Java語(yǔ)言實(shí)現(xiàn)的】3、【單選題】以下關(guān)于分布式文件系統(tǒng)HDFS的說(shuō)法不正確的是:本題答案:【HDFS支持多用戶寫(xiě)入,任意修改文件】4、【單選題】HDFS集群中管理文件系統(tǒng)的元數(shù)據(jù)、負(fù)責(zé)客戶端請(qǐng)求響應(yīng)的節(jié)點(diǎn)是:本題答案:【NameNode】5、【單選題】HDFS(Hadoop1.X版本中)默認(rèn)的塊大小是:本題答案:【64MB】6、【單選題】以下關(guān)于分布式數(shù)據(jù)庫(kù)HBase的說(shuō)法不正確的是:本題答案:【HBase比傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)具有更加豐富的數(shù)據(jù)類型】7、【單選題】HBase中分布式存儲(chǔ)和負(fù)載均衡的最小單元是:本題答案:【Region】8、【單選題】以下關(guān)于數(shù)據(jù)倉(cāng)庫(kù)Hive的說(shuō)法不正確的是:本題答案:【Hive能夠在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢】9、【多選題】Hive的數(shù)據(jù)模型主要包括:本題答案:【表(Tables)#分區(qū)(Partitions)#桶(Buckets)】10、【多選題】NoSQL數(shù)據(jù)庫(kù)的主要類型包括:本題答案:【圖形數(shù)據(jù)庫(kù)#文檔數(shù)據(jù)庫(kù)#鍵值數(shù)據(jù)庫(kù)#列族數(shù)據(jù)庫(kù)】MOOC期末測(cè)試1、【單選題】下列數(shù)據(jù)類型中,不屬于Python內(nèi)置數(shù)據(jù)類型的是:本題答案:【dtype】2、【單選題】假設(shè)d是一個(gè)DataFrame類型對(duì)象,其中包含name和age兩列100行數(shù)據(jù)。則下列表達(dá)式中,錯(cuò)誤的是.本題答案:【d[2,’name’]】3、【單選題】以下不屬于高維數(shù)據(jù)可視化技術(shù)的是.本題答案:【詞云】4、【單選題】以下哪個(gè)是常見(jiàn)的大數(shù)據(jù)處理流程.本題答案:【數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化】5、【單選題】大數(shù)據(jù)分析技術(shù)可以應(yīng)用于哪些行業(yè).本題答案:【其他全是】6、【單選題】測(cè)得一組身高(cm)數(shù)據(jù)如下:176、165、173、168、176、180、177、168、174、176,則其眾數(shù)和中位數(shù)分別是:本題答案:【176,175】7、【單選題】數(shù)據(jù)清洗的方法不包括本題答案:【數(shù)據(jù)可視化】8、【單選題】以下哪個(gè)不屬于分布式文件系統(tǒng)HDFS的特有特性本題答案:【隨機(jī)讀寫(xiě)】9、【單選題】以下哪種方法不屬于預(yù)測(cè)性(有監(jiān)督學(xué)習(xí))模型本題答案:【關(guān)聯(lián)分析】10、【單選題】Apriori算法的加速過(guò)程依賴于以下哪個(gè)策略本題答案:【剪枝】11、【單選題】Spark是使用以下哪種編程語(yǔ)言實(shí)現(xiàn)的?本題答案:【Scala】12、【判斷題】詞典中的key不能是字典類型,但value可以是字典類型。本題答案:【正確】13、【判斷題】傳統(tǒng)數(shù)據(jù)分析主要是完成描述性分析和診斷性分析,而大數(shù)據(jù)分析主要目的是預(yù)測(cè)性分析。本題答案:【正確】14、【判斷題】峰度是數(shù)據(jù)分布偏斜程度的測(cè)度。本題答案:【錯(cuò)誤】15、【判斷題】偏度系數(shù)在0.5~1或-1~-0.5之間被稱為高度偏態(tài)分布。本題答案:【錯(cuò)誤】16、【判斷題】數(shù)據(jù)工程師的主要工作職責(zé)是整理和組織數(shù)據(jù),進(jìn)行描述性統(tǒng)計(jì),分析開(kāi)發(fā)潛在的價(jià)值,構(gòu)建模型解決商業(yè)問(wèn)題。本題答案:【錯(cuò)誤】1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論