數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年

上傳人：題*** IP屬地：浙江上傳時(shí)間：2024-11-08 格式：DOCX 頁數(shù)：6 大?。?4.82KB 積分：6 舉報(bào) 版權(quán)申訴

數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第2頁

數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年_第3頁

免費(fèi)預(yù)覽已結(jié)束，剩余3頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試章節(jié)答案2024年DataFrame對象使用sort_values方法按照某列進(jìn)行排序后,只有該列數(shù)據(jù)按順序調(diào)整位置,其他列保此原順序不變。

答案:錯(cuò)在數(shù)據(jù)統(tǒng)計(jì)中，均值和中位數(shù)是相同的概念。

答案:錯(cuò)清洗數(shù)據(jù)有濾除和填充兩種方法,當(dāng)數(shù)據(jù)集比較小時(shí),應(yīng)盡量選擇數(shù)據(jù)____的方式來清洗數(shù)據(jù)。

答案:填充數(shù)據(jù)記錄了我國4個(gè)直轄市第一(種植業(yè)、林業(yè)、牧業(yè)和漁業(yè))、第二(采掘業(yè),制造業(yè),電力、煤氣、水的生產(chǎn)和供應(yīng)業(yè)、建筑業(yè))、第三產(chǎn)業(yè)(其他)2017年產(chǎn)值的增加量(單位:億元)。創(chuàng)建了如下數(shù)據(jù)表:frompandasimportDataFramedata=[[98.99,9251.40,20783.47],[120.45,5310.63,22569.27],[218.28,7590.36,10786.74],[1339.62,8596.61,9564.04]]value=DataFrame(data,index=['上海','北京','天津','重慶'],columns=['第一','第二','第三'])現(xiàn)在需要在value中新增一列‘總增量’,記錄每個(gè)城市的三類產(chǎn)業(yè)產(chǎn)值增量總和,使用語句:value['____']=value.sum(axis=1)

答案:總增量關(guān)于DataFrame數(shù)據(jù)對象的添加和刪除操作，_______是正確的描述。

答案:DataFrame對象不能直接添加新的行數(shù)據(jù);可以設(shè)置axis的值刪除DataFrame指定行或列的數(shù)據(jù)可以使用DataFrame對象的corr()方法求兩列數(shù)據(jù)的相關(guān)系數(shù),關(guān)于相關(guān)系數(shù)的描述中________是正確的。

答案:相關(guān)系數(shù)為零時(shí)兩列數(shù)據(jù)相關(guān)性最小使用merge方法對DataFrame對象temp1和temp2進(jìn)行列上的合并時(shí),設(shè)置參數(shù)________,實(shí)現(xiàn)按照兩個(gè)對象鍵值的交集進(jìn)行合并。

答案:how=inner調(diào)用DataFrame對象temp的fillna方法填充空值時(shí),設(shè)置________參數(shù)可以控制是否直接更新temp對象。

答案:inplace假定DataFrame對象temp中共有12列,語句________刪除空值(NaN)個(gè)數(shù)大于3的行。

答案:temp.dropna(threshold=9)統(tǒng)計(jì)DataFrame對象stu中各‘省份’同學(xué)人數(shù)的方法是________。

答案:stu[‘省份’].value_counts()統(tǒng)計(jì)量“方差”描述________。

答案:樣本個(gè)體距離均值的離散程度有3張同學(xué)信息表,存儲(chǔ)為DataFrame對象stu1,stu2,stu3,具有相同的列索引,合并的方法是________。

答案:pd.concat([stu1,sut2,sut3])關(guān)于數(shù)據(jù)文件讀寫，_______是錯(cuò)誤的描述。

答案:文件中第一行必須給出列的索引名（columns），否則pandas無法讀取各列內(nèi)容創(chuàng)建students對象,下面語句篩選出_______大于67公斤同學(xué)的_______。students數(shù)據(jù)如下：

ageheightweight1

170

682

165

653

175

65>>>students.loc[students[‘weight’]>67,

‘height’]

答案:體重、身高創(chuàng)建students對象，_______語句可以選出第二個(gè)同學(xué)的身高。students數(shù)據(jù)如下：

ageheightweight1

170

682

165

653

175

答案:students.loc[2,'height']創(chuàng)建height對象，_______語句能選出高度為190的數(shù)據(jù)。height=Series({'13':187,'14':190,'7':185,'2':178,'9':185})

答案:height[1]關(guān)于DataFrame和Series對象，下列敘述正確的是_______。

答案:Series對象主要用于處理一維數(shù)據(jù)CSV文件是_______，可以使用_______查看。

答案:純文本文件，文本編輯器DataFrame對象df中基于位置序號(hào)選取第2行第3列數(shù)據(jù)的方式是_______。（序號(hào)從0開始）

答案:df.iloc[1,2]DataFrame對象的列索引通常表示________。

答案:每列數(shù)據(jù)對應(yīng)的現(xiàn)實(shí)概念觀察樣本多個(gè)屬性值兩兩之間的相關(guān)性,可采用pandas提供了散點(diǎn)圖矩陣pd.plotting.____函數(shù)。

答案:scatter_matrix利用Series.plot繪制概率密度圖時(shí),將kind參數(shù)設(shè)置為____。

答案:'kde'/kde/'density'/densityDataFrame對象temp記錄了8個(gè)城市4個(gè)季度的第三產(chǎn)業(yè)產(chǎn)值,利用DataFrame.plot繪制柱狀圖時(shí),可以設(shè)置參數(shù)____控制畫堆疊或復(fù)式柱狀圖。

答案:stacked觀察男、女同學(xué)對“數(shù)據(jù)科學(xué)”課程的興趣程度與課程成績之間的關(guān)系,應(yīng)使用分組____。

答案:散點(diǎn)圖/scatterdiagram/ScatterDiagram_________可用于展示離散數(shù)據(jù)。

答案:柱狀圖;餅圖關(guān)于餅圖的描述,錯(cuò)誤的是_________。

答案:描述總體各樣本區(qū)間的樣本數(shù)量下面關(guān)于直方圖的說法中,錯(cuò)誤的是_________。

答案:分箱的數(shù)量與數(shù)據(jù)集的分布無關(guān)繪制多個(gè)子圖的正確方法是_________。

答案:導(dǎo)入matplotlib.pyplot庫,創(chuàng)建figure對象,調(diào)用figure.add_subplot函數(shù)比較3個(gè)班級學(xué)生高數(shù)成績的分位數(shù)分布并觀察異常值,可選擇_________。

答案:箱須圖下面關(guān)于使用pyplot和pandas提供的繪圖函數(shù)的說法中,錯(cuò)誤的是_________。

答案:在同一figure對象中,pyplot和pandas的繪圖函數(shù)不可以混合使用/images/questionbank/icon/default.png

答案:對深度學(xué)習(xí)就是具有很多個(gè)隱藏層、每個(gè)隱藏層具有很多結(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)。

答案:對神經(jīng)網(wǎng)絡(luò)中每層中不同的結(jié)點(diǎn)通常采用不同的激活函數(shù)。

答案:錯(cuò)K-means算法迭代過程同時(shí)最小化簇內(nèi)凝聚度和最大化簇間分離度。(判斷1分)

答案:錯(cuò)同一個(gè)數(shù)據(jù)集上,通常使用隨機(jī)森林的方法訓(xùn)練分類模型需要的時(shí)間比C4.5決策樹更長。

答案:對Precision(精確率)指分類問題中真實(shí)正例被正確預(yù)測出的比例。

答案:錯(cuò)回歸分析中,性能評價(jià)指標(biāo)均方根誤差RMSE與測試集的大小無關(guān)。

答案:錯(cuò)神經(jīng)網(wǎng)絡(luò)可用于_________等問題的建模分析。(多選1分)

答案:識(shí)別垃圾短信;根據(jù)房屋特性預(yù)測房價(jià);識(shí)別車牌_________屬于神經(jīng)網(wǎng)絡(luò)常用的激活函數(shù)。(多選1分)

答案:Sigmoid;tanh;ReLU;Softmax關(guān)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的說法中,不正確的是_________。

答案:神經(jīng)網(wǎng)絡(luò)的隱藏層越少,訓(xùn)練時(shí)間越長K-means算法的核心是_________。

答案:樣本間相似度計(jì)算關(guān)于聚類分析的說法,不正確的是_________。

答案:“簇”越多說明聚類效果越好K-means算法中K表示_________。

答案:聚類得到的類別數(shù)數(shù)據(jù)建模分析,_________方法需要計(jì)算樣本之間的距離。

答案:k-meansF1score可用于衡量分類模型性能,根據(jù)以下混淆矩陣,F1=_________。真實(shí)類預(yù)測類Class=YesClass=NoClass=Yes(正例)abClass=No(反例)cd

答案:2a/(2a+b+c)構(gòu)建決策樹的算法在數(shù)據(jù)集中選擇合適的_________作為樹的結(jié)點(diǎn)。

答案:特征項(xiàng)建模分析時(shí),通常用于訓(xùn)練的樣本數(shù)量_________測試集的樣本數(shù)量。

答案:大于________屬于機(jī)器學(xué)習(xí)中的回歸問題。

答案:根據(jù)房屋特性預(yù)測房價(jià)_________屬于有監(jiān)督學(xué)習(xí)(SupervisedLearning)的任務(wù)。

答案:分類問題(Classification)目前人工智能技術(shù),特別是機(jī)器學(xué)習(xí),主要模擬了人的_________思維過程。

答案:學(xué)習(xí)垃圾郵件分類,訓(xùn)練集中每個(gè)郵件的標(biāo)簽:1(垃圾)或0(正常),是由人工標(biāo)注的。

答案:對對文本分類,提取的文本特征個(gè)數(shù)越多,特征向量維度越高,則分類準(zhǔn)確度就越高。

答案:錯(cuò)詞袋模型，將不同長度的文本表示成不同長度的向量。

答案:錯(cuò)分詞工具庫Jieba支持________分詞模式。

答案:全模式;精確模式;搜索引擎模式文本處理中,____任務(wù)將一種自然語言文本自動(dòng)翻譯成另一種自然語言文本。

答案:機(jī)器翻譯基于詞袋模型進(jìn)行文本數(shù)據(jù)分類時(shí),從句子中提取的最重要的特征量為________。

答案:詞頻在文本處理常見任務(wù)類中,垃圾郵件自動(dòng)處理應(yīng)歸類于________。

答案:文本分類詞袋模型的主要缺點(diǎn)是________。

答案:只考慮文本中的詞信息,忽略了詞序、語法以及句法信息中文分詞的作用是________。

答案:將中文句子劃分為以詞為單位的詞序列識(shí)別文本中包含的情感通常使用________方法處理。

答案:文本分類Keras為建立CNN模型,提供了_______等常用層(layer)。

答案:Conv2D;MaxPooling2D與全連接前饋神經(jīng)網(wǎng)絡(luò)相比,用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò)CNN主要通過________操作來減少網(wǎng)絡(luò)參數(shù)數(shù)量,提高訓(xùn)練效率。

答案:卷積;池化________都是著名的圖像分類深度學(xué)習(xí)模型,用戶可以下載這些預(yù)訓(xùn)練模型直接使用。

答案:VGG19;ResNet50;InceptionV3卷積神經(jīng)網(wǎng)絡(luò)的核心是通過卷積塊自動(dòng)提取圖像的____。

答案:局部特征圖片“Robot.jpg”為400*372(寬*高)的彩色圖片,下列Python語句輸出為________。fromskimageimportioprint(io.imread("robot.jpg",1).shape)

答案:(372,400)一個(gè)4096*2160的RGB24數(shù)字圖像,需要占用存儲(chǔ)空間約為________。

答案:253MB數(shù)字圖像識(shí)別采用________建模分析方法實(shí)現(xiàn)。

答案:分類Python在內(nèi)存中使用________來存儲(chǔ)圖像的數(shù)據(jù)。

答案:多維數(shù)組計(jì)算機(jī)數(shù)字圖像,按照顏色和灰度的多少將圖像分為________。

答案:二值圖像、灰度圖像、RGB彩色圖像時(shí)間序列模型的預(yù)測結(jié)果與真實(shí)數(shù)據(jù)通常存的差距,預(yù)測時(shí)間點(diǎn)與原序列時(shí)間點(diǎn)間隔越遠(yuǎn),差距越小。

答案:錯(cuò)使用普通話的語音素材作為語音庫訓(xùn)練出的語音識(shí)別系統(tǒng)能夠識(shí)別上海話。

答案:錯(cuò)時(shí)序數(shù)據(jù)可以采用深度神經(jīng)網(wǎng)絡(luò)模型來建模實(shí)現(xiàn)預(yù)測分析。

答案:對通常時(shí)序數(shù)據(jù)中鄰近的數(shù)據(jù)點(diǎn)之間具有一定的相關(guān)性,而這種相關(guān)性與

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年

文檔簡介

溫馨提示

最新文檔

評論

數(shù)據(jù)科學(xué)技術(shù)與應(yīng)用學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔