《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》配套資源課后習(xí)題及答案_第1頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》配套資源課后習(xí)題及答案_第2頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》配套資源課后習(xí)題及答案_第3頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》配套資源課后習(xí)題及答案_第4頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》配套資源課后習(xí)題及答案_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

經(jīng)典word整理文檔,僅參考,雙擊此處可刪除頁(yè)眉頁(yè)腳。本資料屬于網(wǎng)絡(luò)整理,如有侵權(quán),請(qǐng)聯(lián)系刪除,謝謝!第1一、填空題1.的目的在于將隱藏在一大批看似雜亂無(wú)章的數(shù)據(jù)信息集中提煉出來(lái)有用的數(shù)據(jù)。中包含了、Python在內(nèi)的超過(guò)180個(gè)科學(xué)包及其依賴項(xiàng)。2.3.JupyterNotebook是一個(gè)支持Markdown的Web應(yīng)用程序。二、判斷題代碼、數(shù)學(xué)方程、可視化和1.)2.Python)3.如果要卸載指定環(huán)境中的包,則直接使用remove)三、選擇題1.下列選項(xiàng)中,用于搭接數(shù)據(jù)倉(cāng)庫(kù)和保證數(shù)據(jù)質(zhì)量的是(A.數(shù)據(jù)收集B.數(shù)據(jù)處理C.數(shù)據(jù)分析D.數(shù)據(jù)展現(xiàn)2.關(guān)于Anaconda的說(shuō)法中,下列描述錯(cuò)誤的是(A.Anaconda是一個(gè)可以對(duì)包和環(huán)境進(jìn)行統(tǒng)一管理的發(fā)行版本。B.Anaconda包含了conda、Python在內(nèi)的超過(guò)180個(gè)科學(xué)包及其依賴項(xiàng)C.Anaconda是完全開源的、付費(fèi)的D.Anaconda避免了單獨(dú)安裝包時(shí)需要配置或兼容等各種問(wèn)題3.關(guān)于AnacondaA.AnacondaNavigatorB.AnacondaPromptC.SpyderD.JupyterNotebook4.下面列出的數(shù)據(jù)分析庫(kù)中,用于繪制數(shù)組的2D圖形的是(A.NumPyB.PandasC.MatplotlibD.NLTK四、簡(jiǎn)答題1.什么是數(shù)據(jù)分析?2.請(qǐng)簡(jiǎn)述數(shù)據(jù)分析的基本過(guò)程。3.Python做數(shù)據(jù)分析有哪些優(yōu)勢(shì)?第2一、填空題1.在NumPy中,可以使用數(shù)組對(duì)象________執(zhí)行一些科學(xué)計(jì)算。2.如果ndarray.ndim執(zhí)行的結(jié)果為2,則表示創(chuàng)建的是_____維數(shù)組。3.NumPy的數(shù)據(jù)類型是由一個(gè)類型名和元素________的數(shù)字組成。4.如果兩個(gè)數(shù)組的大?。ǎ┎煌?,則它們進(jìn)行算術(shù)運(yùn)算時(shí)會(huì)出現(xiàn)________機(jī)制。5.花式索引是NumPy的一個(gè)術(shù)語(yǔ),是指用整數(shù)________進(jìn)行索引。二、判斷題1.通過(guò)empty())2.如果沒(méi)有明確地指明數(shù)組中元素的類型,則默認(rèn)為float64)3.)4.)5.當(dāng)通過(guò)布爾數(shù)組索引操作數(shù)組時(shí),返回的數(shù)據(jù)是布爾數(shù)組中False對(duì)應(yīng))三、選擇題1.下列選項(xiàng)中,用來(lái)表示數(shù)組維度的屬性是(A.ndimB.shapeC.sizeD.dtype2.下面代碼中,創(chuàng)建的是一個(gè)3行3列數(shù)組的是(1.arr=np.array([1,2,3])2.arr=np.array([[1,2,3],[4,5,6]])3.arr=np.array([[1,2],[3,4]])4.np.ones((3,3))3.請(qǐng)閱讀下面一段程序:arr_2d=np.array([[11,20,13],[14,25,16],[27,18,9]])print(arr_2d[1,:1])執(zhí)行上述程序后,最終輸出的結(jié)果為(D.[20,25]4.請(qǐng)閱讀下面一段程序:arr=np.arange(6).reshape(1,2,3)print(arr.transpose(2,0,1))執(zhí)行上述程序后,最終輸出的結(jié)果為(A.[[[25]][[03]][[14]]]B.[[[14]][[03]][[25]]]C.[[[03]][[14]][[25]]]D.[[[0][3]][[1][4]][[2][5]]]5.下列函數(shù)或方法中,用來(lái)表示矢量化三元表達(dá)式的是(A.where()B.cumsum()C.sort()D.unique()四、簡(jiǎn)答題1.什么是矢量化運(yùn)算?2.實(shí)現(xiàn)數(shù)組廣播機(jī)制需要滿足哪些條件?五、程序題1.創(chuàng)建一個(gè)數(shù)組,數(shù)組的shape為(5,0),元素都是0。2.創(chuàng)建一個(gè)表示國(guó)際象棋棋盤的8*8數(shù)組,其中,棋盤白格用0填充,棋盤黑格用1填充。第3一、填空題1.Pandas是一個(gè)基于的Python庫(kù)。2.Pandas中有兩個(gè)主要的數(shù)據(jù)結(jié)構(gòu)分別為和。3.Series結(jié)構(gòu)由4.可以使用和組成。創(chuàng)建一個(gè)Series對(duì)象。和5.數(shù)據(jù)排序可以分為和。二、判斷題1.在DataFrame中每列的數(shù)據(jù)都可以看做是一個(gè)Series)2.使用describe)3.方法是將元組列表轉(zhuǎn)換為MultiIndex)4.函數(shù)和read_table())5.Series)三、選擇題1.下列選項(xiàng)中,描述不正確的是(A.Pandas中只有Series和DataFrame這兩種數(shù)據(jù)結(jié)構(gòu)B.Series是一維的數(shù)據(jù)結(jié)構(gòu)C.DataFrame是二維的數(shù)據(jù)結(jié)構(gòu)D.Series和DataFrame都可以重置索引2.下列選項(xiàng)中,描述正確是(A.Series是一維數(shù)據(jù)結(jié)構(gòu),其索引在右,數(shù)據(jù)在左B.DataFrame是二維數(shù)據(jù)結(jié)構(gòu),并且該結(jié)構(gòu)具有行索引和列索引C.Series結(jié)構(gòu)中的數(shù)據(jù)不可以進(jìn)行算術(shù)運(yùn)算D.sort_values方法可以將Series或DataFrame中的數(shù)據(jù)按照索引排序3.下列方法中,可以將元組轉(zhuǎn)換為MultiIndex對(duì)象的是(A.from_tuples()B.from_arrays()C.from_product()D.from_list()4.下列選項(xiàng)中,哪個(gè)方法可以一次性輸出多個(gè)統(tǒng)計(jì)指標(biāo)(A.describe()B.mean()C.median()D.sum()5.請(qǐng)閱讀下面一段程序:ser_obj=pd.Series(range(1,6),index=[5,3,0,4,2])ser_obj.sort_index()執(zhí)行上述程序后,最終輸出的結(jié)果為(A.5130422345B.C.D.023453524154320142532403554321四、簡(jiǎn)答題1.簡(jiǎn)述Series和DataFrame的特點(diǎn)。2.簡(jiǎn)述什么是層次化索引。五、程序題1.現(xiàn)有如下圖所示的數(shù)據(jù),請(qǐng)對(duì)該數(shù)據(jù)進(jìn)行以下操作:(1)使用DataFrame創(chuàng)建該數(shù)據(jù)。(2)將圖中的B列數(shù)據(jù)進(jìn)行按降序排序。(3)將排序后的數(shù)據(jù)寫入到csv文件,并命名為。第4一、填空題1.數(shù)據(jù)清洗的目的是讓數(shù)據(jù)具有、、、、、等特點(diǎn)。2.產(chǎn)生缺失值或空值的原因有和。3.方法可以將轉(zhuǎn)換為。4.concat函數(shù)的堆疊方式有和和。5.拉依達(dá)原則在檢測(cè)異常值時(shí)必須保證數(shù)據(jù)遵守二、判斷題。1.rename)2.方法可以刪除重復(fù)值()。3.)4.當(dāng)一個(gè)具有多層次索引的DataFrame對(duì)象經(jīng)過(guò)后,會(huì)返回一個(gè)Series)5.在使用)三、選擇題1.)A.數(shù)據(jù)清洗的目的是為了提高數(shù)據(jù)質(zhì)量B.異常值一定要?jiǎng)h除C.可使用drop_duplicates()方法刪除重復(fù)數(shù)據(jù)D.concat()函數(shù)可以沿著一條軸將多個(gè)對(duì)象進(jìn)行堆疊2.請(qǐng)閱讀下面一段程序:series_obj=Series([None,4,NaN])pd.isnull(series_obj)執(zhí)行上述程序后,最終輸出的結(jié)果為(A.012TrueFalseTrueB.C.D.012TrueTrueFalse012FalseTrueTrue012TrueTrueTrue3.)A.isnull()B.notnull()C.dropna()D.fillna()4.)A.concat()函數(shù)可以沿著一條軸將多個(gè)對(duì)象進(jìn)行堆疊B.函數(shù)可以根據(jù)一個(gè)或多個(gè)鍵將不同的DataFrame進(jìn)行合并C.可以使用rename()方法對(duì)索引進(jìn)行重命名操作D.unstack()方法可以將列索引旋轉(zhuǎn)為行索引5.請(qǐng)閱讀下面一段程序:importnumpyasnpser_obj.sort_values()執(zhí)行上述程序后,最終輸出的結(jié)果為(A.43.0503212.04.05.06.0NaNB.1NaN230546.05.04.02.03.0C.502.04.032415.06.03.0NaND.0123454.0NaN6.05.03.02.0四、簡(jiǎn)答題1.請(qǐng)簡(jiǎn)述數(shù)據(jù)預(yù)處理的常用操作。2.常用的數(shù)據(jù)合并操作有哪些?五、程序題1.現(xiàn)有如下圖所示的兩組數(shù)據(jù),其中A組中B列數(shù)據(jù)存在缺失值,并且該列數(shù)據(jù)為intB組中的數(shù)據(jù)均為str類型。接下來(lái),請(qǐng)對(duì)這些數(shù)據(jù)進(jìn)行以下操作:(1)使用DataFrame創(chuàng)建這兩組數(shù)據(jù)。(2)現(xiàn)在需要使用B組中的數(shù)據(jù)對(duì)A組中的缺失值進(jìn)行填充并保持?jǐn)?shù)據(jù)類型一致。(3)將合并后A組中索引名為key的索引重命名為D。第5一、填空題1.分組聚合的流程分為2.分組鍵的形式可以有、、、、。、。3.方法會(huì)對(duì)產(chǎn)生的標(biāo)量值進(jìn)行操作。4.當(dāng)對(duì)一個(gè)DataFrame對(duì)象進(jìn)行分組后會(huì)返回一個(gè)對(duì)象。二、判斷題1.分組聚合的原理一般分為拆分-應(yīng)用-合并()。2.只要使用方法分組就會(huì)產(chǎn)生一個(gè)DataFrameGroupby)3.使用agg)4.使用()5.apply)三、選擇題1.下列選項(xiàng)中,關(guān)于groupby)A.分組鍵可以是列表或數(shù)組,但長(zhǎng)度不需要與待分組軸的長(zhǎng)度相同B.可以通過(guò)DataFrame中的列名的值進(jìn)行分組C.可以使用函數(shù)進(jìn)行分組D.可使用series或字典分組2.下列選項(xiàng)中,關(guān)于agg)A.agg方法中func參數(shù)只能傳入一個(gè)函數(shù)B.agg方法中func參數(shù)可以傳入多個(gè)函數(shù)C.agg方法中func參數(shù)可以傳入自定義函數(shù)D.agg方法不能對(duì)產(chǎn)生的標(biāo)量值進(jìn)行廣播3.下列選項(xiàng)中,關(guān)于方法說(shuō)法正確的是()。A.不會(huì)與原數(shù)據(jù)保持相同形狀B.會(huì)對(duì)產(chǎn)生的標(biāo)量值進(jìn)行廣播操作C.func參數(shù)只能傳入內(nèi)置函數(shù)D.func參數(shù)可以傳入多個(gè)內(nèi)置函數(shù)4.下列選項(xiàng)中,關(guān)于apply)A.可以使用自定義函數(shù)B.可以接收多個(gè)函數(shù)C.可以使用廣播功能D.返回的結(jié)果一定與原數(shù)據(jù)的形狀相同5.請(qǐng)閱讀下面一段程序:(pd.DataFrame([[2,3],]*3,columns=['A','B'])).apply(lambdax:x+1)執(zhí)行上述程序后,最終輸出的結(jié)果為(A.AB032132232B.AB023123223C.AB034134234D.AB043143243四、簡(jiǎn)答題1.請(qǐng)簡(jiǎn)述分組聚合的流程。2.請(qǐng)簡(jiǎn)述常用的分組方式。五、程序題1.現(xiàn)有如下圖所示的學(xué)生信息,請(qǐng)根據(jù)圖中的信息完成以下操作:(1)根據(jù)年級(jí)信息為分組鍵,對(duì)學(xué)生信息進(jìn)行分組,并輸出大一學(xué)生信息。(2)分別計(jì)算出四個(gè)年級(jí)中身高最高的同學(xué)。(3)計(jì)算大一學(xué)生與大三學(xué)生的平均體重。第6一、填空題1.bokeh是針對(duì)2.數(shù)據(jù)可視化常見(jiàn)的統(tǒng)計(jì)圖表有3.在使用Matplotlib繪制圖表時(shí),需要導(dǎo)入4.在直方圖中一般使用橫軸表示,用縱軸表示5.在使用Matplotlib繪制柱狀圖時(shí)可以使用pyplot模塊中的使用的交互式可視化庫(kù)。(寫出3個(gè)即可)、、。。函數(shù)。二、判斷題1.seaborn是基于Matplotlib)Figure對(duì)象可以劃分多個(gè)繪圖區(qū)域,每個(gè)繪圖區(qū)域都是一個(gè)Axes)2.繪制圖表時(shí),可以使用subplot())3.Matplotlib)4.Matplotlib)5.三、選擇題1.下列選項(xiàng)中,關(guān)于Matplotlib)Matplotlib是一個(gè)Python3D繪圖庫(kù)A.可輸出PNG、PDF等格式B.漸進(jìn)、交互的方式實(shí)現(xiàn)數(shù)據(jù)可視化C.使用簡(jiǎn)單D.2.下列選項(xiàng)中,不屬于Seaborn)A.Seaborn是基于Matplotlib的可視化庫(kù)基于網(wǎng)格繪制出更加復(fù)雜的圖像集合多個(gè)內(nèi)置主題及顏色主題B.C.D.可以處理大量的數(shù)據(jù)流3.下列選項(xiàng)中,關(guān)于boken)boken是一個(gè)專門針對(duì)Web瀏覽器使用的交互式可視化庫(kù)A.Plotting接口用于構(gòu)建各種組裝圖形元素B.Models接口可以為開發(fā)者提供最大的靈活性C.Charts庫(kù)可直接使用,不需要單獨(dú)安裝D.4.)A.hist()B.()C.bar()D.pie()5.)A.分布B.變化C.餅圖顯示一個(gè)數(shù)據(jù)序列中的各項(xiàng)的大小與各項(xiàng)總和的比例D.條形圖是由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布情況四、程序題1.現(xiàn)有如圖6-40所示的股票數(shù)據(jù),根據(jù)圖中的數(shù)據(jù),完成以下需求:圖6-1股票數(shù)據(jù)(1)使用DataFrame創(chuàng)建該股票數(shù)據(jù)。(2)以證券簡(jiǎn)稱為x軸,最新價(jià)為y軸使用條形圖展示,將生成的條形圖圖以shares_bar.png為文件名保存在桌面上。第7一、填空題1.________是指多個(gè)時(shí)間點(diǎn)上形成的數(shù)值序列。2.ARIMA模型是一種用于時(shí)間序列________的常見(jiàn)統(tǒng)計(jì)模型。3.Pandas中的頻率是由一個(gè)________和一個(gè)乘數(shù)組成的,比如7D。4.________是指將時(shí)間序列從一個(gè)頻率轉(zhuǎn)換到另一個(gè)頻率的處理過(guò)程。5.在Pandas中,使用________類表示一個(gè)標(biāo)準(zhǔn)的時(shí)間段或時(shí)期。二、判斷題1.最基本的時(shí)間序列類型是以時(shí)間戳為索引的Series)2.如果相同頻率的兩個(gè)Period對(duì)象進(jìn)行數(shù)學(xué)運(yùn)算,那么計(jì)算結(jié)果為它們的)3.任何類型的Pandas)4.DatetimeIndex)5.三、選擇題1.下列選項(xiàng)中,不可以用做Pandas對(duì)象索引的是(A.PeriodB.DatetimeIndexC.PeriodIndexD.MultiIndex2.請(qǐng)閱讀下面一段程序:period1=pd.Period('2015/6/1')print(period1+50)執(zhí)行上述程序,最終輸出的結(jié)果為(A.20150718B.20150719C.20150720D.201507213.請(qǐng)閱讀下面一段程序:importnumpyasnpdate_index=pd.date_range(start="2018/08/10",periods=5)date_se=pd.Series(np.arange(5),index=date_index)sorted_se=date_se.sort_index()print(sorted_se.truncate(after='2018-8-11'))執(zhí)行上述程序,最終輸出的結(jié)果為(A.2018-08-122018-08-13B.232018-08-122018-08-132018-08-14C.2342018-08-102018-08-112018-08-12D.0122018-08-102018-08-11014.下列函數(shù)中,用于創(chuàng)建固定頻率DatetimeIndex對(duì)象的是(A.shift()B.date_range()C.period_range()D.asfreq()5.關(guān)于重采樣的說(shuō)法中,下列描述錯(cuò)誤的是(A.重采樣是將時(shí)間序列從一個(gè)頻率轉(zhuǎn)到另一個(gè)頻率B.升采樣的時(shí)間顆粒是變小的C.時(shí)間序列數(shù)據(jù)在降采樣時(shí),總體的數(shù)據(jù)量是增加的D.時(shí)間序列數(shù)據(jù)在降采樣時(shí),總體的數(shù)據(jù)量是減少的四、簡(jiǎn)答題1.時(shí)間序列的數(shù)據(jù)有哪幾種?2.什么是降采樣?什么是升采樣?五、程序分析題行的結(jié)果,否則請(qǐng)說(shuō)明編譯失敗的原因。1.代碼一:date_index=pd.date_range('2018/08/10')ser_obj=pd.Series(11,date_index)print(ser_obj)2.代碼二:period1=pd.Period('2017/1')period2=pd.Period('2017/6')print(period2-period1)3.代碼三:date_index=pd.date_range('2018/09/10','2018/09/13')ser_obj=pd.Series(11,date_index)ser_obj['2018\09\12']第8一、填空題1.常見(jiàn)的情感極性分析方法主要有2.文本相似度的檢測(cè)是根據(jù)3.余弦相似度與向量的幅值和方法。公式進(jìn)行檢測(cè)。,與向量的方向。4.文本分類屬于5.文本分類的步驟包括二、判斷題的機(jī)器學(xué)習(xí)。、、、。1.)2.)3.)4.)5.jieba)三、選擇題1.下列選項(xiàng)中,關(guān)于nltk庫(kù)的描述不正確的是(A.nltk擅長(zhǎng)處理英文文本B.nltk包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別及句法分析等C.nltk是一個(gè)免費(fèi)的、開源的、社區(qū)驅(qū)動(dòng)的項(xiàng)目D.nltk庫(kù)只能處理英文文本2.根據(jù)中文的特點(diǎn)以下不屬于分詞算法的是(A.基于規(guī)則的分詞方法B.基于統(tǒng)計(jì)的分詞方法C.基于理解的分詞方法D.基于動(dòng)態(tài)的分詞方法3.下列選項(xiàng)中,不屬于jieba分詞模式(A.支持精確模式B.支持全模式C.支持搜索引擎模式D.支持繁體分詞模式4.閱讀下面一段程序:sentence='Lifeisshort,youneedPython.'words=nltk.word_tokenize(sentence)stop_words=stopwords.words('english')remain_words=[]forwordinwords:print(remain_words)執(zhí)行上述程序,最終輸出的結(jié)果為(A.['Life','short',',','need','Python','.']B.['Life','short','need','Python',]C.['Life','is','short',',','need','Python','.']D.['Life','short',',','you','need','Python','.']5.閱讀下面一段程序:sentence='人生苦短,我用Pyhton'terms_list=jieba.cut(sentence,cut_all=True)print(''.join(terms_list))執(zhí)行上述程序,最終輸出的結(jié)果為(A.人生苦短我用PyhtonB.人生苦短我用PyhtonC.人生苦短我用PyhtonD.人生苦短我用Pyhton四、簡(jiǎn)答題1.什么是文本分析?2.請(qǐng)簡(jiǎn)述常用的文本情感分析方法。3.請(qǐng)簡(jiǎn)述檢測(cè)文本相似度的流程。第1章五、填空題1.數(shù)據(jù)分析2.Anaconda3.實(shí)時(shí)六、判斷題1.錯(cuò)2.對(duì)3.錯(cuò)七、選擇題1.B2.C3.D4.C八、簡(jiǎn)答題1.數(shù)據(jù)分析是指,用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,從中提取有用信息和形成結(jié)論,并加以詳細(xì)研究和概括總結(jié)的過(guò)程。2.明確目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)。3.(12)擁有一個(gè)巨大且活躍的科34)人工智能時(shí)代的通用5)方便對(duì)接其它語(yǔ)言。第2章六、填空題1.ndarray2.二維3.位長(zhǎng)4.廣播5.數(shù)組或列表七、判斷題1.錯(cuò)2.對(duì)3.對(duì)4.對(duì)5.錯(cuò)八、選擇題1.B2.D3.A4.C5.A九、簡(jiǎn)答題1.答案:NumPy這個(gè)過(guò)程叫做矢量化運(yùn)算。2.答案:兩個(gè)數(shù)組的某一維度等長(zhǎng),或其中一個(gè)數(shù)組為一維數(shù)組。十、程序題1.答案:importnumpyasnparr=np.zeros(5)print(arr)2.答案:importnumpyasnparr=np.zeros((8,8),dtype=int)arr[1::2,::2]=1arr[::2,1::2]=1print(arr)第3章一、填空題1.Numpy2.SeriesDataFrame3.索引數(shù)據(jù)字典4.列表5.按置排序按索引排序二、判斷題1.對(duì)2.對(duì)3.錯(cuò)4.錯(cuò)5.錯(cuò)三、選擇題1.A2.B3.A4.A5.B四、簡(jiǎn)答題1.Series是一個(gè)類似于一維數(shù)組的對(duì)象,它能夠保存任何類型的數(shù)據(jù),主要由一組數(shù)據(jù)和與之相關(guān)的索引兩部分構(gòu)成。DataFrame是一個(gè)類似于二維數(shù)組的對(duì)象,它每列的數(shù)據(jù)可以是不同的數(shù)據(jù)類型。DataFrameDataFrame的索引有行索引和列索引。2.層索引,并且能夠以低緯度形式表示高維度的數(shù)據(jù)。五、程序題(1)答案:df_obj=pd.DataFrame(columns=col_data,data=df_data)df_obj(2)答案:sort_values_data=df_obj.sort_values(by=['B'],ascending=False)sort_values_data(3)答案:sort_values_data.to_csv(r'E:\數(shù)據(jù)分析\write_data.csv')'寫入完畢'第4章一、填空題1.完整性唯一性權(quán)威性合法性一致性2.人為原因3.列索引4.橫向堆疊5.正態(tài)分布二、判斷題1.對(duì)機(jī)械原因行索引縱向堆疊內(nèi)連接外連接2.錯(cuò)3.對(duì)4.錯(cuò)5.錯(cuò)三、選擇題1.B2.A3.C4.D5.A四、簡(jiǎn)答題1.的預(yù)處理操作有數(shù)據(jù)清洗、數(shù)據(jù)合并、數(shù)據(jù)重塑、數(shù)據(jù)轉(zhuǎn)換等,在這幾空值和缺失的檢測(cè)、重復(fù)值的處理、異常值的處理等。2.在Pandas中常用的數(shù)據(jù)合并操作有:函數(shù)表示沿著一條軸將多個(gè)對(duì)象進(jìn)行堆疊、函數(shù)表示根據(jù)一個(gè)或多個(gè)鍵將不同的對(duì)象進(jìn)行合并、join()方法表示根據(jù)索引或指定的列來(lái)合并數(shù)據(jù)、combine_first()方法表示填充合并數(shù)據(jù)。五、程序題(1)答案:importpandasaspdimportnumpyasnpgroup_a=pd.DataFrame({'A':[2,3,5,2,3],'B':['5',np.nan,'2','3','6'],'C':[8,7,50,8,2],'key':[3,4,5,2,5]})print(group_a)print(group_b)(2)答案:group_a=group_bine_first(group_b)group_a(3)答案:group_a.rename(columns={'key':'D'})第5章一、填空題1.拆分應(yīng)用合并2.列表或數(shù)組函數(shù)DataFrame對(duì)象某列的名稱字典或Series對(duì)象3.廣播4.DataFrameGroupBy二、判斷題1.對(duì)2.錯(cuò)3.錯(cuò)4.對(duì)5.對(duì)三、選擇題1.A2.A3.B4.C5.D四、簡(jiǎn)答題1.分組聚合的流程一般為拆分、應(yīng)用、合并。拆分是將數(shù)據(jù)集按照一定規(guī)則分成若干組;應(yīng)用是對(duì)這些分組的數(shù)據(jù)進(jìn)行一系列操作的過(guò)程;合并是將這些執(zhí)行操作后的結(jié)果進(jìn)行整合。2.常用的分組方式主要有4種,分別為:列表或數(shù)組,列表或數(shù)組的長(zhǎng)度需要與帶分組軸的長(zhǎng)度一致、DataFrame中某列的名稱、字典或Series對(duì)象、函數(shù)。五、程序題(1)答案:大一',''三','大四'],姓名李宏卓','李思真','張振海',趙鴻飛白蓉','馬騰飛',張曉凡金紫萱','金燁'],年齡身高160,180,167,170,185],70,52,53,73]})data=studnets_data.groupby('年級(jí)')Freshman=dict([xforxindata])['大一']print(Freshman)(2)答案:deldata['年級(jí)']print(data)(3)答案:Junior=dict([xforxindata])['大三']print(Freshman['體重'].apply('mean'))print(Junior['體重'].apply('mean'))第6章一、填空題1.瀏覽器2.直方圖3.pyplot4.數(shù)據(jù)的類型5.bar餅圖折線圖分布情況二、判斷題1.對(duì)2.對(duì)3.錯(cuò)4.錯(cuò)5.對(duì)三、選擇題1.A2.D3.D4.B5.D四、程序題(1)答案:stock_data=pd.DataFrame({'證券代碼':['000609','000993','002615','000795','00276

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論