大數(shù)據(jù)考試復(fù)習(xí)試題含答案

上傳人：喝*** IP屬地：廣西上傳時間：2024-12-16 格式：DOC 頁數(shù)：33 大?。?3.93KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩28頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第頁大數(shù)據(jù)考試復(fù)習(xí)試題含答案1.se=pd.Series(range(6,10),index=[3,0,1,2])Se1=se.reindex([0,1,3,2,5])則se1的值排序順序?yàn)锳、7.08.06.09.0B、6.07.08.09.0C、7.08.06.09.0NaND、9.08.07.06.0NaN【正確答案】：C2.下列函數(shù)中,用于對URL進(jìn)行解碼的是()。A、encodeB、urlencodeC、unquoteD、decode【正確答案】：B3.對于數(shù)組:[[1,0,0],[0,1,2]]下列描述錯誤的是:A、該數(shù)組的維度是2B、該數(shù)組長度為(2,3)C、該數(shù)組長度為(3,2)D、該數(shù)組第1維的長度為2【正確答案】：C4.層次化索引能夠提供哪一種數(shù)據(jù)操作的優(yōu)勢?A、更高效的數(shù)據(jù)插入與更新B、更容易地處理重復(fù)索引C、更直觀地執(zhí)行分組、合并和透視表操作D、自動填充缺失數(shù)據(jù)【正確答案】：C5.date_index=pd.date_range('2024/02/14',periods=5)Timer_ser=pd.Series(np.arange(5),index=date_index)Se=timer_ser.shift(-1)則se的值為A、"[0,1,2,3,NaN]"B、"[1,2,3,4,NaN]"C、"[NaN,1,2,3,4]"D、"[NaN,1,2,3]"【正確答案】：B6.下列選項中,用來表示數(shù)組維度的屬性是()。A、ndimB、shapeC、sizeD、dtype【正確答案】：B7.matplotlib能繪制()圖A、直方圖B、散點(diǎn)圖C、柱狀圖D、以上都是【正確答案】：D8.下列選項中,描述不正確的是。()A、數(shù)據(jù)清洗的目的是為了提高數(shù)據(jù)質(zhì)量B、異常值一定要刪除C、可使用drop_duplicates()方法刪除重復(fù)數(shù)據(jù)D、concat()函數(shù)可以沿著一條軸將多個對象進(jìn)行堆疊【正確答案】：B9.下列不屬于數(shù)據(jù)分析應(yīng)用場景的是()。A、產(chǎn)品銷量分析B、碼頭貨物吞吐量預(yù)測C、計算機(jī)硬盤使用壽命預(yù)測D、某人一生的命運(yùn)預(yù)測【正確答案】：D10.下列選項中,可以刪除缺失值或空值的是。()A、isnull()B、notnull()C、dropna()D、fillna()【正確答案】：C11.在NumPy中,numpy.array()函數(shù)的作用是什么?A、計算數(shù)組中的最大值B、創(chuàng)建一個數(shù)組對象C、對數(shù)組進(jìn)行排序D、計算數(shù)組的標(biāo)準(zhǔn)差【正確答案】：B12.對于[1,3,9,5,7,6]這組數(shù)值,若采用(n-1)法,且插值方法采用平均值的方法,則其中位數(shù)為:A、6B、5C、6.5D、5.5【正確答案】：D13.請閱讀下面一段程序:importpandasaspdser_obj=pd.Series(range(1,6),index=[5,3,0,4,2])ser_obj.sort_index()執(zhí)行上述程序后,最終輸出的結(jié)果為()。

A、-B、-C、-D、-【正確答案】：B14.index=pd.date_range('2/14/2024',periods=6,freq='H')series=pd.Series(range(6),index=index)則,series.resample('2H').mean()的值為A、[1,3,6]B、[0.5,2.5,4.5]C、[4.5,2,0.5]D、[1,5,9]【正確答案】：B15.arr=np.array([[1,2,3],[4,5,6],[7,8,9]])Arr[0:2,0:2]的結(jié)果為A、array([[1,2,3],[4,5,6]])B、array([[1,2,],[4,5],[7,8]])C、array([[1,2,],[4,5]])D、array([[2,3],[5,6]])【正確答案】：C16.下列關(guān)于廣播機(jī)制描述正確的是:A、廣播機(jī)制將用0來補(bǔ)全缺失元素B、廣播機(jī)制將用NaN來補(bǔ)全缺失元素C、廣播機(jī)制將通過”復(fù)制“的方法來填充缺失元素D、在任何條件下,廣播機(jī)制都可以將兩個形狀不同的數(shù)組擴(kuò)展為形狀相同的數(shù)組【正確答案】：C17.創(chuàng)建一個3x3并且值從1到9的矩陣()A、m=np.arange(9).reshape(3,3)B、m=np.arange(1,10).reshape(3,3)C、m=np.arange(0,9).reshape(3,3)D、m=np.range(1,10).shape(3,3)【正確答案】：B18.下列選項中,描述不正確的是()。A、Pandas中只有Series和DataFrame這兩種數(shù)據(jù)結(jié)構(gòu)B、Series是一維的數(shù)據(jù)結(jié)構(gòu)C、DataFrame是二維的數(shù)據(jù)結(jié)構(gòu)D、Series和DataFrame都可以重置索引【正確答案】：A19.關(guān)于層次化索引,以下描述正確的是A、只有層次化行索引B、只有層次化列索引C、行索引和列索引都可以是層次化的D、層次索引的每一級都可以有一個編號,其中內(nèi)層索引編號為0【正確答案】：C20.下列關(guān)于李四在11.5-11.11這段時間與RFM模型相關(guān)知識描述正確的是:①李四的最近一次消費(fèi)時間間隔(R)是2天(11月11號-11月9號)②李四的最近一次消費(fèi)時間間隔(R)是6天(11月11號-11月5號)③李四的消費(fèi)頻率(F)是總共消費(fèi)的次數(shù),即3次④李四的消費(fèi)頻率(F)是每隔兩天一次,即每天平均0.5次⑤李四的消費(fèi)金額(M)是三天的消費(fèi)金額總和2400元⑥李四的消費(fèi)金額(M)是三天的消費(fèi)金額平均值800元A、①③⑤B、①③⑥C、②③⑥D(zhuǎn)、②④⑥【正確答案】：A21.下列哪個函數(shù)可以通過笛卡爾積的形式生成層次化索引?A、pd.MultiIndex.from_product()B、pd.MultiIndex.from_arrays()C、pd.MultiIndex.from_tuples()D、pd.Index.cross_join()【正確答案】：A22.請閱讀下面一段程序:FrompandasimportSeriesImportpandasaspdFromnumpyimportNaNSeries_obj=Series([None,4,NaN])Pd.isnull(series_obj)執(zhí)行上述程序后,最終輸出的結(jié)果為()。

A、-B、-C、-D、-【正確答案】：A23.下面代碼中,創(chuàng)建的是一個3行3列數(shù)組的是()。A、arr=np.array([1,2,3])B、arr=np.array([[1,2,3],[4,5,6]])C、arr=np.array([[1,2],[3,4]])D、np.ones((3,3))【正確答案】：D24.下列函數(shù)中,可以用于創(chuàng)建等差數(shù)組的函數(shù)是()。A、empty()B、arange()C、zeros()D、ones()【正確答案】：B25.下列選項中,描述正確是()。A、Series是一維數(shù)據(jù)結(jié)構(gòu),其索引在右,數(shù)據(jù)在左B、DataFrame是二維數(shù)據(jù)結(jié)構(gòu),并且該結(jié)構(gòu)具有行索引和列索引C、Series結(jié)構(gòu)中的數(shù)據(jù)不可以進(jìn)行算術(shù)運(yùn)算D、sort_values()方法可以將Series或DataFrame中的數(shù)據(jù)按照索引排序【正確答案】：B26.下列選項中,不屬于ndarray對象屬性的是()A、shapeB、dtypeC、ndimD、map【正確答案】：D27.se=pd.Series(range(6,10),index=[3,0,1,2])Se1=se.reindex([0,1,3,2,5],fill_value=3)則se1的值排序順序?yàn)锳、3.07.08.06.09.0B、7.08.06.09.03.0C、7.08.06.09.0NaND、9.08.07.06.03.0【正確答案】：B28.pd.date_range(start='2/9/2024',end='2/14/2024')以上函數(shù)調(diào)用后生成的DatetimeIndex對象包含幾個時間點(diǎn)?A、4B、5C、6D、3【正確答案】：C29.arr=np.array([['a','b','c'],['d','e','f']])Df=pd.DataFrame(arr)對于df,其行索引和列索引分別為A、[0,1,2]B、[0,1]C、[0,1,2]D、[0,1,2]【正確答案】：B30.下列代碼中繪制直方圖的是()。A、plt.hist(x,y)B、plt.scatter(x,y)C、plt.legend('bottom')D、plt.label(散點(diǎn)圖)【正確答案】：A31.下列選項中,描述不正確是。()A、concat()函數(shù)可以沿著一條軸將多個對象進(jìn)行堆疊B、merge()函數(shù)可以根據(jù)一個或多個鍵將不同的DataFrame進(jìn)行合并C、可以使用rename()方法對索引進(jìn)行重命名操作D、unstack()方法可以將列索引旋轉(zhuǎn)為行索引【正確答案】：D32.以下數(shù)據(jù)屬于連續(xù)性數(shù)據(jù)的是:A、擲一個骰子可能的出現(xiàn)的點(diǎn)數(shù)B、一個學(xué)校每個班級的學(xué)生人數(shù)C、一個學(xué)校開設(shè)的課題題目D、降雨量【正確答案】：D33.importnumpyasnpArr=np.array([[1,2,3],[4,5,6]])如何定義一個布爾掩碼,用于選擇數(shù)組中大于3的元素A、mask=arr>3B、mask=[arr>3]C、mask=['arr>3']D、mask=np.mask(arr)>3【正確答案】：A34.se=pd.Series(range(10,15),index=[5,3,1,3,2])Se_sorted=se.sort_values()以下描述錯誤的是:A、sort_values是按”值“排序B、se_sorted的結(jié)果為[10,11,12,13,14]C、se_sorted的結(jié)果為[14,13,12,11,10]D、如果需要調(diào)整升降序,可以通過ascending參數(shù)來調(diào)整【正確答案】：C35.se=pd.Series([1,2,3],index=['a','b','c'])以下哪種方案不能訪問數(shù)值2A、se[b]B、se['b']C、se.bD、se[1]【正確答案】：A36.以下描述錯誤的是A、ndarray是numpy中最基本的對象B、numpy.array將返回一個ndarray對象C、ndim表示數(shù)組的長度D、shape表示數(shù)組的形狀【正確答案】：C37.下列關(guān)于文本數(shù)據(jù)預(yù)處理,表述錯誤的是:A、文本預(yù)處理包括分詞->詞形歸一化->(詞性標(biāo)注)->刪除停用詞等步驟B、NLTK主要用于中文分詞C、通常,由于中文分詞沒有類似英文的空格,所以中文分詞比英文分詞難度要大D、可以基于規(guī)則、統(tǒng)計和理解進(jìn)行分詞【正確答案】：B38.pandas對數(shù)據(jù)列進(jìn)行排序的函數(shù)是A、set_indexB、sort_valuesC、sort_indexD、truncate【正確答案】：B39.arr=np.array([[1,2,3],[4,5,6],[7,8,9]])Arr[:2]的結(jié)果為A、array([[1,2,3],[4,5,6]])B、array([[1,2,],[4,5],[7,8]])C、array([[1,2,],[4,5]])D、array([[2,3],[5,6]])【正確答案】：A40.Numpy提供()支持以及相應(yīng)的高效處理函數(shù),是Python數(shù)據(jù)分析的基礎(chǔ)A、元祖B、數(shù)據(jù)C、數(shù)組D、字典【正確答案】：C41.請你選出以下選項中錯誤的一項:A、給R、F、M各值打分時,不是按指標(biāo)的數(shù)值大小打分,而是對指標(biāo)的價值打分B、閾值只能通過“分區(qū)域評分,計算平均值”的方式獲得C、RFM值的打分區(qū)間不一定是1~5【正確答案】：B42.se1=pd.Series(range(10,12),index=range(2))Se2=pd.Series(range(20,23),index=range(3))Se_plus=se1.add(se2,fill_value=3)則se_plus的值為A、[30,32,3]B、[3,30,32]C、[30,32,25]D、[25,30,32]【正確答案】：C43.importnumpyasnpArr=np.array([[6,2,7],[3,6,2],[4,3,2]])Arr.sort(axis=1)Arr其打印結(jié)果為:A、array([[2,6,7],[2,3,6],[2,3,4]])B、array([[2,3,4],[2,3,6],[2,6,7]])C、array([[3,2,2],[4,3,2],[6,6,7]])D、array([[2,3,6],[2,3,4],[2,6,7]])【正確答案】：A44.ser=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])則ser[2]與ser['d']的值分別為A、3和4B、2和4C、2和3D、3和'd'【正確答案】：A45.數(shù)據(jù)分析流程中,不包含以下哪個階段?()。A、明確目的與思路B、數(shù)據(jù)展示C、數(shù)據(jù)分析D、數(shù)據(jù)存儲【正確答案】：D46.繪制餅圖的函數(shù)是()。A、plot()B、pie()C、barh()D、bar()【正確答案】：B47.在pandas中,用于檢測DataFrame或Series中重復(fù)值的函數(shù)是哪個?A、pd.duplicated()B、pd.unique()C、pd.find_duplicates()D、pd.is_repeated()【正確答案】：A48.下列不屬于Python優(yōu)勢的是()A、語法簡潔,程序開發(fā)速度快B、擁有大量的第三方庫,能夠調(diào)用C艸+、Java語言C、程序的運(yùn)行速度在所有計算機(jī)語言中最快用類多等D、開源免費(fèi)【正確答案】：C49.關(guān)于all()函數(shù)與any()函數(shù),下列選項中描述正確的是()。A、all()用于判斷整個數(shù)組中的元素的值是否全部滿足條件,如果滿足條件返回True,否則返回FalseB、any()用于判斷整個數(shù)組中的元素的值是否全部滿足條件,如果滿足條件返回False,否則返回TrueC、any()函數(shù)用于判斷整個數(shù)組中的元素至少有一個滿足條件,如果滿足返回False,否則就返回TrueD、all()函數(shù)用于判斷整個數(shù)組中的元素至少有一個滿足條件就返回False,否則就返回True【正確答案】：A50.在Pandas中,用于計算DataFrame某一列(如'column1')平均值的方法是?A、df.mean('column1')B、df['column1'].mean()C、df.aggregate('mean',column='column1')D、df.column1.agg()【正確答案】：B51.請閱讀下面一段程序:Arr=np.arange(6).reshape(1,2,3)Print(arr.transpose(2,0,1))執(zhí)行上述程序后,最終輸出的結(jié)果為()。A、[[[25]][[03]][[14]]]B、[[[14]][[03]][[25]]]C、[[[03]][[14]][[25]]]D、[[[0][3]][[1][4]][[2][5]]]【正確答案】：C52.s=pd.Series([1,2,3,4,5])S.replace(1,5)的結(jié)果為A、[5,2,3,4,5]B、[1,2,3,4,1]C、[1,5,3,4,5]D、[1,2,3,5,5]【正確答案】：A53.若要對DataFrame按照某一列(例如'Age')進(jìn)行排序,應(yīng)使用哪個方法?A、df.sort_values('Age')B、df.order_by('Age')C、df.sort_column('Age')D、df.sort_key('Age')【正確答案】：A54.若要創(chuàng)建一個全為零且形狀為(3,4)的二維數(shù)組,應(yīng)使用下列哪個命令?A、np.zeros((4,3))B、np.empty((3,4),fill_value=0)C、np.ones((4,3))?0D、np.zeros((3,4))【正確答案】：D55.下列關(guān)于重采樣相關(guān)描述錯誤的是:A、重樣是指將常規(guī)時間序列重新采樣,往往會對頻率進(jìn)行轉(zhuǎn)換B、降采樣的時間顆粒會變大,比如原來按天統(tǒng)計,現(xiàn)在按周統(tǒng)計C、升采樣的時間顆粒會變小D、降采樣的總體數(shù)據(jù)量會變大【正確答案】：D56.下面構(gòu)建RFM模型的步驟,正確順序應(yīng)該是①將用戶的RFM值與平均值進(jìn)行對比,標(biāo)記用戶的RFM高低值,對用戶進(jìn)行分類②給用戶的RFM值進(jìn)行打分③分別計算R、F、M各打分值的平均值④獲取含有RFM的用戶數(shù)據(jù),計算R、F、M的值⑤給R、F、M各值按價值劃分打分區(qū)間A、④③⑤②①B、④⑤③②①C、④⑤②③①D、⑤④②③①【正確答案】：C57.關(guān)于Pandas中數(shù)據(jù)排序,下列說法正確的是()。A、即可以按照行索引排序,也可以按照列索引排序B、sort_index()方法表示按照值進(jìn)行排序C、sort_values()方法表示按照索引進(jìn)行排序D、默認(rèn)情況下,sort_index()方法按照降序排列【正確答案】：A58.l=[[1,2,3],[1,6,4],[2,1,3],[1,2,2]]Df=pd.DataFrame(l,columns=["a","b","c"])Df.groupby(by=["b"])可以將df分成幾組A、2B、1C、3D、4【正確答案】：C59.以下哪一項描述的問題無法使用RFM模型進(jìn)行分析A、某廣告投放專員小凡被老板要求減少廣告成本,但又不能對總體廣告帶來的收益影響太大,小凡頭很大B、某銀行業(yè)務(wù)員小劉最近想發(fā)展幾個潛力客戶,可看著一大疊客戶名單,不知道要針對哪些客戶,小劉很苦惱C、某游戲運(yùn)營專員小杰發(fā)現(xiàn)最近游戲中新增用戶減少,想推出活動吸引新用戶D、某電商運(yùn)營專員小龍發(fā)現(xiàn)最近用戶流失率有所增加,他要想辦法找到那些可能流失的用戶,采取挽留措施【正確答案】：C60.Echarts是()公司開發(fā)的產(chǎn)品。A、阿里巴巴B、谷歌C、百度D、騰訊【正確答案】：C61.對于[1,3,5,6,7,9,10]這組數(shù)值,若采用(n-1)法,且插值方法采用”平均值“的方法,其下四分位數(shù)為:A、3B、3.5C、4D、5【正確答案】：C62.df=pd.DataFrame(np.array([[0,1,2],[3,4,5],[8,6,-4]]),index=['f','b','e'])Df_sorted=df.sort_values(by='e',axis=1)以下描述錯誤的是:A、by='e'指按照索引'e'進(jìn)行值排序B、axis=1表示按照水平方向進(jìn)行排序C、默認(rèn)將按照升序進(jìn)行排序D、sort_values()是按照索引進(jìn)行排序【正確答案】：D63.請閱讀下面一段程序:Arr_2d=np.array([[11,20,13],[14,25,16],[27,18,9]])Print(arr_2d[1,:1])執(zhí)行上述程序后,最終輸出的結(jié)果為()。A、"[14]"B、"[25]"C、"[14,25]"D、"[20,25]"【正確答案】：A64.df=pd.DataFrame({"A":[1,2,3],"B":[4,5,6]})Df_re=df.rename(columns={"A":"a","B":"c"})此時,df_re的列索引為A、該方法拋出異常,因?yàn)樗饕荒鼙桓淖傿、["a","c"]C、["a","b"]D、["A","B","a","c"]【正確答案】：B65.pd.cut(np.array([1,7,5,4,6,3]),3)則下屬描述錯誤的是A、該方法將數(shù)組區(qū)間分為等寬的3段B、默認(rèn)分隔的區(qū)間是左閉右開的C、左端點(diǎn)取值默認(rèn)會有一個偏差,通常偏差在1%內(nèi)D、上述結(jié)果中,數(shù)字5將落在(3.0,5.0]這個區(qū)間內(nèi)【正確答案】：B66.list_tuples=[('A','A1'),('A','A2'),('B','B1'),('B','A2'),('B','B3')]Result=MultiIndex.from_tuples(tuples=list_tuples)對于以上代碼,描述錯誤的是A、外層索引為['A','B']B、內(nèi)層索引為['A1','A2','B1','A2','B3']C、result是一個MultiIndex對象D、A2的父級索引是A【正確答案】：D67.下列函數(shù)中,用于計算整數(shù)的絕對值的是()。A、square()B、sqrt()C、abs()D、floor()【正確答案】：C68.關(guān)于DataFrame.stack(),其作用描述正確的是:A、將行索引轉(zhuǎn)換為列索引B、將列索引轉(zhuǎn)換為行索引C、將行列索引互換D、將整個DataFrame旋轉(zhuǎn)90度【正確答案】：B69.在進(jìn)行算術(shù)運(yùn)算時,如果希望一次性輸出多個統(tǒng)計指標(biāo)可以使用()方法。A、statistics()B、describe()C、all()D、results()【正確答案】：B70.下列選項中,不屬于Seaborn庫特點(diǎn)的是()。A、基于網(wǎng)格繪制出更加復(fù)雜的圖像集合B、SeabornMatplotlib是基于的視化庫C、可以處理大量的數(shù)據(jù)流D、多個內(nèi)置主題及顏色主題【正確答案】：C71.假設(shè)有一個數(shù)組:Array([[0.,1.,2.,3.],[1.,2.,3.,4.],[2.,3.,4.,5.],[3.,4.,5.,6.]])Arr[[0,3]]的打印結(jié)果為:A、array([[0.,1.,2.]])B、array([[0.,1.,2.,3.],[1.,2.,3.,4.],[2.,3.,4.,5.]])C、array([[0.,1.,2.,3.],[3.,4.,5.,6.]])D、array([[0],[1],[2],[3]])【正確答案】：C72.df=pd.DataFrame(np.arange(25).reshape(5,5),index=list('abcde'),columns=list('ABCDE'))則以下描述錯誤的是:A、iloc僅可以接收整數(shù)作為參數(shù)B、df.iloc[1]的取值為[5,6,7,8,9]C、df.loc['a']的取值為[0,1,2,3,4]D、df.iloc[0]的取值為[0,5,10,15,20]【正確答案】：D73.下列關(guān)于數(shù)組軸的描述錯誤的是:A、通常,數(shù)組的每個軸都有一個編號B、由于三維坐標(biāo)系通常用x軸、y軸和z軸表示,所以數(shù)組的軸編號不可能超過3C、對于一個二維數(shù)組,縱向軸(y軸)編號為0,水平軸(x軸)編號為1D、高維數(shù)組在執(zhí)行轉(zhuǎn)置操作時,通常需要指定數(shù)組的維度編號【正確答案】：B74.關(guān)于Series和DataFrame下列描述錯誤的是:A、Series主要由數(shù)據(jù)和索引構(gòu)成B、DataFrame主要由行、列索引以及數(shù)據(jù)構(gòu)成C、創(chuàng)建DataFrame時,必須顯式傳入行索引和列索引D、在創(chuàng)建Series時,如果不傳入索引,則默認(rèn)生成0到n的索引【正確答案】：C75.對于以下DataFrame當(dāng)調(diào)用drop_duplicates()后,其行索引為:A、[1,2,3,4]B、[0,2,3,4]C、[0,2]D、[1,3,4]【正確答案】：B76.importnumpyasnpArr=np.empty((3,3))Foriinrange(3):Arr[i]=np.arange(i,i+3)該程序生成的數(shù)組arr為:A、array([[1.,2.,3.],[2.,3.,4.],[4.,5.,6.]])B、array([[0.,1.,2.],[1.,2.,3.],[2.,3.,4.]])C、array([[0.,2.,4.],[1.,3.,5.],[2.,5.,7.]])D、array([[0.,3.],[1.,4.],[2.,5.]])【正確答案】：B77.請閱讀下面一段程序:importnumpyasnpimportpandasaspdser_obj=pd.Series([4,np.nan,6,5,-3,2])ser_obj.sort_values()執(zhí)行上述程序后,最終輸出的結(jié)果為()。

A、-B、-C、-D、-【正確答案】：A78.Matplotlib是python中的()A、繪圖工具庫B、分析方法C、建表D、以上都不是【正確答案】：A79.pandas用于分組的函數(shù)是A、applyB、meanC、groupbyD、describe【正確答案】：C80.arr=np.arange(8)Arr[1:6:2]以上代碼結(jié)果為_____A、list([1,2,3,4,5,6])B、list([1,3,5])C、array([1,3,5])D、array[1,2,6]【正確答案】：C81.根據(jù)下面的代碼,df_g['b']的結(jié)果為:L=[[1,2,3],[1,None,4],[2,1,3],[1,2,2]]Df=pd.DataFrame(l,columns=["a","b","c"])Df_g=df.groupby(by="a").sum()A、[4,1]B、[2,1]C、[1,3]D、[5,2]【正確答案】：A82.下列關(guān)于shape屬性描述錯誤的是A、shape表示數(shù)組的形狀B、shape屬性返回一個元組C、shape屬性返回元組的長度等于數(shù)組的維度(ndim)D、一個2X3的矩陣的shape屬性為(3,2)【正確答案】：D83.下列選項中哪個方法表示將Excel中的數(shù)據(jù)讀取出來,轉(zhuǎn)換成DataFrame展示?()A、read_excel()B、to_DataFrame()C、write_DataFrame()D、excel_write()【正確答案】：A84.下面列出的數(shù)據(jù)分析庫中,用于繪制數(shù)組的2D圖形的是()A、NumPyB、PandasC、MatplotlibD、NLTK【正確答案】：C85.arr=np.array([[1,2,3],[4,5,6],[7,8,9]])Arr[1,2]關(guān)于arr[1,2]的返回結(jié)果描述正確的是A、返回結(jié)果是一個一維數(shù)組B、返回結(jié)果是一個二維數(shù)組C、返回結(jié)果為6D、返回結(jié)果為數(shù)組[[1,2,3],[4,5,6]]【正確答案】：C86.對于應(yīng)用3σ原則的數(shù)據(jù),必須要求數(shù)據(jù)分布服從(或逼近):A、離散數(shù)據(jù)B、連續(xù)數(shù)據(jù)C、正態(tài)分布D、數(shù)據(jù)是分桶的【正確答案】：C87.df=pd.DataFrame(np.arange(9).reshape(3,3),index=[4,3,5])Df_sorted=df.sort_index()Df_sorted[2][3]的值為A、1B、5C、4D、6【正確答案】：B88.pandas提供的去掉重復(fù)值的方法是A、drop_dup()B、drop_duplicates()C、duplicates()D、drop()【正確答案】：B89.arr=np.array([[1,2,3],[4,5,6],[7,8,9]])Arr[:2]關(guān)于arr[:2]的返回結(jié)果描述正確的是A、返回結(jié)果是一個一維數(shù)組B、返回結(jié)果為數(shù)組[1,2]C、返回結(jié)果為數(shù)組[7,8,9]D、返回結(jié)果為數(shù)組[[1,2,3],[4,5,6]]【正確答案】：D90.numbers=[0,1,2]Colors=['green','purple']以上兩個集合,進(jìn)行笛卡爾積運(yùn)算,其總共的組合有:A、4種B、6種C、5種D、2種【正確答案】：B91.下列選項中,不能創(chuàng)建一個Series對象的是()。A、ser_obj=pd.Series([1,2,3,4,5])B、ser_obj=pd.Series({2001:17.8,2002:20.1,2003:16.5})C、ser_obj=pd.Series((1,2,3,4))D、ser_obj=pd.Series(1,2)【正確答案】：D92.s1=pd.Series(['a','b'])S2=pd.Series(['c','d'])Con=pd.concat([s1,s2])以下結(jié)果描述錯誤的是A、con的結(jié)果為['a','c','b','d']B、con的結(jié)果為['a','b','c','d']C、concat()函數(shù)用于進(jìn)行軸向堆疊數(shù)據(jù)D、concat()可以用于合并兩個Series,也可以用于合并兩個DataFrame【正確答案】：A93.關(guān)于Pandas中兩個DataFrame的連接方式,描述錯誤的是:A、inner表示內(nèi)連接B、outer表示外連接C、inner表示兩個集合的交集D、outer表示兩個集合的交集【正確答案】：D94.數(shù)據(jù)清洗方法不包括()。A、刪除原始數(shù)據(jù)中的無關(guān)數(shù)據(jù)B、重復(fù)數(shù)據(jù)處理C、邏輯錯誤處理D、處理缺失值與異常值等【正確答案】：C95.下列關(guān)于Series說法錯誤的是()A、Series是一個類似一維數(shù)組的數(shù)據(jù)結(jié)構(gòu)B、Series可以保存任何類型的數(shù)據(jù)C、Series由數(shù)據(jù)和索引構(gòu)成D、Series必須顯式設(shè)置索引【正確答案】：D96.下面那個方法是計算算數(shù)平均值:()A、sumB、minC、meanD、min【正確答案】：C97.分辨出這個Series對象中,數(shù)據(jù)指的是哪一部分?QQ截圖20221213155225.jpgA、0,'趙'B、0,1,2,3C、'趙','錢','孫','李'D、3,'李'【正確答案】：C98.分辨下圖DataFrame對象中,列索引指的是什么?Image.pngA、0,1,2B、'年齡','崗位','年購買量'C、23,22,21D、'客服','運(yùn)營','公關(guān)'【正確答案】：B99.下列函數(shù)或方法中,用來表示矢量化三元表達(dá)式的是()。A、where()B、cumsum()C、sort()D、unique()【正確答案】：A100.Series對象類似于ndarray數(shù)組對象,也可以進(jìn)行矢量運(yùn)算。對一個值為[1,2,3]的Series對象進(jìn)行Series?2的操作,結(jié)果為:A、Series([1,2,3,1,2,3])B、Series([2,4,6])C、Series([2,4,6,2,4,6])D、Series([0,6])【正確答案】：B1.下列關(guān)于Pandas數(shù)據(jù)排序說法正確的是()。A、sort_values()可以按值排序B、sort_values()可以按索引排序C、sort_index()可以按索引排序D、sort_index()可以按值排序【正確答案】：AC2.關(guān)于dataframe正確的是A、兩維數(shù)據(jù)結(jié)構(gòu)B、一維數(shù)據(jù)結(jié)構(gòu)C、index表示行索引D、list表示列索引E、columns表示列索引【正確答案】：ACE3.pandas的to_datetime函數(shù)可以將以下哪些類型數(shù)據(jù)轉(zhuǎn)換成時間對象A、字典B、SeriesC、字符串D、list【正確答案】：ABCD4.arr=np.arange(12).reshape(3,4)Df=pd.DataFrame(arr,index=['a','b','c'],columns=['a','b','c','d'])Df[0:2]關(guān)于df[0:2]以下描述正確的是A、取第0行和第1行B、取第0列和第1列C、結(jié)果是一個DataFrameD、結(jié)果是一個Series【正確答案】：AC5.pandas中常見的數(shù)據(jù)異常值鑒別方法有:A、3σ原則B、β分布C、離散原則D、箱型圖【正確答案】：AD6.NumPy數(shù)組的轉(zhuǎn)置可以通過()實(shí)現(xiàn)。A、transpose()B、reshape()C、TD、transform()【正確答案】：AC7.pandas中主要的數(shù)據(jù)結(jié)構(gòu)有A、SeriesB、NdarrayC、NumpyDataFrame【正確答案】：AD8.下列說法正確的是()A、散點(diǎn)圖的x軸刻度必須為數(shù)值B、折線圖可以用做查看特征間的趨勢關(guān)系C、柱狀圖可以用做查看各分類之間的數(shù)據(jù)對比D、餅圖可以用做查看各分類在總和中的占比【正確答案】：BCD9.關(guān)于箱線圖分析法正確的是A、位于上下四分位數(shù)之外的就是屬于異常值B、位于上下四分位數(shù)之內(nèi)的就是屬于異常值C、小于QL-1.5IQR屬于異常值D、大于QU+1.5IQR屬于異常值【正確答案】：CD10.關(guān)于arr=np.arange(5,8)以下描述正確的是A、arr中包含5,但不包含8B、arr中包含8,但不包含5C、對于arange函數(shù),其生成的數(shù)組區(qū)間是左閉右開的D、對于arange函數(shù),其生成的數(shù)組區(qū)間是左開右閉的【正確答案】：AC11.創(chuàng)建一個3?3的數(shù)組,下列代碼中正確的是()A、np.ones((3,3))B、np.random.random([3,3,3])C、np.zeros((3,3))D、np.arange(0,9).reshape(3,3)【正確答案】：ACD12.下列函數(shù)中,可以創(chuàng)建NumPy數(shù)組的是()。A、array()B、zeros()C、empty()D、ones()【正確答案】：ABCD1.使用describe()方法會輸出Pandas對象的多個統(tǒng)計指標(biāo)。A、正確B、錯誤【正確答案】：A2.在箱形圖中超出上界和下界的值稱為異常值。()A、正確B、錯誤【正確答案】：A3.在DataFrame中每列的數(shù)據(jù)都可以看作是一個Series對象。A、正確B、錯誤【正確答案】：A4.字典中的值只能夠是字符串類型。()A、正確B、錯誤【正確答案】：B5.pd.MultiIndex.from_arrays()既可以通過數(shù)組創(chuàng)建層次索引對象,也可以通過列表創(chuàng)建A、正確B、錯誤【正確答案】：A6.NumPy數(shù)組不需要循環(huán)遍歷,即可對每個元素執(zhí)行批量的算術(shù)運(yùn)算操作。A、正確B、錯誤【正確答案】：A7.read_csv()函數(shù)和read_table()函數(shù)沒有區(qū)別可以隨意替換使用。()A、正確B、錯誤【正確答案】：B8.pandas中idxmin函數(shù)用于獲取最大值的行索引A、正確B、錯誤【正確答案】：B9.在使用merge()函數(shù)進(jìn)行合并時,不需要指定合并鍵。()A、正確B、錯誤【正確答案】：B10.1.根據(jù)3σ判斷原則,對于一組數(shù)據(jù),若μ表示平均值,σ表示標(biāo)準(zhǔn)差,則某些分布在(μ-σ,μ+σ)區(qū)間外的數(shù)值會被判定為異常值A(chǔ)、正確B、錯誤【正確答案】：B11.使用describe()方法會輸出多個統(tǒng)計指標(biāo)。()、A、正確B、錯誤【正確答案】：A12.當(dāng)通過布爾數(shù)組索引操作數(shù)組時,返回的數(shù)據(jù)是布爾數(shù)組中False對應(yīng)位置的值。()A、正確B、錯誤【正確答案】：B13.數(shù)組之間的任何算術(shù)運(yùn)算都會將運(yùn)算應(yīng)用到元素級。()A、正確B、錯誤【正確答案】：A14.數(shù)組的維度也稱為軸(axes)A、正確B、錯誤【正確答案】：A15.pandas是一個基于Numpy的Python庫A、正確B、錯誤【正確答案】：A16.圖表時,可以使用subplot函數(shù)創(chuàng)建多個子圖。A、正確B、錯誤【正確答案】：A17.DataFrame的結(jié)構(gòu)是由索引和數(shù)據(jù)組成的。A、正確B、錯誤【正確答案】：A18.可以通過np.arrage(12).reshape(3,4),構(gòu)建一個3行4列的數(shù)組A、正確B、錯誤【正確答案】：A19.Series對象不存在層次化索引。()A、正確B、錯誤【正確答案】：B20.通過empty()函數(shù)創(chuàng)建的數(shù)組,該數(shù)組中沒有任何的元素。()A、正確B、錯誤【正確答案】：B21.se=pd.Series([1,3,9,5,7,6])Se.describe()的返回結(jié)果中,25%、50%、75%

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)考試復(fù)習(xí)試題含答案

文檔簡介

溫馨提示

最新文檔

評論

大數(shù)據(jù)考試復(fù)習(xí)試題含答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔