財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)Python 數(shù)據(jù)分析甄阜銘課后參考答案_第1頁
財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)Python 數(shù)據(jù)分析甄阜銘課后參考答案_第2頁
財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)Python 數(shù)據(jù)分析甄阜銘課后參考答案_第3頁
財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)Python 數(shù)據(jù)分析甄阜銘課后參考答案_第4頁
財(cái)務(wù)大數(shù)據(jù)基礎(chǔ)Python 數(shù)據(jù)分析甄阜銘課后參考答案_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章一、選擇題下列有關(guān)數(shù)據(jù)分析的說法錯(cuò)誤的是(D)。數(shù)據(jù)分析是從數(shù)據(jù)中提取有價(jià)值的信息數(shù)據(jù)分析的本質(zhì)是揭示數(shù)據(jù)的規(guī)律數(shù)據(jù)分析是決策者應(yīng)具有的基本能力數(shù)據(jù)分析是大數(shù)據(jù)和人工智能的結(jié)合技術(shù)一般來說,4類數(shù)據(jù)分析的復(fù)雜度從低到高為(C)。診斷性分析→預(yù)測(cè)性分析→描述性分析→規(guī)范性分析預(yù)測(cè)性分析→描述性分析→診斷性分析→規(guī)范性分析描述性分析→診斷性分析→預(yù)測(cè)性分析→規(guī)范性分析規(guī)范性分析→預(yù)測(cè)性分析→診斷性分析→描述性分析規(guī)范性分析需要回答的問題是(A)?!皯?yīng)該做什么?”“發(fā)生了什么?”“為什么會(huì)發(fā)生這種情況?”“未來可能會(huì)發(fā)生什么?”下列有關(guān)數(shù)據(jù)分析的基本流程的說法錯(cuò)誤的是(D)。數(shù)據(jù)分析的重要環(huán)節(jié)是明確目的,即為什么要進(jìn)行數(shù)據(jù)分析數(shù)據(jù)的本質(zhì)是事實(shí)的表示,獲取的數(shù)據(jù)對(duì)象需要與具體的問題關(guān)聯(lián)特征工程的目的是使數(shù)據(jù)滿足設(shè)定的分析目標(biāo)要求數(shù)據(jù)分析為業(yè)務(wù)決策帶來有效應(yīng)用,必須經(jīng)過可視化呈現(xiàn)數(shù)據(jù)分析可能導(dǎo)致糟糕甚至錯(cuò)誤的結(jié)果,不可能的原因是(A)。底層數(shù)據(jù)質(zhì)量太好分析模型過擬合或欠擬合數(shù)據(jù)分析沒有考慮到模型中固有的缺陷不同的問題使用了相同的數(shù)據(jù)分析模型Python模塊的文件擴(kuò)展名是(B)。.ipynb.py.txt.csv下列有關(guān)Python語言特點(diǎn)說法錯(cuò)誤的是(A)。機(jī)器語言高級(jí)語言面向?qū)ο罂缙脚_(tái)Anaconda科學(xué)包及其依賴項(xiàng)中,不包括(D)。PythonPandasNumPyjiebaPython3.x默認(rèn)的源文件編碼格式是(D)。ASCIIgbkUTF-16UTF-8下列有關(guān)JupyterNotebook說法正確的是(D)。JupyterNotebook命令模式和編輯模式不能切換JupyterNotebook編程過程不能編寫說明文檔JupyterNotebook可以在網(wǎng)頁頁面中直接編寫代碼,但是不能運(yùn)行JupyterNotebook相當(dāng)于一個(gè)功能無比強(qiáng)大的“計(jì)算器”二、判斷題預(yù)測(cè)性分析用于回答“發(fā)生了什么”這一基本問題。(×)探索性數(shù)據(jù)分析是一種使用特定的模型或假設(shè)來探索數(shù)據(jù)的方法。(×)數(shù)據(jù)清洗是在保持或接近保持原數(shù)據(jù)完整性的同時(shí)將數(shù)據(jù)集規(guī)模減小,以提高數(shù)據(jù)處理的速度。(×)JupyterNotebook編輯模式(EditMode)按Esc鍵切換到命令模式(CommandMode)。(√)Python每行代碼的長(zhǎng)度沒有限制,不能拆解成多行。(×)三、程序題1.使用JupyterNotebook,在CellType在Markdown模式下,模仿【財(cái)務(wù)應(yīng)用與實(shí)踐】節(jié)的課程內(nèi)容,編輯輸入適當(dāng)?shù)母袷轿谋荆⒌玫饺鐖D1-10所示的運(yùn)行結(jié)果。圖1-10Markdown代碼運(yùn)行結(jié)果2.使用JupyterNotebook,在CellType在Code模式下,編寫(程序題1)“永續(xù)年金現(xiàn)值”代碼并運(yùn)行,得到運(yùn)行的結(jié)果輸出:現(xiàn)值——20000000。并嘗試下載該P(yáng)ython代碼為.py文件,并在提示符下運(yùn)行。第2章一、選擇題Python中的非法標(biāo)識(shí)為(D)。ABCABC_aBc01abcPython語句中表達(dá)式“10+10.0+5//3+True”的值為(B)。2022.0_20.0錯(cuò)誤Python語句中,如果字符串內(nèi)部既包含'又包含",需要借助(C)。分隔符|占位符%轉(zhuǎn)義字符\沒有辦法Python語句中,字符串中含有\(zhòng)\表示的字符是(D)?;剀囍票矸麚Q行\(zhòng)Python數(shù)據(jù)類型中,(C)是可變序列。tuplestrlistbytes以下關(guān)于列表操作的描述,錯(cuò)誤的是(C)。append()方法可以向列表添加元素extend()方法可以將另一個(gè)列表中的元素逐一添加到列表add()方法可以向列表添加元素insert(index,object)方法在指定位置index前插入objectPython中,有多種可以直接作用于for循環(huán)的數(shù)據(jù)類型,但是不包括(C)。liststrfloatdict以下關(guān)于循環(huán)控制語句描述錯(cuò)誤的是(C)。循環(huán)可以嵌套使用for語句可以在任意序列上進(jìn)行迭代訪問ifelif結(jié)構(gòu)中必須包含else子句if語句可以嵌套以下關(guān)于字典操作的描述中,錯(cuò)誤的是(D)。del()用于刪除字典或者元素clear()用于清空字典中的數(shù)據(jù)len()方法可以計(jì)算字典中鍵值對(duì)的個(gè)數(shù)keys()方法可以獲取字典的值視圖以下關(guān)于循環(huán)結(jié)構(gòu)的描述,錯(cuò)誤的是(B)。使用range()函數(shù)可以指定for循環(huán)的次數(shù)使用int在for循環(huán)結(jié)構(gòu)中可以指定循環(huán)次數(shù)foriinrange(5)表示循環(huán)5次,i的值是從0到4用字符串做循環(huán)結(jié)構(gòu)的時(shí)候,循環(huán)的次數(shù)是字符串的長(zhǎng)度二、判斷題數(shù)學(xué)上理解x=x+5那無論如何是不成立的,在python程序中可以這樣使用,是賦值語句。(√)Python中變量名不區(qū)分英文大小寫。(×)Python中變量名必須是大小寫英文、數(shù)字和_的組合,且不能用數(shù)字開頭。(√)Python中數(shù)據(jù)類型tuple是可變序列。(×)Python流程控制子句表達(dá)式只能是邏輯表達(dá)式。(×)三、程序題1.企業(yè)劃分為大型、中型、小型、微型4種類型,工業(yè)行業(yè)劃型標(biāo)準(zhǔn)為:從業(yè)人員1000人以下或營(yíng)業(yè)收入40000萬元以下的為中小微型企業(yè),否則為大型企業(yè)。其中,企業(yè)從業(yè)人員300人及以上,且營(yíng)業(yè)收入2000萬元及以上的為中型企業(yè);從業(yè)人員20人及以上,且營(yíng)業(yè)收入300萬元及以上的為小型企業(yè);從業(yè)人員20人以下或營(yíng)業(yè)收入300萬元以下的為微型企業(yè)。(1)有企業(yè)A,30人年?duì)I業(yè)收入500萬元。請(qǐng)編寫程序,判斷該企業(yè)的類型。(2)請(qǐng)編寫程序,該企業(yè)每年?duì)I業(yè)收入和每年招聘人數(shù)增長(zhǎng)率為10%,判斷10年后是何種類型企業(yè)。2.假設(shè)某地區(qū)個(gè)人所得稅計(jì)算依據(jù)為表2-8。表2-8個(gè)人所得稅稅率表(綜合所得適用)級(jí)數(shù)全年應(yīng)納稅所得額稅率(%)1不超過36000元的32超過36000元至144000元的部分103超過144000元至300000元的部分204超過300000元至420000元的部分255超過420000元至660000元的部分306超過660000元至960000元的部分357超過960000元的部分45不考慮其他因素,給定個(gè)人年綜合所得,請(qǐng)編寫程序計(jì)算個(gè)人所得稅。第3章一、選擇題下面有關(guān)Python面向?qū)ο蟮乃枷?,不正確的是(C)。常用的代碼塊打包成一個(gè)函數(shù)是語句層面的封裝容器類數(shù)據(jù)類型是數(shù)據(jù)層面的封裝把所有的代碼寫在一個(gè)主程序中是程序封裝描述事物特征的數(shù)據(jù)和代碼塊是類封裝下面關(guān)于Python類操作中,不正確的是(D)??梢栽L問或修改實(shí)例變量,甚至可以添加或者刪除調(diào)用類實(shí)例對(duì)象的方法,也可給類對(duì)象動(dòng)態(tài)添加方法構(gòu)造函數(shù)用于創(chuàng)建實(shí)例對(duì)象時(shí)使用,也可以沒有構(gòu)造函數(shù)創(chuàng)建類的實(shí)例對(duì)象時(shí),Python解釋器不會(huì)自動(dòng)調(diào)用構(gòu)造函數(shù)Python類體中,用@staticmethod修飾的方法為(C)。類方法實(shí)例方法靜態(tài)方法動(dòng)態(tài)方法面向?qū)ο蟪绦蛟O(shè)計(jì)中有3個(gè)重要特性,不包括(C)。封裝繼承靜態(tài)多態(tài)從根文件夾開始,描述一個(gè)文件為(C)。當(dāng)前路徑相對(duì)路徑絕對(duì)路徑復(fù)雜路徑Python語句“foo=(lambdax,y:x>y)(3,5)”的運(yùn)行結(jié)果foo的值為(C)。trueTrueFalsefalseabs函數(shù)實(shí)際上是定義在(C)中的,不需要用戶手動(dòng)引用。pandas模塊os模塊builtins模塊import模塊Python程序當(dāng)在主模塊運(yùn)行時(shí),__name__的值為(D)?!癬_file__”“__class__”“__module__”“__main__”當(dāng)代碼不符合Python語法規(guī)則時(shí),解釋器在解析時(shí)就會(huì)報(bào)出(C)。AssertionErrorIndexErrorSyntaxErrorKeyError(A)可以看作是對(duì)try模式的簡(jiǎn)化,其用于對(duì)軟件系統(tǒng)中的資源進(jìn)行管理。with子句for子句if子句while子句二、判斷題Python類體中,以“變量名=變量值”方式定義的變量,為實(shí)例屬性。(×)open()函數(shù)支持的文件打開模式,r只讀模式打開文件,讀文件內(nèi)容的指針會(huì)放在文件的結(jié)尾。(×)builtins是Python中的一個(gè)模塊。該模塊提供對(duì)Python的所有內(nèi)置標(biāo)識(shí)符的直接訪問,不需要用戶手動(dòng)引用。(√)Python中,map()和reduce()函數(shù)不是高階函數(shù)。(×)Python中,return語句在同一函數(shù)中不可以出現(xiàn)多次。(×)語法錯(cuò)誤是解析代碼時(shí)出現(xiàn)的錯(cuò)誤。(√)當(dāng)代碼不符合Python語法規(guī)則時(shí),解釋器在解析時(shí)就會(huì)報(bào)出TypeError。(×)在Python中,把運(yùn)行時(shí)產(chǎn)生錯(cuò)誤的情況叫作異常(Exceptions)。(√)在Python中有一些異常,是程序正常運(yùn)行的結(jié)果,比如用raise手動(dòng)引發(fā)的異常。(√)在Python中try子句可以看作是對(duì)with模式的簡(jiǎn)化。(×)三、程序題1.請(qǐng)判斷如下代碼段的運(yùn)行結(jié)果,然后鍵入代碼,并執(zhí)行。(1)input()函數(shù)憑證號(hào)=input("憑證號(hào):")or'20230528'#輸入回車print(憑證號(hào))(2)用.strip()去除字符串兩端的空白科目名稱=input("科目名稱:").strip("")#輸入若干空格“材料采購”print(科目名稱)(3)用.split()解包input接收的多個(gè)輸入科目代碼=input("科目代碼:").split(",")#輸入“1401,2221,100202”print(科目代碼)(4)簡(jiǎn)單的交互response=input("保存記賬憑證(Y/確認(rèn)):\n")#輸入yifresponse.upper()=="Y":print("已保存記賬憑證……")else:print("已取消……")(5)print輸出多個(gè)變量或值記賬憑證={'憑證號(hào)':'230052','制單日期':'2023年5月28日'}print(f"憑證號(hào):{記賬憑證['憑證號(hào)']}"+""*4+f"制單日期:{記賬憑證['制單日期']}")(6)end參數(shù)決定換行/不換行輸出,續(xù)(5)print(f"憑證號(hào):{記賬憑證['憑證號(hào)']:>8}",end="")print(f"制單日期:{記賬憑證['制單日期']:>12}",end="")(7)sep決定用什么間隔符來分隔多個(gè)值或變量,續(xù)(6)print(f"憑證號(hào):{記賬憑證['憑證號(hào)']}"+""*4,f"制單日期:{記賬憑證['制單日期']}",sep='|')(8)導(dǎo)入模塊和函數(shù)應(yīng)用importmathdefmove(x,y,step,angle=0):nx=round(x+step*math.cos(angle))ny=round(y+step*math.sin(angle))returnnx,nymove(0,0,1,3.14/3)2.深入了解變量的作用空間,完成以下任務(wù)。dir(obj)可以得到obj對(duì)象的成員列表,其中包括內(nèi)置命名空間的變量標(biāo)識(shí)(雙下劃線開始和結(jié)束),以及obj對(duì)象的局部命名空間的變量。請(qǐng)編寫一個(gè)函數(shù),返回去除的內(nèi)置命名空間變量的列表。3.續(xù)第2章的課后習(xí)題“三、程序題1.”,要求:(1)請(qǐng)編寫函數(shù)和主程序,輸入任意企業(yè)的人員規(guī)模和營(yíng)業(yè)收入,判斷企業(yè)規(guī)模類型。(2)結(jié)合“第二章【財(cái)務(wù)應(yīng)用與實(shí)踐】”,“工業(yè)”和“農(nóng)、林、牧、漁業(yè)”行業(yè)企業(yè)規(guī)模類型的判斷標(biāo)準(zhǔn),采用類和函數(shù)編程,給定企業(yè)規(guī)模屬性,判斷企業(yè)類型。4.續(xù)第2章的課后習(xí)題“三、程序題2.”,要求:(1)編寫一個(gè)函數(shù),打印輸出:表2-7個(gè)人所得稅稅率表;(2)編寫函數(shù)和主程序,輸入有意義年個(gè)人所得,給出應(yīng)納稅額。5.續(xù)本章【財(cái)務(wù)應(yīng)用與實(shí)踐】中的年金類程序,要求:(1)修改原有不適用的代碼,并增加定義“遞延年金“、“預(yù)付年金”(2)編寫或重寫計(jì)算現(xiàn)值和終值的實(shí)例方法;(3)編寫主程序,輸入任意年金的屬性值,可以得到其現(xiàn)值和終值。第四章一、選擇題下列代碼運(yùn)行的結(jié)果是(B)。importnumpyasnpa=np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])print(a[:,1])A. B. C. D. 續(xù)1題,print(a.shape)執(zhí)行的結(jié)果是(C)。A. (2,6) B. (4,3) C. (2,2,3) D. (3,2,2)下面代碼運(yùn)行的輸出結(jié)果是(A)。importnumpyasnpnp.arange(0.1,0.5,0.2)A.array([0.1,0.3]) B.array([0,0.3] C.array([0.1,0.5] D.array([0.3,0.5]下面代碼運(yùn)行的輸出結(jié)果是(C)。pd.DataFrame(np.array([[1,2,3],[4,5,6]]),columns=['a','b','c'])A. B. C. D. TypeerrorPandas使用Series()

函數(shù)來創(chuàng)建Series對(duì)象,當(dāng)傳遞的索引值無法找到與其對(duì)應(yīng)的值時(shí),使用(B)填充。A.None B. NaN

C. null D. 0isnull()和notnull()用于檢測(cè)Series中的缺失值。如果為值不存在或者缺失,則isnull()返回(A),則notnull()返回(A)。A. True,F(xiàn)alse B. True,True C. False,True D. False,F(xiàn)alseDataFrame表格中每列的數(shù)據(jù)類型可以不同,稱為(B)。A. 同構(gòu)數(shù)據(jù)表 B. 異構(gòu)數(shù)據(jù)表 C. 結(jié)構(gòu)化數(shù)據(jù)表 D. 非結(jié)構(gòu)化下列(D)不是DataFrame遍歷的方法。A. itertuples() B. iterrows() C. iteritems() D. itercols()在沒有指定索引時(shí),Series和DataFrame自帶行標(biāo)簽索引,這種情況為(C)。A. 01索引 B. 字符索引 C. 隱式索引 D. 顯式索引索引操作DataFrame,iloc允許接受兩個(gè)參數(shù)分別是行和列,參數(shù)之間使用“逗號(hào)”隔開,但只能接收(B)。A. 標(biāo)簽索引 B. 整數(shù)索引 C. 隱式索引 D. 顯式索引二、判斷題NumPy的廣播功能要求運(yùn)算的數(shù)組的形狀完全一致。(×)Pandas只能讀入excel數(shù)據(jù)文件,而不能讀入像.txt這樣的存文本文件。(×)DataFrame對(duì)象的索引標(biāo)簽只能是整數(shù),不能是其他數(shù)據(jù)類型。(×)DataFrame的iloc和loc是不同的屬性,前者關(guān)注數(shù)據(jù)的索引位置,后者則是索引標(biāo)簽。(√)Series可以保存任何數(shù)據(jù)類型,它的標(biāo)簽?zāi)J(rèn)為整數(shù),從1開始依次遞增。(×)DataFrame的方法isnull(),如果為值不存在或者缺失,則返回False。(×)DataFrame的方法notnull(),如果值不存在或者缺失,則返回True。(×)DataFrame是一種表格型的數(shù)據(jù)結(jié)構(gòu),既有行標(biāo)簽(index),又有列標(biāo)簽(columns)。(√)Series和DataFrame自帶行標(biāo)簽索引,稱為“顯式索引”。(×)DataFrame的loc方法允許接兩個(gè)參數(shù)分別是行和列,參數(shù)之間需要使用“冒號(hào)”隔開,但該函數(shù)只能接收標(biāo)簽索引。(×)三、程序題1.首先鍵入如下代碼,并運(yùn)行,觀察運(yùn)行結(jié)果importpandasaspdimportnumpyasnpN=10df=pd.DataFrame({'日期':pd.date_range(start='2023-01-01',periods=N,freq='D'),'序號(hào)':np.linspace(0,stop=N-1,num=N),'重量':np.random.rand(N),'等級(jí)':np.random.choice(['Low','Medium','High'],N).tolist(),'體積':np.random.normal(100,10,size=(N)).tolist()})完成以下要求:(1)查閱資料,熟悉代碼中NumPy的方法;(2)利用head(),tail(),sample(),info(),describe()等函數(shù),了解數(shù)據(jù)集;(3)提取偶數(shù)“序號(hào)”的數(shù)據(jù)集;(4)提取“重量”大于均值,并且體積小于中位數(shù)的數(shù)據(jù)集;(5)增加一列,標(biāo)簽為“產(chǎn)品質(zhì)量”,把(3)提取的樣本標(biāo)記為“不合格”,其他為合格;(6)把最終的DataFrame存儲(chǔ)為.csv文件。2.針對(duì)給定的上市公司基本信息數(shù)據(jù)集<公司基本信息.xlsx>,完成以下操作(1)讀入數(shù)據(jù),要求把第2行設(shè)為列標(biāo)題,['股票代碼','同公司B股代碼','同公司H股代碼']列設(shè)為字符類型,'股票代碼'設(shè)置為索引列。(2)初步了解數(shù)據(jù)集查看數(shù)據(jù)了解數(shù)據(jù)集各列的數(shù)據(jù)類型,是否為空值,內(nèi)存占用情況數(shù)據(jù)集各列的數(shù)據(jù)統(tǒng)計(jì)情況(最大值、最小值、標(biāo)準(zhǔn)偏差、分位數(shù)等等)(3)依據(jù)索引和位置提取數(shù)據(jù)重新設(shè)置[股票代碼]及[上市板塊]為行索引,并排序使用loc或iloc進(jìn)行數(shù)據(jù)提取,并賦值。要求上市公司分為兩類:IT企業(yè)——[主營(yíng)產(chǎn)品名稱]含有“計(jì)算機(jī)”,其他企業(yè)——[主營(yíng)產(chǎn)品名稱]不含有“計(jì)算機(jī)”,并將寫入新的列[ICT分類]。提取注冊(cè)地在遼寧省,注冊(cè)資本最大的上市公司股票代碼(4)改寫數(shù)據(jù)列[注冊(cè)資本],改成以“億元”為單位,并保留4位小數(shù)(5)根據(jù)要求提取數(shù)據(jù)文件的自己數(shù)據(jù)創(chuàng)業(yè)板的所有上市公司數(shù)據(jù)集df_c,并得到其中公司的個(gè)數(shù)根據(jù)得到的df_c,取得所有東三省的上市公司df_ne把的數(shù)據(jù)集df_ne,提取['股票代碼','公司簡(jiǎn)稱','首發(fā)上市日期','摘牌日期','注冊(cè)資本','所在省份']列,并存儲(chǔ)為xlsx文件,文件名為<東北地區(qū)創(chuàng)業(yè)板.xlsx>。操作數(shù)據(jù)集df_ne,按首發(fā)上市時(shí)間排序索引,得出東北地區(qū)每年上市的公司個(gè)數(shù)。第5章一、選擇題對(duì)DataFrame操作,下列方法中(C)是聚合方法。A. head() B. iloc() C. mean() D. reindex()在DataFrame中,使用聚合類方法時(shí)需要指定軸(axis)參數(shù),(B)表示按垂直方向進(jìn)行計(jì)算。A. axis=1 B. axis=0 C. axis='columns' D. axis=None3-7題依據(jù)如下代碼的數(shù)據(jù)幀df回答。importPandasaspdimportnumpyasnpdata=[1,2,10,15,19,27]name=np.arange(6)columns=['col1']df=pd.DataFrame(data=data,index=name,columns=columns)gb=df.groupby(df['col1']//10)gb.ngroups上述代碼的輸出值為(B)。A. 2 B. 3 C. 4 D. 5gb.sum().iloc[2].col1上述代碼的輸出值為(D)。A. 3 B. 36 C. 11 D. 27gb.mean().iloc[2].col1上述代碼的輸出值為(D)。A. 3.0 B. 36.0 C. 11.0 D. 27.0gb.transform(lambdax:x-x.mean()).iloc[1].col1上述代碼的輸出值為(A)。A. 0.5 B. -0.5 C. 1.0 D. -1.0gb.apply(lambdax:x.max()-x.min()).iloc[0].col1上述代碼的輸出值為(C)。A. 0 B. -1 C. 1 D. 2通過給(D)函數(shù)傳遞一個(gè)自定義函數(shù)和適當(dāng)數(shù)量的參數(shù)值,把所有的DataFrme中元素作為整體操作對(duì)象。A. mean() B. applymap() C. apply() D. pipe()通過給(C)函數(shù)傳遞一個(gè)自定義函數(shù)和適當(dāng)數(shù)量的參數(shù)值,把DataFrme某一行或者某一列作為操作對(duì)象。A. mean() B. applymap() C. apply() D. pipe()DataFrame數(shù)據(jù)表結(jié)構(gòu)的(B)方法,他們都可以接受一個(gè)Python函數(shù),并返回相應(yīng)的值。針對(duì)每個(gè)要素操作。A. mean() B. applymap() C. apply() D. pipe()二、判斷題Pandasjoin()函數(shù)具有l(wèi)eft,right,outer,inner連接方式,默認(rèn)為left連接。(√)groupby()是DataFrame方法,不適用Series。(×)GroupBy對(duì)象可以用于迭代。(√)在Pandas中的關(guān)系型連接函數(shù)merge()和join()中提供了on參數(shù)來代表連接方式。(×)Pandas能夠?qū)崿F(xiàn)SQL關(guān)系型數(shù)據(jù)庫的操作。(√)三、程序題1.簡(jiǎn)單數(shù)據(jù)處理根據(jù)給定的數(shù)據(jù),完成操作任務(wù)。數(shù)據(jù)集生成代碼如下。[in] importPandasaspddata=[[5,6,1000],[15,5,1000]]name=['債券2301','債券2305']columns=['期數(shù)','利率','面值']df=pd.DataFrame(data=data,index=name,columns=columns)display(df)[out]完成如下任務(wù):(1)用loc屬性或insert函數(shù)增加一個(gè)[數(shù)量]列,值為[100000,1000000];(2)在df中增加一行數(shù)據(jù),“債券2302”,值為[5,8,1000,1000000];(3)修改行標(biāo)題,“債券2302”改為“債券2300”;(4)“債券2305”的[面值]修改為1100;(5)刪除[面值]為80或90的行。2.數(shù)據(jù)清洗根據(jù)給定的數(shù)據(jù),完成數(shù)據(jù)清洗任務(wù)。數(shù)據(jù)集引入代碼如下。df_raw=pd.read_excel('..\data\ch5\習(xí)題\行業(yè)分類.xlsx',\dtype={'大類':str})完成如下任務(wù):(1)使用數(shù)據(jù)清洗操作,將df_raw轉(zhuǎn)化為行業(yè)門類表(參考<..\data\ch5\習(xí)題\行業(yè)門類.xlsx>(2)使用數(shù)據(jù)清洗操作,將df_raw轉(zhuǎn)化為行業(yè)大類表(參考<..\data\ch5\習(xí)題\行業(yè)大類.xlsx>)3.數(shù)據(jù)處理根據(jù)給定的數(shù)據(jù)集,完成數(shù)據(jù)處理任務(wù)。在資源文件夾<data\ch5\習(xí)題\>中查閱如下文件。完成如下任務(wù):(1)對(duì)“公司基本信息”數(shù)據(jù)集按行業(yè)大類分組,并得到注冊(cè)資本均值前5個(gè)行業(yè)的注冊(cè)資本的均值、最大值,公司個(gè)數(shù)。(2)對(duì)“利潤(rùn)表_T”,“資產(chǎn)負(fù)債表_T”2個(gè)表進(jìn)行處理,使它們添加[公司簡(jiǎn)稱]和[行業(yè)大類]列數(shù)據(jù)。(3)“利潤(rùn)表_T”和“資產(chǎn)負(fù)債表_T”進(jìn)行連接,得到有2個(gè)表都有的數(shù)據(jù)集,并存為<資產(chǎn)負(fù)債_利潤(rùn).xlsx>。

第6章一、選擇題以下關(guān)于使用Matplotlib繪圖流程的說法錯(cuò)誤的是(D)。簡(jiǎn)單單個(gè)圖形,無需手動(dòng)創(chuàng)建畫布數(shù)據(jù)準(zhǔn)備是繪圖的基礎(chǔ)標(biāo)簽設(shè)置與繪制圖形沒有先后添加圖例可在繪制圖形之前以下有關(guān)數(shù)據(jù)量化分類的說法錯(cuò)誤的是(B)。定類尺度的主要數(shù)學(xué)特征是“=”或“≠”順序尺度不能用表示類別量定距尺度是比順序尺度高一層次的計(jì)量尺度定比尺度的主要數(shù)學(xué)特征是“÷”或“×”以下關(guān)于使用Matplotlib繪圖的說法錯(cuò)誤的是(C)。繪圖無法正確顯示中文在同一子圖繪圖一定會(huì)刪除覆蓋原圖形一個(gè)畫布只能創(chuàng)建一個(gè)子圖Matplotlib繪圖可以存儲(chǔ)為不同格式的圖形文件obj.plot或plt.plot()的函數(shù)中kind參數(shù)表示的是(B)。A. 垂直柱狀圖 B.繪圖類型 C. 不存在 D.None繪制直方圖,plt.plot()的函數(shù)的kind參數(shù)應(yīng)該賦值(C)。A. ‘kde’ B.‘bar’ C. ‘hist D.‘pie’下列代碼中繪制散點(diǎn)圖的是(B)。A. plt.plot() B.plt.scatter() C.plt.legend() D.plt.box()下列字符串是表示plot線條的顏色-紅色、形狀-五角星點(diǎn)、線形-短虛線的是(A)。A. 'r*-' B.'go-' C. 'r*+' D.'bs-'下列說法正確的是(D)。餅圖中的數(shù)值表示樣本的數(shù)量關(guān)系散點(diǎn)圖的x軸刻度一定是數(shù)值箱線圖的異常值數(shù)量是不能調(diào)整的折線圖可以用作查看特征間的趨勢(shì)關(guān)系下列代碼執(zhí)行結(jié)果是(A)。importmatplotlib.pyplotaspltimportpandasaspddf=DataFrame([[20,60,178],[50,20,165],[45,67,167]],index=[1,2,3],columns=['age','weight','height'])df.plot(kind='bar')plt.show()A. B. C. D.基于如下代碼的說法,正確的是(C)。importmatplotlib.pyplotaspltfig=plt.figure()ax=plt.axes()A. ax是畫布對(duì)象 B.fig是子圖對(duì)象 C. axes是子圖構(gòu)造函數(shù) D.figure是子圖類二、判斷題無序類別數(shù)據(jù)僅表示不同類別,而不表示其他之間量的順序或量的大小。(√)定距尺度的主要數(shù)學(xué)特征是“÷”或“×”。(×)obj.plot或plt.plot()的函數(shù)體參數(shù)完全一致。(×)plt.plot()默認(rèn)繪制折線圖(line)。(√)Series對(duì)象plot()方法中參數(shù)use_index默認(rèn)為True,用索引作為x軸刻度。(√)上市公司的上市年份是分類數(shù)據(jù),也是順序數(shù)據(jù),也是定距數(shù)據(jù),而不是比例數(shù)據(jù)。(√)plt.xlabel()和plt.ylabel()用于設(shè)置子圖x、y軸標(biāo)題。(√)在同一幅圖形中繪制多根線條,不能采用多次調(diào)用plot函數(shù)。(×)plt.show()會(huì)釋放圖形對(duì)象資源,如果在顯示圖像之前保存圖片將只能保存空?qǐng)D片。(×)1個(gè)畫布figure可以有若干子圖axes,1個(gè)子圖一般有2個(gè)數(shù)軸axis。(√)三、程序題1.利用DataFrame繪圖(1)data是某城市生產(chǎn)總值r=[0.83,0.92,1.12,1.23,1.21,1.52,2.24,2.52,2.54]#總收入(百萬)data=pd.DataFrame({'總收入:百萬':r},index=['2014','2015','2016','2017','2018','2019','2020','2021','2022'])請(qǐng)分別采用plt、sns和DataFrameAPI,繪制該數(shù)據(jù)的line/bar/hist/box圖。(2)給(1)的數(shù)據(jù)增加兩個(gè)列。data['投資收益占比']=[0.1,0.15,0.20,0.14,0.25,0.23,0.3,0.32,0.35]data['ESG評(píng)級(jí)']=['合格','良','良','良','優(yōu)','良','優(yōu)','良','優(yōu)']請(qǐng)分別采用plt、sns和DataFrameAPI,分別繪制該數(shù)據(jù)多組數(shù)據(jù)的line/bar/hist/box圖。并再將這些圖集成為1張圖。(3)精細(xì)繪圖。請(qǐng)給根據(jù)(2)的數(shù)據(jù)data,繪制畫布大小為8×6,樣式如圖6-4所示的圖形。圖6-4data精細(xì)繪圖樣本2.數(shù)據(jù)集可視化讀入資源包<..\data\ch6\固定資產(chǎn).csv>數(shù)據(jù)集(1)對(duì)該數(shù)據(jù)集進(jìn)行清洗,得到上市公司年報(bào)固定資產(chǎn)數(shù)據(jù),并填充缺失數(shù)據(jù)集。得到新的數(shù)據(jù)集。(2)對(duì)(1)得到的數(shù)據(jù)集進(jìn)行可視化,要求:固定資產(chǎn)賬面原值的各個(gè)類別的箱線圖固定資產(chǎn)賬面原值,固定資產(chǎn)賬面價(jià)值的總計(jì)散點(diǎn)圖篩選出“平安銀行”的固定資產(chǎn)數(shù)據(jù),畫一張圖展示該公司的固定資產(chǎn)的變化,以及各個(gè)類別之間的關(guān)系第7章一、選擇題下列不是Pandas數(shù)據(jù)的是(D)A.objectB.datetime64C.categoryD.list下列關(guān)于Pandas數(shù)據(jù)的說法不正確的是(D)。object可以轉(zhuǎn)化為stringdtypes屬性為序列或數(shù)據(jù)幀的數(shù)據(jù)類型astype方法可以改變序列的數(shù)據(jù)類型object和string是同一種數(shù)據(jù)類型下列代碼的執(zhí)行結(jié)果是(C)。s=pd.Series([100,88,999])s.astype('string').str[1][1]A.’0’B.’9’C.’8’D.’1’下列有關(guān)字符串的說法正確的是(D)。chr()能夠把任意整數(shù)解釋成字符decode()方法能把任意編碼轉(zhuǎn)化為字符串Python默認(rèn)的字符編碼為GBKencode()方法能夠把任意字符串轉(zhuǎn)化為對(duì)應(yīng)的編碼re.findall('[^ac]','abc')的執(zhí)行結(jié)果是(B)。A.['^a']B.['b']C.['^ab']D.['a']下列有關(guān)str對(duì)象的說法錯(cuò)誤的是(B)。str屬性定義在Index或Seriesstr對(duì)象方法和str的方法完全一致object或string數(shù)據(jù)類型都有str屬性str對(duì)象方法有時(shí)返回一個(gè)DataFrame下列代碼的執(zhí)行結(jié)果是(C)re.findall(r'大連市(.{2,3}區(qū))(.{2,3}[街|路])(\d+號(hào))','大連市沙河口區(qū)尖山街217號(hào)')[('沙河口','尖山','217')][('區(qū)','街','號(hào)')][('沙河口區(qū)','尖山街','217號(hào)')][('大連市沙河口區(qū)','尖山街','217號(hào)')]下列代碼的執(zhí)行結(jié)果是(C)。my_index=pd.Index(['abc','abc','abc'])my_index.str.rstrip().str.len()Int64Index([3,3,5],dtype='int64')Int64Index([4,3,3],dtype='int64')Int64Index([4,3,4],dtype='int64')Int64Index([5,3,4],dtype='int64')下列代碼的執(zhí)行結(jié)果是(C)。s=pd.Series(['D','U','F','E'])s.str.pad(7,'both','*')[2]'***D***''***U***''***F***''***E***'pd.to_numeric方法能夠?qū)ψ址袷降臄?shù)值進(jìn)行快速轉(zhuǎn)換和篩選,其中不是參數(shù)errors選項(xiàng)的是(A)。'downcast''raise''coerce''ignore'二、判斷題Pandas有一種類別數(shù)據(jù)類型category,用于對(duì)分類值進(jìn)行編碼。(√)正則表達(dá)式是由普通字符和元字符組成的文字模式。(√)普通字符都是可打印字符。(×)在正則表達(dá)式中特殊字符稱為轉(zhuǎn)義字符。(×)正則表達(dá)式中匹配前面的子表達(dá)式零次或一次,使用元字符*或{0,1}。(×)正則表達(dá)式語法中"貪婪"搜索,指的是盡可能快速地搜索最短的匹配文字。(×)轉(zhuǎn)義字符集與正則表達(dá)式的簡(jiǎn)寫字符集等價(jià)。(×)flags參數(shù)是用來指定正則表達(dá)式操作的額外選項(xiàng)。(√)re的拆分和查找操作只能從左到右,不支持從右到左。(×)re只能處理一行文本數(shù)據(jù),多行處理需要借助其他工具。(×)三、程序題1.正則表達(dá)式(1)pile()函數(shù)的用法,代碼如下。[in] importrepattern=pile(r'\d+')result=pattern.findall('中國(guó)999,創(chuàng)新777')print(result)[out]['999','777']請(qǐng)學(xué)習(xí)pile語法,效仿以上代碼,查閱資料,了解中國(guó)資本市場(chǎng)上市公司股票代碼的編碼規(guī)則。請(qǐng)編寫pattern在多行文本中,匹配上市公司股票代碼。并將結(jié)果分別命名為:深市主板,深市中小板,上市主板,上市科創(chuàng)板2.str對(duì)象df為數(shù)據(jù)幀,代碼如下。[in] df=pd.DataFrame([['機(jī)器設(shè)備(5)','1280萬','120萬'],['房屋及建筑物(3)','8.89億','2億'],['交通工具(12)','99萬','2萬']],columns=['固定資產(chǎn)(數(shù)量)','原值','累計(jì)折舊'])請(qǐng)根據(jù)要求做如下操作:(1)將[固定資產(chǎn)(數(shù)量)]列中的[數(shù)量]改為獨(dú)立列存儲(chǔ)。(2)編寫函數(shù),將[原值],[累計(jì)折舊]兩列轉(zhuǎn)化為數(shù)字列。文本數(shù)據(jù)處理綜合讀取數(shù)據(jù)資源包文件<公司基本信息_習(xí)題.csv>,代碼如下。[in] df=pd.read_csv('..\data\ch7\公司基本信息_習(xí)題.csv',encoding='gbk')display(df.sample(5))[out]請(qǐng)根據(jù)要求做如下操作:(1)考察上市公司注冊(cè)地址,與辦公地址是否一致。并用適當(dāng)圖形展示。(2)對(duì)[注冊(cè)地址]與[辦公地址]不一致的上市公司進(jìn)行文本分析。根據(jù)結(jié)果創(chuàng)建一個(gè)新的數(shù)據(jù)集,對(duì)公司地址不一致的上市公司進(jìn)行分類,如雙總部,異省搬遷,省搬遷等。并用適當(dāng)圖形展示。第8章一、選擇題DatetimeIndex是由(B)對(duì)象組成的序列。A. datetime64[ns] B.Timestamp C. Datetimes D.timeIndex下列代碼的執(zhí)行結(jié)果是(C)。s=pd.Series({'日期':'10-Feb-23'})s=pd.to_datetime(s)print(s.dt.month)A. 日期10-2-23 B.日期Feb C. 日期2 D.錯(cuò)誤通過date_range()方法可以創(chuàng)建某段連續(xù)的時(shí)間或者固定間隔的時(shí)間段,(C)不是該函數(shù)的參數(shù)。A. start B.end C. period D.freq下列代碼的執(zhí)行結(jié)果是(B)。s=pd.Series(['2020-02-1402:14:00'])s=pd.to_datetime(s)print(s.dt.day.values)A. 02-14 B.[14] C.14 D.錯(cuò)誤可以將整型或浮點(diǎn)型表示的時(shí)間轉(zhuǎn)換為時(shí)間戳,時(shí)間戳單位默認(rèn)是(C)。A. 毫秒 B.秒 C.納秒 D.微秒Pandas(D)方法,將標(biāo)量、數(shù)組、列表或Series轉(zhuǎn)換為Timedelta類型。A. to_datetime B.DatetimeIndex C.TimedeltaIndex D.to_timedelta下列代碼的執(zhí)行結(jié)果是(A)。index=pd.date_range('20220201','20220215')data=[3,3,6,4,2,20,3,8,9,10,12,15,13,22,14]s_data=pd.Series(data,index=index)print(s_data.rolling(3).mean()[2])A. 4.0 B.6.0 C3. D.4.33pd.to_datetime()函數(shù)能夠智能將常見日期格式轉(zhuǎn)換,'2023/10/1'轉(zhuǎn)換為(A)。A. ['2023-10-01'] B.['2023-01-10'] C.['2023/01/10'] D.['下列有關(guān)dt對(duì)象的索引和切片說法正確的是(D)。A.dt對(duì)象的索引和切片與list相同B.時(shí)間序列分析過程中,一般不把時(shí)間戳序列作為索引使用C.DatetimeIndex數(shù)據(jù)類型精確到分鐘D.dt對(duì)象切片操作的引用可以不在索引序列之中下列代碼的執(zhí)行結(jié)果是(D)。index=pd.date_range('20230501','20230515')data=[3,6,4,5,2,1,3,9,9,10,12,15,13,22,14]s_data=pd.Series(data,index=index)print(s_data.rolling(3,min_periods=1).mean()[1])A. 3.0 B.6.0 C.4.0 D.4.5二、程序題1.resample()方法(1)重采樣resample()方法,可以把時(shí)間序列數(shù)據(jù)集從一個(gè)時(shí)間頻率f1轉(zhuǎn)換為另一個(gè)時(shí)間頻率f2,分為降采樣和升采樣。閱讀執(zhí)行以下代碼,理解降采樣的意義。index

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論