版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、項(xiàng)目一 財(cái)務(wù)大數(shù)據(jù)認(rèn)知一、單選題1. 下列哪個(gè)選項(xiàng)不屬于大數(shù)據(jù)的特點(diǎn)(B)A. 海量化的數(shù)據(jù) B. 大數(shù)據(jù)都是有價(jià)值的數(shù)據(jù)C. 數(shù)據(jù)類型的多樣化 D. 大數(shù)據(jù)的價(jià)值密度相對(duì)較低2. 關(guān)于大數(shù)據(jù)思維下列哪個(gè)描述是錯(cuò)誤的(D)A. 大數(shù)據(jù)時(shí)代的思維方式從樣本思維轉(zhuǎn)向總體思維 B. 大數(shù)據(jù)思維要從精確性轉(zhuǎn)向模糊性C. 大數(shù)據(jù)思維要從因果關(guān)系轉(zhuǎn)向相關(guān)關(guān)系 D. 大數(shù)據(jù)時(shí)代,所有數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù)3. 關(guān)于財(cái)務(wù)大數(shù)據(jù),下列哪個(gè)說法是錯(cuò)誤的(D)A. 大數(shù)據(jù)時(shí)代,大量的財(cái)報(bào)報(bào)表數(shù)據(jù)由程序自動(dòng)處理,工作效率大大提升 B. 大數(shù)據(jù)時(shí)代,財(cái)務(wù)共享中心是未來的趨勢(shì)C. 大數(shù)據(jù)能夠使財(cái)務(wù)人員更精準(zhǔn)地制定預(yù)算管理,為
2、領(lǐng)導(dǎo)層提供決策依據(jù)D. 大數(shù)據(jù)時(shí)代,財(cái)會(huì)人員只關(guān)注自己企業(yè)的內(nèi)部數(shù)據(jù)即可,不需關(guān)注行業(yè)數(shù)據(jù)4. 下列哪個(gè)選項(xiàng)不屬于大數(shù)據(jù)處理的環(huán)節(jié)(A)A. 數(shù)據(jù)模型 B. 數(shù)據(jù)預(yù)處理C. 數(shù)據(jù)分析 D. 數(shù)據(jù)可視化5. 下列哪個(gè)選項(xiàng)可以作為大數(shù)據(jù)處理工具(B)A. Google B. PythonC. Baidu D. Windows二、簡(jiǎn)答題1大數(shù)據(jù)的4個(gè)V特征分別是什么?請(qǐng)舉例說明和解釋。大數(shù)據(jù)具有Volume、Variety、Velocity、Value四個(gè)特點(diǎn),簡(jiǎn)稱為“4V”。(1)Volume:Volume是指海量化的數(shù)據(jù)。無(wú)論是采集數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)還是數(shù)據(jù)計(jì)算,其量都非常大。2020年全球估計(jì)有3
3、5ZB的數(shù)據(jù)量。BAT巨頭百度、阿里和騰訊,他們各自擁有的數(shù)據(jù)量也已接近EB級(jí)。(2)Variety:Variety指的是數(shù)據(jù)類型的多樣化。根據(jù)數(shù)據(jù)的特點(diǎn)把大數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)兩種。結(jié)構(gòu)化數(shù)據(jù)是具有統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)和規(guī)范的數(shù)據(jù)訪問和處理方法的數(shù)據(jù),企業(yè)銷售系統(tǒng)數(shù)據(jù)、客戶關(guān)系管理數(shù)據(jù)、庫(kù)存數(shù)據(jù)、訂單數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等都是結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)多存放在關(guān)系型數(shù)據(jù)庫(kù)中。非結(jié)構(gòu)化數(shù)據(jù)是指不能采用預(yù)先定義好的數(shù)據(jù)模型或者沒有以一個(gè)預(yù)先定義的方式來組織的數(shù)據(jù),常見的非結(jié)構(gòu)化數(shù)據(jù)有辦公文檔、郵件、各類報(bào)表、圖像、音頻、視頻信息等。半結(jié)構(gòu)化數(shù)據(jù)是介于結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),互聯(lián)
4、網(wǎng)中的XML文件、HTML文件就屬于半結(jié)構(gòu)化數(shù)據(jù)。(3)Velocity:Velocity是指大數(shù)據(jù)的時(shí)效性。大數(shù)據(jù)的時(shí)效性包含兩個(gè)層面:數(shù)據(jù)生成速度高和數(shù)據(jù)處理速度高。比如搜索引擎要求幾分鐘前的新聞能夠被用戶查詢到,個(gè)性化推薦引擎盡可能要求實(shí)時(shí)完成推薦。時(shí)效性是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)的顯著特征。(4)Value:Value是指大數(shù)據(jù)的價(jià)值密度。與結(jié)構(gòu)化數(shù)據(jù)相比,大數(shù)據(jù)的價(jià)值密度相對(duì)較低,但基于大數(shù)據(jù)得到的分析結(jié)果,其商業(yè)價(jià)值卻很高。2. 列舉大數(shù)據(jù)的數(shù)據(jù)來源和類型有哪些?大數(shù)據(jù)的數(shù)據(jù)來源主要有三個(gè)方面。第一,全球約有40億人接入了互聯(lián)網(wǎng),每個(gè)人都是信息的接收者和產(chǎn)生者,每個(gè)人都是數(shù)據(jù)源;第二,
5、全球大約有1000億個(gè)傳感器,這些傳感器24小時(shí)不停地產(chǎn)生數(shù)據(jù)。第三,人類活動(dòng)的進(jìn)一步擴(kuò)展使數(shù)據(jù)規(guī)模急劇膨脹,數(shù)據(jù)類型越來越多,數(shù)據(jù)結(jié)構(gòu)越來越復(fù)雜。根據(jù)數(shù)據(jù)的特點(diǎn)把大數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)兩種。根據(jù)大數(shù)據(jù)的數(shù)據(jù)類型把大數(shù)據(jù)分為數(shù)字、文本、圖像、音頻、視頻、地理位置信息、網(wǎng)絡(luò)日志等。3列舉當(dāng)前大數(shù)據(jù)的應(yīng)用場(chǎng)景;思考將來還可應(yīng)用在哪些方面?當(dāng)前大數(shù)據(jù)的應(yīng)用場(chǎng)景:(1)大數(shù)據(jù)+民生;(2)大數(shù)據(jù)+交通;(3)大數(shù)據(jù)+金融;(4)大數(shù)據(jù)+安全,等等。將來還可應(yīng)用在哪些方面:答案略。4. 列舉哪些數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)?哪些是非結(jié)構(gòu)化數(shù)據(jù)?存放在關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù),包括企
6、業(yè)銷售系統(tǒng)數(shù)據(jù)、客戶關(guān)系管理數(shù)據(jù)、庫(kù)存數(shù)據(jù)、訂單數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等。常見的非結(jié)構(gòu)化數(shù)據(jù)有辦公文檔、郵件、各類報(bào)表、圖像、音頻、視頻信息等,對(duì)于計(jì)算機(jī)而言,這些非結(jié)構(gòu)化信息很難理解,無(wú)論是存儲(chǔ)、查詢還是利用都需要更加智能化的信息技術(shù)。5. 談?wù)勀銓?duì)財(cái)務(wù)大數(shù)據(jù)的理解。略。6. 數(shù)據(jù)分析的目的是什么?數(shù)據(jù)分析是采用適當(dāng)?shù)姆椒▽?duì)收集來的大量看似雜亂無(wú)章的數(shù)據(jù)進(jìn)行理解、分析和匯總,提煉數(shù)據(jù)的內(nèi)在規(guī)律,以最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程,基于大數(shù)據(jù)的分析活動(dòng)主要挑戰(zhàn)的不是大數(shù)據(jù)分析的技術(shù),而是基于對(duì)行業(yè)的深入了解和對(duì)業(yè)務(wù)的精準(zhǔn)把
7、控,只有明確問題分析的方向才有可能準(zhǔn)確地實(shí)現(xiàn)分析的目標(biāo)。7. 簡(jiǎn)述數(shù)據(jù)分析的基本過程數(shù)據(jù)分析包括了狹義數(shù)據(jù)分析和數(shù)據(jù)挖掘。狹義數(shù)據(jù)分析的基本過程是:根據(jù)事先確定的分析目標(biāo),選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法或工具,對(duì)收集來的大量數(shù)據(jù)進(jìn)行處理與分析,從中提取有價(jià)值的信息,形成分析結(jié)論。分析結(jié)果可以輔助企業(yè)進(jìn)行管理優(yōu)化、預(yù)測(cè)和決策。數(shù)據(jù)挖掘的基本過程是:采用適當(dāng)?shù)耐诰蛩惴ɑ蚬ぞ?,?duì)收集來的海量數(shù)據(jù)進(jìn)行挖掘,從中發(fā)現(xiàn)不為人知、無(wú)法通過人的經(jīng)驗(yàn)或?qū)?shù)據(jù)的直觀觀察得出的規(guī)則或結(jié)論。挖掘出的規(guī)則或結(jié)論可以用于預(yù)測(cè)和決策。8. Python作為大數(shù)據(jù)處理工具的優(yōu)勢(shì)有哪些?首先,對(duì)于初學(xué)者來說,Python非常易學(xué)易用,
8、它的語(yǔ)法結(jié)構(gòu)簡(jiǎn)單,通俗易懂,同時(shí)借助各種第三方庫(kù),Python能實(shí)現(xiàn)無(wú)所不能的數(shù)據(jù)管理和分析任務(wù)。其次,大量復(fù)雜操作的任務(wù),在Python中只需要短短幾行代碼就能輕松解決,特別是當(dāng)數(shù)據(jù)分析任務(wù)重復(fù)度很高的時(shí)候,只要略微改動(dòng)代碼即可完成任務(wù),大大節(jié)省了時(shí)間,提高了效率。再次,Python處理數(shù)據(jù)的體量很大。最后,Python有強(qiáng)大的繪圖功能,可以自動(dòng)生成可視化圖形,再?gòu)?fù)雜的繪圖過程都可以一次性完成,數(shù)據(jù)結(jié)果還非常清晰直觀。項(xiàng)目二 Python環(huán)境搭建與使用一、單選題1. 下列說法不正確的(C)A. Anaconda是一個(gè)集成環(huán)境 B. Jupyter Notebook是Anaconda中的一個(gè)組
9、件C. 安裝了Anaconda還需要安裝Python D. 安裝了Anaconda就安裝好了數(shù)據(jù)分析所用的模塊2. 下列關(guān)于Jupyter Notebook,說法不正確的是(D)A. Jupyter Notebook是Anaconda集成環(huán)境中自帶的代碼編輯器 B. Jupyter Notebook是一個(gè)網(wǎng)頁(yè)程序C. Jupyter Notebook頁(yè)面單元格中不僅可以輸入代碼還可以輸入文字 D. Jupyter Notebook的Markdown單元中只能輸入文字3. 對(duì)于print語(yǔ)句的使用,下列選項(xiàng)正確的是(A)A. print(“歡迎進(jìn)入財(cái)務(wù)大數(shù)據(jù)的學(xué)習(xí)”) B. print “歡迎進(jìn)
10、入財(cái)務(wù)大數(shù)據(jù)的學(xué)習(xí)”C. print(歡迎進(jìn)入財(cái)務(wù)大數(shù)據(jù)的學(xué)習(xí)) D. print(歡迎進(jìn)入財(cái)務(wù)大數(shù)據(jù)的學(xué)習(xí))4. 執(zhí)行下列代碼,正確的運(yùn)行結(jié)果是(A)print("第二季度銷售毛利率為:" , end='')print(328.5/228.6)A. 第二季度銷售毛利率為:1.4370078740157481 B. 第二季度銷售毛利率為:1.4370078740157481C. 第二季度銷售毛利率為:1.44 D. 第二季度銷售毛利率為:1.445. 在Jupyter Notebook編寫的文件保存后,后綴為(A)A. .ipynb B. .pyC. .cl
11、ass D. .conda二、實(shí)操題1練習(xí)從清華大學(xué)開源軟件鏡像站下載適合自己計(jì)算機(jī)的Anaconda 安裝程序。參考答案見教材中的視頻。2. 在計(jì)算機(jī)上練習(xí)安裝Anaconda環(huán)境,并檢驗(yàn)是否安裝成功。參考答案見教材中的視頻。3. 在Jupyter Notebook中創(chuàng)建Python程序,完成北京MG公司2019年度銷售毛利率的計(jì)算,并將文件命名為GrossMarginRate。參考答案見GrossMarginRate.ipynb文件。4. 將GrossMarginRate程序下載另存為HTML形式的文件,嘗試把學(xué)習(xí)成果分享給親人或好友。參考答案見GrossMarginRate.html文件
12、。5. 在Jupyter中完成Python文件的復(fù)制、移動(dòng)、刪除、下載、上傳、重命名等操作。參考答案見教材中的視頻。項(xiàng)目三 Python基礎(chǔ)程序設(shè)計(jì)一、單選題1. 以下合法的Python變量名是( B )A1num B. num1 C. print D. num1+02. 下面哪個(gè)賦值命令是不合法的( B )Aaccount=123456 B. 123456=account C. account= account+1D. account= 12+156-903. 賦值語(yǔ)句x=(-b+ac)/2a在Python中如何表示( C )A. x=(-b+ac)/(2a) B. x=(-b+a*c)/2
13、*a C. x=(-b+a*c)/(2*a) D. x=(-b+a*c)/(2a)4. 小明有個(gè)水果店,現(xiàn)在想通過列表管理水果品種,假如有三種水果:蘋果、桃子和西瓜,那么,下面哪個(gè)語(yǔ)句正確定義了包含這三種水果的列表fruits( A )A. fruits = '蘋果', '桃子', '西瓜' B. fruits = 蘋果, 桃子, 西瓜C. fruits = ('蘋果', '桃子', '西瓜') D. fruits = (蘋果, 桃子, 西瓜)5. 接第4題,如果要在桃子前插入一個(gè)草莓,則下面哪個(gè)語(yǔ)
14、句正確定義了在列表中插入元素( C )A. fruits .insert(2,'草莓') B. fruits .insert(1,草莓)C. fruits .insert(1,'草莓') D. fruits .append('草莓')6. 若有字典fruits = 'apple':10,'pear':12,'orange':23,當(dāng)執(zhí)行fruits'pear' = 22后,則fruits的字典元素變?yōu)椋?B )。A. 'apple':10,'pear'
15、:12,'orange':23 B. 'apple': 10, 'pear':22,'orange': 23C. 'apple':10, 'orange':23 D. 'apple':10,'pear':12,'orange':23二、實(shí)操題實(shí)操題答案見“代碼”文件夾下“ch3”文件夾中的“項(xiàng)目三-技能訓(xùn)練-實(shí)操題.ipynb”。項(xiàng)目四 Python分支結(jié)構(gòu)程序設(shè)計(jì)一、單選題1. 下面哪種程序結(jié)構(gòu)可以實(shí)現(xiàn)二選一的程序執(zhí)行邏輯(C)A. 順序結(jié)構(gòu) B.
16、單分支程序 C. 雙分支程序 D. Pyhon程序2. 下面屬于不正確的分支結(jié)構(gòu)語(yǔ)法的是( D )A. if 條件表達(dá)式1: 語(yǔ)句塊1elif 條件表達(dá)式2: 語(yǔ)句塊2else: 語(yǔ)句塊nB. if 條件表達(dá)式: 語(yǔ)句塊1else: 語(yǔ)句塊2C.if 條件表達(dá)式: 語(yǔ)句塊D.if 條件表達(dá)式1: 語(yǔ)句塊1else: 語(yǔ)句塊23. if的條件表達(dá)式是假值的選項(xiàng)為(B)。A. if (12+9) B. if (12-12) C. if ('true') D. if (3>=2) 4. if的條件表達(dá)式是假值的選項(xiàng)為( C )。A. if (3>2 and 12<1
17、3) B. if (3>2 or 12<13) C. if (not 'true') D. if (not 3<2)5. 下面哪個(gè)分支程序的語(yǔ)法和程序邏輯不正確的為( B )A. if x<y: print("x小于y") B. if x<y: print('x小于y')else: print('x大于y') C. if x<y: print('x小于y')D. if x<y: print("x小于y")else: print("x不小于y
18、")6. 根據(jù)表4-1給出的2018年和2019年中國(guó)軟件的資產(chǎn)負(fù)債率,完成下面的程序填空,if后填( A ),elif后填( C )。表4-1 中國(guó)軟件的資產(chǎn)負(fù)債率單位:元項(xiàng)目2018年2019年資產(chǎn)負(fù)債率54%59%程序段:ROA18=float(input('請(qǐng)輸入中國(guó)軟件2018年的資產(chǎn)負(fù)債率:')ROA19=float(input('請(qǐng)輸入中國(guó)軟件2019年的資產(chǎn)負(fù)債率:')if( ): print("2018年的資產(chǎn)負(fù)債率低于2019的資產(chǎn)負(fù)債率。")elif( ): print("2018年的資產(chǎn)負(fù)債率等于2
19、019的資產(chǎn)負(fù)債率。")else: print("2018年的資產(chǎn)負(fù)債率高于2019的資產(chǎn)負(fù)債率。")A. ROA18 < ROA19 B. ROA18 > ROA19 C. ROA18 = ROA19 D. ROA18 = ROA19二、實(shí)操題實(shí)操題答案見“代碼”文件夾下“ch4”文件夾中的“項(xiàng)目四-技能訓(xùn)練-實(shí)操題.ipynb”。項(xiàng)目五 Python循環(huán)結(jié)構(gòu)程序設(shè)計(jì)一、單選題1.若有字典fruits = 'apple':10,26,'pear':12,68,'orange':23,32,當(dāng)執(zhí)行prin
20、t(fruits'pear'1)語(yǔ)句后,結(jié)果為( B )A. 12 B. 68 C. 26 D.322. 下列哪個(gè)選項(xiàng)不屬于循環(huán)語(yǔ)句的關(guān)鍵字(D)A. for.in B. continueC. while D. exit3. 下面的代碼用于計(jì)算各個(gè)資產(chǎn)的年折舊額,請(qǐng)問哪個(gè)選項(xiàng)的結(jié)果是正確的程序輸出( A )# asserts中各值含義:資產(chǎn)名稱、資產(chǎn)原值、報(bào)廢時(shí)凈殘值、預(yù)計(jì)使用年限asserts ='房屋', 10000000, 1000000, 50, '服務(wù)器', 900000, 90000, 20, '大型空調(diào)機(jī)', 100
21、000, 10000, 10depreciation= # 折舊額列表for i in range(0,len(asserts): depreciation.append(assertsi1-assertsi2)/assertsi3) print('各個(gè)資產(chǎn)的年折舊額為:')for i in range(0,len(asserts): print(assertsi0 + ':', end = '') print(depreciationi,'元')A. 各個(gè)資產(chǎn)的年折舊額為:房屋:180000.0元服務(wù)器:40500.0元大型空調(diào)
22、機(jī):9000.0元 B. 各個(gè)資產(chǎn)的年折舊額為:房屋:180000.0元 服務(wù)器:40500.0元 大型空調(diào)機(jī):9000.0 C. 各個(gè)資產(chǎn)的年折舊額為:房屋:180000.0元服務(wù)器:40500.0元大型空調(diào)機(jī):9000.0元 D. 各個(gè)資產(chǎn)的年折舊額為:房屋:180000.0元end 服務(wù)器:40500.0元end 大型空調(diào)機(jī):9000.0 end4. 下列代碼求1至100(包括100)中所有偶數(shù)的和,while后面的條件應(yīng)該為(A)sum=0i=1while ( ): if i%2=0: sum=sum+i i=i+1print("sum=", sum)A. i &l
23、t;= 100 B. i < 100 C. i >= 100 D. i > 1005. 下列代碼將1到10(包括10)范圍內(nèi)、所有不能被3整除的數(shù)輸出,那么,if語(yǔ)句下劃線的位置應(yīng)填入哪個(gè)選項(xiàng)( A )for i in range(1,10+1): if i % 3 =0: print(i,end=' ')A. continue B. break C. exit D. end二、實(shí)操題實(shí)操題答案見“代碼”文件夾下“ch5”文件夾中的“項(xiàng)目五-技能訓(xùn)練-實(shí)操題.ipynb”。項(xiàng)目六 數(shù)據(jù)分析工具Pandas入門一、單選題1. 下列選項(xiàng)中,描述不正確的是( A )
24、A. Pandas只有Series和DataFrame 這兩種數(shù)據(jù)結(jié)構(gòu) B. Series是一維的數(shù)據(jù)結(jié)構(gòu)C. DataFrame是二維的數(shù)據(jù)結(jié)構(gòu) D. Series和DataFrame都可以重置索引2. 下列選項(xiàng)中,描述正確的是(B )A. Series是一維的數(shù)據(jù)結(jié)構(gòu),其索引在由,數(shù)據(jù)在左 B. DataFrame是二維的數(shù)據(jù)結(jié)構(gòu),并且該結(jié)構(gòu)具有行索引和列索引C. Series結(jié)構(gòu)中的數(shù)據(jù)不可以進(jìn)行算術(shù)運(yùn)算 D. Series對(duì)象只提供了index屬性3. 下列選項(xiàng)中,描述不正確的是( A )A. Pandas只提供了讀取文本文件、Excel文件的函數(shù) B. 從excel文件中讀入的數(shù)據(jù)系
25、統(tǒng)自動(dòng)轉(zhuǎn)換成DataFrame對(duì)象C. read_excel()函數(shù)用來讀取Excel文件 D. Pandas提供了將數(shù)據(jù)寫入到外部文件中的方法4. 閱讀下面的程序,該程序執(zhí)行后的輸出結(jié)果為( B ) import pandas as pddata = 68,56,88,86,52,71,88,79,89df = pd.DataFrame(data,columns='語(yǔ)文','數(shù)學(xué)','英語(yǔ)')df'語(yǔ)文'1A. 68 B. 86C. 88 D. 報(bào)錯(cuò)5. 使用上一題的數(shù)據(jù)集df,語(yǔ)句df.loc1:2,'語(yǔ)文'執(zhí)
26、行后的結(jié)果是( A )A. 1 862 88Name: 語(yǔ)文, dtype: int64 B. 0 681 86Name: 語(yǔ)文, dtype: int64C. 1 522 79Name: 語(yǔ)文, dtype: int64 D. 0 561 52Name: 語(yǔ)文, dtype: int64二、實(shí)操題實(shí)操題答案見“代碼”文件夾下“ch6”文件夾中的“項(xiàng)目六-技能訓(xùn)練-實(shí)操題.ipynb”。項(xiàng)目七 統(tǒng)計(jì)計(jì)算與分組運(yùn)算一、單選題1. 下列哪個(gè)函數(shù)不是Pandas的統(tǒng)計(jì)計(jì)算函數(shù)(D)A. mean()函數(shù) B. sum()函數(shù)C. max()函數(shù) D. print()函數(shù)2. 下列選項(xiàng)中,哪個(gè)方法可以
27、一次性輸出多個(gè)統(tǒng)計(jì)指標(biāo)?(C)A. mean() B. median()C. describe() D.sum()3. 下列選項(xiàng)中,描述不正確的是(C)A. sort_index()函數(shù)專門用于按數(shù)據(jù)集的索引標(biāo)簽名進(jìn)行排序 B. Pandas支持按行或列的索引名排序和按實(shí)際值排序C. sort函數(shù)既可以按索引名排序又可以按實(shí)際值排序 D. sort_values()函數(shù)用于將數(shù)據(jù)集按值進(jìn)行排序4. 下列選項(xiàng)中,關(guān)于groupby()的操作不正確的是(D)A. list(df.groupby('系部') B. df.groupby(by='系部')C. df.gr
28、oupby('系部',sort=True) D. df.groupby( '系部','性別') 5. 對(duì)于如下數(shù)據(jù)集df的分組運(yùn)算,對(duì)代碼的解釋下列哪個(gè)選項(xiàng)是錯(cuò)誤的?(D)系部姓名性別比賽得分1會(huì)計(jì)系李彥斌男892信息系趙科男793金融系章麗麗女684會(huì)計(jì)系王靜女775會(huì)計(jì)系彭偉男676信息系金子軒女82A. df.groupby(系部) ,表示按“系部” 進(jìn)行分組 B. df.groupby( 系部,性別) ,表示按“系部” 和“性別”進(jìn)行分組C. df.groupby(系部).sum(),表示按“系部“分組并求每個(gè)系部的比賽總分 D. df.
29、groupby( '性別').sum(),表示按“性別“分組并求男生和女生的總數(shù)二、實(shí)操題實(shí)操題答案見“代碼”文件夾下“ch7”文件夾中的“項(xiàng)目七-技能訓(xùn)練-實(shí)操題.ipynb”。 項(xiàng)目八 數(shù)據(jù)清洗一、單選題1. 下列選項(xiàng)中,描述不正確的是( B )A. 數(shù)據(jù)清洗的目的是為了提高數(shù)據(jù)質(zhì)量 B. 空值一定要?jiǎng)h除C. 數(shù)據(jù)預(yù)處理包括數(shù)據(jù)的清洗、合并、重塑與轉(zhuǎn)換 D. 在Pandas中,缺失值使用NaN表示2. 下列選項(xiàng)中,用于刪除缺失值或空值的方法是( B )A. isnull() B. dropna()C. notnull() D. fillna()3. 下列選項(xiàng)中,說法不正確的
30、選項(xiàng)是( A )A. fillna()函數(shù)不能通過inplace參數(shù)來確定是否對(duì)原始數(shù)據(jù)集進(jìn)行填充更改B. 使用位于空值前面的數(shù)據(jù)進(jìn)行填充的代碼是df.fillna(method='bfill')C. 使用位于空值后面的數(shù)據(jù)進(jìn)行填充的代碼是df.fillna(method='ffill') D. 用平均值填充空值的代碼是df.fillna(df.mean()4. 對(duì)于下列代碼生成的數(shù)據(jù)集df,下列哪個(gè)選項(xiàng)的結(jié)果和其他三個(gè)選項(xiàng)不一樣( C )import pandas as pddata = "姓名":'李彥','趙科&
31、#39;,'章麗','王靜','彭偉','金子',"性別":'男','男','女','女','男','女'df = pd.DataFrame(data)A. df.duplicated(subset='性別') B. df.duplicated(subset='性別')C. df.duplicated(subset='性別',keep='last') D
32、. df.duplicated(subset='性別',keep='first')5. 下列選擇項(xiàng)中,用于刪除重復(fù)值的函數(shù)是( A )A. drop_duplicates()函數(shù) B. drop()函數(shù)C. dropna()函數(shù) D. del()函數(shù)二、實(shí)操題實(shí)操題答案見“代碼”文件夾下“ch8”文件夾中的“項(xiàng)目八-技能訓(xùn)練-實(shí)操題.ipynb”。 項(xiàng)目九 數(shù)據(jù)規(guī)整一、單選題1. 下列選項(xiàng)中,描述不正確的是(D)A. concat()函數(shù)默認(rèn)是行拼接 B. concat()函數(shù)要實(shí)現(xiàn)列拼接,要指定axis=1C. 行拼接是指上下多行進(jìn)行拼接 D. 列拼接操作后,
33、兩個(gè)數(shù)據(jù)集中相同列信息只保留一列2. 關(guān)于匿名函數(shù),描述不正確的是(D )A. 使用匿名函數(shù)可以省去定義函數(shù)的過程,讓代碼更加精簡(jiǎn) B. 匿名函數(shù)有個(gè)限制,就是只能有一個(gè)表達(dá)式C. 匿名函數(shù)也是一個(gè)函數(shù)對(duì)象,把匿名函數(shù)賦值給一個(gè)變量,再利用變量來調(diào)用該函數(shù) D. 匿名函數(shù)也可以實(shí)現(xiàn)復(fù)雜的編程邏輯3. func=lambda x: x*2語(yǔ)句定義了一個(gè)匿名函數(shù),計(jì)算一個(gè)數(shù)的平方,現(xiàn)在要計(jì)算2的平方,正確的調(diào)用是(A)A. func(2) B. func2 C. func D. func=24. 下列選項(xiàng)中,關(guān)于apply()方法正確的說法是(C)A. apply()方法是對(duì)DataFrame每一個(gè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年石嘴山市檔案館招聘考試真題
- 2024年城市綠化工程草皮供應(yīng)合同
- 2023年貴德縣選聘大學(xué)生到村任職考試真題
- 2024年居間協(xié)調(diào)協(xié)議-項(xiàng)目合作準(zhǔn)則
- 2024年婚禮場(chǎng)地預(yù)訂協(xié)議書
- 2024年一次性酒店用品訂購(gòu)協(xié)議
- 2024年國(guó)際物流倉(cāng)儲(chǔ)服務(wù)長(zhǎng)期合作協(xié)議
- 2024年農(nóng)業(yè)科技研發(fā)與推廣合作協(xié)議
- 2024年工程監(jiān)理單位BIM技術(shù)監(jiān)督管理合同
- 2024年品牌授權(quán)合同(標(biāo)的:品牌使用權(quán)及授權(quán)生產(chǎn))
- 小學(xué)數(shù)學(xué)《倍的認(rèn)識(shí)》教案基于學(xué)科核心素養(yǎng)的教學(xué)設(shè)計(jì)及教學(xué)反思
- 高中生如何交往人際關(guān)系主題班會(huì)課件
- GB/T 20638-2023步進(jìn)電動(dòng)機(jī)通用技術(shù)規(guī)范
- 垃圾滲濾液處理站運(yùn)維及滲濾液處理投標(biāo)方案(技術(shù)標(biāo))
- 3.3《不簡(jiǎn)單的杠桿》課件
- 弗洛伊德生平及精神分析學(xué)說的發(fā)展歷程
- 四年級(jí)作文-記一次活動(dòng)之有趣的搶凳子游戲(課堂PPT)
- 國(guó)企領(lǐng)導(dǎo)人員管理暫行規(guī)定
- 高校學(xué)生干部培訓(xùn)會(huì)新聞稿
- 招商引資面試題
- 人教版九年級(jí)物理全一冊(cè)課件【全冊(cè)】
評(píng)論
0/150
提交評(píng)論