版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
專題三數(shù)據(jù)處理與應(yīng)用考點(diǎn)過關(guān)練考點(diǎn)一常用表格數(shù)據(jù)的處理1.(2022諸暨海亮高中期中,16)為了響應(yīng)全民健身計(jì)劃,某高中對(duì)學(xué)生進(jìn)行了體質(zhì)健康測(cè)評(píng),并用Excel軟件進(jìn)行數(shù)據(jù)處理,如圖a所示。圖a請(qǐng)回答下列問題:(1)區(qū)域M2:P15的數(shù)據(jù)是通過公式計(jì)算得到的,在M2單元格中輸入公式后,再使用自動(dòng)填充功能完成該區(qū)域的計(jì)算,則N3單元格中的公式是“=SUMPRODUCT(()*($I$3:$I$553=N$1))”。
(提示:M2單元格輸入公式=SUMPRODUCT((A1:A100=“2”)*(I1:I100=“優(yōu)秀”)),表示同時(shí)滿足A1:A100是2班和I1:I100是優(yōu)秀這兩個(gè)條件的情況數(shù)量,也就是進(jìn)行條件計(jì)數(shù)。)(2)根據(jù)圖a中的數(shù)據(jù)制作的圖表如圖b所示。創(chuàng)建該圖表的數(shù)據(jù)區(qū)域是。
圖b(3)對(duì)圖a工作表進(jìn)行相關(guān)數(shù)據(jù)分析,下列說法正確的是(多選,填字母)。
A.以“總分等級(jí)”為依據(jù)進(jìn)行升序排序,選擇的區(qū)域是A3:I553B.選擇“A3:I553”按照“總分等級(jí)”升序排序后,圖b的圖表不會(huì)發(fā)生改變C.現(xiàn)需要選出總分等級(jí)為“不及格”的學(xué)生,可選擇區(qū)域A3:I553,以“總分等級(jí)”為“不及格”進(jìn)行篩選并保留結(jié)果D.為了顯示男生立定跳遠(yuǎn)得分最高的3位學(xué)生數(shù)據(jù),可先對(duì)“性別”為“男”進(jìn)行篩選,再對(duì)“立定跳遠(yuǎn)”進(jìn)行篩選,選擇最大的3項(xiàng)答案(1)$A$3:$A$553=$K3(2)M1:P1,M16:P16(3)ABC2.(2023杭州“六縣九校”期中,16)小明同學(xué)為備戰(zhàn)明年的計(jì)算機(jī)類研究生考試,收集了部分高校的計(jì)算機(jī)專業(yè)復(fù)試分?jǐn)?shù)線并進(jìn)行分析。小明收集到的數(shù)據(jù)如圖a所示。各院校總分展示圖請(qǐng)幫助小明同學(xué)對(duì)表格數(shù)據(jù)進(jìn)行下列分析:(1)若想知道這些學(xué)校的總分情況,則在F2單元格先輸入公式(要求必須使用函數(shù)),然后使用自動(dòng)填充功能完成單元格F3:F8的計(jì)算。
(2)現(xiàn)要求按照“總分”列進(jìn)行降序排序,并篩選出總分在290分及以上的院校并顯示,最后繪制各個(gè)院校總分的垂直柱形圖(如圖b)。請(qǐng)?jiān)诔绦騽澗€①②③處填入合適的代碼。importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['KaiTi','SimHei','FangSong']#圖表中文顯示處理df=pd.read_excel("score.xlsx")df1=df[①]
print(df1)#輸出篩選數(shù)據(jù)df=df.②("總分",ascending=False)#按照“總分”列降序排序
print(df)#輸出排序好的數(shù)據(jù)#------創(chuàng)建圖表代碼------plt.title("各院校總分展示圖")plt.xlabel("院校名稱")plt.③(df.院校名稱,df.總分)#各個(gè)院校總分的垂直柱形圖
plt.show()答案(1)=SUM(B2:E2)(2)①df.總分>=290或者df["總分"]>=290②sort_values③bar3.(2023杭州S9聯(lián)盟聯(lián)考,14)小明收集了當(dāng)?shù)?023年3月份的天氣情況,數(shù)據(jù)存儲(chǔ)在文件“temp.xlsx”中,如圖a所示。分析溫差最大的日期,并生成反映各類天氣情況的天數(shù)對(duì)比圖如圖b所示。(1)在對(duì)表格進(jìn)行數(shù)據(jù)整理時(shí)發(fā)現(xiàn),“日期”可能存在的數(shù)據(jù)問題是(單選:A.數(shù)據(jù)缺失;B.數(shù)據(jù)異常;C.邏輯錯(cuò)誤;D.數(shù)據(jù)格式不一致)。
(2)程序代碼如下所示,請(qǐng)?jiān)趧澗€處填入合適的代碼。importmatplotlib.pyplotaspltimportpandasaspdplt.rcParams["font.sans-serif"]=["SimHei"]#設(shè)置中文字體df=pd.read_excel("temp.xlsx")df["溫差"]=①#新增"溫差"列
s=df.sort_values("溫差",ascending=False,ignore_index=True)df_max=②#獲取溫差最大的日期,如并列只輸出第一個(gè)日期
print(df_max)df_t=s.groupby("天氣",as_index=False).count()df_t=df_t.rename(columns={"日期":"天數(shù)"})#修改列名"日期"為"天數(shù)"x=df_t["天氣"]y=df_t["天數(shù)"]③(x,y,label="天氣情況")
plt.legend()plt.show()(3)觀察圖b,3月份天數(shù)最多的天氣類型是。
答案(1)D(2)①df["最高氣溫"]-df["最低氣溫"]②s["日期"][0]或s.at[0,"日期"]③plt.bar(3)小雨4.(2023杭州地區(qū)重點(diǎn)中學(xué)期中,15)某中學(xué)高一年級(jí)完成一次7選3意向調(diào)查,數(shù)據(jù)存儲(chǔ)在“xk73.xlsx”中,如圖a所示,其中1代表選擇科目,0代表?xiàng)夁x科目。(1)使用pandas編程計(jì)算本次選課各門課人數(shù)占總?cè)藬?shù)的比例,請(qǐng)?jiān)趧澗€處填入合適的代碼。importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']#圖表顯示中文df=pd.read_excel("①")
a=[""]*len(df)#存儲(chǔ)每個(gè)學(xué)生的選課組合dic={"物":0,"化":0,"生":0,"政":0,"歷":0,"地":0,"技":0}foriindf.index:forjindf.columns[3:]:ifdf.at[i,j]==1:②
a[i]+=jforiindic.keys():dic[i]=round(dic[i]/len(df)*100,2)(2)按照各科選考人數(shù)占比創(chuàng)建如圖b所示的圖表。各科選考人數(shù)占比df1=pd.DataFrame({"學(xué)科":dic.keys(),"人數(shù)占比":dic.values()})df1=①
plt.title("各科選考人數(shù)占比")plt.bar(②,label="人數(shù)占比")
plt.legend()plt.show()觀察圖b,橫線處應(yīng)填入的代碼為:①;②(選填字母)。
A.df1.sort_values("人數(shù)占比",ascending=True)B.df1.sort_values("人數(shù)占比",ascending=False)C.df1.學(xué)科,df1.人數(shù)占比D.df1.人數(shù)占比,df1.學(xué)科(3)小李同學(xué)想查詢某種七選三組合有多少人。以下程序代碼可以為小李同學(xué)提供查詢功能,程序運(yùn)行示例如圖c所示,請(qǐng)?jiān)趧澗€處填入合適的代碼。請(qǐng)輸入需要查詢的選課組合:物化技選擇物化技組合的同學(xué)共有:192人圖ccx=input("請(qǐng)輸入需要查詢的選課組合:")cnt=0foriinrange(len(a)):if:
cnt=cnt+1print(f"選擇{cx}組合的同學(xué)共有:{cnt}人")答案(1)①xk73.xlsx②dic[j]+=1(2)①B②C(3)a[i]==cx或其他等價(jià)表達(dá)式5.(2023浙江1月選考,14,9分)小紅收集了部分城市2021年全年每天PM2.5、PM10、CO濃度數(shù)據(jù),每天的數(shù)據(jù)分別保存在以8位日期字符串命名的CSV文件中,部分文件如圖a所示,每個(gè)文件記錄了一天24小時(shí)的監(jiān)測(cè)數(shù)據(jù),示例如圖b所示。為統(tǒng)計(jì)分析城市A全年各月份PM2.5的月平均濃度(當(dāng)月的日平均濃度的平均值),編寫Python程序。請(qǐng)回答下列問題:(1)定義pmday函數(shù),功能為:讀取某天的CSV文件,返回城市A當(dāng)天PM2.5的日平均濃度。函數(shù)代碼如下,劃線處應(yīng)填入的代碼為(單選,填字母)。
A.df['類型']=='PM2.5'B.df['類型'=='PM2.5']C.df[df['類型']]=='PM2.5'D.df[df['類型']=='PM2.5']importpandasaspddefpmday(dayfile):df=pd.read_csv(dayfile)#讀取文件dayfile中的數(shù)據(jù)df=
returndf['城市A'].mean()#返回城市A當(dāng)天PM2.5的日平均濃度(2)統(tǒng)計(jì)城市A各月份PM2.5的月平均濃度并繪制線形圖,部分Python程序如下,請(qǐng)?jiān)趧澗€處填入合適的代碼。importmatplotlib.pyplotaspltdeftstr(t):ift<10:retrun'0'+str(t)else:retrunstr(t)pm=[0]*12mdays=[31,28,31,30,31,30,31,31,30,31,30,31]#2021年每月天數(shù)forminrange(12):sm=0mstr=tstr(m+1)fordinrange(①):
dstr=tstr(d+1)dayfile='2021'+mstr+dstr+'.csv'sd=pmday(dayfile)②
pm[m]=sm/mdays[m]x=[1,2,3,4,5,6,7,8,9,10,11,12]y=③
plt.plot(x,y)#繪制線形圖#設(shè)置繪圖參數(shù),顯示如圖c所示線形圖,代碼略(3)城市A2021年P(guān)M2.5年平均濃度為34.6微克/立方米。由圖c可知,城市A2021年P(guān)M2.5月平均濃度超過年平均濃度的月份共個(gè)。
答案(1)D(2)①mdays[m]②sm+=sd③pm(3)5考點(diǎn)二大數(shù)據(jù)處理1.(2023寧波三鋒期中,2)下列關(guān)于大數(shù)據(jù)與大數(shù)據(jù)處理的說法,不正確的是()A.處理大數(shù)據(jù)時(shí),一般采用分治思想B.大數(shù)據(jù)的處理對(duì)象是全體數(shù)據(jù),而不是抽樣數(shù)據(jù)C.大數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)量大、速度快、數(shù)據(jù)類型多、價(jià)值密度低D.Hadoop是一個(gè)可運(yùn)行于大規(guī)模計(jì)算機(jī)集群上的分布式系統(tǒng)基礎(chǔ)架構(gòu),適用于處理實(shí)時(shí)數(shù)據(jù)答案D2.(2023金華十校聯(lián)考,3)下列有關(guān)大數(shù)據(jù)處理、數(shù)據(jù)可視化的說法不正確的是()A.靜態(tài)數(shù)據(jù)是指處理時(shí)已收集完成、計(jì)算時(shí)不會(huì)發(fā)生改變的數(shù)據(jù)B.流數(shù)據(jù)主要是指不間斷地、持續(xù)地到達(dá)的實(shí)時(shí)數(shù)據(jù)C.圖計(jì)算是指有關(guān)大量圖片的計(jì)算D.“各省生產(chǎn)總值占比情況”可以采用餅圖或環(huán)形圖呈現(xiàn)答案C3.有Python程序段如下所示:importpandasaspdimportnumpyasnpa=np.array([1,2,3,4]).reshape(2,2)df=pd.DataFrame(a)print(df.at[1,1])該程序段運(yùn)行后輸出的結(jié)果為()A.4B.3C.2D.1答案A4.小張收集了近階段要學(xué)習(xí)的英文單詞,存儲(chǔ)為“data.txt”文件,格式如圖所示。處理“data.txt”文件中的英文單詞的Python程序段如下所示:file='data.txt'word_c=[]n=0forwordinopen(file):ifword[0:1]=="c":word_c.append(word)
print('字母c開頭的單詞個(gè)數(shù)為:',n)(1)劃線處的代碼為。
(2)該程序段運(yùn)行后,列表word_c中的數(shù)據(jù)為。
答案(1)n=n+1或n+=1(2)data.txt中所有以小寫字母"c"開頭的單詞5.請(qǐng)?jiān)诳崭裉幪顚懻_的代碼,使程序完善。實(shí)現(xiàn)功能:繪制y=x2-2x+1的圖象。#加載numpy模塊并取名為npimportnumpyasnp#加載matplotlib.pyplot模塊并取名為pltimportmatplotlib.pyplotasplt#x在-7到9之間,每隔0.1取一個(gè)值x=np.arange(-7,9,0.1)①=x**2-2*x+1
plt.plot(x,②)
plt.title('y=x*x-2*x+1')plt.xlabel('x')plt.ylabel('y')plt.③
答案①y②y③show()6.在網(wǎng)上搜索朱自清的文章《綠》,如圖所示。(1)搜索信息并保存為txt文件,該過程稱為。
(2)“綠.txt”文件的文本類型是。(填寫字母:A.結(jié)構(gòu)化數(shù)據(jù)/B.半結(jié)構(gòu)化數(shù)據(jù)/C.非結(jié)構(gòu)化數(shù)據(jù))
(3)制作標(biāo)簽云的代碼如下:importcollectionsimportjiebaimportwordcloudaswcimportnumpyasnpfromPILimportImagewcg=wc.WordCloud(background_color="white",font_path='assets/msyh.ttf')text=open('data/綠.txt',encoding='utf-8')read()seg_list=①
f=collections.Counter(seg_list)wcg.fit_words(f)wcg.to_file('output/b.png')劃線處①語句是調(diào)用jieba對(duì)象的cut函數(shù)對(duì)變量為text的文件進(jìn)行分詞,則該處語句為。
(4)得到的標(biāo)簽云如圖所示。該圖片的文件名是,表現(xiàn)該文本特征的是。(至少寫出3個(gè))
答案(1)采集信息(2)C(3)jieba.cut(text)(4)b.png;我、的、著、了、綠、你專題綜合練題組一1.(2023十校聯(lián)盟聯(lián)考,5)近年來,各地相繼出現(xiàn)了一些無人售貨超市,其購(gòu)物流程為:通過微信號(hào)/支付寶注冊(cè)→掃碼或掃臉開門→選購(gòu)商品→結(jié)算區(qū)顯示屏清單確認(rèn)(智能檢測(cè))→開門即走(智能扣款)。整個(gè)過程快捷方便,達(dá)到無感支付。超市內(nèi)24小時(shí)利用攝像頭監(jiān)控,實(shí)行人臉識(shí)別防盜監(jiān)控,發(fā)現(xiàn)有小偷將自動(dòng)抓拍報(bào)警并列入黑名單,通過RFID技術(shù)+核心軟件算法有效識(shí)別和定位貨損源頭,并進(jìn)行有效處理和防范。此外,超市也會(huì)依靠大數(shù)據(jù)、云計(jì)算技術(shù),對(duì)各種商品的銷售狀況進(jìn)行匯總分析,并智能判斷客戶的購(gòu)買習(xí)慣進(jìn)行產(chǎn)品推薦,還能預(yù)測(cè)銷售走勢(shì),給商家提供合理的建議。根據(jù)閱讀材料,下列說法正確的是()A.匯總分析已完成的商品銷售狀況數(shù)據(jù)屬于流數(shù)據(jù)B.無人售貨超市依靠大數(shù)據(jù)處理只需要分析最近幾個(gè)月的抽樣數(shù)據(jù)C.根據(jù)客戶賬號(hào)的購(gòu)買習(xí)慣進(jìn)行產(chǎn)品推薦,不需要知道用戶購(gòu)買商品的原因D.無人售貨超市中的每一個(gè)數(shù)據(jù)都來自真實(shí)數(shù)據(jù),體現(xiàn)了大數(shù)據(jù)價(jià)值密度高的特點(diǎn)答案C2.(2023舟山高二期末,12)小明用下列Python程序?qū)Da處理成圖b所示效果,發(fā)現(xiàn)處理后的圖像不理想,他要想將圖像處理成圖c所示效果,則可做的修改是()fromPILimportImage#第0行importnumpyasnp#第1行importmatplotlib.pyplotasplt#第2行img=np.array(Image.open('dj.jpg').convert('L'))#第3行row,cols=img.shape#第4行foriinrange(row):#第5行forjinrange(cols):#第6行ifimg[i,j]>188:#第7行img[i,j]=1#1表示白色#第8行else:#第9行img[i,j]=0#0表示黑色#第10行plt.figure('dj')#第11行plt.imshow(img,cmap='gray')#第12行plt.axis('off')#第13行plt.show()A.將第7行中的數(shù)字188改成138B.將第7行中的數(shù)字188改成250C.將第7行中的>改成<D.將第8行的代碼與第10行的代碼互換答案A3.(2022杭州重點(diǎn)中學(xué)期中,13)小蕭從國(guó)家統(tǒng)計(jì)局網(wǎng)站上收集了近幾年國(guó)民總收入相關(guān)數(shù)據(jù),并使用Excel軟件進(jìn)行相關(guān)數(shù)據(jù)處理與分析。部分界面如圖a所示,請(qǐng)回答下列問題:(1)下列關(guān)于數(shù)據(jù)整理的描述,正確的是(單選)。
A.某些缺失的數(shù)據(jù)可以自己隨意估計(jì)一個(gè)值進(jìn)行補(bǔ)充B.Excel表格中的異常數(shù)據(jù)可以直接刪除或忽略C.Excel表格中的重復(fù)數(shù)據(jù)可以進(jìn)行合并或刪除D.Excel中格式不一致的數(shù)據(jù),一般只保留一種格式的數(shù)據(jù),刪除其他格式的數(shù)據(jù)(2)圖b的圖表數(shù)據(jù)類型為(選填:柱形圖/條形圖/折線圖)。
圖b(3)根據(jù)表格數(shù)據(jù)呈現(xiàn),從2017年開始可以計(jì)算國(guó)民總收入增長(zhǎng)比例,方法是在C8單元格輸入公式(計(jì)算公式:(當(dāng)年國(guó)民總收入-去年國(guó)民總收入)/去年國(guó)民總收入),設(shè)置百分比格式后自動(dòng)填充至F8單元格。
(4)除了Excel,可以進(jìn)行數(shù)據(jù)分析的軟件還有(多選,填數(shù)字)。
①Word②SPSS③SAS④MATLAB⑤記事本⑥Python⑦錄音機(jī)答案(1)C(2)柱形圖(3)=(C2-B2)/B2(4)②③④⑥4.(2022杭州八縣市區(qū)期末,16)某次測(cè)試的Excel文件成績(jī)表如圖1所示。圖1(1)已知有200名同學(xué)參加了本次測(cè)試。小明想把全體同學(xué)的信息平均分放在D202單元格,那么在D202單元格輸入的公式為。
(2)現(xiàn)在要求用Python增加“總分”列數(shù)據(jù),然后求每個(gè)班總分的平均分(如圖2),最后繪制每班總分平均分的垂直柱形圖(如圖3)。請(qǐng)?jiān)诔绦騽澗€①②處選擇合適的代碼(填字母)。圖2圖3importpandasaspdimportmatplotlib.pyplotasplt#圖表中文顯示處理,代碼略df=pd.read_excel("test.xlsx")score=[]foriindf.values:js=①#①處請(qǐng)選擇(填字母):A.df["信息"]+df["通用"]/B.i[3]+i[4]
score.append(js)df["總分"]=scoredf1=df.groupby("班級(jí)".as_index=False)["總分"].mean()plt.title("期中技術(shù)平均分")plt.②(df1["班級(jí)"],df1["總分"],width=0.5)#②處請(qǐng)選擇(填字母):
A.plot/B.bar/C.scatter答案(1)=AVERAGE(D2:D201)(2)①B②B5.(2022麗水期末,13)小明收集了本周信息技術(shù)學(xué)科學(xué)習(xí)評(píng)價(jià)的數(shù)據(jù),如圖所示。(1)觀察上表小明做了如下操作,其中屬于數(shù)據(jù)整理的是(多選,填字母)。
A.刪除重復(fù)行第五行B.驗(yàn)證并修改D2單元格數(shù)據(jù)C.通過公式計(jì)算全班平均分D.重新設(shè)置C3單元格格式(2)為了分析每個(gè)組的平均分,設(shè)計(jì)了如下Python程序。importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_excel("成績(jī)表.xlsx")
print(df1)劃線處的代碼應(yīng)為(單選,填字母)。
A.df1=df.groupby("平均分").mean()B.df1=df.mean()C.df1=df.groupby("小組").mean()D.df1=df["小組"].mean()(3)利用Python程序繪制各小題得分率圖表,如圖所示。請(qǐng)?jiān)趧澗€處填寫合適的代碼。num=int(input("請(qǐng)輸入小組:"))plt.figure(figsize=(10,5))list=[]foriinrange(12):s="題"+str(i+1)list.append(df1.at[num,s]*50)plt.bar(range(1,13),list)plt.title(str(num)+"")
plt.xlabel("questionnumber")plt.ylabel("correctrate")plt.show()答案(1)ABD(2)C(3)group6.(2024屆A9協(xié)作體返校考,14)張三同學(xué)收集了一個(gè)地區(qū)8月各類共享單車的騎行數(shù)據(jù)記錄,每天的用戶數(shù)據(jù)存儲(chǔ)于“sharedbikes.xlsx”文件中,不考慮跨天數(shù)據(jù)。數(shù)據(jù)格式如圖a所示,請(qǐng)回答下列問題:(1)cal函數(shù)功能為:讀取騎行時(shí)間的小時(shí)和分鐘部分,轉(zhuǎn)換為分鐘格式并返回,如“2022/8/206:57”獲取“6:57”轉(zhuǎn)換為417(6*60+57=417),代碼如下。請(qǐng)?jiān)趧澗€處填入合適的代碼。defcal(s):n=len(s)foriinrange(n):ifs[i]=="":#如果為空格字符p=iifs[i]==":":q=it=+int(s[q+1:])
returnt(2)統(tǒng)計(jì)本月各類型單車的每天平均騎行時(shí)長(zhǎng),并繪制柱形圖,代碼如下,繪制的圖表如圖b所示,請(qǐng)?jiān)趧澗€處填入合適的代碼。importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_excel("sharedbikes.xlsx")bike=["哈羅單車","摩拜單車","美團(tuán)單車","青桔單車"]sm=[0]*4avg=[0]*4days=31foriin①:
t=cal(df.at[i,"結(jié)束時(shí)間"])-cal(df.at[i,"開始時(shí)間"])forjinrange(4):ifdf.at[i,"App類型”]==bike[j]:②
breakforiinrange(4):avg[i]=sm[i]/daysplt.figure(figsize=(12,4))x=bikey=③
plt.bar(x,y)plt.show()(3)統(tǒng)計(jì)本月各類型單車的騎行次數(shù),加框處代碼有錯(cuò),可以改正為(選填字母:A.max()/B.min()/C.mean()/D.count())。
n=df.groupby("App類型",as_index=True).用戶編號(hào).sum()答案(1)int(s[p+1:q])*60(2)①df.index或range(len(df))②sm[j]+=t③avg(3)D7.(2024屆紹興診斷性測(cè)試,14)學(xué)校暑期開展“青春迎亞運(yùn)”活動(dòng),邀請(qǐng)高二學(xué)生每日參加運(yùn)動(dòng)鍛煉并進(jìn)行線上打卡。每周收集一次相關(guān)數(shù)據(jù),分別保存在相應(yīng)的xlsx文件中,部分文件如圖a所示。每個(gè)文件記錄了一周7天的打卡數(shù)據(jù),示例如圖b所示,其中運(yùn)動(dòng)時(shí)長(zhǎng)單位為分鐘。為統(tǒng)計(jì)分析學(xué)生鍛煉情況,給出周報(bào)數(shù)據(jù),編寫Python程序,請(qǐng)回答以下問題:(1)定義px函數(shù),功能為:讀取某一周的打卡數(shù)據(jù),將其按班級(jí)進(jìn)行排序操作并返回結(jié)果。函數(shù)代碼如下,將劃線處代碼補(bǔ)充完整。importpandasaspddefpx(file_week):df=pd.read_excel(file_week)df=df.sort_values(,ignore_index=True)
#按班級(jí)升序排序,參數(shù)ignore_index=True表示更新索引returndf(2)統(tǒng)計(jì)某一周各運(yùn)動(dòng)項(xiàng)目的參與人次,并繪制柱形圖,如圖c所示,部分Python代碼如下:importmatplotlib.pyplotasplts=input("請(qǐng)輸入文件名:")df=px(s)df1=df.groupby("運(yùn)動(dòng)項(xiàng)目".as_index=False).①#統(tǒng)計(jì)各運(yùn)動(dòng)項(xiàng)目參與人次
df1.rename(columns={"學(xué)號(hào)":"參與人次"},inplace=True)#更改列標(biāo)題plt.bar(②)
plt.xlabel("運(yùn)動(dòng)項(xiàng)目")plt.ylabel("參與人次")plt.show()劃線處應(yīng)填入的代碼為(單選,填字母)。
A.①count()②df1["參與人次"],df1["運(yùn)動(dòng)項(xiàng)目"]B.①sum()②df1["參與人次"],df1["運(yùn)動(dòng)項(xiàng)目"]C.①sum()②df1.運(yùn)動(dòng)項(xiàng)目,df1.參與人次D.①count()②df1.運(yùn)動(dòng)項(xiàng)目,df1.參與人次(3)統(tǒng)計(jì)某一周每班各學(xué)生的總運(yùn)動(dòng)時(shí)長(zhǎng)后,比較得出該周每班最高的兩位時(shí)長(zhǎng),部分Python程序代碼如下,請(qǐng)?jiān)趧澗€處填入合適的代碼。qp=[[0foriinrange(m)]forjinrange(n)]'''定義數(shù)組qp記錄每班各學(xué)生一周運(yùn)動(dòng)總時(shí)長(zhǎng),n為班級(jí)數(shù),m為每班人數(shù)。其中qp[0][0]~qp[0][m-1]存儲(chǔ)1班1號(hào)~m號(hào)同學(xué)的每周運(yùn)動(dòng)總時(shí)長(zhǎng),依次類推,qp[n-1][0]~qp[n-1][m-1]存儲(chǔ)n班1號(hào)~m號(hào)同學(xué)的每周運(yùn)動(dòng)總時(shí)長(zhǎng)。'''print("本周每班最高的兩位時(shí)長(zhǎng)分別為:")i=0whilei<len(df):#df為調(diào)用px函數(shù)后的返回結(jié)果num=df["學(xué)號(hào)"][i]cla=df["班級(jí)"][i]①
ifi!=0anddf["班級(jí)"][i]!=df["班級(jí)"][i-1]or②:
cla=df["班級(jí)"][i-1]k1=0;k2=0forjinrange(1,len(qp[cla-1])):ifqp[cla-1][j]>qp[cla-1][k1]:③
k1=jelifqp[cla-1][j]>qp[cla-1][k2]:k2=jprint(cla,"班",qp[cla-1][k1].qp[cla-1][k2])i=i+1(4)統(tǒng)計(jì)某一周各運(yùn)動(dòng)項(xiàng)目的參與人次后繪制柱形圖如圖c所示,由圖可知,該周參與人氣最高的運(yùn)動(dòng)項(xiàng)目為。
答案(1)"班級(jí)"(2)D(3)①qp[cla-1][num-1]+=df["運(yùn)動(dòng)時(shí)長(zhǎng)"][i]②i==len(df)-1③k2=k1(4)跑步8.(2024屆寧波模擬,13)已知某年級(jí)有6個(gè)班級(jí),所有學(xué)生名單存儲(chǔ)在文件“name.csv”中(如圖1),學(xué)校舉行某趣味活動(dòng)項(xiàng)目中,需要每個(gè)班抽3名代表參加比賽,請(qǐng)編寫一個(gè)隨機(jī)抽取程序,執(zhí)行效果如圖2。請(qǐng)回答以下問題:(1)加框處代碼的作用是。
(2)實(shí)現(xiàn)上述功能的部分Python程序如下,請(qǐng)?jiān)趧澗€處填寫合適的代碼。importcsvimportrandom#數(shù)據(jù)讀入f=open("name.csv","r")flines=csv.reader(f)name_list=[]m=6#班級(jí)總數(shù)total=18#參賽總?cè)藬?shù)forlineinflines:ifline[0]=="班級(jí)":continue#跳過當(dāng)前循環(huán)的剩余語句,繼續(xù)進(jìn)行下一次循環(huán)name_list.append(line)①
flag=[False]*ngrade=[3]*mi=0whilei<total:p=random.randint(②,③)
bj=int(name_list[p][0])ifflag[p]==False:ifgrade[bj-1]>0:flag[p]=True④
i+=1print("抽取名單為:")print("班級(jí)","姓名")foriinrange(n):ifflag[i]:print(name_list[i][0],name_list[i][1])f.close()答案(1)列表name_list中的數(shù)據(jù)不包括標(biāo)題行(2)①n=len(name_list)②0③n-1④grade[bj-1]-=19.(2023杭州地區(qū)重點(diǎn)中學(xué)聯(lián)考,14)小明利用“在線社團(tuán)報(bào)名系統(tǒng)”收集了全校學(xué)生的社團(tuán)報(bào)名信息,并將報(bào)名數(shù)據(jù)導(dǎo)出到“社團(tuán)報(bào)名.xlsx”中,如圖1所示。然后編寫Python程序?qū)?bào)名數(shù)據(jù)進(jìn)行處理,生成分別以班級(jí)名和社團(tuán)名為文件名的Excel文件,以便分發(fā)給相應(yīng)的社團(tuán)指導(dǎo)老師和班主任。(1)在對(duì)表格進(jìn)行數(shù)據(jù)整理時(shí)發(fā)現(xiàn),關(guān)于“Jacky.Y”同學(xué)的記錄可能存在的數(shù)據(jù)問題是(選填:A.數(shù)據(jù)缺失B.數(shù)據(jù)異常C.邏輯錯(cuò)誤D.數(shù)據(jù)格式不一致)。
(2)其中生成每個(gè)社團(tuán)名單文件的過程是:先對(duì)報(bào)名數(shù)據(jù)按社團(tuán)名稱進(jìn)行分類,并對(duì)選報(bào)同一社團(tuán)的學(xué)生按班級(jí)進(jìn)行升序排序,然后生成各個(gè)社團(tuán)名單文件,如圖2所示。對(duì)應(yīng)的程序代碼如下,請(qǐng)?jiān)趧澗€處填寫合適的代碼。importpandasaspddefread_file(filename):#讀入報(bào)名數(shù)據(jù)的原始文件,并將表中的數(shù)據(jù)轉(zhuǎn)換成列表,代碼略defsave_file(a):#保存名單到相應(yīng)社團(tuán)的Excel電子表格文件df=pd.DataFrame(a,columns=["班級(jí)","姓名","選報(bào)社團(tuán)"])df.to_excel(①)+".xlsx",index=False)
a=read_file("社團(tuán)報(bào)名.xlsx")n=len(a)#按社團(tuán)名(參照拼音的字母順序)進(jìn)行升序排序,代碼略#統(tǒng)計(jì)各社團(tuán)人數(shù),存在列表rs中,rs=[["滑板社",36],…],代碼略s=0foriinrange(len(rs)):②
left,right=s,s+num-1whileleft<right:imin=imax=leftforkinrange(left+1,right+1):ifa[k][0]<a[imin][0]:imin=kelifa[k][0]>a[imax][0]:imax=kifimin!=left:a[imin],a[left]=a[left],a[imin]ifimax==left:③
ifimax!=right:a[imax],a[right]=a[right],a[imax]left=left+1;right=right-1④
s+=num答案(1)B(2)①a[0][2]或df.at[0,"選報(bào)社團(tuán)"]或df["選報(bào)社團(tuán)"][0]②num=rs[i][1]③imax=imin④save_file(a[s:s+num])題組二1.(2022諸暨期末,4)使用pandas編程處理數(shù)據(jù)DF1,下列選項(xiàng)能實(shí)現(xiàn)行列轉(zhuǎn)置操作的是()A.DF1.TB.DF1.columnsC.DF1.valuesD.DF1.index答案A2.(2022寧波奉化期末,9)有如下Python程序段:importpandasaspds=pd.Series(range(5,11,3))s[1]=15print(s)該程序執(zhí)行后,輸出的結(jié)果是()11528dtype:int6405115dtype:int6411528311dtype:int6405115211dtype:int64A.B.C.D.答案B3.(2022寧波咸祥中學(xué)期中,16)小明收集了某超市飲料銷售情況相關(guān)數(shù)據(jù),并使用Excel軟件進(jìn)行處理,如圖a所示。請(qǐng)回答下列問題:(1)區(qū)域I3:I15的數(shù)據(jù)是通過公式計(jì)算得到的。在I3單元格輸入公式后,用自動(dòng)填充功能完成I4:I15的計(jì)算,則I3單元格中的公式是。(占銷售總額百分比=銷售額(元)/銷售總額(元))
(2)若因誤操作將I16單元格刪除,則I3單元格會(huì)顯示(選填字母:A.#VALUEB.#DIV/0!C.######D.#REF!)。
(3)要將類別為“可樂”的飲料以“毛利潤(rùn)(元)”為主要關(guān)鍵字降序排序,則選擇排序的區(qū)域?yàn)椤?/p>
(4)小王根據(jù)圖a中的數(shù)據(jù),制作了一張反映橙汁類飲料銷售額和毛利潤(rùn)對(duì)比的圖表,如圖b所示,則建立該圖表的數(shù)據(jù)區(qū)域是。將E8單元格數(shù)值修改成6.00,是否會(huì)影響該圖表?(選填:是/否)
圖b答案(1)=G3/$I$16或=G3/I$16(2)B(3)B8:I11(4)B2,G2:H2,B5:B7,G5:H7;否4.(2022臺(tái)州啟超中學(xué)期中,16)APP活躍人數(shù)數(shù)據(jù)存儲(chǔ)在“app.xlsx”文件中,如圖所示,現(xiàn)要編程統(tǒng)計(jì)結(jié)果,請(qǐng)回答下列問題:若要把“app.xlsx”第1張工作表中的信息導(dǎo)入到book1對(duì)象中,并進(jìn)行統(tǒng)計(jì),實(shí)現(xiàn)這個(gè)功能的Python代碼如下,在程序劃線處填入合適的代碼。importpandasaspdbook1=(1)#讀取app.xlsx文件數(shù)據(jù),并存儲(chǔ)在book1對(duì)象中
book1_sum=(2)
#計(jì)算10月人數(shù)之和book1_aver=(3)
#計(jì)算11月人數(shù)平均值book1_g=(4)
#按應(yīng)用領(lǐng)域分組統(tǒng)計(jì)book1_sort=(5)
#按11月人數(shù)值,降序排序print("10月人數(shù)之和:",book1_sum)print("11月人數(shù)平均值:",book1_aver)答案(1)pd.read_excel("app.xlsx")(2)book1["10月人數(shù)"].sum()(3)book1["11月人數(shù)"].mean()(4)book1.groupby("應(yīng)用領(lǐng)域")(5)book1.sort_values("11月人數(shù)",ascending=False)5.(2022寧波奉化期末,14)小孫收集了2016年到2020年的各地區(qū)糧食生產(chǎn)總量并存儲(chǔ)在“l(fā)scl.xlsx”文件中,如圖a所示,現(xiàn)使用Python對(duì)其進(jìn)行數(shù)據(jù)處理,并實(shí)現(xiàn)數(shù)據(jù)可視化,繪制的圖表如圖b所示。實(shí)現(xiàn)如上功能的代碼如下,請(qǐng)回答以下問題。importpandasaspdimportmatplotlib.pyplotaspltplt.rc('font',**{'family':'SimHei'})#設(shè)置中文字體df=pd.read_excel("lscl.xlsx")df.①("2020年",ascending=False,inplace=True)
df1=df.head(10)x=②
y=df1["2020年"]plt.figure(figsize=(8,6))plt.③("2020年糧食產(chǎn)量TOP10")
plt.bar(x,y,label="2020年")plt.xlabel("地區(qū)")plt.legend()④
(1)請(qǐng)?jiān)趧澗€處填入合適的代碼語句,以實(shí)現(xiàn)以上功能。(2)代碼語句“plt.bar(x,y,label="2020年")”的功能為繪制如圖b所示的圖像,能夠?qū)崿F(xiàn)相同功能的語句是(多選題,少選得1分,多選不得分)。
A.df.head(10).plot("地區(qū)","2020年")B.df[:10:].plot("地區(qū)","2020年",kind="bar")C.plt.plot(x,y,label="2020年",kind="bar")D.plt.bar("地區(qū)","2020年",label="2020年")E.df1.plot("地區(qū)","2020年",kind="bar")答案(1)①sort_values②df1["地區(qū)"]或df1.地區(qū)③title④plt.show()(2)BE6.(2022杭州場(chǎng)口中學(xué)、桐廬富春中學(xué)檢測(cè),16)在月考之后,學(xué)校教務(wù)員拿到了高一年級(jí)月考的基礎(chǔ)成績(jī)并用Excel軟件進(jìn)行數(shù)據(jù)處理,如圖1所示。請(qǐng)回答下列問題:圖1(1)區(qū)域M2:M645的數(shù)據(jù)是通過在M2單元格輸入公式并自動(dòng)填充得到的,則M645單元格中的公式是。
(2)為了分析各班級(jí)的數(shù)學(xué)平均分,設(shè)計(jì)了如下Python程序,利用其繪制各班數(shù)學(xué)平均分圖表,如圖2所示:結(jié)合上圖的效果,請(qǐng)?jiān)诔绦騽澗€處填寫合適的代碼。importmatplotlib.pyplotaspltimportpandasaspddf=pd.read_excel('高一月考成績(jī).xlsx')df1=df.groupby("班級(jí)").①
plt.bar(df1.index,②)
plt.title("高一各班數(shù)學(xué)平均分")plt.ylim(40,100)plt.xlabel(③)
plt.ylabel("分?jǐn)?shù)")plt.show()答案(1)=SUM(D645:L645)(2)①mean()②df1.數(shù)學(xué)③"班級(jí)"7.(2023三月百校聯(lián)考,14)李明收集了梅西2004年至2022年俱樂部比賽數(shù)據(jù),保存在“梅西俱樂部詳細(xì)比賽數(shù)據(jù).xlsx”文件中,部分?jǐn)?shù)據(jù)如圖a所示,現(xiàn)在利用pandas模塊處理數(shù)據(jù)。(1)梅西2004年10月—2021年7月效力于巴塞羅那俱樂部,2021年8月轉(zhuǎn)會(huì)至巴黎圣日耳曼俱樂部,現(xiàn)在李明想知道梅西每個(gè)賽季的勝率,實(shí)現(xiàn)上述功能的Python程序如下,請(qǐng)?jiān)趧澗€處填入合適的代碼。importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_excel("梅西俱樂部詳細(xì)比賽數(shù)據(jù).xlsx")df['年']=pd.to_datetime(df["時(shí)間"]).dt.strftime('%Y').astype(int)df['月']=pd.to_datetime(df["時(shí)間"]).dt.strftime('%m').astype(int)df['勝負(fù)情況']=""foriinrange(len(df)):f=True;z=0;k=0forcindf["比分"][i]:if①:
iff:z=z*10+int(c)else:k=k*10+int(c)else:f=notfjlb="巴塞羅那"ifdf["年"][i]*100+df["月"][i]>=202108:②
if(df["主隊(duì)"][i]==jlbandz>k)or(df["客隊(duì)"][i]==jlbandz<k):df['勝負(fù)情況'][i]="勝"elifz==k:df['勝負(fù)情況'][i]="平"else:df['勝負(fù)情況'][i]="負(fù)"g=df.groupby(df["年"],as_index=True).count()③
g1=df1.groupby(df1["年"],as_index=True).count()g["勝率"]=g1["勝負(fù)情況"]/g["勝負(fù)情況"]*100(2)圖b為2004—2022年梅西俱樂部比賽勝率統(tǒng)計(jì)圖。2004-2022年梅西俱樂部比賽勝率統(tǒng)計(jì)plt.plot(,marker='^')plt.title("2004-2022年梅西俱樂部比賽勝率統(tǒng)計(jì)")plt.show()方框處代碼為(多選:填字母)。
A.g["年"],g["勝率"]B.g["年"],g.勝率C.g.index,g["勝率"]D.g.index,g.勝率答案(1)①c!="-"或c>="0"andc<="9"②jlb="巴黎圣日耳曼"③df1=df[df['勝負(fù)情況']=="勝"](2)CD8.(2022湖州三賢聯(lián)盟期中,14)小張同學(xué)為了更好地了解冬奧會(huì),從網(wǎng)上收集了歷屆冬奧會(huì)各個(gè)項(xiàng)目比賽信息,收集到的部分?jǐn)?shù)據(jù)如圖1所示。圖1圖2為分析數(shù)據(jù),小張編寫了如下程序:importpandasaspdimportmatplotlib.pyplotaspltfrommatplotlib.pyplotimportMultipleLocatorplt.rcParams['font.sans-serif']=['SimHei']#正常顯示中文標(biāo)簽df=pd.read_csv("dongao.csv")#刪除所有未獲得獎(jiǎng)牌的記錄,并將獎(jiǎng)牌列中的"G"修改為"金牌","S"修改為"銀牌","B"修改為"銅牌"jp={'G':'金牌','S':'銀牌','B':'銅牌'}foriindf.index:if①:
df=df.drop(i)else:df.at[i,'獎(jiǎng)牌']=jp[df.at[i,'獎(jiǎng)牌']]#對(duì)輸入國(guó)家每屆的獎(jiǎng)牌數(shù)進(jìn)行統(tǒng)計(jì),并制作相應(yīng)圖表,如圖2所示nt=input("請(qǐng)輸入國(guó)家名稱:")df1=df[df['國(guó)家']==nt]df3=pd.DataFrame(df2)#將分組后數(shù)據(jù)生成新的二維結(jié)構(gòu),索引為“屆次”,列標(biāo)題為“獎(jiǎng)牌”x=df3.indexy=②
plt.title(nt+"歷屆冬奧會(huì)獎(jiǎng)牌趨勢(shì)圖")plt.③(x,y)
plt.show()(1)在劃線處填上合適的代碼。(2)為了能顯示某國(guó)歷屆冬奧會(huì)獎(jiǎng)牌變化,需在加框處添加的語句為(多選)。
A.df2=df1.groupby('獎(jiǎng)牌')df2=df1.屆次.count()B.df2=df1.groupby('屆次')df2=df2['獎(jiǎng)牌'].count()C.df2=df1.groupby('獎(jiǎng)牌')['屆次'].count()D.df2=df1.groupby('屆次').獎(jiǎng)牌.count()答案(1)①df.at[i,'獎(jiǎng)牌']=='0'或df.獎(jiǎng)牌[i]=='0'或df['獎(jiǎng)牌'][i]=='0'②df3["獎(jiǎng)牌"]或df3.獎(jiǎng)牌③plot(2)BD9.(2023十校聯(lián)盟聯(lián)考,14)小明從網(wǎng)上下載了豆瓣圖書1900—2017年間出版的圖書數(shù)據(jù),存儲(chǔ)在Exce
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 招標(biāo)文件中的運(yùn)輸說明
- 增長(zhǎng)的算法-空手
- 2024年九年級(jí)化學(xué)上冊(cè) 第二單元 課題1 空氣教案 (新版)新人教版
- 2024-2025學(xué)年高中數(shù)學(xué) 第一章 預(yù)備知識(shí) 4 一元二次函數(shù)與一元二次不等式 1.4.3 一元二次不等式的應(yīng)用教案 北師大版必修第一冊(cè)
- 2023六年級(jí)英語下冊(cè) Unit 8 What′s Your Dream第4課時(shí)教案 陜旅版(三起)
- 2024-2025學(xué)年新教材高中歷史 第一單元 古代文明的產(chǎn)生與發(fā)展 第1課 文明的產(chǎn)生與早期發(fā)展教學(xué)教案 新人教版必修《中外歷史綱要(下)》
- 八年級(jí)物理上冊(cè) 4.2《探究汽化和液化的特點(diǎn)》教學(xué)設(shè)計(jì) (新版)粵教滬版
- 2024-2025學(xué)年高中歷史下學(xué)期第1周 新中國(guó)初期的外交教學(xué)設(shè)計(jì)
- 易制爆化學(xué)品庫管員職責(zé)
- 鉆井糾斜技術(shù)服務(wù)合同(2篇)
- 初中英語閱讀教學(xué)中滲透德育的路徑例析
- 2024年軟裝公司合同模板
- 2024-2030年智慧環(huán)保行業(yè)市場(chǎng)發(fā)展分析及競(jìng)爭(zhēng)形勢(shì)與投資發(fā)展前景研究報(bào)告
- 部編版語文四年級(jí)上冊(cè)習(xí)作《記一次游戲》精美課件
- 2025年高考作文備考之作文審題強(qiáng)化訓(xùn)練(6)(客觀題+主觀題)
- 《算法設(shè)計(jì)與分析基礎(chǔ)》(Python語言描述) 課件 第4章分治法2
- 2024-2025學(xué)年蘇教版小學(xué)三年級(jí)上學(xué)期期中數(shù)學(xué)試卷與參考答案
- 旅游行業(yè)人才培養(yǎng)需求分析
- 2024年中國(guó)海油秋季校園招聘高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 2024年消防宣傳月知識(shí)競(jìng)賽考試題庫200題(含答案)
- 五年級(jí)口算題卡每天100題帶答案
評(píng)論
0/150
提交評(píng)論