浙江版高中信息技術復習練習專題三數據處理與應用課件_第1頁
浙江版高中信息技術復習練習專題三數據處理與應用課件_第2頁
浙江版高中信息技術復習練習專題三數據處理與應用課件_第3頁
浙江版高中信息技術復習練習專題三數據處理與應用課件_第4頁
浙江版高中信息技術復習練習專題三數據處理與應用課件_第5頁
已閱讀5頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

高考

技術第一部分信息技術專題三數據處理與應用浙江省專用考點一常用表格數據的處理1.(2022諸暨海亮高中期中,16)為了響應全民健身計劃,某高中對學生進行了體質健康

測評,并用Excel軟件進行數據處理,如圖a所示。

圖a請回答下列問題:(1)區(qū)域M2:P15的數據是通過公式計算得到的,在M2單元格中輸入公式后,再使用自

動填充功能完成該區(qū)域的計算,則N3單元格中的公式是“=SUMPRODUCT((

)*($I$3:$I$553=N$1))”。(提示:M2單元格輸入公式=SUMPRODUCT((A1:A100=“2”)*(I1:I100=“優(yōu)秀”)),表

示同時滿足A1:A100是2班和I1:I100是優(yōu)秀這兩個條件的情況數量,也就是進行條件計

數。)(2)根據圖a中的數據制作的圖表如圖b所示。創(chuàng)建該圖表的數據區(qū)域是

圖b(3)對圖a工作表進行相關數據分析,下列說法正確的是

(多選,填字母)。A.以“總分等級”為依據進行升序排序,選擇的區(qū)域是A3:I553B.選擇“A3:I553”按照“總分等級”升序排序后,圖b的圖表不會發(fā)生改變C.現需要選出總分等級為“不及格”的學生,可選擇區(qū)域A3:I553,以“總分等級”為

“不及格”進行篩選并保留結果D.為了顯示男生立定跳遠得分最高的3位學生數據,可先對“性別”為“男”進行篩

選,再對“立定跳遠”進行篩選,選擇最大的3項答案

(1)$A$3:$A$553=$K3

(2)M1:P1,M16:P16(3)ABC2.(2023杭州“六縣九?!逼谥?16)小明同學為備戰(zhàn)明年的計算機類研究生考試,收集

了部分高校的計算機專業(yè)復試分數線并進行分析。小明收集到的數據如圖a所示。

各院??偡终故緢D請幫助小明同學對表格數據進行下列分析:(1)若想知道這些學校的總分情況,則在F2單元格先輸入公式

(要求必

須使用函數),然后使用自動填充功能完成單元格F3:F8的計算。(2)現要求按照“總分”列進行降序排序,并篩選出總分在290分及以上的院校并顯示,

最后繪制各個院??偡值拇怪敝螆D(如圖b)。請在程序劃線①②③處填入合適的代

碼。importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['KaiTi','SimHei','FangSong']#圖表中文顯示處理df=pd.read_excel("score.xlsx")df1=df[①

]print(df1)

#輸出篩選數據df=df.②

("總分",ascending=False)

#按照“總分”列降序排序print(df)

#輸出排序好的數據#------創(chuàng)建圖表代碼------plt.title("各院??偡终故緢D")plt.xlabel("院校名稱")plt.③

(df.院校名稱,df.總分)#各個院??偡值拇怪敝螆Dplt.show()答案

(1)=SUM(B2:E2)

(2)①df.總分>=290或者df["總分"]>=290②sort_values

③bar3.(2023杭州S9聯(lián)盟聯(lián)考,14)小明收集了當地2023年3月份的天氣情況,數據存儲在文

件“temp.xlsx”中,如圖a所示。分析溫差最大的日期,并生成反映各類天氣情況的天

數對比圖如圖b所示。

(1)在對表格進行數據整理時發(fā)現,“日期”可能存在的數據問題是

(單選:A.

數據缺失;B.數據異常;C.邏輯錯誤;D.數據格式不一致)。(2)程序代碼如下所示,請在劃線處填入合適的代碼。importmatplotlib.pyplotaspltimportpandasaspdplt.rcParams["font.sans-serif"]=["SimHei"]#設置中文字體df=pd.read_excel("temp.xlsx")df["溫差"]=①

#新增"溫差"列s=df.sort_values("溫差",ascending=False,ignore_index=True)df_max=②

#獲取溫差最大的日期,如并列只輸出第一個日期print(df_max)df_t=s.groupby("天氣",as_index=False).count()df_t=df_t.rename(columns={"日期":"天數"})#修改列名"日期"為"天數"x=df_t["天氣"]y=df_t["天數"]③

(x,y,label="天氣情況")plt.legend()plt.show()(3)觀察圖b,3月份天數最多的天氣類型是

。答案

(1)D

(2)①df["最高氣溫"]-df["最低氣溫"]

②s["日期"][0]或s.at[0,"日期"]③plt.bar

(3)小雨4.(2023杭州地區(qū)重點中學期中,15)某中學高一年級完成一次7選3意向調查,數據存儲

在“xk73.xlsx”中,如圖a所示,其中1代表選擇科目,0代表棄選科目。

(1)使用pandas編程計算本次選課各門課人數占總人數的比例,請在劃線處填入合適

的代碼。importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']#圖表顯示中文df=pd.read_excel("①

")a=[""]*len(df)#存儲每個學生的選課組合dic={"物":0,"化":0,"生":0,"政":0,"歷":0,"地":0,"技":0}foriindf.index:forjindf.columns[3:]:ifdf.at[i,j]==1:②

a[i]+=jforiindic.keys():dic[i]=round(dic[i]/len(df)*100,2)(2)按照各科選考人數占比創(chuàng)建如圖b所示的圖表。各科選考人數占比

df1=pd.DataFrame({"學科":dic.keys(),"人數占比":dic.values()})df1=①

plt.title("各科選考人數占比")plt.bar(②

,label="人數占比")plt.legend()plt.show()觀察圖b,橫線處應填入的代碼為:①

;②

(選填字母)。A.df1.sort_values("人數占比",ascending=True)B.df1.sort_values("人數占比",ascending=False)C.df1.學科,df1.人數占比D.df1.人數占比,df1.學科(3)小李同學想查詢某種七選三組合有多少人。以下程序代碼可以為小李同學提供查詢功能,程序運行示例如圖c所示,請在劃線處填入合適的代碼。請輸入需要查詢的選課組合:物化技選擇物化技組合的同學共有:192人圖ccx=input("請輸入需要查詢的選課組合:")cnt=0foriinrange(len(a)):if

:cnt=cnt+1print(f"選擇{cx}組合的同學共有:{cnt}人")答案

(1)①xk73.xlsx②dic[j]+=1

(2)①B②C

(3)a[i]==cx或其他等價表達式5.(2023浙江1月選考,14,9分)小紅收集了部分城市2021年全年每天PM2.5、PM10、CO

濃度數據,每天的數據分別保存在以8位日期字符串命名的CSV文件中,部分文件如圖a

所示,每個文件記錄了一天24小時的監(jiān)測數據,示例如圖b所示。

為統(tǒng)計分析城市A全年各月份PM2.5的月平均濃度(當月的日平均濃度的平均值),編寫

Python程序。請回答下列問題:(1)定義pmday函數,功能為:讀取某天的CSV文件,返回城市A當天PM2.5的日平均濃

度。函數代碼如下,劃線處應填入的代碼為

(單選,填字母)。A.df['類型']=='PM2.5'B.df['類型'=='PM2.5']C.df[df['類型']]=='PM2.5'D.df[df['類型']=='PM2.5']importpandasaspddefpmday(dayfile):df=pd.read_csv(dayfile)#讀取文件dayfile中的數據df=

returndf['城市A'].mean()#返回城市A當天PM2.5的日平均濃度(2)統(tǒng)計城市A各月份PM2.5的月平均濃度并繪制線形圖,部分Python程序如下,請在劃

線處填入合適的代碼。importmatplotlib.pyplotaspltdeftstr(t):ift<10:retrun'0'+str(t)else:retrunstr(t)pm=[0]*12mdays=[31,28,31,30,31,30,31,31,30,31,30,31]#2021年每月天數forminrange(12):sm=0mstr=tstr(m+1)fordinrange(①

):dstr=tstr(d+1)dayfile='2021'+mstr+dstr+'.csv'sd=pmday(dayfile)②

pm[m]=sm/mdays[m]x=[1,2,3,4,5,6,7,8,9,10,11,12]y=③

plt.plot(x,y)#繪制線形圖#設置繪圖參數,顯示如圖c所示線形圖,代碼略

(3)城市A2021年PM2.5年平均濃度為34.6微克/立方米。由圖c可知,城市A2021年

PM2.5月平均濃度超過年平均濃度的月份共

個。答案

(1)D

(2)①mdays[m]②sm+=sd③pm

(3)5考點二大數據處理1.(2023寧波三鋒期中,2)下列關于大數據與大數據處理的說法,不正確的是

(

)A.處理大數據時,一般采用分治思想B.大數據的處理對象是全體數據,而不是抽樣數據C.大數據的特點是數據量大、速度快、數據類型多、價值密度低D.Hadoop是一個可運行于大規(guī)模計算機集群上的分布式系統(tǒng)基礎架構,適用于處理實

時數據答案

D

2.(2023金華十校聯(lián)考,3)下列有關大數據處理、數據可視化的說法不正確的是

(

)A.靜態(tài)數據是指處理時已收集完成、計算時不會發(fā)生改變的數據B.流數據主要是指不間斷地、持續(xù)地到達的實時數據C.圖計算是指有關大量圖片的計算D.“各省生產總值占比情況”可以采用餅圖或環(huán)形圖呈現答案

C

3.有Python程序段如下所示:importpandasaspdimportnumpyasnpa=np.array([1,2,3,4]).reshape(2,2)df=pd.DataFrame(a)print(df.at[1,1])該程序段運行后輸出的結果為

(

)A.4B.3C.2D.1答案

A

4.小張收集了近階段要學習的英文單詞,存儲為“data.txt”文件,格式如圖所示。

處理“data.txt”文件中的英文單詞的Python程序段如下所示:file='data.txt'word_c=[]n=0forwordinopen(file):ifword[0:1]=="c":word_c.append(word)

print('字母c開頭的單詞個數為:',n)(1)劃線處的代碼為

。(2)該程序段運行后,列表word_c中的數據為

。答案

(1)n=n+1或n+=1

(2)data.txt中所有以小寫字母"c"開頭的單詞5.請在空格處填寫正確的代碼,使程序完善。實現功能:繪制y=x2-2x+1的圖象。

#加載numpy模塊并取名為npimportnumpyasnp#加載matplotlib.pyplot模塊并取名為pltimportmatplotlib.pyplotasplt#x在-7到9之間,每隔0.1取一個值x=np.arange(-7,9,0.1)①

=x**2-2*x+1plt.plot(x,②

)plt.title('y=x*x-2*x+1')plt.xlabel('x')plt.ylabel('y')plt.③

答案①y②y③show()6.在網上搜索朱自清的文章《綠》,如圖所示。

(1)搜索信息并保存為txt文件,該過程稱為

。(2)“綠.txt”文件的文本類型是

。(填寫字母:A.結構化數據/B.半結構化數據/C.非結構化數據)(3)制作標簽云的代碼如下:importcollectionsimportjiebaimportwordcloudaswcimportnumpyasnpfromPILimportImagewcg=wc.WordCloud(background_color="white",font_path='assets/msyh.ttf')text=open('data/綠.txt',encoding='utf-8')read()seg_list=①

f=collections.Counter(seg_list)wcg.fit_words(f)wcg.to_file('output/b.png')劃線處①語句是調用jieba對象的cut函數對變量為text的文件進行分詞,則該處語句為

。(4)得到的標簽云如圖所示。

該圖片的文件名是

,表現該文本特征的是

。(至

少寫出3個)答案

(1)采集信息

(2)C

(3)jieba.cut(text)(4)b.png;我、的、著、了、綠、你題組一1.(2023十校聯(lián)盟聯(lián)考,5)近年來,各地相繼出現了一些無人售貨超市,其購物流程為:通

過微信號/支付寶注冊→掃碼或掃臉開門→選購商品→結算區(qū)顯示屏清單確認(智能

檢測)→開門即走(智能扣款)。整個過程快捷方便,達到無感支付。超市內24小時利用

攝像頭監(jiān)控,實行人臉識別防盜監(jiān)控,發(fā)現有小偷將自動抓拍報警并列入黑名單,通過

RFID技術+核心軟件算法有效識別和定位貨損源頭,并進行有效處理和防范。此外,超

市也會依靠大數據、云計算技術,對各種商品的銷售狀況進行匯總分析,并智能判斷

客戶的購買習慣進行產品推薦,還能預測銷售走勢,給商家提供合理的建議。根據閱讀材料,下列說法正確的是

(

)A.匯總分析已完成的商品銷售狀況數據屬于流數據B.無人售貨超市依靠大數據處理只需要分析最近幾個月的抽樣數據C.根據客戶賬號的購買習慣進行產品推薦,不需要知道用戶購買商品的原因D.無人售貨超市中的每一個數據都來自真實數據,體現了大數據價值密度高的特點答案

C

2.(2023舟山高二期末,12)小明用下列Python程序將圖a處理成圖b所示效果,發(fā)現處理

后的圖像不理想,他要想將圖像處理成圖c所示效果,則可做的修改是

(

)

fromPILimportImage

#第0行importnumpyasnp

#第1行importmatplotlib.pyplotasplt

#第2行img=np.array(Image.open('dj.jpg').convert('L'))

#第3行row,cols=img.shape

#第4行foriinrange(row):

#第5行forjinrange(cols):

#第6行ifimg[i,j]>188:

#第7行img[i,j]=1#1表示白色

#第8行else:

#第9行img[i,j]=0#0表示黑色#第10行plt.figure('dj')

#第11行plt.imshow(img,cmap='gray')#第12行plt.axis('off')

#第13行plt.show()A.將第7行中的數字188改成138B.將第7行中的數字188改成250C.將第7行中的>改成<D.將第8行的代碼與第10行的代碼互換答案

A

3.(2022杭州重點中學期中,13)小蕭從國家統(tǒng)計局網站上收集了近幾年國民總收入相

關數據,并使用Excel軟件進行相關數據處理與分析。部分界面如圖a所示,請回答下列

問題:

(1)下列關于數據整理的描述,正確的是

(單選)。A.某些缺失的數據可以自己隨意估計一個值進行補充B.Excel表格中的異常數據可以直接刪除或忽略C.Excel表格中的重復數據可以進行合并或刪除D.Excel中格式不一致的數據,一般只保留一種格式的數據,刪除其他格式的數據(2)圖b的圖表數據類型為

(選填:柱形圖/條形圖/折線圖)。

圖b(3)根據表格數據呈現,從2017年開始可以計算國民總收入增長比例,方法是在C8單元

格輸入公式

(計算公式:(當年國民總收入-去年國民總收入)/去年國民總

收入),設置百分比格式后自動填充至F8單元格。(4)除了Excel,可以進行數據分析的軟件還有

(多選,填數字)。①Word②SPSS③SAS④MATLAB⑤記事本⑥Python⑦錄音機答案

(1)C

(2)柱形圖

(3)=(C2-B2)/B2(4)②③④⑥4.(2022杭州八縣市區(qū)期末,16)某次測試的Excel文件成績表如圖1所示。

圖1(1)已知有200名同學參加了本次測試。小明想把全體同學的信息平均分放在D202單元格,那么在D202單元格輸入的公式為

。(2)現在要求用Python增加“總分”列數據,然后求每個班總分的平均分(如圖2),最后

繪制每班總分平均分的垂直柱形圖(如圖3)。請在程序劃線①②處選擇合適的代碼

(填字母)。

圖2

圖3importpandasaspdimportmatplotlib.pyplotasplt#圖表中文顯示處理,代碼略df=pd.read_excel("test.xlsx")score=[]foriindf.values:js=①

#①處請選擇(填字母):A.df["信息"]+df["通用"]/B.i[3]+i[4]score.append(js)df["總分"]=scoredf1=df.groupby("班級".as_index=False)["總分"].mean()plt.title("期中技術平均分")plt.②

(df1["班級"],df1["總分"],width=0.5)

#②處請選擇(填字母):A.plot/B.bar/C.scatter答案

(1)=AVERAGE(D2:D201)

(2)①B②B5.(2022麗水期末,13)小明收集了本周信息技術學科學習評價的數據,如圖所示。

(1)觀察上表小明做了如下操作,其中屬于數據整理的是

(多選,填字母)。A.刪除重復行第五行B.驗證并修改D2單元格數據C.通過公式計算全班平均分D.重新設置C3單元格格式(2)為了分析每個組的平均分,設計了如下Python程序。importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_excel("成績表.xlsx")

print(df1)劃線處的代碼應為

(單選,填字母)。A.df1=df.groupby("平均分").mean()B.df1=df.mean()C.df1=df.groupby("小組").mean()D.df1=df["小組"].mean()(3)利用Python程序繪制各小題得分率圖表,如圖所示。

請在劃線處填寫合適的代碼。num=int(input("請輸入小組:"))plt.figure(figsize=(10,5))list=[]foriinrange(12):s="題"+str(i+1)list.append(df1.at[num,s]*50)plt.bar(range(1,13),list)plt.title(str(num)+"

")plt.xlabel("questionnumber")plt.ylabel("correctrate")plt.show()答案

(1)ABD

(2)C

(3)group6.(2024屆A9協(xié)作體返校考,14)張三同學收集了一個地區(qū)8月各類共享單車的騎行數據

記錄,每天的用戶數據存儲于“sharedbikes.xlsx”文件中,不考慮跨天數據。數據格

式如圖a所示,請回答下列問題:

(1)cal函數功能為:讀取騎行時間的小時和分鐘部分,轉換為分鐘格式并返回,如“2022

/8/206:57”獲取“6:57”轉換為417(6*60+57=417),代碼如下。請在劃線處填入合適的代碼。defcal(s):n=len(s)foriinrange(n):ifs[i]=="":#如果為空格字符p=iifs[i]==":":q=it=

+int(s[q+1:])returnt(2)統(tǒng)計本月各類型單車的每天平均騎行時長,并繪制柱形圖,代碼如下,繪制的圖表如

圖b所示,請在劃線處填入合適的代碼。

importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_excel("sharedbikes.xlsx")bike=["哈羅單車","摩拜單車","美團單車","青桔單車"]sm=[0]*4avg=[0]*4days=31foriin①

:t=cal(df.at[i,"結束時間"])-cal(df.at[i,"開始時間"])forjinrange(4):ifdf.at[i,"App類型”]==bike[j]:②

breakforiinrange(4):avg[i]=sm[i]/daysplt.figure(figsize=(12,4))x=bikey=③

plt.bar(x,y)plt.show()(3)統(tǒng)計本月各類型單車的騎行次數,加框處代碼有錯,可以改正為

(選填字母:

A.max()/B.min()/C.mean()/D.count())。n=df.groupby("App類型",as_index=True).用戶編號.sum()答案

(1)int(s[p+1:q])*60

(2)①df.index或range(len(df))②sm[j]+=t③avg

(3)D7.(2024屆紹興診斷性測試,14)學校暑期開展“青春迎亞運”活動,邀請高二學生每日

參加運動鍛煉并進行線上打卡。每周收集一次相關數據,分別保存在相應的xlsx文件

中,部分文件如圖a所示。每個文件記錄了一周7天的打卡數據,示例如圖b所示,其中運

動時長單位為分鐘。

為統(tǒng)計分析學生鍛煉情況,給出周報數據,編寫Python程序,請回答以下問題:(1)定義px函數,功能為:讀取某一周的打卡數據,將其按班級進行排序操作并返回結

果。函數代碼如下,將劃線處代碼補充完整。importpandasaspddefpx(file_week):df=pd.read_excel(file_week)df=df.sort_values(

,ignore_index=True)#按班級升序排序,參數ignore_index=True表示更新索引returndf(2)統(tǒng)計某一周各運動項目的參與人次,并繪制柱形圖,如圖c所示,部分Python代碼如

下:importmatplotlib.pyplotasplts=input("請輸入文件名:")df=px(s)df1=df.groupby("運動項目".as_index=False).①

#統(tǒng)計各運動項目參與人次df1.rename(columns={"學號":"參與人次"},inplace=True)#更改列標題plt.bar(②

)plt.xlabel("運動項目")plt.ylabel("參與人次")plt.show()劃線處應填入的代碼為

(單選,填字母)。A.①count()②df1["參與人次"],df1["運動項目"]B.①sum()②df1["參與人次"],df1["運動項目"]C.①sum()②df1.運動項目,df1.參與人次D.①count()②df1.運動項目,df1.參與人次(3)統(tǒng)計某一周每班各學生的總運動時長后,比較得出該周每班最高的兩位時長,部分Python程序代碼如下,請在劃線處填入合適的代碼。qp=[[0foriinrange(m)]forjinrange(n)]'''定義數組qp記錄每班各學生一周運動總時長,n為班級數,m為每班人數。其中qp[0][0]

~qp[0][m-1]存儲1班1號~m號同學的每周運動總時長,依次類推,qp[n-1][0]~qp[n-1][m-

1]存儲n班1號~m號同學的每周運動總時長。'''print("本周每班最高的兩位時長分別為:")i=0whilei<len(df):#df為調用px函數后的返回結果num=df["學號"][i]cla=df["班級"][i]①

ifi!=0anddf["班級"][i]!=df["班級"][i-1]or②

:cla=df["班級"][i-1]k1=0;k2=0forjinrange(1,len(qp[cla-1])):ifqp[cla-1][j]>qp[cla-1][k1]:③

k1=jelifqp[cla-1][j]>qp[cla-1][k2]:k2=jprint(cla,"班",qp[cla-1][k1].qp[cla-1][k2])i=i+1(4)統(tǒng)計某一周各運動項目的參與人次后繪制柱形圖如圖c所示,由圖可知,該周參與人

氣最高的運動項目為

答案

(1)"班級"

(2)D

(3)①qp[cla-1][num-1]+=df["運動時長"][i]②i==len(df)-1

③k2=k1

(4)跑步8.(2024屆寧波模擬,13)已知某年級有6個班級,所有學生名單存儲在文件“name.csv”

中(如圖1),學校舉行某趣味活動項目中,需要每個班抽3名代表參加比賽,請編寫一個隨

機抽取程序,執(zhí)行效果如圖2。請回答以下問題:

(1)加框處代碼的作用是

。(2)實現上述功能的部分Python程序如下,請在劃線處填寫合適的代碼。importcsvimportrandom#數據讀入f=open("name.csv","r")flines=csv.reader(f)name_list=[]m=6#班級總數total=18#參賽總人數forlineinflines:ifline[0]=="班級":continue#跳過當前循環(huán)的剩余語句,繼續(xù)進行下一次循環(huán)name_list.append(line)①

flag=[False]*ngrade=[3]*mi=0whilei<total:p=random.randint(②

,③

)bj=int(name_list[p][0])ifflag[p]==False:ifgrade[bj-1]>0:flag[p]=True④

i+=1print("抽取名單為:")print("班級","姓名")foriinrange(n):ifflag[i]:print(name_list[i][0],name_list[i][1])f.close()答案

(1)列表name_list中的數據不包括標題行

(2)①n=len(name_list)②0③n-1④grade[bj-1]-=19.(2023杭州地區(qū)重點中學聯(lián)考,14)小明利用“在線社團報名系統(tǒng)”收集了全校學生

的社團報名信息,并將報名數據導出到“社團報名.xlsx”中,如圖1所示。然后編寫

Python程序對報名數據進行處理,生成分別以班級名和社團名為文件名的Excel文件,

以便分發(fā)給相應的社團指導老師和班主任。

(1)在對表格進行數據整理時發(fā)現,關于“Jacky.Y”同學的記錄可能存在的數據問題

(選填:A.數據缺失B.數據異常C.邏輯錯誤D.數據格式不一致)。(2)其中生成每個社團名單文件的過程是:先對報名數據按社團名稱進行分類,并對選

報同一社團的學生按班級進行升序排序,然后生成各個社團名單文件,如圖2所示。對

應的程序代碼如下,請在劃線處填寫合適的代碼。importpandasaspddefread_file(filename):#讀入報名數據的原始文件,并將表中的數據轉換成列表,代碼略defsave_file(a):#保存名單到相應社團的Excel電子表格文件df=pd.DataFrame(a,columns=["班級","姓名","選報社團"])df.to_excel(①

)+".xlsx",index=False)a=read_file("社團報名.xlsx")n=len(a)#按社團名(參照拼音的字母順序)進行升序排序,代碼略#統(tǒng)計各社團人數,存在列表rs中,rs=[["滑板社",36],…],代碼略s=0foriinrange(len(rs)):②

left,right=s,s+num-1whileleft<right:imin=imax=leftforkinrange(left+1,right+1):ifa[k][0]<a[imin][0]:imin=kelifa[k][0]>a[imax][0]:imax=kifimin!=left:a[imin],a[left]=a[left],a[imin]ifimax==left:③

ifimax!=right:a[imax],a[right]=a[right],a[imax]left=left+1;right=right-1④

s+=num答案

(1)B

(2)①a[0][2]或df.at[0,"選報社團"]或df["選報社團"][0]②num=rs[i][1]③imax=imin

④save_file(a[s:s+num])題組二1.(2022諸暨期末,4)使用pandas編程處理數據DF1,下列選項能實現行列轉置操作的是

(

)A.DF1.TB.DF1.columnsC.DF1.valuesD.DF1.index答案

A

2.(2022寧波奉化期末,9)有如下Python程序段:importpandasaspds=pd.Series(range(5,11,3))s[1]=15print(s)該程序執(zhí)行后,輸出的結果是

(

)11528dtype:int6405115dtype:int6411528311dtype:int6405115211dtype:int64A.B.C.D.答案

B

3.(2022寧波咸祥中學期中,16)小明收集了某超市飲料銷售情況相關數據,并使用Excel

軟件進行處理,如圖a所示。

請回答下列問題:(1)區(qū)域I3:I15的數據是通過公式計算得到的。在I3單元格輸入公式后,用自動填充

功能完成I4:I15的計算,則I3單元格中的公式是

。(占銷售總額百分比=

銷售額(元)/銷售總額(元))(2)若因誤操作將I16單元格刪除,則I3單元格會顯示

(選填字母:A.#VALUE

B.#DIV/0!C.######D.#REF!)。(3)要將類別為“可樂”的飲料以“毛利潤(元)”為主要關鍵字降序排序,則選擇排序

的區(qū)域為

。(4)小王根據圖a中的數據,制作了一張反映橙汁類飲料銷售額和毛利潤對比的圖表,

如圖b所示,則建立該圖表的數據區(qū)域是

。將E8單元格數值修改成6.00,是否會影響該圖表?

(選填:是/否)

圖b答案

(1)=G3/$I$16或=G3/I$16

(2)B

(3)B8:I11(4)B2,G2:H2,B5:B7,G5:H7;否4.(2022臺州啟超中學期中,16)APP活躍人數數據存儲在“app.xlsx”文件中,如圖所示,

現要編程統(tǒng)計結果,請回答下列問題:

若要把“app.xlsx”第1張工作表中的信息導入到book1對象中,并進行統(tǒng)計,實現這個功能的Python代碼如下,在程序劃線處填入合適的代碼。importpandasaspdbook1=

(1)

#讀取app.xlsx文件數據,并存儲在book1對象中book1_sum=

(2)

#計算10月人數之和book1_aver=

(3)

#計算11月人數平均值book1_g=

(4)

#按應用領域分組統(tǒng)計book1_sort=

(5)

#按11月人數值,降序排序print("10月人數之和:",book1_sum)print("11月人數平均值:",book1_aver)答案

(1)pd.read_excel("app.xlsx")(2)book1["10月人數"].sum()

(3)book1["11月人

數"].mean()(4)book1.groupby("應用領域")(5)book1.sort_values("11月人數",ascending=False)5.(2022寧波奉化期末,14)小孫收集了2016年到2020年的各地區(qū)糧食生產總量并存儲

在“l(fā)scl.xlsx”文件中,如圖a所示,現使用Python對其進行數據處理,并實現數據可視

化,繪制的圖表如圖b所示。

實現如上功能的代碼如下,請回答以下問題。importpandasaspdimportmatplotlib.pyplotaspltplt.rc('font',**{'family':'SimHei'})#設置中文字體df=pd.read_excel("lscl.xlsx")df.①("2020年",ascending=False,inplace=True)df1=df.head(10)x=②

y=df1["2020年"]plt.figure(figsize=(8,6))plt.③

("2020年糧食產量TOP10")plt.bar(x,y,label="2020年")plt.xlabel("地區(qū)")plt.legend()④

(1)請在劃線處填入合適的代碼語句,以實現以上功能。(2)代碼語句“plt.bar(x,y,label="2020年")”的功能為繪制如圖b所示的圖像,能夠實現

相同功能的語句是

(多選題,少選得1分,多選不得分)。A.df.head(10).plot("地區(qū)","2020年")B.df[:10:].plot("地區(qū)","2020年",kind="bar")C.plt.plot(x,y,label="2020年",kind="bar")D.plt.bar("地區(qū)","2020年",label="2020年")E.df1.plot("地區(qū)","2020年",kind="bar")答案

(1)①sort_values②df1["地區(qū)"]或df1.地區(qū)③title④plt.show()

(2)BE6.(2022杭州場口中學、桐廬富春中學檢測,16)在月考之后,學校教務員拿到了高一年

級月考的基礎成績并用Excel軟件進行數據處理,如圖1所示。請回答下列問題:

圖1(1)區(qū)域M2:M645的數據是通過在M2單元格輸入公式并自動填充得到的,則M645單元

格中的公式是

。(2)為了分析各班級的數學平均分,設計了如下Python程序,利用其繪制各班數學平均

分圖表,如圖2所示:

結合上圖的效果,請在程序劃線處填寫合適的代碼。importmatplotlib.pyplotaspltimportpandasaspddf=pd.read_excel('高一月考成績.xlsx')df1=df.groupby("班級").①

plt.bar(df1.index,②

)plt.title("高一各班數學平均分")plt.ylim(40,100)plt.xlabel(③

)plt.ylabel("分數")plt.show()答案

(1)=SUM(D645:L645)(2)①mean()②df1.數學③"班級"7.(2023三月百校聯(lián)考,14)李明收集了梅西2004年至2022年俱樂部比賽數據,保存在

“梅西俱樂部詳細比賽數據.xlsx”文件中,部分數據如圖a所示,現在利用pandas模塊

處理數據。

(1)梅西2004年10月—2021年7月效力于巴塞羅那俱樂部,2021年8月轉會至巴黎圣日耳

曼俱樂部,現在李明想知道梅西每個賽季的勝率,實現上述功能的Python程序如下,請

在劃線處填入合適的代碼。importpandasaspdimportmatplotlib.pyplotaspltdf=pd.read_excel("梅西俱樂部詳細比賽數據.xlsx")df['年']=pd.to_datetime(df["時間"]).dt.strftime('%Y').astype(int)df['月']=pd.to_datetime(df["時間"]).dt.strftime('%m').astype(int)df['勝負情況']=""foriinrange(len(df)):f=True;z=0;k=0forcindf["比分"][i]:if①

:iff:z=z*10+int(c)else:k=k*10+int(c)else:f=notfjlb="巴塞羅那"ifdf["年"][i]*100+df["月"][i]>=202108:②

if(df["主隊"][i]==jlbandz>k)or(df["客隊"][i]==jlbandz<k):df['勝負情況'][i]="勝"elifz==k:df['勝負情況'][i]="平"else:df['勝負情況'][i]="負"g=df.groupby(df["年"],as_index=True).count()③

g1=df1.groupby(df1["年"],as_index=True).count()g["勝率"]=g1["勝負情況"]/g["勝負情況"]*100(2)圖b為2004—2022年梅西俱樂部比賽勝率統(tǒng)計圖。2004-2022年梅西俱樂部比賽勝率統(tǒng)計

plt.plot(

,marker='^')plt.title("2004-2022年梅西俱樂部比賽勝率統(tǒng)計")plt.show()方框處代碼為

(多選:填字母)。A.g["年"],g["勝率"]B.g["年"],g.勝率C.g.index,g["勝率"]D.g.index,g.勝率答案

(1)①c!="-"或c>="0"andc<="9"②jlb="巴黎圣日耳曼"③df1=df[df['勝負

情況']=="勝"]

(2)CD8.(2022湖州三賢聯(lián)盟期中,14)小張同學為了更好地了解冬奧會,從網上收集了歷屆冬

奧會各個項目比賽信息,收集到的部分數據如圖1所示。

圖1

圖2為分析數據,小張編寫了如下程序:importpandasaspdimportmatplotlib.pyplotaspltfrommatplotlib.pyplotimportMultipleLocatorplt.rcParams['font.sans-serif']=['SimHei']#正常顯示中文標簽df=pd.read_csv("dongao.csv")#刪除所有未獲得獎牌的記錄,并將獎牌列中的"G"修改為"金牌","S"修改為"銀牌","B"

修改為"銅牌"jp={'G':'金牌','S':'銀牌','B':'銅牌'}foriindf.index:if①

:df=df.drop(i)else:df.at[i,'獎牌']=jp[df.at[i,'獎牌']]#對輸入國家每屆的獎牌數進行統(tǒng)計,并制作相應圖表,如圖2所示nt=input("請輸入國家名稱:")df1=df[df['國家']==nt]df3=pd.DataFrame(df2)#將分組后數據生成新的二維結構,索引為“屆次”,列標題

為“獎牌”x=df3.indexy=②

plt.title(nt+"歷屆冬奧會獎牌趨勢圖")plt.③

(x,y)plt.show()(1)在劃線處填上合適的代碼。(2)為了能顯示某國歷屆冬奧會獎牌變化,需在加框處添加的語句為

(多選)。A.df2=df1.groupby('獎牌')df2=df1.屆次.count()B.df2=df1.groupby('屆次')df2=df2['獎牌'].count()C.df2=df1.groupby('獎牌')['屆次'].count()

D.df2=df1.groupby('屆次').獎牌.count()答案

(1)①df.at[i,'獎牌']=='0'或df.獎牌[i]=='0'或df['獎牌'][i]=='0'②df3["獎牌"]或

df3.獎牌③plot

(2)BD9.(2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論