項(xiàng)目五 Python數(shù)據(jù)處理 實(shí)訓(xùn)三 去哪兒網(wǎng)數(shù)據(jù)處理_第1頁(yè)
項(xiàng)目五 Python數(shù)據(jù)處理 實(shí)訓(xùn)三 去哪兒網(wǎng)數(shù)據(jù)處理_第2頁(yè)
項(xiàng)目五 Python數(shù)據(jù)處理 實(shí)訓(xùn)三 去哪兒網(wǎng)數(shù)據(jù)處理_第3頁(yè)
項(xiàng)目五 Python數(shù)據(jù)處理 實(shí)訓(xùn)三 去哪兒網(wǎng)數(shù)據(jù)處理_第4頁(yè)
項(xiàng)目五 Python數(shù)據(jù)處理 實(shí)訓(xùn)三 去哪兒網(wǎng)數(shù)據(jù)處理_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

VIP免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[鍵入文字]大數(shù)據(jù)應(yīng)用基礎(chǔ)

教學(xué)內(nèi)容項(xiàng)目五python數(shù)據(jù)處理實(shí)訓(xùn)三去哪兒網(wǎng)數(shù)據(jù)處理教學(xué)方法項(xiàng)目教學(xué)法理論課時(shí)實(shí)踐課時(shí)4課時(shí)教學(xué)目標(biāo)知識(shí)目標(biāo)1.掌握matplotlib畫圖基本語(yǔ)法2.掌握不同圖表畫圖準(zhǔn)備數(shù)據(jù)的基本方法能力目標(biāo)1.能夠使用matplotlib將分析結(jié)果展現(xiàn)出來(lái)2.能夠使用matplotlib繪制基本的圖形素質(zhì)目標(biāo)1.自學(xué)能力2.協(xié)作精神3.認(rèn)真細(xì)致的專研精神思政目標(biāo)1.通過(guò)制作精美圖表,提升學(xué)生的美學(xué)修養(yǎng)教學(xué)重點(diǎn)1.創(chuàng)建畫布與創(chuàng)建子圖;2.添加圖像輔助內(nèi)容;3.基本圖像的畫法;4.繪制條形圖和水平條形圖。教學(xué)難點(diǎn)1.繪制直方圖;2.繪制散點(diǎn)圖;3.將數(shù)據(jù)分析后可視化呈現(xiàn);教學(xué)資源1.教材;2.網(wǎng)絡(luò)課程資源。教學(xué)過(guò)程教學(xué)階段教學(xué)過(guò)程設(shè)計(jì)課前系統(tǒng)學(xué)知識(shí)【教師】1.利用超星“學(xué)習(xí)通”平臺(tái)向?qū)W生推送課前學(xué)習(xí)任務(wù)清單,并明確分階段的任務(wù)完成時(shí)間;2.根據(jù)學(xué)生完成任務(wù)進(jìn)度,做出及時(shí)反饋,督促學(xué)生按照要求保質(zhì)保量完成課前操作學(xué)習(xí);任務(wù)一課前自學(xué),學(xué)習(xí)m任務(wù)一課前自學(xué),學(xué)習(xí)matplotlib基礎(chǔ)知識(shí)和matplotlib數(shù)據(jù)可視化任務(wù)二:課前測(cè)試1.繪制一個(gè)簡(jiǎn)單的圖形;2.繪制一個(gè)水平條形圖;3.查閱平臺(tái)中的班級(jí)學(xué)習(xí)情況報(bào)告,通過(guò)數(shù)據(jù)分析,調(diào)整并確定本次教學(xué)的重點(diǎn)難點(diǎn)?!緦W(xué)生】1.完成網(wǎng)上指定PPT與視頻學(xué)習(xí)任務(wù);2.完成課前操作測(cè)試。課上重難點(diǎn)突破【教師】一、引入去哪兒網(wǎng)等平臺(tái)上有大量的旅行線路信息數(shù)據(jù),可通過(guò)大數(shù)據(jù)分析為景區(qū)制定營(yíng)銷策略、優(yōu)化旅游產(chǎn)品、提供數(shù)據(jù)支撐。提取多維度的游客數(shù)據(jù),有效幫助解決旺季景區(qū)營(yíng)運(yùn)壓力大、淡季景區(qū)如何攬客、如何實(shí)現(xiàn)游客的二次消費(fèi)、緊急事件如何預(yù)警等難題。思政點(diǎn):(1)大數(shù)據(jù)分析為景區(qū)制定營(yíng)銷策略,引導(dǎo)學(xué)生樹立民族自信,培養(yǎng)學(xué)生的愛國(guó)熱情。(2)數(shù)據(jù)要按照數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化處理流程來(lái)進(jìn)行。做事要有計(jì)劃,任何事情都有其先后順序,做人處事條理要清晰,凡事預(yù)則立不預(yù)則廢,計(jì)劃越周詳越精細(xì),則做事越順利。二、實(shí)訓(xùn)三去哪兒網(wǎng)數(shù)據(jù)處理第一,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理1.使用pandas庫(kù)的read_csv()函數(shù)讀入數(shù)據(jù)。df=pd.read_csv('E:/qunar_freetrip.csv',sep='\t',encoding='gbk')print(df.head())2.查看數(shù)據(jù)類型;print(())3.去掉列名中的空格。#列名中有空格,需要去空格data=df.rename(columns=lambdax:x.strip())print(data.head())思政點(diǎn):數(shù)據(jù)處理要認(rèn)真、細(xì)致,列名中的空格如果不去掉會(huì)影響整體數(shù)據(jù)處理過(guò)程。通過(guò)編寫與調(diào)試程序,讓同學(xué)們切身體會(huì)到:任何一個(gè)小小的疏忽,哪怕是一個(gè)小小的標(biāo)點(diǎn)符號(hào)或是單詞拼寫錯(cuò)誤,整個(gè)程序都會(huì)報(bào)錯(cuò)或是無(wú)法得到正確的結(jié)果。引導(dǎo)學(xué)生無(wú)論是在日常學(xué)習(xí)、生活中,還是今后的工作崗位上,都需要養(yǎng)成認(rèn)真、細(xì)心和嚴(yán)謹(jǐn)?shù)淖黠L(fēng)和習(xí)慣。4.提取所需要的數(shù)據(jù)data1=data[['出發(fā)地','目的地','價(jià)格','節(jié)省','路線名','酒店']]print(data1.head())思政點(diǎn):化繁為簡(jiǎn),大道至簡(jiǎn),大音希聲,樸素的真理往往都蘊(yùn)含在至精至誠(chéng)的內(nèi)容中,以小見大地啟迪著人生、滋潤(rùn)著心靈、教化著萬(wàn)民,學(xué)習(xí)的核心就在技能精湛和價(jià)值塑造,要實(shí)現(xiàn)入腦入心,就必須善于引譬設(shè)喻、化繁為簡(jiǎn)。5.缺失值處理#判斷缺失值print((data1.isnull()).sum())#出發(fā)地的缺失值處理chufa=data1.loc[data1.出發(fā)地.isnull(),'路線名'].str.slice(0,2).valuesdata1.loc[data1.出發(fā)地.isnull(),'出發(fā)地']=[xforxinchufa]#目的地的缺失值處理data1.loc[data1.目的地.isnull(),'目的地']=data1.loc[data1.目的地.isnull(),'路線名'].str.slice(3,5)#刪除價(jià)格和節(jié)省的缺失值data2=data1.dropna()思政點(diǎn):數(shù)據(jù)中存在的缺失值要選擇合適的缺失值填充方法,尊重事實(shí),合理選擇。(1)教育學(xué)生在人生道路中,存在諸多選擇,引導(dǎo)學(xué)生樹立正確的世界觀、人生觀、價(jià)值觀,養(yǎng)成良好的職業(yè)道德;(2)在面臨個(gè)人利益與國(guó)家利益相沖突問(wèn)題時(shí),以國(guó)家利益為重。6.異常值處理#異常值處理print(data2.價(jià)格.describe())#異常值處理#三倍標(biāo)準(zhǔn)差判斷法standard=(data2.價(jià)格-data2.價(jià)格.mean())/data2.價(jià)格.std()data3=data2.drop(data2[standard.abs()>3].index,axis=0)思政點(diǎn):(1)生活中遇到困難或者異常,要積極想辦法,不鉆牛角尖,不放棄不拋棄,堅(jiān)持到底;(2)在2020年新冠疫情中,國(guó)家面對(duì)困難,不畏艱難,迎難而上,以人民生命為重,打贏了抗疫的阻擊戰(zhàn),要常懷感恩之心,愛國(guó)愛黨,學(xué)好本領(lǐng),報(bào)效祖國(guó)。7.文本字符串處理data3[['酒店名','類型','星級(jí)']]=data3['酒店'].str.split('',2,True)data3['星級(jí)']=data3.星級(jí).str.slice(0,3).astype(np.float32)print(data3.head())思政點(diǎn):酒店的星級(jí)數(shù)據(jù)是以文本形式存在的,需要提取其中的數(shù)字并轉(zhuǎn)換為數(shù)值類型才能加以使用。數(shù)據(jù)類型的轉(zhuǎn)換,使學(xué)生理解選擇大于努力,做任何事都要心中有度,“度”是做人的標(biāo)準(zhǔn),意味著人應(yīng)該遵循一定的規(guī)則。第二,對(duì)數(shù)據(jù)進(jìn)行分析預(yù)處理后的數(shù)據(jù),可以通過(guò)條件查詢,判斷旅行線路中的價(jià)格分布,篩選出需要的信息,也可以通過(guò)分布分析(cut)、分組分析(groupby)、交叉分析(pivot_table)及相關(guān)分析等分析函數(shù),進(jìn)一步為旅行社調(diào)整運(yùn)營(yíng)模式作支撐。思政點(diǎn):努力尋找數(shù)據(jù)分析方法,激發(fā)學(xué)生分析數(shù)據(jù)的樂(lè)趣和熱情,積極思考、用于探索,充分利用知識(shí)和技能,展現(xiàn)聰明才智。1.條件查詢#篩選出從成都出發(fā)價(jià)格小于1200的旅行線路print(data3[(data3.價(jià)格<1200)&(data3.出發(fā)地=='成都')])#篩選出價(jià)格在1000至1000之間的旅行線路并按價(jià)格升序排序print(data3[data3.價(jià)格.between(1000,1200)].sort_values(by='價(jià)格'))2.分組分析#統(tǒng)計(jì)不同的出發(fā)地與目的地條件下旅行線路的個(gè)數(shù)及均價(jià)print(data3.groupby(['出發(fā)地','目的地'])['價(jià)格'].agg([np.size,np.mean]))3.交叉分析#交叉分析print(data3.pivot_table(values=['價(jià)格'],index=['出發(fā)地'],columns=['目的地'],aggfunc=[np.size,np.mean]))4.相關(guān)分析#相關(guān)分析print(data3['價(jià)格'].corr(data3['星級(jí)']))思政點(diǎn):理解事物的聯(lián)系是普遍聯(lián)系的,引導(dǎo)學(xué)生用類比法進(jìn)行知識(shí)遷移。5.分布分析#以成都為出發(fā)地的旅行線路價(jià)格分布分析bins=[0,500,1000,2000,3000,4000,5000,6000,7000]dataCD=data3[data3.出發(fā)地=='成都']print(pd.cut(dataCD.價(jià)格,bins).value_counts())#酒店星級(jí)分布分析bins1=[0.0,1.0,2.0,3.0,3.5,4.0,4.3,4.5,4.8,5.0]print(pd.cut(data3.星級(jí),bins1).value_counts())第三,數(shù)據(jù)可視化。思政點(diǎn):從分析到可視化--堅(jiān)持到底,積極向上,追求真理。1.旅行線路價(jià)格分布可視化pd.cut(dataCD.價(jià)格,bins).value_counts().plot.bar(rot=20)plt.title('以成都為出發(fā)地的旅行線路價(jià)格分布分析')plt.show()2.酒店星級(jí)分布可視化#酒店星級(jí)分布分析bins1=[0.0,3.0,3.5,4.0,4.3,4.5,4.8,5.0]star=pd.cut(data3.星級(jí),bins1).value_counts().to_dict()starData=list(star.values())starLabel=list(star.keys())plt.pie(starData,labels=starLabel,autopct='%3.1f%%',pctdistance=0.75)plt.show()思政點(diǎn):可視化要按照相應(yīng)圖表來(lái)準(zhǔn)備數(shù)據(jù),如需調(diào)整數(shù)據(jù)類型則需要調(diào)整后再運(yùn)用相應(yīng)的圖表可視化。沒(méi)有規(guī)矩不成方圓—告誡學(xué)生在上課學(xué)習(xí)、日常生活和將來(lái)工作崗位中要遵守相應(yīng)的制度與規(guī)定,并以約束指導(dǎo)自己的行為,成為合格的社會(huì)公民。警示學(xué)生必須按照規(guī)矩做事,懷著實(shí)實(shí)在在的態(tài)度做事。(1)遵守?cái)?shù)據(jù)處理規(guī)范推及法律法規(guī),在校要遵循校紀(jì)校規(guī),畢業(yè)后要遵守公司的規(guī)章制度,任何時(shí)候都要守法,講誠(chéng)信;(2)團(tuán)隊(duì)合作時(shí),如果每位成員都遵循規(guī)范,可以大大提高開發(fā)效率,降低溝通成本;(3)探索任何事情的客觀規(guī)律,循序漸進(jìn)。引導(dǎo)學(xué)生設(shè)立周全計(jì)劃,做到井井有條,有規(guī)律的工

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論