版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
單元3分析電影評論評分項目介紹項目一:影評數(shù)據(jù)分析與可視化本項目從某電影網(wǎng)站采集了電影《流浪地球》的部分評論數(shù)據(jù),包括城市、影評內(nèi)容、評分、評論時間、評論點贊數(shù)等,根據(jù)采集的數(shù)據(jù)對電影評論的數(shù)量、點贊數(shù)和評分三個方面進行分析,完成數(shù)據(jù)分析可視化,給對科幻電影感興趣的觀影者、電影投資者提供一些參考。01準備活動點名、復習本次課學習內(nèi)容、學習目標介紹學習內(nèi)容任務三分析電影評論評分本任務從評論評分與城市名稱、評分等級三個方面來分析電影評論評分。通過繪制面積圖、折線圖和詞云圖對電影評論評分情況進行分布分析、對比分析,以便全面挖掘該電影的口碑、觀影熱度、觀眾對電影的理解等信息,為觀眾提供觀影參考任務分解:子任務1評論評分與城市的關系分析(面積圖)子任務2評論評分好評與差評的關鍵信息分析(詞云圖)學習目標1、知識(1)掌握matplotlib面積圖的繪制方法(2)掌握jieba分詞
(3)掌握pandas統(tǒng)計詞頻的方法
(4)掌握matplotlib詞云的繪制方法2、技能(1)能使用jieba分詞處理文本(2)能使用matplotlib子庫plotlib根據(jù)數(shù)據(jù)繪制面積圖和詞云圖3、素養(yǎng)(1)嚴謹認真、代碼規(guī)范;(2)數(shù)據(jù)安全、愛國精神;(3)信息檢索能力02發(fā)展活動任務分析、任務資訊、任務實施子任務1評論評分與城市的關系分析(面積圖)任務分析:本任務需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評論評分字段scores和城市名稱字段citys數(shù)據(jù)統(tǒng)計出不同評分及對應城市的評論數(shù)量。根據(jù)統(tǒng)計出的不同評分及對應城市的評論數(shù)量,取出前五名城市的數(shù)據(jù),使用Matplotlib繪制折線圖和面積圖,要求橫軸為評分,縱軸為評論數(shù)量,顯示不同評分、不同城市的評論數(shù)據(jù)變化趨勢。1.面積圖任務資訊面積圖對軸和線之間的區(qū)域著色,不僅能夠強調(diào)峰和谷,還能夠強調(diào)高點和低點的持續(xù)時間。高點持續(xù)時間越長,線下面積越大。pyplot模塊可以使用fill_between()函數(shù)和stackplot()函數(shù)繪制面積圖。fill_between()函數(shù)語法格式如下:1.面積圖任務資訊stackplot()函數(shù)語法格式如下1.面積圖任務資訊示例:顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過fill_between()函數(shù)繪制面積圖,代碼如下:以上代碼設置alpha為0.5(半透明),同時繪制了兩條折線圖,能顯示出面積圖的上邊緣,運行結(jié)果如圖1-3-2所示1.面積圖任務資訊示例::顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過stackplot()函數(shù)繪制堆疊面積圖,代碼如下:以上代碼繪制了一個堆疊面積圖,堆疊面積圖有兩個顏色的面積,分別對應2022年和2021年的銷售情況,運行結(jié)果如圖1-3-3所示。任務實施步驟:步驟1:初始工作。導入相關包,Pandas從CommentInfo.csv文件中讀取電影評論數(shù)據(jù),設置Matplotlib繪圖常用參數(shù)值。步驟2:統(tǒng)計不同評分各城市的評分數(shù)量。根據(jù)處理評分字段scores和城市名稱字段citys數(shù)據(jù),統(tǒng)計不同評分及對應城市的評分數(shù)量,取出評論數(shù)量最多的五個城市的數(shù)據(jù)用于繪圖步驟3:繪制折線圖和面積圖。繪制5條折線圖和5個面積圖,橫軸為評分,縱軸為評論數(shù)量,顯示不同評分、不同城市的評論數(shù)據(jù)變化趨勢。子任務2評論評分好評與差評的關鍵信息分析任務分析:本任務需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評論評分字段scores,按照好評差評標準進行分類。對分類的數(shù)據(jù)做jieba分詞后使用WordCloud()繪制好評和差評留言的詞云圖,顯示好評和差評關鍵字信息。1.詞云圖任務資訊詞云圖,也叫文字云,即對輸入的一段文字計算詞匯出現(xiàn)的頻率(詞頻),然后根據(jù)詞頻集中顯示高頻詞,簡潔、直觀、高效。詞云圖使人們可以快速感知最突出的文字,迅速抓住重點,了解主旨。制作詞云圖的方法有很多,可以借助第三方網(wǎng)站的在線詞云圖工具,也可以基于Python。這里使用WordCloud制作詞云圖,制作流程如下:1)準備一段文字。2)使用jieba分詞。3)準備停用詞。4)WordCloud生成詞云圖示例:簡單分詞,代碼如下:1.詞云圖任務資訊示例:制作朱自清《春》的詞云圖1.詞云圖任務資訊修改示例:制作朱自清《春》的詞云圖任務實施步驟:步驟1:初始工作。導入相關包,設置Matplotlib繪圖常用參數(shù)值。步驟2:準備停用詞。定義stop_words()函數(shù),讀取提供的停用詞文件數(shù)據(jù),按需求定義停用詞。步驟3:定義函數(shù)douban_word_cloud(data_after,title),繪制詞云圖,參數(shù)data_after表示生成詞云圖的文本數(shù)據(jù),參數(shù)title表示生成詞云圖的標題步驟4:定義主函數(shù)run(),從文件CommentInfo.csv讀取數(shù)據(jù),根據(jù)評判標準(評分大于等于30的為好評,評分小于30的為差評)把電影評論分為好評和差評,再分別調(diào)用步驟3定義的函數(shù)douban_word_cloud(data_after,title),繪制詞云圖步驟5:執(zhí)行主函數(shù)run()03整合活動總結(jié)、知識點梳理學習總結(jié)布置作業(yè):進一步完善任務。完成拓展題【拓展】拓展任務使用Matplotlib繪制豆瓣短評評分=50的評論留言的關鍵詞詞云信息圖?!稊?shù)據(jù)可視化技術(shù)》課題04Matplotlib綜合運用前言本次課完成第一次單元測試:自選項目數(shù)據(jù)分析及可視化,各位同學將準備好的課題,完成數(shù)據(jù)爬蟲,自選角度完成數(shù)據(jù)可視化。01準備活動點名、復習本次課學習內(nèi)容、學習目標介紹學習內(nèi)容任務:
自選項目數(shù)據(jù)分析及Matplotlib可視化
訪問“湖南機電新聞”網(wǎng)站,完成數(shù)據(jù)爬取、處理分析和可視化學習目標1、知識(1)掌握爬蟲流程和方法(2)掌握pandas庫的基本操作、數(shù)據(jù)處理基本的選取、統(tǒng)計等函數(shù)(3)掌握matplotlib庫繪制圖形的基本方法,以及基本圖的繪制方法2、技能(1)能爬取非結(jié)構(gòu)網(wǎng)頁(2)能使用beautifulsoup、、lxml(xpath)、re等庫從爬取的網(wǎng)頁中提取有用的數(shù)據(jù)
(3)能使用pandas庫讀取文本數(shù)據(jù),按照任務要求處理數(shù)據(jù)(4)能使用matplotlib子庫plotlib根據(jù)數(shù)據(jù)繪制基本圖3、素養(yǎng)(1)嚴謹認真、代碼規(guī)范;(2)數(shù)據(jù)安全、愛國精神;(3)信息檢索能力02發(fā)展活動任務分析、任務資訊、任務實施任務實施1、教師講解
本次課為第一次單元測試,各同學自選課題,完成數(shù)據(jù)爬取,分析,并自選角度完成數(shù)據(jù)可視化。2、明確任務(1)各同學自選課題,爬取數(shù)據(jù)(2)使用matplotlib完成自選角度的4個基本圖(折線圖、柱形圖、餅圖和詞云)。(3)對展示的圖進行分析,寫出結(jié)論任務實施訪問“湖南機電新聞”網(wǎng)站,完成數(shù)據(jù)爬取、處理分析和可視化:/about/xue-yuan-xin-wen-list-0.htm1、數(shù)據(jù)采集訪問/about/xue-yuan-xin-wen-list-0.htm,使用Python采集學校新聞所有的新聞數(shù)據(jù)(要求至少采集50頁新聞數(shù)據(jù)),根據(jù)新聞詳細地址采集新聞的發(fā)布部門信息,信息包括:新聞標題、發(fā)布時間、新聞詳細地址三列信息,相關信息采集下來后,保存為文件名“機電學校新聞.csv”任務實施2、數(shù)據(jù)處理和分析使用Python的pandas讀取“機電學校新聞.csv”文件,完成如下數(shù)據(jù)處理和分析操作:對數(shù)據(jù)進行清洗,把“發(fā)布時間”的年月日分別提取出來,單列成三列“年”、“月”、“日”,保存新聞標題、年、月、日四列數(shù)據(jù)到“機電學校新聞_發(fā)布年月日.csv”文件。任務實施3、數(shù)據(jù)可視化根據(jù)題目需求使用Python讀取“機電學校新聞_發(fā)布年月日.csv”csv文件中的數(shù)據(jù),完成如下操作:(1)使用折線圖展示學校新聞2020年12月每日發(fā)布數(shù)量。(2)使用折線圖展示學校新聞2020年每月發(fā)布的數(shù)量。03整合活動總結(jié)、知識點梳理學習總結(jié)通過本次課
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025石材長期采購合同
- 2025年度國防科技產(chǎn)業(yè)核心秘密保護合同3篇
- 2025年度遠程教育兼職教師聘任合同3篇
- 2025年度農(nóng)村房屋買賣合同協(xié)議書(含農(nóng)村電商合作)2篇
- 2025年度公司公務車借用及維修保養(yǎng)協(xié)議范本3篇
- 二零二五年度企業(yè)核心高管聘用合同:企業(yè)戰(zhàn)略轉(zhuǎn)型升級合作協(xié)議3篇
- 2025農(nóng)村宅基地置換項目宅基地置換補償評估協(xié)議
- 2025年度婚姻財產(chǎn)保全與風險評估協(xié)議3篇
- 二零二五年度老舊小區(qū)電梯加裝工程合同3篇
- 二零二五年度特色農(nóng)業(yè)機械租賃合作框架協(xié)議2篇
- 【MOOC】隧道工程-中南大學 中國大學慕課MOOC答案
- 劇作策劃與管理智慧樹知到期末考試答案2024年
- 鐵路基礎知識考試題庫500題(單選、多選、判斷)
- 水利五大員施工員教材講義
- 醫(yī)療機構(gòu)資產(chǎn)負債表(通用模板)
- 廢舊鋰離子電池高值資源化回收利用項目環(huán)評報告書
- 審計英語詞匯大全講課教案
- JIS G3507-1-2021 冷鐓用碳素鋼.第1部分:線材
- 初二家長會ppt通用PPT課件
- 小學生家庭作業(yè)布置存在的誤區(qū)及改進策略論文1
- 生物醫(yī)學研究的統(tǒng)計學方法課后習題答案 2014 主編 方積乾
評論
0/150
提交評論