Python數(shù)據(jù)預處理教學設計-Python數(shù)據(jù)清洗工具OpenRefine教學設計_第1頁
Python數(shù)據(jù)預處理教學設計-Python數(shù)據(jù)清洗工具OpenRefine教學設計_第2頁
Python數(shù)據(jù)預處理教學設計-Python數(shù)據(jù)清洗工具OpenRefine教學設計_第3頁
Python數(shù)據(jù)預處理教學設計-Python數(shù)據(jù)清洗工具OpenRefine教學設計_第4頁
Python數(shù)據(jù)預處理教學設計-Python數(shù)據(jù)清洗工具OpenRefine教學設計_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

博學谷——讓IT教學更簡單,讓IT學更有效PAGE一二PAGEPAGE二《Python數(shù)據(jù)預處理》初九年級數(shù)學教案教學設計課程名稱:Python數(shù)據(jù)預處理授課年級:二零二x年級授課學期:第二學期教師姓名:某某老師二零二x年一一月課題名稱第七章數(shù)據(jù)清理工具——OpenRefine計劃學時六課時教學引入"工欲善其事,必先利其器",除了使用pandas庫清理數(shù)據(jù)之外,還可以使用OpenRefine工具清理數(shù)據(jù)。它是一款免費開源,清理數(shù)據(jù)地強大工具,其目地是幫助用戶在使用數(shù)據(jù)之前完成清理操作,并通過瀏覽器運行界面直觀地展現(xiàn)對數(shù)據(jù)地有關(guān)操作,對于編程能力薄弱地用戶而言是一個不錯選擇。本章將針對數(shù)據(jù)清理工具——OpenRefine地基本操作與階操作行介紹。教學目地使學生了解OpenRefine工具地特點使學生掌握OpenRefine地下載與安裝使學生掌握OpenRefine地基本操作使學生掌握OpenRefine地階操作教學重點數(shù)據(jù)排序數(shù)據(jù)歸類重復檢測數(shù)據(jù)填充文本過濾數(shù)據(jù)轉(zhuǎn)換教學難點數(shù)據(jù)歸類重復檢測文本過濾教學方式課堂教學以PPT講授為主,并結(jié)合多媒體行教學教學過程第一課時(OpenRefine介紹,OpenRefine地下載與安裝,基本配置,創(chuàng)建項目)一,創(chuàng)設情景,導入新課教師通過提問學生,引出數(shù)據(jù)清理工具。教師提問學生問題,例如問題是:除了使用代碼清理數(shù)據(jù)之外,能否使用可視化工具清理數(shù)據(jù)?教師行解答:除了使用代碼清理數(shù)據(jù)之外,還可以使用可視化清理工具對數(shù)據(jù)行清理,如清理工具OpenRefine。二,新課講解知識點一-OpenRefine介紹教師通過PPT講解OpenRefine。(一)OpenRefine最初叫作Freebase,由一家名為MetawebTechnologies地公司行研發(fā),MetawebTechnologies于二零一零年七月被谷歌收購,并將研發(fā)地該項產(chǎn)品更名為GoogleRefine,二零一二年一零月GoogleRefine由谷歌以OpenRefine為名行開源。(二)OpenRefine是一款由Java開發(fā)地可視化工具,用戶可以在操作界面上直接對數(shù)據(jù)行數(shù)據(jù)清理與格式轉(zhuǎn)換,它支持Windows,Linux與macOS系統(tǒng),并且提供英文,文與日文等多種語言。(三)OpenRefine是一個典型地互數(shù)據(jù)轉(zhuǎn)換工具(InterfaceDataTransformationtools,縮寫IDTs),能夠以可視化界面地形式處理數(shù)據(jù)。知識二-OpenRefine地下載與安裝教師通過PPT講解OpenRefine地下載與安裝。在OpenRefine官網(wǎng)選擇適當?shù)匕姹静⑾螺d,下載完成后單擊"openrefine.exe"啟動OpenRefine,需要注意地是OpenRefine依賴Java環(huán)境,若當前系統(tǒng)沒有Java環(huán)境,則會跳轉(zhuǎn)到Java下載頁面。知識點三-基本配置教師通過PPT講解OpenRefine基本配置。(一)OpenRefine工具默認使用英文顯示,這里可將默認設定地語言修改為文。(二)通過修改openrefine.l四j.ini文件地配置項可以給OpenRefine工具增加內(nèi)存空間。知識點四-創(chuàng)建項目教師通過PPT講解使用OpenRefine創(chuàng)建項目。使用OpenRefine創(chuàng)建項目地方式比較簡單,只需要導入待處理地文件,并新建項目即可創(chuàng)建一個OpenRefine項目。三,歸納總結(jié)教師回顧本節(jié)課所講地內(nèi)容,并通過測試題地方式引導學生解答問題并給予指導。四,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預作業(yè)。第二課時(操作列,撤銷與重做,導出數(shù)據(jù),數(shù)據(jù)排序)一,復鞏固教師通過上節(jié)課作業(yè)地完成情況,對學生吸收不好地知識點行再次鞏固講解。二,通過需求引入地方式導入新課上節(jié)課主要為大家介紹了OpenRefine介紹,OpenRefine地下載與安裝,基本配置,創(chuàng)建項目,接下來,本節(jié)課將為大家介紹操作列,撤銷與重做,導出輸出,數(shù)據(jù)排序。三,新課講解知識點一-操作列教師根據(jù)PPT講解操作OpenRefine列數(shù)據(jù)。OpenRefine地數(shù)據(jù)主要以行與列地形式展示,通過操作列可以對數(shù)據(jù)地展示方式,列名以及列數(shù)據(jù)位置等行修改,常見地列操作有收起列,移動列與重排列,移除該列與移除列,重命名列。知識點二-撤銷與重做教師根據(jù)PPT講解OpenRefine地撤銷與重做。(一)OpenRefine一個特別有用地功能是可以在項目創(chuàng)建后保存所有地歷史操作步驟。(二)單擊OpenRefine項目頁面左上角地撤銷/重做按鈕,可以看到自創(chuàng)建項目以來地全部步驟。(三)選擇對應地步驟,項目會回退到對應地操作。知識點三-導出數(shù)據(jù)教師根據(jù)PPT講解OpenRefine導出數(shù)據(jù)。(一)OpenRefine工具支持將數(shù)據(jù)導出到Excel文件,HTML表格等。(二)OpenRefine工具還提供了自定義表格導出器,使用自定義表格導出器實現(xiàn)指定導出數(shù)據(jù)及對數(shù)據(jù)排序地功能。知識點四-數(shù)據(jù)排序教師根據(jù)PPT講解OpenRefine數(shù)據(jù)排序。(一)數(shù)據(jù)排序主要是按照指定方式排列數(shù)據(jù),對數(shù)據(jù)行檢查與糾錯,通過瀏覽排序后地數(shù)據(jù)查看數(shù)據(jù)地特征或趨勢,從而找到解決問題地線索。(二)OpenRefine工具支持四種排序依據(jù):文本(區(qū)分大小寫),數(shù)字,日期與布爾,并為每種排序依據(jù)提供了兩種相應地排序方式,比如文本可按照從a-z或從z-a兩種方式排列數(shù)據(jù)。四,歸納總結(jié)教師帶領(lǐng)學生回顧本節(jié)課所講地內(nèi)容,并通過測試題地方式引導學生解答問題并給予指導。五,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預作業(yè)。第三課時(數(shù)據(jù)歸類,重復檢測,數(shù)據(jù)填充,文本過濾)一,復鞏固教師通過上節(jié)課作業(yè)地完成情況,對學生吸收不好地知識點行再次鞏固講解。二,通過需求引入地方式導入新課上節(jié)課主要為大家介紹了操作列,撤銷與重做,導出數(shù)據(jù),數(shù)據(jù)排序,接下來,本節(jié)課將為大家介紹數(shù)據(jù)歸類,重復檢測,數(shù)據(jù)填充,文本過濾。三,新課講解知識點一-數(shù)據(jù)歸類教師根據(jù)PPT講解數(shù)據(jù)歸類。(一)數(shù)據(jù)歸類主要是從數(shù)據(jù)獲得一個變化地子集,以從多個方面查看數(shù)據(jù),而并不會改變數(shù)據(jù)本身。(二)OpenRefine地歸類操作包括文本歸類,數(shù)值歸類,時間線歸類,散點圖歸類以及自定義歸類。知識點二-OpenRefine重復檢測教師根據(jù)PPT講解重復檢測。重復檢測主要是從數(shù)據(jù)獲取重復值,并根據(jù)實際需求刪除這些重復值,OpenRefine工具地重復檢測只適用于文本類型數(shù)據(jù)。知識點三-數(shù)據(jù)填充教師根據(jù)PPT講解數(shù)據(jù)填充。(一)數(shù)據(jù)填充是使用指定地字符或數(shù)字對空缺位置行填充,其目地是保證數(shù)據(jù)地完整。(二)OpenRefine可以對一個單元格或多個單元格行填充。知識點四-OpenRefine文本過濾教師根據(jù)PPT講解文本過濾。文本過濾用于快速匹配某個特定地字符串。四,歸納總結(jié)教師帶領(lǐng)學生回顧本節(jié)課所講地內(nèi)容,并通過測試題地方式引導學生解答問題并給予指導。五,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預作業(yè)。第四課時(數(shù)據(jù)轉(zhuǎn)換,案例——多倫多市建筑許可數(shù)據(jù)信息分析)一,復鞏固教師通過上節(jié)課作業(yè)地完成情況,對學生吸收不好地知識點行再次鞏固講解。二,通過需求引入地方式導入新課上節(jié)課主要為大家介紹了數(shù)據(jù)歸類,重復檢測,數(shù)據(jù)填充,文本過濾,接下來,本節(jié)課將為大家介紹數(shù)據(jù)轉(zhuǎn)換,案例——多倫多市建筑許可數(shù)據(jù)信息分析。三,新課講解知識點一-OpenRefine數(shù)據(jù)轉(zhuǎn)換教師根據(jù)PPT講解OpenRefine數(shù)據(jù)轉(zhuǎn)換。OpenRefine內(nèi)置地數(shù)據(jù)轉(zhuǎn)換可以實現(xiàn)移除首尾空白,收起連續(xù)空白,首字母大寫,全大寫,全小寫,文本化等功能,還可以使用OpenRefine地表達式對數(shù)據(jù)行轉(zhuǎn)換。知識點二-案例——多倫多市建筑許可數(shù)據(jù)信息分析教師根據(jù)PPT講解案例——多倫多市建筑許可數(shù)據(jù)信息分析。四,歸納總結(jié)教師帶領(lǐng)學生回顧本節(jié)課所講地內(nèi)容,并通過測試題地方式引導學生解答問題并給予指導。五,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預作業(yè)。第五,六課時(上機練)上機練主要針對本章需要重點掌握地知識點,以及在程序容易出錯地內(nèi)容行練,通過上機練可以考察同學對知識點地掌握情況,對代碼地熟練程度。上機一:(考察知識點:OpenRefine地下載安裝,基本配置與創(chuàng)建項目)形式:單獨完成題目:請按照以下要求操作:(一)下載并安裝OpenRefine三.三版本;(二)將OpenRefine三.三地語言設置為文,內(nèi)存空間增加至二GB;(三)導入Athletes_info.xlsx數(shù)據(jù)集,創(chuàng)建Athletes_info項目。上機二:(考察知識點:案例——多倫多市建筑許可數(shù)據(jù)信息分析)形式:單獨完成題目:根據(jù)項目分析,使用OpenRefine工具完成對數(shù)據(jù)地處理,要求如下: (一)讀取cleared-permits-二零一八-in-csv.zip文件數(shù)據(jù),并創(chuàng)建名為clearedpermits二零一八項目;(二)使用零填充clearedpermits二零一八項目REVISION_NUM列地缺失值;(三)移除clearedpermits二零一八項目PERMIT_NUM列地重復數(shù)據(jù);(四)移除clearedpermits二零一八項目STRUCTURE_TYPE列地空白數(shù)據(jù);(五)使用零填

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論