Python文件和數(shù)據(jù)格式化基礎(chǔ)教程_第1頁
Python文件和數(shù)據(jù)格式化基礎(chǔ)教程_第2頁
Python文件和數(shù)據(jù)格式化基礎(chǔ)教程_第3頁
Python文件和數(shù)據(jù)格式化基礎(chǔ)教程_第4頁
Python文件和數(shù)據(jù)格式化基礎(chǔ)教程_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Python文件和數(shù)據(jù)格式化基礎(chǔ)教程匯報(bào)人:XX2024-01-09目錄CONTENTSPython文件基本操作數(shù)據(jù)格式化基礎(chǔ)文件與數(shù)據(jù)交互常見文件格式處理數(shù)據(jù)清洗與轉(zhuǎn)換技巧實(shí)戰(zhàn)案例:Python實(shí)現(xiàn)自動化報(bào)表生成01CHAPTERPython文件基本操作文件打開與關(guān)閉打開文件使用`open()`函數(shù)打開文件,需要指定文件路徑和打開模式。關(guān)閉文件使用`close()`方法關(guān)閉文件,釋放資源。文件讀寫模式以只讀方式打開文件,使用`read()`方法讀取文件內(nèi)容。寫入模式以寫入方式打開文件,使用`write()`方法向文件中寫入內(nèi)容。如果文件不存在,則創(chuàng)建新文件;如果文件已存在,則覆蓋原有內(nèi)容。追加模式以追加方式打開文件,使用`write()`方法向文件中追加內(nèi)容。如果文件不存在,則創(chuàng)建新文件;如果文件已存在,則在文件末尾追加內(nèi)容。讀取模式123使用`tell()`方法獲取文件指針當(dāng)前位置。獲取當(dāng)前位置使用`seek()`方法移動文件指針到指定位置。移動指針使用`seek(0)`方法將文件指針重置到文件開頭。重置指針文件指針操作文件不存在異常當(dāng)嘗試打開不存在的文件時(shí),會拋出`FileNotFoundError`異常。文件讀寫異常當(dāng)在讀寫文件過程中發(fā)生錯(cuò)誤時(shí),會拋出`IOError`異常。文件關(guān)閉異常當(dāng)嘗試關(guān)閉未打開的文件或已關(guān)閉的文件時(shí),會拋出`ValueError`異常。文件異常處理030201文件異常處理為了處理這些異常,可以使用try...except語句塊來捕獲并處理異常。例如·```python文件異常處理tryfile=open("example.txt","r")文件異常處理content=file.read()文件異常處理print(content)print("Filenotfound.")exceptFileNotFoundError文件異常處理exceptIOErrorprint("AnI/Oerroroccurred.")文件異常處理文件異常處理finallyfile.close()VS```在上面的代碼中,我們嘗試打開并讀取一個(gè)名為"example.txt"的文件。如果文件不存在,則會拋出`FileNotFoundError`異常;如果在讀寫過程中發(fā)生錯(cuò)誤,則會拋出`IOError`異常。我們使用`try...except`語句塊來捕獲這些異常,并打印相應(yīng)的錯(cuò)誤消息。最后,我們使用`finally`語句塊來確保文件被正確關(guān)閉,無論是否發(fā)生異常。文件異常處理02CHAPTER數(shù)據(jù)格式化基礎(chǔ)Python中的基本數(shù)據(jù)類型包括整數(shù)、浮點(diǎn)數(shù)、布爾值、字符串等。變量用于存儲數(shù)據(jù),可以通過賦值語句將數(shù)據(jù)賦給變量。Python中的變量不需要聲明類型,類型會根據(jù)賦值的數(shù)據(jù)自動推斷。數(shù)據(jù)類型與變量變量數(shù)據(jù)類型字符串格式化符號Python中使用`%`或`format()`方法進(jìn)行字符串格式化。常見的格式化符號包括`%s`(字符串)、`%d`(整數(shù))、`%f`(浮點(diǎn)數(shù))等。格式化字符串示例"Hello,%s!"%name或"Hello,{name}!".format(name=name),其中name是一個(gè)變量。格式化字符串使用`open()`函數(shù)打開一個(gè)文件,并指定打開模式(如寫入模式`'w'`)。打開文件寫入格式化數(shù)據(jù)關(guān)閉文件使用`write()`方法將格式化后的字符串寫入文件。使用`close()`方法關(guān)閉文件。示例代碼如下030201格式化輸出到文件格式化輸出到文件```pythonf.write("Hello,%s!"%name)withopen('output.txt','w')asf```使用`open()`函數(shù)打開文件,并指定打開模式(如讀取模式`'r'`)。從文件讀取數(shù)據(jù)讀取的數(shù)據(jù)通常是字符串格式,可以使用相應(yīng)的函數(shù)或方法進(jìn)行解析,如使用`int()`或`float()`將字符串轉(zhuǎn)換為數(shù)字。解析數(shù)據(jù)使用`close()`方法關(guān)閉文件。示例代碼如下關(guān)閉文件格式化輸入與解析```pythonwithopen('input.txt','r')asf格式化輸入與解析data=f.read()number=int(data)#將字符串解析為整數(shù)```格式化輸入與解析03CHAPTER文件與數(shù)據(jù)交互使用`open()`函數(shù)打開文件,指定文件名和打開模式(如讀取模式"r")。打開文件讀取內(nèi)容關(guān)閉文件使用`read()`、`readline()`或`readlines()`方法讀取文件內(nèi)容。使用`close()`方法關(guān)閉文件,釋放資源。從文件中讀取數(shù)據(jù)使用`open()`函數(shù)打開文件,指定文件名和打開模式(如寫入模式"w")。打開文件使用`write()`方法將數(shù)據(jù)寫入文件。寫入內(nèi)容使用`close()`方法關(guān)閉文件,確保數(shù)據(jù)被保存。關(guān)閉文件將數(shù)據(jù)寫入文件使用`open()`函數(shù)打開文件,指定文件名和打開模式(如追加模式"a"或讀寫模式"r+")。打開文件定位到指定位置修改內(nèi)容關(guān)閉文件使用`seek()`方法定位到需要修改的位置。使用`write()`方法覆蓋或添加新的內(nèi)容。使用`close()`方法關(guān)閉文件,保存更改。文件內(nèi)容修改與更新使用`os.walk()`或`os.listdir()`遍歷指定文件夾下的所有文件。遍歷文件夾對每個(gè)文件使用上述讀取數(shù)據(jù)的方法,獲取所需數(shù)據(jù)。批量讀取數(shù)據(jù)對每個(gè)文件使用上述寫入數(shù)據(jù)的方法,將數(shù)據(jù)寫入相應(yīng)文件。批量寫入數(shù)據(jù)在批量處理過程中,添加異常處理機(jī)制,確保程序穩(wěn)定運(yùn)行。錯(cuò)誤處理批量處理文件數(shù)據(jù)04CHAPTER常見文件格式處理文本文件讀寫01使用Python內(nèi)置函數(shù)`open()`打開文本文件,通過指定模式(如讀取模式'r'、寫入模式'w'、追加模式'a')進(jìn)行讀寫操作。文本文件內(nèi)容處理02讀取文本文件內(nèi)容后,可以使用字符串處理方法(如`split()`、`replace()`等)對文本內(nèi)容進(jìn)行清洗、分割、替換等操作。文本文件編碼處理03在讀寫文本文件時(shí),需要注意文件的編碼格式(如UTF-8、GBK等),可以通過指定編碼格式進(jìn)行讀寫,避免亂碼問題。文本文件格式處理CSV文件讀寫使用Python標(biāo)準(zhǔn)庫中的`csv`模塊進(jìn)行CSV文件的讀寫操作,可以通過創(chuàng)建`csv.reader`或`csv.writer`對象來處理CSV文件。CSV文件內(nèi)容處理讀取CSV文件內(nèi)容后,可以使用Python列表和字典等數(shù)據(jù)結(jié)構(gòu)對CSV數(shù)據(jù)進(jìn)行存儲和處理,如提取特定列數(shù)據(jù)、篩選數(shù)據(jù)等。CSV文件編碼處理與文本文件類似,需要注意CSV文件的編碼格式,并在讀寫時(shí)指定正確的編碼方式。CSV文件格式處理JSON文件讀寫使用Python標(biāo)準(zhǔn)庫中的`json`模塊進(jìn)行JSON文件的讀寫操作,可以通過`json.load()`和`json.dump()`函數(shù)來加載和保存JSON數(shù)據(jù)。JSON數(shù)據(jù)解析和處理讀取JSON數(shù)據(jù)后,可以使用Python中的字典和列表等數(shù)據(jù)結(jié)構(gòu)對JSON數(shù)據(jù)進(jìn)行解析和處理,如提取特定鍵值對、遍歷數(shù)組等。JSON數(shù)據(jù)格式化和美化可以使用第三方庫(如`prettyjson`)對JSON數(shù)據(jù)進(jìn)行格式化和美化,使其更易于閱讀和調(diào)試。010203JSON文件格式處理XML文件格式處理XML文件讀寫使用Python標(biāo)準(zhǔn)庫中的`xml.etree.ElementTree`模塊進(jìn)行XML文件的讀寫操作,可以通過解析XML文檔構(gòu)建DOM樹,并對其進(jìn)行遍歷和操作。XML數(shù)據(jù)解析和處理通過DOM樹可以方便地訪問XML文檔中的元素和屬性,提取所需的數(shù)據(jù)或進(jìn)行修改操作。XML數(shù)據(jù)格式化和轉(zhuǎn)換可以使用第三方庫(如`lxml`)對XML數(shù)據(jù)進(jìn)行格式化和轉(zhuǎn)換,如將XML轉(zhuǎn)換為JSON格式或HTML格式等。05CHAPTER數(shù)據(jù)清洗與轉(zhuǎn)換技巧03無效數(shù)據(jù)識別與處理通過判斷數(shù)據(jù)類型、空值檢測等方式識別無效數(shù)據(jù),并采用刪除、填充等方式進(jìn)行處理。01使用set數(shù)據(jù)結(jié)構(gòu)去重將列表或數(shù)據(jù)集轉(zhuǎn)換為set數(shù)據(jù)結(jié)構(gòu),利用set元素唯一性特點(diǎn)去除重復(fù)數(shù)據(jù)。02使用pandas庫去重利用pandas庫的drop_duplicates()方法,對數(shù)據(jù)框中的重復(fù)行進(jìn)行去重操作。去除重復(fù)和無效數(shù)據(jù)01使用Python內(nèi)置函數(shù)如int()、float()、str()等進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換。數(shù)據(jù)類型轉(zhuǎn)換02利用pandas庫提供的astype()方法,將數(shù)據(jù)框中指定列的數(shù)據(jù)類型進(jìn)行轉(zhuǎn)換。pandas庫中的數(shù)據(jù)類型轉(zhuǎn)換03根據(jù)實(shí)際需求,編寫自定義的轉(zhuǎn)換函數(shù),實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)類型轉(zhuǎn)換邏輯。自定義轉(zhuǎn)換函數(shù)數(shù)據(jù)類型轉(zhuǎn)換與轉(zhuǎn)換函數(shù)應(yīng)用正則表達(dá)式基礎(chǔ)了解正則表達(dá)式的基本語法和常用元字符,如.、*、+、?、d、w等。re模塊應(yīng)用使用Python內(nèi)置的re模塊,進(jìn)行正則表達(dá)式的匹配、查找和替換操作。示例演示通過具體示例,演示如何使用正則表達(dá)式對文本內(nèi)容進(jìn)行匹配和替換。使用正則表達(dá)式匹配和替換文本內(nèi)容使用Python內(nèi)置的os模塊,進(jìn)行文件或目錄的重命名、移動和刪除操作。os模塊應(yīng)用使用Python內(nèi)置的shutil模塊,實(shí)現(xiàn)文件的復(fù)制、移動和刪除等操作。shutil模塊應(yīng)用通過具體示例,演示如何批量處理文件,如批量重命名、移動或刪除指定目錄下的文件。批量處理示例批量重命名、移動或刪除文件操作06CHAPTER實(shí)戰(zhàn)案例:Python實(shí)現(xiàn)自動化報(bào)表生成報(bào)表需求確定需要生成的報(bào)表類型、報(bào)表內(nèi)容、報(bào)表格式等。要點(diǎn)一要點(diǎn)二數(shù)據(jù)源明確報(bào)表數(shù)據(jù)來源,如數(shù)據(jù)庫、Excel文件、CSV文件等。需求分析:明確報(bào)表需求及數(shù)據(jù)源根據(jù)報(bào)表需求和數(shù)據(jù)源類型,選擇合適的技術(shù)棧,如Python的pandas、openpyxl等庫。設(shè)計(jì)自動化報(bào)表生成的流程,包括數(shù)據(jù)讀取、數(shù)據(jù)處理、報(bào)表生成等步驟。技術(shù)棧選擇實(shí)現(xiàn)方案設(shè)計(jì)思路:選擇合適的技術(shù)棧及實(shí)現(xiàn)方案數(shù)據(jù)讀取使用pandas等庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論