下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Python編程基礎(chǔ)與應(yīng)用教案0903-網(wǎng)絡(luò)爬蟲庫(kù)的應(yīng)用requests的安裝和簡(jiǎn)介Python編程基礎(chǔ)與應(yīng)用教案0903-網(wǎng)絡(luò)爬蟲庫(kù)的應(yīng)用requests的安裝和簡(jiǎn)介Python編程基礎(chǔ)與應(yīng)用教案0903-網(wǎng)絡(luò)爬蟲庫(kù)的應(yīng)用requests的安裝和簡(jiǎn)介Python編程基礎(chǔ)與應(yīng)用電子教案課題requests的安裝和簡(jiǎn)介授課人課型實(shí)訓(xùn)課程Python編程基礎(chǔ)與應(yīng)用班級(jí)課時(shí)2上課時(shí)間上課地點(diǎn)教學(xué)目標(biāo)認(rèn)識(shí)爬蟲的概念和用途認(rèn)識(shí)requests的概念和用途掌握requests的安裝方法掌握requests庫(kù)的常用函數(shù)重 點(diǎn)難 點(diǎn)學(xué)情分析教學(xué)方法演示法、做中學(xué)、項(xiàng)目教學(xué)法教學(xué)準(zhǔn)備多媒體電腦機(jī)房,云教學(xué)平臺(tái)環(huán)
2、境,投影儀教學(xué)過程與內(nèi)容設(shè)計(jì)意圖時(shí)間環(huán)節(jié)一:爬蟲簡(jiǎn)介1、簡(jiǎn)介在學(xué)習(xí)Python開發(fā)的過程中,一個(gè)比較常見的案例就是采用Python開發(fā)爬蟲。用Python開發(fā)爬蟲是比較方便的,尤其在當(dāng)前的大數(shù)據(jù)時(shí)代,通過爬蟲來獲取Web數(shù)據(jù)是一個(gè)比較常見的數(shù)據(jù)采集方式,所以在大數(shù)據(jù)應(yīng)用的早期,通過Python開發(fā)爬蟲是不少Python程序員的重要工作內(nèi)容之一。Python爬蟲常用框架或者模塊有以下一些:Scrapy、PySpider、Crawley、Portia、Newspaper、requests、Beautiful Soup、Grab、Cola和selenium。其中Scrapy是一個(gè)為了爬取網(wǎng)站數(shù)據(jù),提
3、取結(jié)構(gòu)性數(shù)據(jù)而編寫的應(yīng)用框架。 可以應(yīng)用在包括數(shù)據(jù)挖掘,信息處理或存儲(chǔ)歷史數(shù)據(jù)等一系列的程序中。它是很強(qiáng)大的爬蟲框架,可以滿足簡(jiǎn)單的頁面爬取,比如可以明確獲知url pattern的情況。2、requests的安裝和簡(jiǎn)介requests庫(kù)是一個(gè)常用的用于http請(qǐng)求的模塊,它使用python語言編寫,可以方便地對(duì)網(wǎng)頁進(jìn)行爬取,是學(xué)習(xí)python爬蟲的較好的http請(qǐng)求模塊。它的安裝方法很簡(jiǎn)單,可以直接使用PIP進(jìn)行安裝: pip install requests環(huán)節(jié)二:requests庫(kù)常用的函數(shù)和屬性1、requests庫(kù)常用的函數(shù)方法說明requests.request()構(gòu)造一個(gè)請(qǐng)求,支
4、持以下各種方法requests.get()獲取html的主要方法requests.head()獲取html頭部信息的主要方法requests.post()向html網(wǎng)頁提交post請(qǐng)求的方法requests.put()向html網(wǎng)頁提交put請(qǐng)求的方法requests.patch()向html提交局部修改的請(qǐng)求requests.delete()向html提交刪除請(qǐng)求2、response對(duì)象的一些屬性屬性說明r.status_codehttp請(qǐng)求的返回狀態(tài),若為200則表示請(qǐng)求成功。r.texthttp響應(yīng)內(nèi)容的字符串形式,即返回的頁面內(nèi)容r.encoding從http header 中猜測(cè)的相
5、應(yīng)內(nèi)容編碼方式r.apparent_encoding從內(nèi)容中分析出的響應(yīng)內(nèi)容編碼方式(備選編碼方式)r.contenthttp響應(yīng)內(nèi)容的二進(jìn)制形式環(huán)節(jié)三:范例1、requests的基本方法:抓取百度首頁的信息其中代碼請(qǐng)參考課本。2、使用requests下載一個(gè)網(wǎng)頁到本地其中代碼請(qǐng)參考課本。效果如下:環(huán)節(jié)四:學(xué)生實(shí)訓(xùn)和練習(xí)完成環(huán)節(jié)三的實(shí)訓(xùn)。代碼請(qǐng)參考課本。環(huán)節(jié)五:小結(jié)和布置作業(yè)1、小結(jié)requests庫(kù)支持非常豐富的鏈接訪問功能,包括域名和URL的獲取、HTTP長(zhǎng)連接和連接緩存、HTTP會(huì)話和cookie保持、瀏覽器的SSL驗(yàn)證、基本的制作摘要認(rèn)證、有效的鍵值對(duì)cookie記錄、自動(dòng)解壓縮、自動(dòng)內(nèi)容解碼、文件分塊上傳、HTTP和HTTPS代理功能、連接超時(shí)處理、流數(shù)據(jù)下載等。Req
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DB13-T 5999-2024 公路路基剛性樁復(fù)合地基應(yīng)用技術(shù)規(guī)范
- 人教版初中信息技術(shù)教案
- 2024年心血管支架行業(yè)現(xiàn)狀分析:我國(guó)心血管支架使用量為190萬根
- 2024年LED路燈行業(yè)前景分析:我國(guó)LED路燈產(chǎn)量約為3795.77萬盞
- 2024-2025學(xué)年小學(xué)信息技術(shù)(信息科技)五年級(jí)上冊(cè)桂教版教學(xué)設(shè)計(jì)合集
- 2024年幼兒園垃圾分類工作計(jì)劃
- 2024奧運(yùn)征文800字模板
- 2024-2025學(xué)年中職中職專業(yè)課語言類-旅游外語77 教育與體育大類教學(xué)設(shè)計(jì)合集
- 2024-2025學(xué)年初中地理七年級(jí)下冊(cè)人教版(新課程標(biāo)準(zhǔn))(2024)教學(xué)設(shè)計(jì)合集
- 2024年08月金華事業(yè)單位公開招聘浙江大學(xué)金華研究院家庭教育中心公開招聘1人筆試歷年典型考點(diǎn)解題思路附帶答案詳解
- 重慶大學(xué)《應(yīng)用數(shù)值分析》(王開榮 楊大地)課后參考答案_助教版
- 陶喆那個(gè)女孩歌詞-陶喆那個(gè)女孩歌詞分配
- 人員素質(zhì)辭典(通用類)
- 氣管鏡檢查應(yīng)急預(yù)案-咯血
- 人工挖孔樁危險(xiǎn)源及預(yù)防措施,辨識(shí)
- JJF 1834-2020非自動(dòng)衡器通用技術(shù)要求
- 醫(yī)藥行業(yè)員工手冊(cè)范本
- 典型化工生產(chǎn)技術(shù)PPT學(xué)習(xí)教案
- 貝多芬《鋼琴三重奏》演奏探究
- 混合痔痔的護(hù)理查房.ppt
- 生物化學(xué)實(shí)驗(yàn)
評(píng)論
0/150
提交評(píng)論