Python自然語言處理入門與實戰(zhàn)-教案 第1、2章 導論、文本數(shù)據(jù)爬取_第1頁
Python自然語言處理入門與實戰(zhàn)-教案 第1、2章 導論、文本數(shù)據(jù)爬取_第2頁
Python自然語言處理入門與實戰(zhàn)-教案 第1、2章 導論、文本數(shù)據(jù)爬取_第3頁
Python自然語言處理入門與實戰(zhàn)-教案 第1、2章 導論、文本數(shù)據(jù)爬取_第4頁
Python自然語言處理入門與實戰(zhàn)-教案 第1、2章 導論、文本數(shù)據(jù)爬取_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1章導論教案課程名稱:Python自然語言處理入門與實戰(zhàn)課程類別:必修適用專業(yè):大數(shù)據(jù)技術(shù)類相關(guān)專業(yè)總學時:64學時(其中理論40學時,實驗24學時)總學分:4.0學分本章學時:3學時一、材料清單(1)《Python自然語言處理入門與實戰(zhàn)》教材。(2)配套PPT。(3)引導性提問。(4)探究性問題。(5)拓展性問題。二、教學目標與基本要求.教學目標介紹NLP的基本概念和發(fā)展歷程;講解NLP的研究內(nèi)容和與新聞傳媒的關(guān)系;介紹常見NLP的處理工具和Python在NLP技術(shù)應用中的常見庫;介紹Anaconda安裝流程和NLP虛擬環(huán)境的創(chuàng)建方法。.基本要求了解自然語言處理的基本概念。了解自然語言處理的工具。(3)熟悉Anaconda安裝流程以及自然語言處理虛擬環(huán)境的創(chuàng)建方法。三、問題.引導性提問引導性提問需要教師根據(jù)教材內(nèi)容和學生實際水平,提出問題,啟發(fā)引導學生去解決問題,提問,從而達到理解、掌握知識,發(fā)展各種能力和提高思想覺悟的目的。(1)什么是自然語言?(2)現(xiàn)實生活中存在哪些自然語言處理技術(shù)?(3)該如何處理自然語言?.探究性問題探究性問題需要教師深入鉆研教材的基礎上精心設計,提問的角度或者在引導性提問的基礎上,從重點、難點問題切入,進行插入式提問?;蛘呤菍σ龑教釂栔猩形瓷婕暗谡n文中又是重要的問題加以設問。Python中常用自然語言處理庫有哪些?(2)自然語言處理的能夠應用在那些場景?.拓展性問題拓展性問題需要教師深刻理解教材的意義,學生的學習動態(tài)后,根據(jù)學生學習層次,提出切實可行的關(guān)乎實際的可操作問題。亦可以提供拓展資料供學生研習探討,完成拓展性問題。Python語言用于自然語言處理有哪些優(yōu)勢?(2)人與機器可以對話么?四、主要知識點、重點與難點.主要知識點(1)自然語言處理的概念、發(fā)展歷程。(2)自然語言處理與新聞傳媒。(3)自然語言處理的工具。Windows系統(tǒng)下Anaconda安裝。NLP虛擬環(huán)境的創(chuàng)建流程。.重點(1)自然語言處理的概念、發(fā)展歷程。Windows系統(tǒng)下Anaconda安裝。NLP虛擬環(huán)境的創(chuàng)建流程。.難點NLP虛擬環(huán)境的創(chuàng)建流程。五、教學過程設計.理論教學過程(1)自然語言處理的概念。(2)自然語言處理的發(fā)展歷程。(3)自然語言處理的應用場景。(4)自然語言處理的流程。在Windows操作系統(tǒng)上安裝Anacondao(6)創(chuàng)建NLP虛擬環(huán)境。.實驗教學過程在Windows操作系統(tǒng)上安裝Anacondao(2)創(chuàng)建NLP虛擬環(huán)境。六、教材與參考資料.教材戴程,張良均.Python自然語言處理入門與實戰(zhàn)[M].北京:人民郵電出版社.2022..參考資料[1]張良均.Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M].北京:機械工業(yè)出版社.2015.12]張良均.Python與數(shù)據(jù)挖掘[M].北京:機械工業(yè)出版社.2016.[3]肖剛,張良均.Python中文自然語言處理基礎與實戰(zhàn)[M].北京:人民郵電出版社.2021.第2章文本數(shù)據(jù)爬取教案課程名稱:Python自然語言處理入門與實戰(zhàn)課程類別:必修適用專業(yè):大數(shù)據(jù)技術(shù)類相關(guān)專業(yè)總學時:64學時(其中理論40學時,實驗24學時)總學分:4.0學分本章學時:6學時七、材料清單(Python自然語言處理入門與實戰(zhàn)》教材。(7)配套PPT。(8)引導性提問。(9)探究性問題。(10)拓展性問題。八、教學目標與基本要求.教學目標對超文本傳輸協(xié)議(HTTP)及其相關(guān)機制進行了簡要介紹,包括HTTP請求方式與過程、常見HTTP狀態(tài)碼、HTTP頭部信息,以及Cookie機制。然后分別介紹爬取靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁中的數(shù)據(jù)的方法,包括實現(xiàn)HTTP請求、網(wǎng)頁解析、數(shù)據(jù)存儲、逆向分析爬取和使用Selenium庫爬取.基本要求(4)熟悉HTTP請求方法與過程。(5)熟悉常見的HTTP狀態(tài)碼、頭字段和Cookie。(6)掌握靜態(tài)網(wǎng)頁數(shù)據(jù)的爬取方法。了解靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁的區(qū)別。(8)掌握逆向分析和使用Selenium庫爬取動態(tài)網(wǎng)頁的方法。九、問題.引導性提問引導性提問需要教師根據(jù)教材內(nèi)容和學生實際水平,提出問題,啟發(fā)引導學生去解決問題,提問,從而達到理解、掌握知識,發(fā)展各種能力和提高思想覺悟的目的。(4)網(wǎng)頁數(shù)據(jù)為什么可以被爬???(5)拿到一個HTML代碼文本,如果你想獲取其中一些字段你會怎么獲???(6)你認為爬蟲可以分為幾個部分?.探究性問題探究性問題需要教師深入鉆研教材的基礎上精心設計,提問的角度或者在引導性提問的基礎上,從重點、難點問題切入,進行插入式提問。或者是對引導式提問中尚未涉及但在課文中又是重要的問題加以設問。打開一個簡單的靜態(tài)網(wǎng)站看見的數(shù)據(jù)會位于HTTP響應的哪一個位置?Selenium庫爬取網(wǎng)站的優(yōu)缺點是什么?Selenium庫如何快速得到想要數(shù)據(jù)?.拓展性問題拓展性問題需要教師深刻理解教材的意義,學生的學習動態(tài)后,根據(jù)學生學習層次,提出切實可行的關(guān)乎實際的可操作問題。亦可以提供拓展資料供學生研習探討,完成拓展性問題。Cookie和Session的相同點是什么?(4)如何規(guī)避通過訪問頻度反爬?(5)如何提高Selenium爬取網(wǎng)站速度?十、主要知識點、重點與難點.主要知識點HTTP通信過程中的客戶端發(fā)起請求的方式與服務器發(fā)送響應的過程。HTTP通信過程中服務器發(fā)送響應的常見HTTP狀態(tài)碼。HTTP協(xié)議中的頭部類型與對應類型的常用的頭字段。Cookie機制的運作原理及其作用。(10)使用Requests庫實現(xiàn)HTTP請求。(11)使用BeautifulSoup庫解析網(wǎng)頁。(12)將數(shù)據(jù)存儲入MySQL數(shù)據(jù)庫。了解靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁區(qū)別。(14)逆向分析爬取動態(tài)網(wǎng)頁。使用Selenium庫爬取動態(tài)網(wǎng)頁。.重點HTTP通信過程中的客戶端發(fā)起請求的方式與服務器發(fā)送響應的過程。HTTP通信過程中服務器發(fā)送響應的常見HTTP狀態(tài)碼。HTTP協(xié)議中的頭部類型與對應類型的常用的頭字段。Cookie機制的運作原理及其作用。(8)使用Requests庫實現(xiàn)HTTP請求。(9)使用BeautifulSoup庫解析網(wǎng)頁。(10)將數(shù)據(jù)存儲入MySQL數(shù)據(jù)庫。(11)逆向分析爬取動態(tài)網(wǎng)頁。(12)使用Selenium庫爬取動態(tài)網(wǎng)頁。3.難點HTTP通信過程中的客戶端發(fā)起請求的方式與服務器發(fā)送響應的過程。HTTP通信過程中服務器發(fā)送響應的常見HTTP狀態(tài)碼。HTTP協(xié)議中的頭部類型與對應類型的常用的頭字段。Cookie機制的運作原理及其作用。(5)使用Requests庫實現(xiàn)HTTP請求。(6)使用BeautifulSoup庫解析網(wǎng)頁。(7)逆向分析爬取動態(tài)網(wǎng)頁。(8)使用Selenium庫爬取動態(tài)網(wǎng)頁。教學過程設計1.理論教學過程(7)介紹HTTP通信過程中的客戶端發(fā)起請求的方式與服務器發(fā)送響應的過程。(8)介紹HTTP通信過程中服務器發(fā)送響應的常見HTTP狀態(tài)碼。(9)介紹HTTP協(xié)議中的頭部類型與對應類型的常用的頭字段。(10)介紹Cookie機制的運作原理及其作用。(11)使用Requests庫實現(xiàn)HTTP請求。(12)使用BeautifulSoup庫解析網(wǎng)頁。(13)將數(shù)據(jù)存儲入MySQL數(shù)據(jù)庫。(14)介紹靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁區(qū)別。(15)逆向分析爬取動態(tài)網(wǎng)頁。(16)使用Selenium庫爬取動態(tài)網(wǎng)頁。2.實驗教學過程在Windows操作系統(tǒng)上安裝Anaconda。(4)創(chuàng)建NLP虛擬環(huán)境。使用Requests庫實現(xiàn)HTTP請求。(5)使用BeautifulSoup庫解析網(wǎng)頁。(6)將數(shù)據(jù)存儲入MySQL數(shù)據(jù)庫。(7)介紹靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁區(qū)別。(8)逆向分析爬取動態(tài)網(wǎng)頁。(9)使用Selenium庫爬取動態(tài)網(wǎng)頁。十二、教材與參考資料.教材戴程,張良均.P

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論