Python自然語言處理PPT1附錄 教學大綱_第1頁
Python自然語言處理PPT1附錄 教學大綱_第2頁
Python自然語言處理PPT1附錄 教學大綱_第3頁
Python自然語言處理PPT1附錄 教學大綱_第4頁
Python自然語言處理PPT1附錄 教學大綱_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE5附錄教學大綱課程名稱:python自然語言處理適用專業(yè):計算機科學與技術、軟件工程、人工智能、大數據等專業(yè)先修課程:概率論與數理統(tǒng)計、Python程序設計語言總學時:56學時授課學時:30學時實驗(上機)學時:26學時一、課程簡介本教材包括自然語言處理概述、Python語言簡述、Python數據類型、Python流程控制、Python函數、Python數據分析、Sklearn和NLTK、語料清洗、特征工程、中文分詞、文本分類、文本聚類、指標評價、信息提取和情感分析。二、課程內容及要求第1章自然語言處理概述(2學時)主要內容:1人工智能發(fā)展歷程 2自然語言處理 3機器學習算法4自然語言處理相關庫5.語料庫基本要求:了解人工智能發(fā)展歷程、自然語言處理相關內容;機器學習算法相關概念;了解基于Python與自然語言處理的關系;了解語料庫的相關概念。重點:自然語言處理相關內容、機器學習算法難點:基于Python的相關庫第2章Python語言簡介(2學時)主要內容:1.python簡介2.Python解釋器3python編輯器4代碼書寫規(guī)則基本要求:了解python簡介、熟悉Python解釋器、掌握python編輯器、了解代碼書寫規(guī)則重點:掌握python編輯器、了解代碼書寫規(guī)則難點:掌握python編輯器第3章Python數據類型(4學時)主要內容:1.常量、變量和表達式2.基本數據類型3.運算符與表達式4.列表5.元組6.字符串7.字典8.集合基本要求:理解數據類型的概念、作用以及Python語言的基本數據類型;掌握常量、變量基本概念;掌握Python語言各類運算符的含義、運算符的優(yōu)先級和結合性、表達式的構成以及表達式的求解過程。掌握序列基礎知識;熟練掌握列表的定義、常用操作和常用函數;熟練掌握元組的定義和常用操作;熟練掌握字典的定義和常用操作;掌握字符串格式化、字符串截取的方法;理解與字符串相關的重要內置方法。熟練掌握字典的定義和常用操作;熟練掌握集合的定義和常用操作。重點:數據類型的作用、變量的定義,各類運算符以及構成的表達式的求解。序列、列表、元組的定義和常用操作。字典、集合的定義和常用操作。難點:運算符的優(yōu)先級和結合性。列表常用函數的應用,字符串的應用。字典及集合的應用。第4章Python流程控制(4學時)主要內容:1.數據輸入與輸出2.順序結構3.單分支選擇結構4.雙分支選擇結構5.多分支選擇結構6.while循環(huán)結構7.for語句結構8.循環(huán)的嵌套基本要求:掌握程序的三種基本結構;掌握順序結構程序設計;熟練掌握Python語言中輸入輸出格式的規(guī)則和用法。熟練掌握if語句的三種形式和用法以及if語句的嵌套使用;掌握分支結構的應用。熟練掌握循環(huán)結構while、for語句的規(guī)則和用法;熟悉continue、break、pass語句的用法;掌握循環(huán)結構的嵌套規(guī)則。重點:數據的輸入輸出。if語句的三種形式和使用方法。while、for語句的規(guī)則和用法;循環(huán)結構的應用。難點:格式化輸出的規(guī)則和用法。分支結構的應用。循環(huán)的嵌套。第5章Python函數(4學時)主要內容:1.函數聲明與調用2.函數傳參3.lambda函數4.遞歸函數基本要求:理解函數的作用;熟練掌握函數定義和函數調用的規(guī)則和用法;掌握函數參數傳遞的規(guī)則和用法;lambda函數;理解函數的嵌套和遞歸調用。重點:函數的作用、定義和調用;參數分類。難點:函數的參數傳遞、遞歸調用。第6章Python數據分析(4學時)1.科學計算2.Numpy3Scipy4matplotlib5Pandas6Seaborn 基本要求:了解科學計算的基本概念;掌握Numpy、Scipy、matplotlib、Pandas、Seaborn的函數使用方法 重點:Numpy、Scipy、matplotlib和Pandas難點:Numpy、matplotlib和Pandas第7章Sklearn和NLTK(4學時)主要內容:1.Sklearn2基于Sklearn機器學習3.NLTK4NlTK語料庫5NlTK文本分類 基本要求:了解Sklearn的基本功能,數據集,了解基于Sklearn機器學習流程。了解NLTK的基本功能、NLTK語料庫以及NL文本分類。重點:Sklearn與NLTK難點:Sklearn與NLTK第8章語料清洗(4學時)主要內容:1數據清洗方法1.1缺失值清洗 1.2異常值清洗 1.3重復值清洗2數據轉換3missingno4詞云基本要求:了解數據清洗,掌握缺失值、異常值和重復值的處理方法;掌握missingno和詞云使用方法重點:數據轉換、數據清洗難點:缺失值、異常值和重復值清洗方法第9章特征工程(4學時)主要內容:1特征預處理 1.1規(guī)范化 1.2標準化 1.3魯棒化 1.4正則化2獨熱編碼3CountVectorizer4TF-IDF基本要求:了解特征預處理,掌握規(guī)范化和標準化的處理方法。掌握獨熱編碼、CountVectorizer和TF-IDF基本原理和使用方法重點:特征工程預處理、獨熱編碼難點:獨熱編碼、CountVectorizer、TF-IDF第10章中文分詞(4學時)主要內容: 1常見中文分詞方法1.1基于規(guī)則和詞表方法1.2基于統(tǒng)計方法 2Jieba分詞庫 3HanLP分詞庫 基本要求:了解常見中文分詞方法,掌握Jieba分詞庫和HanLP分詞庫。重點:Jieba分詞庫和HanLP分詞庫難點:Jieba分詞庫和HanLP分詞庫第11章文本分類(4學時)主要內容:1歷史回顧2貝葉斯定理 3樸素貝葉斯分類 3.1GaussianNB類 3.2MultinomialNB類 3.3BernoulliNB類 4支持向量機4.1線性核函數 4.2多項式核函數 4.3高斯核函數5貝葉斯進行垃圾郵件分類基本要求:了解文本分類的歷史回顧、文本分類的相關方法;掌握貝葉斯定理、樸素貝葉斯分類;了解支持向量機原理,掌握線性核函數、多項式核函數和高斯核函數。重點:貝葉斯定理、樸素貝葉斯分類難點:樸素貝葉斯分類、支持向量機分類第12章文本聚類(4學時)主要內容:1文本聚類步驟2主成分分析 3Kmeans算法步驟 4Kmeans評估指標4.1調整蘭德系數4.2輪廓系數5掌握Kmeans進行英文和中文聚類 基本要求:了解文本聚類步驟,掌握主成分分析、掌握Kmeans算法步驟,掌握調整蘭德系數和輪廓系數、掌握Kmeans進行英文和中文聚類 重點:聚類算法、主成分分析、k-means算法步驟難點:主成分分析、K-means算法流程,Kmeans進行英文和中文聚類第13章指標評價(4學時)主要內容:1混淆矩陣2準確率3精確率4召回率5F1score6ROC曲線7AUC面積8分類評估報告9中文分詞的指標10未登錄詞和登錄詞召回率基本要求:掌握混淆矩陣、準確率、精確率與召回率、F1score、ROC曲線、AUC面積和分類評估報告,中文分詞的指標、未登錄詞和登錄詞召回率重點:混淆矩陣和分類評估報告難點:混淆矩陣、精確率與召回率、ROC曲線、AUC面積,中文分詞的指標、未登錄詞和登錄詞召回率第14章信息提?。?學時)主要內容: 1相關概念 1.1信息 1.2信息熵 1.3互信息 2正則表達式 2.1基本語法 2.2re模塊 3命名實體 4馬爾可夫模型 基本要求:了解信息提取的相關概念,如信息、信息熵、互信息等。掌握正則表達式的基本語法和re模塊。了解命名實體和馬爾可夫模型的特點和使用方式。重點:正則表達式的基本語法和re模塊、馬爾可夫模型難點:正則表達式的基本語法和re模塊 第15章情感分析(4學時)主要內容:1情感分析概述2基于情感詞典方法 3textblob 3.1分句和分詞 3.2詞性標注 3.3情感分析 4snownlp 4.1分詞 4.2詞性標注 4.3斷句 4.4情緒判斷 5小說人物情感分析6電影影評情感分析基本要求:了解情感分析概念、了解基于情感詞典的文本匹配算法、掌握textblob和snownlp、掌握小說人物和電影影評情感分析重點:掌握textblob和snownlp難點:掌握textblob和snownlp、掌握小說人物和電影影評情感分析三、教學安排及學時分配教學環(huán)節(jié)及學時主要內容學時分配講課習題課實驗小計自然語言處理概述22Python語言簡介22Python數據類型224Python流程控制224Python函數224Python數據分析224Sklearn和NLTK224語料清洗224特征工程224中文分詞224文本分類224文本聚類224指標評價224信息提取224情感分析224302656四、考核方式最終成績由課堂成績、實驗成績和期末大作業(yè)組成:(1)課堂成績:30%。主要考核課堂和翻轉課堂表現,課后作業(yè)完成情況。(2)實驗成績:30%,包括課堂小測、實驗報告等,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論