




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Python編程基礎(chǔ)與應(yīng)用教案0901-文本處理庫的應(yīng)用jieba的安裝和簡介Python編程基礎(chǔ)與應(yīng)用教案0901-文本處理庫的應(yīng)用jieba的安裝和簡介Python編程基礎(chǔ)與應(yīng)用教案0901-文本處理庫的應(yīng)用jieba的安裝和簡介Python編程基礎(chǔ)與應(yīng)用電子教案課題jieba的安裝和簡介授課人課型實(shí)訓(xùn)課程Python編程基礎(chǔ)與應(yīng)用班級課時(shí)2上課時(shí)間上課地點(diǎn)教學(xué)目標(biāo)認(rèn)識中文分詞和詞云的概念和用途認(rèn)識jieba的概念和用途掌握jieba的安裝方法掌握jieba庫的常用函數(shù)重 點(diǎn)難 點(diǎn)學(xué)情分析教學(xué)方法演示法、做中學(xué)、項(xiàng)目教學(xué)法教學(xué)準(zhǔn)備多媒體電腦機(jī)房,云教學(xué)平臺(tái)環(huán)境,投影儀教學(xué)過程與內(nèi)容設(shè)計(jì)意圖
2、時(shí)間環(huán)節(jié)一:中文分詞和詞云1、中文分詞在英文的行文中,單詞之間是以空格作為自然分界符的,顯得相對簡單。但是中文比之英文要復(fù)雜得多、困難得多。中文分詞是中文文本處理的一個(gè)基礎(chǔ)步驟,也是中文人機(jī)自然語言交互的基礎(chǔ)模塊。不同于英文的是,中文句子中沒有詞的界限,因此在進(jìn)行中文自然語言處理時(shí),通常需要先進(jìn)行分詞,分詞效果將直接影響詞性、句法等模塊的效果。2、詞云詞云就是對網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過濾掉大量的文本信息,使瀏覽者只要一眼掃過文本就可以領(lǐng)略文本的主旨。詞云是數(shù)據(jù)可視化的一種形式,根據(jù)關(guān)鍵詞的出現(xiàn)頻率而生成的一幅圖像,如圖9-2
3、。環(huán)節(jié)二:了解一些詞云WordItOut詞云圖。它操作簡單,進(jìn)入網(wǎng)站后只需要輸入一段文本,然后就可以生成各種樣式的“云”文字。用戶可以根據(jù)自己的需要對WordItOut進(jìn)行再設(shè)計(jì),比如顏色、字符、字體、背景、文字位置等,保存下載后,可以復(fù)制。但是WordItOut是不識別中文的,如果輸入中英混合的文本,保存后只顯示英文字體,對于不懂英文的同學(xué)是比較痛苦的。它的網(wǎng)址為/ 。Tagxed詞云圖。它有幾大優(yōu)點(diǎn):強(qiáng)大的導(dǎo)入功能(可導(dǎo)入網(wǎng)頁、文字等)、自定義設(shè)置詞云形狀(這個(gè)真心好)、可導(dǎo)入想要的字體、顏色主題多(各種選擇)等。最重要的是它支持中文。它的網(wǎng)址為/。WordArt詞云圖。WordArt 云
4、可以自定義字體、詞云的形狀,顏色等,做出來的詞云圖很酷炫,為網(wǎng)站訪問者提供良好的用戶體驗(yàn)。它的網(wǎng)址為/ 。圖悅。這款國內(nèi)的在線詞頻分析工具,在長文本自動(dòng)分詞并制作詞云方面還是很出眾的,而且也容易上手,還可以自定義定制圖形模板:標(biāo)準(zhǔn)、微信、地圖等,切換自如,用起來體驗(yàn)很不錯(cuò)。它的網(wǎng)址為/ 。BDP個(gè)人版詞云圖。這是一款數(shù)據(jù)可視化工具,除了詞云,還有很多其他酷炫的圖表,如GIS地圖、漏斗圖等。BDP很容易上手,直接把詞語這個(gè)數(shù)據(jù)拉到維度欄,再選擇詞云就瞬間呈現(xiàn)詞云圖表,BDP會(huì)自動(dòng)算好詞頻,你可以設(shè)置顏色,快速實(shí)現(xiàn)詞云可視化。它的網(wǎng)址為/home.html 。wordcloud詞云庫。它是優(yōu)秀的詞
5、云展示第三方庫,詞云以詞語為基本單位,更加直觀和藝術(shù)的展示文本。它的網(wǎng)址為/amueller/word_cloud環(huán)節(jié)三:jieba的安裝“結(jié)巴”中文分詞支持繁體分詞,支持自定義詞典,還支持四種分詞模式:1)精確模式,試圖將句子最精確地切開,適合文本分析。2)全模式,把句子中所有的可以成詞的詞語都掃描出來, 速度非??欤遣荒芙鉀Q歧義。3)搜索引擎模式,在精確模式的基礎(chǔ)上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞。4)paddle模式,利用PaddlePaddle深度學(xué)習(xí)框架,訓(xùn)練序列標(biāo)注(雙向GRU)網(wǎng)絡(luò)模型實(shí)現(xiàn)分詞。它的安裝方法很簡單,可以直接使用PIP進(jìn)行安裝: pip ins
6、tall jieba環(huán)節(jié)四:學(xué)生實(shí)訓(xùn)和練習(xí)應(yīng)用jieba庫的三種分詞模式,對字符串“jieba是優(yōu)秀的中文分詞第三方庫”進(jìn)行分詞。結(jié)果如下: 精確模式: Python, 是, 一門, 計(jì)算機(jī), 編程語言全模式: Python, 是, 一門, 計(jì)算, 計(jì)算機(jī), 算機(jī), 編程, 編程語言, 語言搜索引擎模式: Python, 是, 一門, 計(jì)算, 算機(jī), 計(jì)算機(jī), 編程, 語言, 編程語言加入新詞后的精確模式: Python, 是, 一門, 計(jì)算機(jī)編程語言環(huán)節(jié)五:小結(jié)和布置作業(yè)1、小結(jié)jieba庫的常用函數(shù)函數(shù)名稱描述jieba.lcut(s)精確模式,返回一個(gè)列表類型。jieba.lcut(s,cut_all=True)全模式,返回一個(gè)列表類型。jieba.lcu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年漢中市漢臺(tái)區(qū)河?xùn)|店鎮(zhèn)中心衛(wèi)生院招聘考試真題
- 突起路標(biāo)行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報(bào)告
- 2024年福建片仔癀化妝品商貿(mào)有限公司社會(huì)招聘考試真題
- 2025年度個(gè)人車位使用權(quán)轉(zhuǎn)讓與車位車位使用權(quán)終止及補(bǔ)償協(xié)議
- 2025年度電子設(shè)備維修工程師勞動(dòng)合同范本
- 港口集裝箱裝卸安全協(xié)議
- 2025年度房產(chǎn)代理傭金收取誠意金合同
- 2025年度交通事故損害賠償及保險(xiǎn)理賠諒解協(xié)議
- 2025年中國錐體蠟燭機(jī)行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報(bào)告
- 2025年度醫(yī)院食堂營養(yǎng)膳食承包管理協(xié)議
- 部編人教版語文小學(xué)六年級下冊第四單元主講教材解讀(集體備課)
- (2024年)師德師風(fēng)學(xué)習(xí)內(nèi)容教師師德師風(fēng)培訓(xùn)內(nèi)容通用多篇
- GB/T 3452.3-2005液壓氣動(dòng)用O形橡膠密封圈溝槽尺寸
- EN779-2012一般通風(fēng)過濾器——過濾性能測定(中文版)
- 形位公差測量方法
- 車轍防治指導(dǎo)意見(確定稿)
- 一個(gè)近乎完美的微信引流招生方案
- 門診特殊病種審批表
- T_CEC 102.1-2016 電動(dòng)汽車充換電服務(wù)信息交換 第1部分_總則_(高清-最新版)
- 國際形式發(fā)票模板
- 山西省會(huì)計(jì)師事務(wù)所服務(wù)收費(fèi)標(biāo)準(zhǔn)(匯編)
評論
0/150
提交評論