版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《人工智能應用基礎》
項目五:你的評論表達你的喜好任務描述
☆
文本情感分析輸入一段客戶評價文字,對文字進行分析,了解客戶滿意度知識目標素質目標(1)培養(yǎng)學生吃苦耐勞的品質(2)培養(yǎng)學生團隊協(xié)作、互相幫助的精神(3)提高學生全面、系統(tǒng)考慮問題的意識。1.了解文本分析的基本流程了解分詞、詞向量的概念和作用理解文本分類的應用能力目標認識中文分詞的過程掌握詞向量的表示方法掌握使用深度學習進行文本分類的方法5.1了解中文分詞
5.2理解文本表示5.3了解文本分類模型5.4應用5.1了解中文分詞為什么需要中文分詞?自然語言人工語言人類社會約定俗成程序設計語言/機器語言漢語,英語等C++,Java,Python等簡潔長度和規(guī)則上都會有一定的冗余含糊、歧義無二義性如果李春來到了無錫,我請他吃飯。5.1了解中文分詞分詞:WordSegmentation在自然語言處理中,英文文本具有天然的空格作為區(qū)分,但是中文沒有明顯的分隔符,因此需要對中文進行分詞。單詞是語義的基本單位,句子和文檔都由大量單詞構成。中文分詞指將中文語句切分成一個個單獨的詞語。即將連續(xù)的自然語言文本,切分成具有語義合理性和完整性的詞匯序列。5.1了解中文分詞分詞:WordSegmentation5.1了解中文分詞常用的分詞工具現(xiàn)有的分詞方法可分為三大類:基于字符串匹配的分詞方法;基于理解的分詞方法;基于統(tǒng)計的分詞方法。5.1了解中文分詞常用的分詞工具jieba分詞:支持三種模式:(1)精確模式:試圖將句子最精確地切開,適合文本分析;(2)全模式:把句子中所有的可以成詞的詞語都掃描出來,速度非??欤遣荒芙鉀Q歧義;(3)搜索引擎模式:在精確模式的基礎上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞。5.1了解中文分詞案例5.1了解中文分詞常用的分詞工具SnowNLPTHULACNLPIR分詞系統(tǒng)5.1了解中文分詞5.2理解文本表示5.3了解文本分類模型5.4應用5.2理解文本表示機器無法直接識別人類語言,更不能對輸入的非結構化文本數(shù)據(jù)直接進行處理。所以重要的一步就是將非結構化文本數(shù)據(jù)轉化為計算機可以識別和處理的結構化數(shù)據(jù),然后才能進行下一步任務,這一步稱為文本表示。為什么需要文本表示?5.2理解文本表示文本表示的兩種方法1.獨熱表示獨熱表示:將文本中的詞以高維向量的形式表示,從而將對文本的處理轉化為向量空間中的向量運算。其中,詞表中包含我們需要的所有詞,以詞表的長度大小作為詞向量的維度,向量中該詞所在的位置取1,其余位置都用0表示。5.2理解文本表示文本表示的兩種方法1.獨熱表示存在三個問題有序性問題語義鴻溝維度災難5.2理解文本表示文本表示的兩種方法2.分布式表示分布式表示:也被稱為詞嵌入,該方法通常將文本中的單詞輸入到某個預訓練模型中進行訓練,然后將其轉換為連續(xù)的稠密向量。其依據(jù)是分布式假設,即擁有相同或相似上下文語境的詞具有相同或相似的含義。
5.2理解文本表示西瓜呆瓜草莓“西瓜”在語義上更像“呆瓜”還是“草莓”呢?案例5.2理解文本表示西瓜呆瓜草莓向量化表示:相似度計算:向量化表示:0.01805,0.46956,0.50758,-0.59865,0.1858,0.0353,0.1479,0.2210,0.2251,0.28621,0.0347,0.04131,0.1150.325詞向量與語義相似度(WordEmbedding&SemanticSimilarity)對詞匯進行向量化表示,并據(jù)此實現(xiàn)詞匯的語義相似度計算向量化表示詞匯,并計算詞匯語義相似度車頭如何放置車牌前牌照怎么裝如何辦理北京牌照5.2理解文本表示向量化表示:相似度計算:向量化表示:0.844,-0.0.039,-0.789,-0.4990.355,0.238,-0.671,-0.743,0.197,0.619,0.-0.849,-0.652,0.7620.486文本語義相似度(TextSemanticSimilarity)依托全網海量數(shù)據(jù)和深度神經網絡技術,實現(xiàn)文本間的的語義相似度計算的能力車頭如何放置車牌前牌照怎么裝如何辦理北京牌照向量化表示文本并計算語義相似度5.2理解文本表示5.1了解中文分詞5.2理解文本表示5.3了解文本分類模型5.4項目開發(fā)文字內容的情感傾向分析5.3了解文本分類模型5.3了解文本分類模型5.3了解文本分類模型5.1了解中文分詞5.2理解文本表示5.3了解文本分類模型5.4應用5.4應用詞向量利用大數(shù)據(jù)和深度學習模型,將語言詞表中的詞映射成一個長度固定的向量。所有的詞向量構成一個向量空間,每一個詞都是這個詞向量空間中的一個點,據(jù)此實現(xiàn)詞匯之間的相似度計算和詞匯本身的向量化表示二向量表示的應用熱搜新聞詞個性推薦5.4應用評論觀點抽取功能自動分析評論關注點和評論觀點,并輸出評論觀點標簽及評論觀點。輸入單條用戶評論產品評論觀點挖掘5.4應用新聞摘要80字摘要:最后,朱愛勝書記提出,輔導員隊伍是我校思想政治教育的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024美團商家入駐平臺合作協(xié)議及客戶服務承諾3篇
- 2024熟石灰采購合同范本
- 二零二五版高端個性化二婚離婚補償協(xié)議定制合同
- 2025年度金融科技產品服務水平協(xié)議2篇
- 2024年項目性勞動合同
- 2025版公立醫(yī)療機構與學校醫(yī)務室共建項目合同3篇
- 二零二五版民品典當借款合同法律適用說明4篇
- 租賃合同(2025年度):魚池場地租賃、養(yǎng)殖技術指導及分成3篇
- 長白山職業(yè)技術學院《漢字及其教學》2023-2024學年第一學期期末試卷
- 小學生體育活動中的團隊協(xié)作能力培養(yǎng)
- 海外資管機構赴上海投資指南(2024版)
- 山東省青島市2023-2024學年七年級上學期期末考試數(shù)學試題(含答案)
- 墓地銷售計劃及方案設計書
- 從偏差行為到卓越一生3.0版
- 優(yōu)佳學案七年級上冊歷史
- 鋁箔行業(yè)海外分析
- 紀委辦案安全培訓課件
- 超市連鎖行業(yè)招商策劃
- 城市道路智慧路燈項目 投標方案(技術標)
- 【公司利潤質量研究國內外文獻綜述3400字】
- 工行全國地區(qū)碼
評論
0/150
提交評論