Python自然語(yǔ)言處理 課件 第8章 情感分析_第1頁(yè)
Python自然語(yǔ)言處理 課件 第8章 情感分析_第2頁(yè)
Python自然語(yǔ)言處理 課件 第8章 情感分析_第3頁(yè)
Python自然語(yǔ)言處理 課件 第8章 情感分析_第4頁(yè)
Python自然語(yǔ)言處理 課件 第8章 情感分析_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

情感分析Python自然語(yǔ)言處理第八章CONTENT目錄

01情感分析的應(yīng)用02情感分析的基本方法03實(shí)戰(zhàn)電影評(píng)論情感分析課前回顧詞義消歧詞義角色標(biāo)注深層語(yǔ)義推理情感分析的應(yīng)用01在電子商務(wù)領(lǐng)域的應(yīng)用在市場(chǎng)呼聲領(lǐng)域的應(yīng)用在輿情分析領(lǐng)域的應(yīng)用在消費(fèi)者呼聲領(lǐng)域的應(yīng)用情感分析在電子商務(wù)領(lǐng)域的應(yīng)用

電子商務(wù)是作為情感分析較為重要且比較常見(jiàn)的應(yīng)用領(lǐng)域。例如在京東、淘寶以及其他網(wǎng)上購(gòu)物平臺(tái)上應(yīng)用廣泛。消費(fèi)者評(píng)價(jià)消費(fèi)者購(gòu)買(mǎi)某個(gè)商品瀏覽相關(guān)的評(píng)價(jià)完成商品的購(gòu)買(mǎi)之后消費(fèi)者根據(jù)自己的體驗(yàn)進(jìn)行評(píng)價(jià)情感分析在電子商務(wù)領(lǐng)域的應(yīng)用情感分析在市場(chǎng)呼聲領(lǐng)域的應(yīng)用市場(chǎng)呼聲:消費(fèi)者對(duì)競(jìng)爭(zhēng)對(duì)手所提供的產(chǎn)品或者服務(wù)的評(píng)價(jià)。優(yōu)勢(shì):在競(jìng)爭(zhēng)中取得一定的優(yōu)勢(shì)、促進(jìn)新產(chǎn)品的研發(fā)參考評(píng)價(jià)情感分析在市場(chǎng)呼聲領(lǐng)域的應(yīng)用實(shí)時(shí)地消費(fèi)者想法:幫助企業(yè)改良產(chǎn)品的功能制定新的精準(zhǔn)的營(yíng)銷(xiāo)策略對(duì)產(chǎn)品可能的故障進(jìn)行預(yù)測(cè)情感分析在輿情分析領(lǐng)域的應(yīng)用情感分析在輿情分析中有助于:及時(shí)進(jìn)行公關(guān)正確地維護(hù)好公司和品牌的聲譽(yù)維護(hù)產(chǎn)品和服務(wù)的評(píng)價(jià)情感分析在消費(fèi)者呼聲領(lǐng)域的應(yīng)用消費(fèi)者呼聲是客戶(hù)體驗(yàn)管理當(dāng)中較為關(guān)鍵的因素消費(fèi)者呼聲有助于:企業(yè)根據(jù)其導(dǎo)向進(jìn)行產(chǎn)品改進(jìn)并研發(fā)新產(chǎn)品,客戶(hù)意見(jiàn)的獲取并且挖掘、分析幫助企業(yè)確定新產(chǎn)品的功能需求以及成本、性能等非功能上的需求。本章小結(jié)情感分析的應(yīng)用在電子商務(wù)領(lǐng)域的應(yīng)用在市場(chǎng)呼聲領(lǐng)域的應(yīng)用在輿情分析領(lǐng)域的應(yīng)用在消費(fèi)者呼聲領(lǐng)域的應(yīng)用情感分析Python自然語(yǔ)言處理第八章CONTENT目錄

01情感分析的應(yīng)用02情感分析的基本方法03實(shí)戰(zhàn)電影評(píng)論情感分析課前回顧電子商務(wù)領(lǐng)域市場(chǎng)呼聲領(lǐng)域輿情分析領(lǐng)域消費(fèi)者呼聲領(lǐng)域情感分析的基本方法02詞法分析機(jī)器學(xué)習(xí)方法混合分析詞法分析詞是最小的能夠獨(dú)立運(yùn)用的語(yǔ)言單位詞法分析是其他一切自然語(yǔ)言處理問(wèn)題的基礎(chǔ),會(huì)對(duì)后續(xù)問(wèn)題產(chǎn)生深刻的影響。而詞法分析的任務(wù)就是:將輸入的句子字串轉(zhuǎn)換成詞序列并標(biāo)記出各詞的詞性。詞法分析不同的語(yǔ)言詞法分析具體做法是不同的。以英語(yǔ)和漢語(yǔ)為例作為對(duì)比:詞法分析對(duì)于中文詞法分析而言,具體任務(wù)如下圖所示:以句子:“警察正在詳細(xì)調(diào)查事故原因”為例。詞法分析原理:先使用詞法分析器將輸入的待分析文本轉(zhuǎn)換為單詞的序列形式。將每一個(gè)經(jīng)過(guò)詞法分析器分詞之后的單詞與字典中的詞匯進(jìn)行逐一匹配。假設(shè)存在一個(gè)匹配為積極的,輸入文本的分?jǐn)?shù)總池中會(huì)增加相應(yīng)的分?jǐn)?shù)。詞法分析處理方法流程圖情感分析的基本方法02詞法分析機(jī)器學(xué)習(xí)方法混合分析機(jī)器學(xué)習(xí)方法采用有監(jiān)督學(xué)習(xí)的算法進(jìn)行分析,劃分為三個(gè)階段數(shù)據(jù)的采集數(shù)據(jù)的預(yù)處理訓(xùn)練模型并情感分類(lèi)機(jī)器學(xué)習(xí)方法特征向量:unigram(單個(gè)短語(yǔ))bigrams(兩個(gè)連續(xù)的短語(yǔ))trigrams(三個(gè)連續(xù)的短語(yǔ))支持向量機(jī)(SVM)卷積神經(jīng)網(wǎng)絡(luò)(CNN)樸素貝葉斯(NB)算法文檔的長(zhǎng)度積極詞匯的數(shù)量消極詞匯的數(shù)量等等機(jī)器學(xué)習(xí)方法挑戰(zhàn):訓(xùn)練數(shù)據(jù)如何獲取分類(lèi)器如何設(shè)計(jì)未知短語(yǔ)的正確解釋情感分析的基本方法02詞法分析機(jī)器學(xué)習(xí)方法混合分析混合分析兩種方法組合,屏蔽掉兩種算法的缺點(diǎn)——混合分析利用詞法分析高效率的優(yōu)點(diǎn)截取機(jī)器學(xué)習(xí)算法高準(zhǔn)確率的特性本章小結(jié)情感分析的基本方法詞法分析機(jī)器學(xué)習(xí)方法混合分析情感分析Python自然語(yǔ)言處理第八章CONTENT目錄

01情感分析的應(yīng)用02情感分析的基本方法03實(shí)戰(zhàn)電影評(píng)論情感分析課前回顧詞法分析機(jī)器學(xué)習(xí)方法混合分析實(shí)戰(zhàn)電影評(píng)論情感分析電影評(píng)價(jià)類(lèi)別很值得一看的電影,很好!正面電影劇情很老套,狗血,還有就是感覺(jué)不太切合實(shí)際。負(fù)面太垃圾了,拍的什么!負(fù)面主題正能量,場(chǎng)面壯觀(guān),情節(jié)感人正面實(shí)戰(zhàn)電影評(píng)論情感分析03模型選擇載入數(shù)據(jù)輔助函數(shù)模型設(shè)置調(diào)參配置訓(xùn)練過(guò)程模型選擇卷積神經(jīng)網(wǎng)絡(luò)模型選擇

將RNN的函數(shù)表示為f,那么公式可以表示為:循環(huán)神經(jīng)網(wǎng)絡(luò)模型選擇

循環(huán)神經(jīng)網(wǎng)絡(luò)模型選擇長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型選擇長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型選擇長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)實(shí)戰(zhàn)電影評(píng)論情感分析03模型選擇載入數(shù)據(jù)輔助函數(shù)模型設(shè)置調(diào)參配置訓(xùn)練過(guò)程載入數(shù)據(jù)標(biāo)簽分?jǐn)?shù)負(fù)面評(píng)價(jià)<=4正面評(píng)價(jià)>=7載入數(shù)據(jù)引入檢查一下數(shù)據(jù)結(jié)果載入數(shù)據(jù)結(jié)果實(shí)戰(zhàn)電影評(píng)論情感分析03模型選擇載入數(shù)據(jù)輔助函數(shù)模型設(shè)置調(diào)參配置訓(xùn)練過(guò)程輔助函數(shù)實(shí)戰(zhàn)電影評(píng)論情感分析03模型選擇載入數(shù)據(jù)輔助函數(shù)模型設(shè)置調(diào)參配置訓(xùn)練過(guò)程模型設(shè)置batch_size=24lstm_units=64nun_labels=2iterations=200000importtensorflowastff.reset_default_graph()labels=tf.placeholder(tf.float32,[batch_size,nun_labels])input_data=tf.placeholder(32,[batch_size,maxseq_num])data=tf.Variable(tf.zeros([batch_size,maxSeqLength,numDimensions]),dtype=tf.float32)data=tf.nn.embedding_lookup(wordVectors,input_data)lstmCe11=tf.contrib.rnn.BasictsTMCell(lstm_units)lstmCe11=tf.contrib.rnn.Dropoutwrapper(ce11=lstmCe11,output_keep_Prob=0.75)value,_=tf.nn.dynanic_rnn(lstmCe11,input_data,dtype=tf.float32)模型設(shè)置weight=tf.Variable(tf.truncated_normal([lstm_units,num_labels]))bias=tf.Variable(tf.constant(0.1,shape=[num_labels]))value=tf.transpose(value,[1,0,2])last=tf.gather(value,int(value.get_shape()[0])-1)prediction=(tf.matnul(last,weight)+bias)correct_pred=tf.equal(tf.argmax(prediction,1),tf.argmax(labels,1))accuracy=tf.reduce_mean(tf.cast(correct_pred,tf.float32))loss=tf.reduce_mean(tf.nn.softaax_cross_entropy_with_1ogits(logits=prediction,labels=labels))optimizer=tf.train.Adamoptimizer().mininize(1088)模型設(shè)置importdatetimesess=tf.InteractiveSession()tf.device("/gpu:0")saver=tf.train.Saver()sess.run(tf.global_variables_initializer())tf.sumnary.scalar("Loss",loss)tf.summary.scalar('Accuracy',accuracy)merged=tf.summary.nerge_all()logdir="tensorboard/"+datetime.datetime.now().strftime("%Y%m%d-%H%M%S")+"/"writer=tf.sumnary.Filewriter(logdir,sess.graph)foriinrange(iterations):#下個(gè)批次的數(shù)據(jù)

nextBatch,nextBatchtabels=get_train_batch()sess.run(optimizer,{input_data:nextBatch,labels:nextBatchtabels})#每50次寫(xiě)入一次leadboard.if(i*50==0):summary=sess.run(merged,{input_data:nextBatch,labels:nextBatch})writer.add_summary(summary,i)#每10000次保存一下模型

if(i%10000==0andi!=0):save_path=saver.save(sess,"models/pretrained_lstm.ckpt",global_step=1)print("savedto%s'%save_path")writer.close()實(shí)戰(zhàn)電影評(píng)論情感分析03模型選擇載入數(shù)據(jù)輔助函數(shù)模型設(shè)置調(diào)參配置訓(xùn)練過(guò)程調(diào)參配置1.LearningRate:RNN網(wǎng)絡(luò)訓(xùn)練速度慢,耗時(shí)非常久2.優(yōu)化器:之所以?xún)?yōu)化器選擇Adam,是因?yàn)槠鋸V泛被使用。3.LSTM細(xì)胞數(shù)量:這個(gè)值取決于輸入文本的平均長(zhǎng)度。單元數(shù)量過(guò)多會(huì)導(dǎo)致速度非常慢。4.詞向量維度:詞向量一般設(shè)置在50~300之間,維度越多可以存放越多的單詞信息,但是也意味著更高的計(jì)算成本。實(shí)戰(zhàn)電影評(píng)論情感分析03模型選擇載入數(shù)據(jù)輔助函數(shù)模型設(shè)置調(diào)參配置訓(xùn)練過(guò)程訓(xùn)練過(guò)程使用Tensorflow訓(xùn)練的基本過(guò)程是:先定義一個(gè)Tensorflow的會(huì)話(huà),如果有

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論