Excel電商數(shù)據(jù)分析與應(yīng)用 課件 11.4.1評(píng)價(jià)詞頻分析11.4.2評(píng)價(jià)情感分析_第1頁
Excel電商數(shù)據(jù)分析與應(yīng)用 課件 11.4.1評(píng)價(jià)詞頻分析11.4.2評(píng)價(jià)情感分析_第2頁
Excel電商數(shù)據(jù)分析與應(yīng)用 課件 11.4.1評(píng)價(jià)詞頻分析11.4.2評(píng)價(jià)情感分析_第3頁
Excel電商數(shù)據(jù)分析與應(yīng)用 課件 11.4.1評(píng)價(jià)詞頻分析11.4.2評(píng)價(jià)情感分析_第4頁
Excel電商數(shù)據(jù)分析與應(yīng)用 課件 11.4.1評(píng)價(jià)詞頻分析11.4.2評(píng)價(jià)情感分析_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

消費(fèi)者運(yùn)營(yíng)分析11.4.1評(píng)價(jià)詞頻分析&11.4.2評(píng)價(jià)情感分析1評(píng)價(jià)詞頻分析2CONTENTS評(píng)價(jià)情感分析評(píng)價(jià)詞頻分析PARTONE評(píng)價(jià)詞頻分析詞頻分析是文本分析的基礎(chǔ),基于詞頻可以了解大量文本信息的內(nèi)容,既可以分析自己的商品也可以分析競(jìng)品。接口說明如下。通過基于機(jī)器學(xué)習(xí)算法分詞的開源接口,可查閱接口的相關(guān)說明。接口:/get.php?source=¶m1=¶m2=。接口參數(shù)如下?!癝ource=”:要分詞的文本?!癙aram1=”:返回分詞結(jié)果的概率,最小為0,最大為1。“Param2=”:是否為調(diào)試模式,調(diào)試模式可以看到分詞結(jié)果的概率。0為非調(diào)試模式,1為調(diào)試模式。例1:/get.php?source=清華大學(xué)是好學(xué)校¶m1=0¶m2=1。返回:清華:0.604942清華大學(xué):1華大:0.068537大學(xué):0.937618好學(xué):0.730473好學(xué)校:0.699564學(xué)校:0.833307例2:/get.php?source=清華大學(xué)是好學(xué)校¶m1=0.8¶m2=1。返回:清華大學(xué):1大學(xué):0.949906學(xué)校:0.936925例3:/get.php?source=清華大學(xué)是好學(xué)校¶m1=0¶m2=0返回:清華清華大學(xué)華大大學(xué)好學(xué)學(xué)校評(píng)價(jià)詞頻分析圖11-78評(píng)價(jià)詞頻分析例4:圖11-78所示為采集某競(jìng)品的消費(fèi)者評(píng)價(jià)數(shù)據(jù),分析評(píng)價(jià)的詞頻。數(shù)據(jù)采集路徑:【淘寶商品】-【評(píng)價(jià)詳情頁】。解:選中數(shù)據(jù),如圖11-79所示,在【數(shù)據(jù)】選項(xiàng)卡中單擊【自表格/區(qū)域】選項(xiàng),將評(píng)價(jià)導(dǎo)入PowerQuery編輯器。圖11-79圖11-80圖11-81如圖11-80所示,在PowerQuery編輯器中篩選數(shù)據(jù),搜索“此用戶”,將無效的評(píng)價(jià)“此用戶沒有填寫評(píng)價(jià)?!边^濾掉。如圖11-81所示,在【添加列】選項(xiàng)卡中,單擊【自定義列】功能鍵。評(píng)價(jià)詞頻分析圖11-82圖11-83評(píng)價(jià)詞頻分析如圖11-83所示,鍵入公式“Csv.Document(Web.Contents("/get.php?source="&Uri.EscapeDataString([評(píng)價(jià)])&"¶m1=0.8¶m2=0"))”。M函數(shù)說明:Web.Contents:是以二進(jìn)制文件的格式下載網(wǎng)頁。Csv.Document:是將二進(jìn)制文件轉(zhuǎn)換成Csv格式的表格。由于是訪問互聯(lián)網(wǎng)數(shù)據(jù)需要設(shè)置隱私級(jí)別,為了方便練習(xí),如圖11-82所示,可直接勾選【忽略此文件的隱私級(jí)別檢查……】,老版本沒有這個(gè)選項(xiàng),選擇公共權(quán)限。獲取數(shù)據(jù)后,如圖11-84所示,勾選【展開】和【Column1】字段,展開后將字段“Column1”重命名為“分詞”。展開后,按照?qǐng)D11-85所示內(nèi)容,篩選掉空白行。圖11-84圖11-85消費(fèi)者復(fù)購(gòu)率計(jì)算與分析圖11-86圖11-87消費(fèi)者復(fù)購(gòu)率計(jì)算與分析如圖11-86所示,在【開始】選項(xiàng)卡中單擊【分組依據(jù)】選項(xiàng)。如圖11-87所示,基于分詞進(jìn)行分組。圖11-88圖11-89消費(fèi)者復(fù)購(gòu)率計(jì)算與分析如圖11-88所示,單擊【開始】選項(xiàng)卡中【關(guān)閉并上載】選項(xiàng),將數(shù)據(jù)關(guān)閉并上載到Excel工作表中。如圖11-89所示,對(duì)“計(jì)數(shù)”進(jìn)行排序,可以觀察到買家對(duì)這款產(chǎn)品的評(píng)價(jià)關(guān)鍵詞,通過觀察可以發(fā)現(xiàn)買家對(duì)這款產(chǎn)品滿意的占比較大,因此這款產(chǎn)品的效果不錯(cuò)。評(píng)價(jià)情感分析PARTTWO評(píng)價(jià)情感分析評(píng)價(jià)情感分析是判斷文本的情感得分,正面得分越高表示買家對(duì)產(chǎn)品或服務(wù)越滿意,負(fù)面得分越高表示消費(fèi)者對(duì)產(chǎn)品或服務(wù)越不滿意。情感分析同樣需要使用API接口實(shí)現(xiàn),沒有純免費(fèi)的接口,可使用商業(yè)接口的免費(fèi)調(diào)用次數(shù)。商業(yè)接口可以在API集市申請(qǐng),本例使用/的接口,每天可調(diào)用500次。接口地址:/sentiment/analysis。調(diào)用方式:Post。圖11-90圖11-91例5:圖11-90所示是評(píng)價(jià)數(shù)據(jù),使用接口分析評(píng)價(jià)情感得分。數(shù)據(jù)采集路徑:【淘寶商品】-【評(píng)價(jià)詳情頁】。選中數(shù)據(jù),如圖11-91所示,在【數(shù)據(jù)】選項(xiàng)卡中單擊【自表格/區(qū)域】選項(xiàng),將評(píng)價(jià)導(dǎo)入PowerQuery編輯器。評(píng)價(jià)情感分析圖11-92圖11-93由于接口的次數(shù)限制,在PowerQuery編輯器中進(jìn)行數(shù)據(jù)篩選,只保留前5條,每次只消耗5次API調(diào)用次數(shù)。如圖11-92所示,在PowerQuery編輯器【開始】選項(xiàng)卡中,單擊【保留行】中的【保留最前面幾行】選項(xiàng),指定保留5行。如圖11-93所示,在【添加列】選項(xiàng)卡中,單擊【自定義列】選項(xiàng)。評(píng)價(jià)情感分析如圖11-94所示,鍵入函數(shù):“Json.Document(Web.Contents("/sentiment/analysis",[Headers=[#"X-Token"="UGlLtDcd.16189.rHC5FhNFHzqU"],Content=Text.ToBinary("["""&[評(píng)價(jià)]&"""]")]))”。圖11-94圖11-95由于訪問互聯(lián)網(wǎng)數(shù)據(jù)需要設(shè)置隱私級(jí)別,為了方便練習(xí),如圖11-95所示,可直接勾選【忽略此文件的隱私級(jí)別檢查……】,如果沒有這個(gè)選項(xiàng),選擇公共權(quán)限即可。評(píng)價(jià)情感分析“Json.Document(Web.Contents("/sentiment/analysis",[Headers=[#"X-Token"="UGlLtDcd.16189.rHC5FhNFHzqU"],Content=Text.ToBinary("["""&[評(píng)價(jià)]&"""]")]))”函數(shù)說明:Json.Document:是將二進(jìn)制文件以Json格式解析成表格。Web.Contents:是以二進(jìn)制文件的格式下載網(wǎng)頁。由于是Post方法,需要添加表頭和請(qǐng)求正文,格式為:Web.Contents(網(wǎng)址,表頭,正文)。表頭的格式:[Headers=[#"表頭1"="參數(shù)",#"表頭2"="參數(shù)",……]]。本例由于只有一個(gè)必要表頭參數(shù),因此格式為:[Headers=[#"X-Token"="API密鑰"]],其中“#”具有聲明參數(shù)字段的作用,在“X-Token”前加上“#”,表示這是個(gè)參數(shù)字段。正文的格式:Content=Text.ToBinary("請(qǐng)求正文")。本例接口要求請(qǐng)求正文是一個(gè)字典格式的文本,因此格式為:Content=Text.ToBinary("["""&[評(píng)價(jià)內(nèi)容]&"""]")。其中每一對(duì)雙引號(hào)中的兩個(gè)連續(xù)的雙引號(hào)起到轉(zhuǎn)義的作用,表示一個(gè)雙引號(hào),“&”是連接兩端文本的膠水符號(hào),如果文本是“清華大學(xué)是一所好學(xué)?!保ㄌ?hào)中的文本內(nèi)容為:["清華大學(xué)是一所好學(xué)校"],導(dǎo)入公式寫法為:"["""&"清華大學(xué)是一所好學(xué)校"&"""]"。評(píng)價(jià)情感分析圖11-96圖11-97如圖11-96所示,展開List,單擊“自定義”右側(cè)的雙向箭頭,選擇【擴(kuò)展到新行】選項(xiàng),展開后還是List的內(nèi)容,這是因?yàn)榻涌诜祷氐臄?shù)據(jù)結(jié)構(gòu)屬于特例。如圖11-97所示,再次單擊“自定義”右側(cè)的雙向箭頭,選擇【提取值】選項(xiàng)。評(píng)價(jià)情感分析如圖11-98所示,提取值后會(huì)“自定義”列中每行有兩個(gè)數(shù)字,逗號(hào)前是正面得分,逗號(hào)后是負(fù)面得分。選中“自定義”列(情感得分),如圖11-99所示,【開始】選項(xiàng)卡中單擊【拆分列】-【

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論