版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
摘要:中國互聯(lián)網(wǎng)絡信息中心(CNNIC)第51次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》發(fā)布,截至2022年12月,我國網(wǎng)民規(guī)模達10.67億,互聯(lián)網(wǎng)普及率達75.6%。在互聯(lián)網(wǎng)發(fā)展的大環(huán)境下,電商平臺出現(xiàn)了數(shù)以萬計的評論數(shù)據(jù),對挖掘線上藥品消費者的需求和提升電商藥品的口碑具有重要價值。文章爬取了京東電商平臺上某腸胃藥品的評論數(shù)據(jù),并基于預處理以后的文本數(shù)據(jù)進行了情感傾向性分析和LDA主題模型分析。結果表明,該腸胃藥品具有價格偏貴、售后服務差、物流運輸差、部分包裝損壞等不足之處。根據(jù)所得結論對電商藥品消費者提供一些決策參考,同時為該腸胃藥品線上銷售的升級提供一定的參考依據(jù)。關鍵詞:電商商品評論;情感分析;藥品在線評論;LDA主題模型
ResearchononlinesentimentanalysisofdrugreviewsbasedonLDAmodelAbstract:The51stStatisticalReportonInternetDevelopmentinChinawasreleasedbytheChinaInternetNetworkInformationCenter(CNNIC),andasofDecember2022,thesizeofChina'sInternetusersreached1.067billion,andtheInternetpenetrationratereached75.6%.InthecontextofInternetdevelopment,tensofthousandsofreviewdatahaveappearedone-commerceplatforms,whichareofgreatvalueformininguserdemandandimprovingproductreputation.ThispapercrawlsthereviewdataofagastrointestinaldrugontheJingdonge-commerceplatform,andanalyzestheemotionaltendencyanalysisandLDAthememodelbasedonthepreprocessedtextdata.Theresultsshowthatthegastrointestinaldrughastheadvantagesoffastcurativeeffect,highcostperformanceandcomprehensivetherapeuticfunction,butitalsohasshortcomingssuchasexpensiveprice,poorafter-salesservice,poorlogisticsandtransportation,anddamagetosomepackaging.Theconclusionprovidedacertainreferencefortheupgradeoftheonlinesalesofgastrointestinaldrugs.Keywords:MartialArtsElectives;Motivation;Factors;Countermeasures
目錄TOC\o"1-3"\h\u4361基于LDA模型的藥品在線評論情感分析研究 124815學生姓名:弋佳悅指導教師:張振芳 198511引言 117451.1研究背景 183981.2研究意義 1307281.3國內(nèi)外文獻綜述 1164411.4研究目標與研究內(nèi)容 414672文本挖掘與分析 59972.1文本挖掘 5252252.2文本預處理 6111762.2.1數(shù)據(jù)清洗 640542.2.2文本分詞 662972.2.2去停用詞和詞性標注 7170542.2.3詞頻統(tǒng)計 728373傾向化分析 9255493.1基于機器學習的方法 9292403.1.1支持向量機模型 9123983.1.2情感分析結果 9245354LDA主題模型 1034454.1LDA模型步驟及原理 10115084.1.1LDA模型原理及步驟 104684.1.2尋優(yōu)圖 11114684.1.3輸出主題 1192274.1.3主題數(shù)為10時LDA可視化 11140905結論與展望 13123595.1對醫(yī)藥電商零售商的建議 1362895.2對醫(yī)藥購買者的建議 13255075.3局限性 1414023參考文獻 14
1引言1.1研究背景當今我國移動寬帶用戶普及率已達到98%。越來越多的消費者參與在電商交易中,人們在線上購物時經(jīng)常參考商品評論對產(chǎn)品進行更多的了解,與此同時在購買后也會進行評價,發(fā)表自己的使用感受。Diana和Maria[1]在《關于在線評論和評級對網(wǎng)上預定酒店的影響》中提到,人們在看到其他人的評論被很多人關注的時,由于自身也想被關注的欲望會激發(fā)他們?nèi)ピu價,這意味著線上商品評論會不斷激發(fā)出更多的評論。當然,也有很多平臺會以獎勵積分等方式來激勵用戶做評論。而電商的各個參與者需要挖掘海量評論隱藏的信息。對電商平臺來說,可以依據(jù)文本數(shù)據(jù)更好地調(diào)整產(chǎn)品排版,產(chǎn)品關鍵詞更新等等;生產(chǎn)商亦可以根據(jù)用戶評論的傾向性改進產(chǎn)品,使用戶更滿意;對消費者而言,尤其在購買藥品上注重的更多,考慮得更細節(jié)。購買關乎健康的藥品需要更多保障,所以在購買前以大量產(chǎn)品信息做參考,從而減少信息不對稱有效的做出決策。1.2研究意義為了快速了解消費者的使用感受,本文使用機器學習模型的分析途徑來挖掘文本情感傾向信息,并且研究商品評論中的消費者感受和偏好,降低人工查閱的負擔,對企業(yè)經(jīng)營以及產(chǎn)品銷售的改進提供支持。不帶任何主觀感情且只對真實情況進行闡述的評論能夠明顯地表達出產(chǎn)品的好壞,起到提升購買量的作用。在消費者市場中了解顧客非常關注的因素,這對促進企業(yè)營銷,控制資源消耗,提升消費者滿意度至關重要。理論意義方面,本文運用支持向量機作為分類方法,對大量的文本進行了情感分析,利用LDA主題模型提取出現(xiàn)頻率最高的幾個產(chǎn)品特征詞以及差評中相關聯(lián)的產(chǎn)品特征,從而總結出商品的改進之處。不僅驗證了機器學習模型在藥品評論情感分析中的實用性,也為藥品營銷和產(chǎn)品宣傳做升級等提供一些參考?,F(xiàn)實意義方面,電商平臺依據(jù)顧客的意見重新調(diào)整旗下平臺產(chǎn)品的投放資源,也可以對網(wǎng)頁的板塊分布進行更新。對廠商來說,本文提取的差評關鍵詞為他們提供參考,了解品牌的聲譽情況以及消費者的使用感受,及時進行改進和升級。對電商平臺的消費者來說,本文幫助他們更快了解有效的產(chǎn)品信息,包括產(chǎn)品的優(yōu)勢以及缺陷,消費者結合產(chǎn)品信息再決定是否購買,避免了物流、包裝破損等問題造成的損失。如此,可以讓平臺、企業(yè)以及用戶之間相互了解,不僅可以大程度的降低企業(yè)在各方面的成本,同時也可以增加顧客對于企業(yè)以及平臺的滿意度,也可以在一定程度上降低客戶對于產(chǎn)品的投訴,打造出一個好的產(chǎn)品形象,形成良好的品牌效應。所以,本文的研究具有重要的意義。1.3國內(nèi)外文獻綜述支持向量機模型以及LDA模型在情感分析中的應用比較常見。例如胡偉芳【2】研究基于經(jīng)典的4C營銷理論,采用語料庫的技術和方法分析亞馬遜平臺XM公司某一款手機產(chǎn)品的在線商品評論,從中挖掘4個方面的評價信息,即“消費者”、“成本”、“便利”及“溝通”,將消費者最關心的商品特征及其評價觀點系統(tǒng)地呈現(xiàn)出來。吳健等【3】利用情感詞典對評論進行情感分析,得出14703條評論中所隱含的滿意度評價。從語義網(wǎng)絡結構與主題分布的研究角度,對正面評價與負面評價進行文本挖掘,提取得到各市場類型下隨州香菇網(wǎng)絡零售滿意度的影響因素。黃昕凱等【4】設計了一種商品評論分析系統(tǒng),能將評論處理后進行情感特征分析,為線上消費者提供更好的消費體驗,同時為線上消費用戶提供一些決策上的參考意見。LDA模型是自然語言處理領域中最重要的技術之一,賴顯靜【5】深入探究在線課程評論文本數(shù)據(jù),識別出參與在線學習過程中學習者關注的話題,該研究利用LDA主題模型對課程評論文本進行主題挖掘,以此為導向改進在線學習效果。杜利【6】對某款手機的評論進行了分詞等預處理,基于預處理后的數(shù)據(jù)進行情感分析,通過LDA主題模型分析評論,挖掘潛在目標用戶的需求、想法等,對改善產(chǎn)品提出相關的建議。趙桂紅等【7】運用LDA模型對航空旅客滿意度評論進行主題提取,識別航班延誤后的旅客滿意度影響因素以及發(fā)現(xiàn)了新的影響因素——娛樂活動。吳楠楠等【8】爬取京東平臺某手機的評論數(shù)據(jù),基于預處理之后的數(shù)據(jù)進行了傾向性分析和LDA主題模型分析。研究結果表明,該品牌手機具有外觀好看、充電快、性價比高和硬件功能強大等優(yōu)勢,但也有產(chǎn)品定價偏貴、品牌新品保值率低、包裝的零件不全等不足之處。所得結論為該品牌手機升級提供一定的參考依據(jù)。薛繼肖【9】收集書桌的消費者評論,利用Python軟件對其進行去停用詞、分詞、詞性分析及關鍵詞詞頻統(tǒng)計處理,運用LDA模型得到主題關鍵詞,并在此基礎上挖掘用戶需求??偨Y出線上用戶對于書桌方面的需求主要集中在書桌的質(zhì)量、做工、味道等方面。支持向量機是一種有堅實理論基礎的新穎的小樣本學習方法,劉祉燊等【10】應用支持向量機對學院的官方微博評論進行了情感分析,調(diào)整優(yōu)化參數(shù)后取得了更好的分析結果。李首政等【11】構建高斯核的支持向量機分類器實現(xiàn)對微博數(shù)據(jù)的情感分析,實驗結果顯示,對比樸素貝葉斯、決策樹等方法,使用支持向量機可獲得較高的準確率,并且在小樣本數(shù)據(jù)上有明顯的優(yōu)勢。游棉州【12】闡述情感分析是進行文本數(shù)據(jù)挖掘的一個重要技術,介紹了邏輯回歸、支持向量機、樸素貝葉斯三種常見的分析算法及其常見應用場景。朱玉林【13】對蘭新高鐵信號設備故障數(shù)據(jù)使用SVM、LR等多種機器學習分類算法進行訓練,實驗表明,結合LDA模型后支持向量機(SVM)的分類算法的準確率可以達到0.84。黃勝男研究了情感分析過程,通過實驗對比,選取支持向量機作系統(tǒng)的分類器。涂晨等【14】通過LDA主題模型構建文本相似度計算規(guī)則,對微信公眾號文章進行主題分類;借由TextRank關鍵詞提取方法,提取出各個評論中的產(chǎn)品名稱,再通過中文情感分析在產(chǎn)品評論的基礎上建立了多維度熱度分析模型做出年度熱度排行,旨在分析新冠疫情時期城市周邊游的發(fā)展和未來規(guī)劃。呂曉將等【15】以日本Henn-na酒店和中國Flyzoo酒店為研究對象,通過網(wǎng)絡爬蟲技術抓取在線評論數(shù)據(jù),采用詞頻分析、語義共現(xiàn)網(wǎng)絡分析和情感分析等文本分析方法探討顧客對智能機器人酒店的感知偏好和差異,使人工智能設計者理解用戶對酒店智能機器人的體驗感受,也為酒店人工智能的應用提供了管理實踐經(jīng)驗。王一帆等【16】基于網(wǎng)絡輿情發(fā)展中情感演化視角,構建河南暴雨事件網(wǎng)絡輿情處理分析模型,以微博輿情數(shù)據(jù)作為研究對象,采用SnowNLP、詞云等方法揭示其情感特征和情感傾向,通過網(wǎng)絡輿情處理分析模型合理劃分輿情演變過程,挖掘輿情演變規(guī)律,為相關部門提供有針對性的引導策略及理論支撐。溫廷新等【17】基于傳播社會學視角構建政策話題多屬性語義分析模型,采用社會網(wǎng)絡分析、改進的語義分析、LDA主題模型等方法,從話題、結構和內(nèi)容多屬性挖掘三孩話題語義,進而掌握民意,也對政府決策和輿情防控具有積極意義。國外學者也有很多利用支持向量機模型進行情感分析,DeepaR.等【18】提出了使用多項式樸素貝葉斯和邏輯回歸對餐廳評論數(shù)據(jù)集進行情感分析,這個程序幫助所有者迅速確定客戶的情緒去了解客戶,有助于他們更成功地發(fā)展業(yè)務。ChandralekhaE.等【19】對有關國家資格和入學考試(NEET)的文本數(shù)據(jù)進行情感分析.進行分類.并確定人們對NEET的感覺。在這項研究中.11種不同的機器學習分類器被用來分析微博情緒,以及自然語言處理(NLP),幫助政府和組織在這種文本數(shù)據(jù)調(diào)查的幫助下更迅速地對令人震驚的問題采取行動。OladeleTemidayoMichael等【20】從Twitter上收集了帶有#EndSARS的用戶推文,并對其進行預處理,將其標注為正類和負類,然后使用支持向量分類器對其中表達的情感進行分類;實驗結果表明,在測試集上,準確率為90%,精確率為94%,召回率為85%,F1分數(shù)為89%,在社交媒體上挖掘這樣的輿情可以通過作為預警系統(tǒng)來輔助政府和其他關注組織。RitaPaulo等【21】在英國大選的選舉期間,使用了提及保守黨和工黨這兩個主要的英國政黨、他們各自的總理候選人以及確定他們的政治競選的條款,進行數(shù)據(jù)收集,使用R和RapidMiner進行處理和分析,將社交媒體用戶在選舉期間表現(xiàn)出的情緒與選舉的實際結果進行比較。結果表明,社交媒體上觀點的情感極性并不是可靠的選舉結果預測指標。SufiFahim等【22】利用人工智能(AI)和自然語言處理(NLP)的現(xiàn)代技術進步來理解與網(wǎng)絡攻擊和電子戰(zhàn)相關的社交媒體帖子的上下文信息,在75天中,基于人工智能的語言檢測、翻譯和情感分析在47種不同語言的中解析15983條推特,最終為中國、澳大利亞、俄羅斯、烏克蘭、伊朗和印度生成了75個異常的每日網(wǎng)絡威脅指數(shù),利用這些情報,戰(zhàn)略決策者可以調(diào)整他們的網(wǎng)絡準備,以減輕網(wǎng)絡罪犯所遭受的有害損害。StellacciStefania等【23】研究對意大利熱門目的地周邊——歷史廣場和火車站的在線評論進行情感分析,旨在為城市設計分析中的社區(qū)參與提供新的視角,這種先進的分析重塑了人們解讀更廣泛社區(qū)的思想和情感的方式,從而將這些納入以地方為中心的發(fā)展戰(zhàn)略。JassimMustafaAbdalrassual等【24】比較了簡單和集成ML方法作為SA的分類器:隨機森林、K近鄰、LightGBM、隨機梯度下降和Bagging等等。使用一個50,000次電影評論的測試集數(shù)據(jù)庫,選擇了20000個對文件的感覺有影響的詞語,從大規(guī)模和序列試驗中獲得的詞頻特征和詞頻-逆文檔頻率,比較使用特征提取技術的各種分類器獲得的結果。為了評估和量化我們所考慮的不同ML方法的性能使用了6個標準度量:精確率、準確率、召回率、f值、AUC和Kappa-measure,結果表明支持向量機模型(SVM)分類器是最好的,其準確率為88.333%,其次是FDOSM方法,在相同的測量中,它的準確率為0.800。1.4研究目標與研究內(nèi)容隨著時間的推移,線上平臺積累了規(guī)模龐大的藥品評論數(shù)據(jù)。這些藥品評論內(nèi)容雖然看起來雜亂,卻隱含了消費者對線上購買藥品的感情色彩,蘊藏著巨大的價值。本文將針對京東電商平臺上的某腸胃藥品評論數(shù)據(jù),嘗試將已有的機器學習技術(支持向量機模型)應用于線上評論文本中,驗證機器學習模型對藥品評論情感分析的實用性。不僅豐富情感分析在健康醫(yī)療領域中藥品評論方面的研宄,也為消費者提供便利,節(jié)約了解產(chǎn)品瀏覽大量評論的時間。最后,通過LDA主題模型在處理好的數(shù)據(jù)文本中提煉出消費者真實的態(tài)度和意見,幫助生產(chǎn)企業(yè)更加深入了解用戶的真實需求與情感評價。
2文本挖掘與分析2.1文本挖掘文本挖掘是指利用計算機從大量的文本數(shù)據(jù)中統(tǒng)計提煉出文本隱含的信息或特征的過程。對原始爬取得到的文本不能直觀看到其主要特征,因此需要進行文本挖掘。本文從京東商城爬取了電商評論數(shù)據(jù),直接爬取的數(shù)據(jù)都是非結構化的,需要經(jīng)過一系列處理轉(zhuǎn)為結構化數(shù)據(jù)再進行進一步研究。本文選取的線上商品為腸胃藥品,數(shù)據(jù)來源于京東商城某品牌腸胃藥自營旗艦店評論,此類型藥品評論數(shù)據(jù)非常多,相較于其他的產(chǎn)品其評論內(nèi)容趨于更加多樣化,消費者所關注的產(chǎn)品特征更多。由于京東商城商品在線評論文本使用python代碼爬取受到限制,所以本文直接通過第三方采集器八爪魚進行采集。原始數(shù)據(jù)共爬取正、負面評價各1000條。如圖為爬取到的部分評論數(shù)據(jù)(正面):圖1評論示例
2.2文本預處理2.2.1數(shù)據(jù)清洗從爬取到的部分數(shù)據(jù)可以看出,評論中會出現(xiàn)重復的評論,原因可能是消費者對自己多次購買的商品給出了同樣的評價,也有為了獲得京東積分而復制多次評價內(nèi)容。重復的評價在文本處理時應當及時去除,否則統(tǒng)計詞頻和后續(xù)使用LDA模型獲取產(chǎn)品關鍵詞時會造成誤差。另外,評價文本中大量的出現(xiàn)重復的詞語,例如“很好很好很好”,“還不錯不錯不錯”等,應當采用壓縮去詞的方法進行清洗,如圖展示的是部分評論壓縮去詞成果。爬取到的評論數(shù)據(jù)經(jīng)過簡單的去重處理之后,可以得到比較干凈的文本。2.2.2文本分詞預處理首先要對文本進行分詞。Python中的jieba庫詞匯量非常豐富,本文對商品評論數(shù)據(jù)基于中文分詞處理時使用結巴分詞中的精確模式,分詞時直接加載了結巴分詞包進行操作。本文數(shù)據(jù)是商品評論數(shù)據(jù),不具有特別的新詞,因此直接采用默認的分詞詞典進行操作。調(diào)用Python的jieba分詞包中對應的函數(shù)可以同時獲得分詞結果和對應的詞性標注。標注詞性后可以去掉指定詞性的詞,例如嘆詞,時間詞,非語素詞等。經(jīng)過分詞處理和詞性標注的部分評論結果(好評)如圖所示:圖2分詞經(jīng)過分詞處理后共得到4982個詞。2.2.2去停用詞和詞性標注根據(jù)上述步驟得到文本的分詞結果中,需要去除沒有實際意義的詞,例如“就是”、“已經(jīng)”、“時候”、“可以”等。這些詞不僅浪費文本空間,且對文本挖掘沒有幫助,所以將其加入到停用詞表中,起到提高后期文本分類的效果。再對詞語添加名詞等標簽。本文基于全部的分詞在標注詞性之后再去停用詞。本文所用的停用詞表是哈工大停用詞表(746個詞),此外,由于本文數(shù)據(jù)是京東電商產(chǎn)品評論數(shù)據(jù),文本中會出現(xiàn)很多“京東”、“京豆”等詞,這樣的詞也需要添加在停用詞表中,最終停用詞表共包含751個詞,然后遍歷分詞結果,如果停用詞在文本中,將其刪去。最終過濾掉所有停用詞后剩余12545個詞。圖3詞性標注結果2.2.3詞頻統(tǒng)計本節(jié)對腸胃藥品評論預處理后的文本數(shù)據(jù)做詞頻統(tǒng)計,如圖展示的是爬取到的評論數(shù)據(jù)中出現(xiàn)頻次最高的前7個關鍵詞。圖4詞頻統(tǒng)計展示
3傾向化分析3.1基于機器學習的方法3.1.1支持向量機模型文本情感分析的步驟為對預處理后的詞采用基于統(tǒng)計的方法對詞對所在的逐條文本進行分類,文本情感基本可以分為積極和消極兩類。支持向量機(SupportVectorMachine,SVM)是人工監(jiān)督下的一個二元分類器,其思想是找到最佳的直線或平面,將數(shù)據(jù)分為兩類,在特征空間上由于支持向量機是間隔最大的線性分類器,找到的最優(yōu)直線或平面使分類結果呈現(xiàn)最魯棒狀態(tài),所以SVM的學習策略為求分類間隔最大化。3.1.2情感分析結果基于機器學習的方法不會損失評論數(shù),數(shù)據(jù)預處理后的2000條文本經(jīng)機器學習分類的預測都輸出了對應的標簽(pos代表情感為正面,neg代表情感為負面)。其中正面904條,負面1096條。圖5評論分類結果圖6負面評論分類結果
4LDA主題模型167164.1LDA模型步驟及原理8584.1.1LDA模型原理及步驟LDA是一種最常用的主題模型,也叫隱含狄利克雷分布。主題模型認為,主題是以一定的概率選擇了文檔,二者之間應當對應一個概率分布;同理,關鍵詞也是以一定的概率選擇了某個主題,此二者之間也應當對應一個概率分布。具體的提取流程是將文本語言材料進行特征提取后,先將帶有潛在主題信息的詞匯提取出來,然后再經(jīng)過對特征詞匯的不同維度進行分析對比,最后再篩選出符合標準的詞匯建立特征詞庫。整個生成文本的過程可以解釋為:先以一定的概率值從全文檔中選擇一篇文檔,對本文來說是選取某條評論;再基于該文檔從文檔-主題的狄利克雷分布中選取某個主題,該過程重復多次選出的主題應當服從一個多項式分布;然后根據(jù)上一步選到的某個主題,根據(jù)主題-詞語的狄利克雷分布選擇某個詞,因為上一過程選出的主題是變化的,因此這一過程中,變化的主題選出的詞應當服從一個多項式分布。所有重復過程完成之后最終生成所有詞語,并組合形成文檔。利用Python建立LDA主題模型做文本特征分析基于以下幾個步驟:①基于獲得的分詞文本建立詞典;②基于建立的詞典構建語料庫;③基于models.LdaModel()函數(shù)循環(huán)生成主題并計算主題間相似度;④計算主體間平均余弦相似度;⑤選擇最優(yōu)主題數(shù)并輸出主題和關鍵詞;⑥基于輸出的主題和對應關鍵詞進行分析。73464.1.2尋優(yōu)圖圖7coherence圖8coherence73464.1.3輸出主題圖9主題詞輸出262574.1.3主題數(shù)為10時LDA可視化可以使用詞云圖分析了解出現(xiàn)在負面評價中的高頻詞,初步分析產(chǎn)品特征,但要進一步的分析消費者對某一具體特征做出的評價,或判斷某個高頻詞屬于哪個主題時,詞云圖無法明確。例如“不錯”這個詞,僅從詞云圖無法判斷是在說藥品質(zhì)量還是在說物流感受,但人們認為“不錯”應當大概率會出現(xiàn)在藥品質(zhì)量的主題下,運用LDA主題模型,可以從概率的角度給出這一判斷的依據(jù)。LDA主題模型經(jīng)過計算可以獲得某一詞匯在某個主題中的概率分布,并將某個特定詞劃分到其概率最大的主題下,從而可以實現(xiàn)“不錯”以最大概率屬于哪個主題的劃分。同時,還可以求得該主題下其他的關鍵詞,輸出的關鍵詞的數(shù)目來自設定,一般每個主題取貢獻度最大的前10個詞作為該主題下的主題詞。相對于其他主題模型,LDA主題模型的先驗分布是狄利克雷分布,模型的泛化能力更強,不易出現(xiàn)過擬合現(xiàn)象。圖10詞云圖圖11正面數(shù)據(jù)可視化圖12負面數(shù)據(jù)可視化
5結論與展望50285.1對醫(yī)藥電商零售商的建議改進商品的外包裝。對電商銷售來說,消費者接觸不到賣家,也接觸不到自己將買到的商品,在這種情形下,拿到包裹以及打開包裹的體驗將決定了消費者對該商品的第一印象,在缺乏面對面交流和不太了解產(chǎn)品的情況下發(fā)生的電商購買,消費者將對商品外包裝和購物體驗要求將更加苛刻,根據(jù)LDA的分析結果可以看出,差評的一大原因就是商品外包裝不讓消費者滿意。提升物流效率和客戶服務。物流時間過長一直是網(wǎng)絡購物的一大詬病,物流時間太長大大降低了消費者的購物體驗,甚至直接導致差評,除了提升發(fā)貨倉效率,縮短發(fā)貨時間,當消費者反映物流問題時,客服的服務態(tài)度和方式將直接決定差評是否可以挽回。因此客戶服務無論在售前,售中還是售后都顯得尤其重要,服務應當永遠走在銷售產(chǎn)品之前。注重商品防偽和質(zhì)量監(jiān)測。由于藥品是易潮品,消費者可能在短時間內(nèi)一次購買多量同一商品,也可能在線下商場也購買過同一商品,如果消費者收到的產(chǎn)品有差異,也會導致差評的出現(xiàn),此時商家應當在商品外包裝上印上商品防偽碼,并且以可能的方式告知消費者收到的商品會與舊版本有何差距,消除消費者上當受騙的感受,另外,應當加強質(zhì)檢,避免出現(xiàn)商品質(zhì)量問題,從而讓消費者認為買到了假貨??刂苾r格變化幅度。商品價格變化過快也是導致差評的原因之一,消費者買前和買后的價格差價過高難免會引起消費者的不滿。商家在利用降價來吸引新顧客的同時,也要照顧到老顧客的購買感受,可以采取適當?shù)臓I銷方式,例如給老顧客送優(yōu)惠券,或者返差價的方法提升顧客滿意度。148625.2對醫(yī)藥購買者的建議從評論特征的分析結果看,此類藥品的差評主要來自于外部原因,例如包裝,物流,服務和是否正品等。從商品自身的品控來看,該品牌藥品的確是一個不錯的選擇,但在包裝、物流、服務等方面不足,消費者在決定是否購買該款產(chǎn)品時可以根據(jù)自身最關心的因素來確定,如果看重商品的外包裝和物流速度等,可以選擇去線下購買或者提前與客服協(xié)商商品包裝和物流問題,預留好快遞等待的時間??偠灾?,該品牌藥品有許多不足之處。對生產(chǎn)商而言,應當繼續(xù)加強產(chǎn)品品牌和質(zhì)量控制并逐漸開發(fā)出更好的功能,帶給消費者更多更好的體驗;對銷售商而言,應當更加注意與消費者的溝通和以及加強產(chǎn)品外包裝和價格控制,同時做好售后工作爭取減少差評,對消費者而言,也要根據(jù)自身的理性判斷和實際需求來決定是否購買。50285.3局限性本文對詞典的構建依然比較粗糙,未來可對詞典的構建展開深入研宄。本文雖然通過機器學習能夠得到較好的模型,但是近幾年深度學習發(fā)展迅速,在以后的研宄中可考慮利用深度學習相關知識進行構建模型。參考文獻[1]DianaGavilan,MariaAvello,GemaMartinez-Navarro.Theinfluenceofonlineratingsandreviewsonhotelbookingconsideration[J].TourismManagement,2018,66.[2]胡偉芳.基于在線商品評論的XM公司手機產(chǎn)品營銷策略優(yōu)化研究[D].安徽財經(jīng)大學,2023.DOI:10.26916/ki.gahcc.2023.000029.[3]吳鍵,李秀軍.基于文本挖掘的特色農(nóng)產(chǎn)品網(wǎng)絡零售滿意度影響因素與提升策略研究——以隨州香菇為例[J].湖北農(nóng)業(yè)科學,2022,61(24):236-242+266.DOI:10.14088/ki.issn0439-8114.2022.24.047.[4]黃昕凱,羅梓汛,徐鵬.基于自然語言處理的商品評論分析系統(tǒng)設計[J].信息與電腦(理論版),2022,34(16):163-165+169.[5]賴顯靜.基于LDA主題模型的MOOC課程評論文本分析[J].現(xiàn)代信息科技,2023,7(04):43-46.DOI:10.19850/ki.2096-4706.2023.04.011.[6]杜利.基于LDA模型的電商用戶評價分析[J].科技創(chuàng)業(yè)月刊,2023,36(02):176-179.[7]趙桂紅,寧慧慧.基于LDA主題模型的航班延誤服務補救意見識別研究[J/OL].經(jīng)營與管理:1-13[2023-03-16].DOI:10.16517/12-1034/f.20230130.002.[8]吳楠楠,石家程,劉勝強.基于LDA主題模型的某品牌手機評論數(shù)據(jù)分析[J].現(xiàn)代信息科技,2023,7(02):12-14.DOI:10.19850/ki.2096-4706.2023.02.003.[9]薛繼肖,陳于書,李佳茜.LDA模型在書桌線上用戶評價及需求分析中的運用[J].家具,2023,44(01):25-29.DOI:10.16610/ki.jiaju.2023.01.006.[10]劉祉燊,張倩,周菠,汪志霖,顧永昊.基于支持向量機的中文文本情感分析方法研究[J].科技創(chuàng)新與應用,2022,12(32):27-30.DOI:10.19981/j.CN23-1581/G3.2022.32.007.[11]李首政,王琪,王力.基于支持向量機的微博情感分析方法研究[J].現(xiàn)代計算機,2022,28(19):63-66+80.[12]游棉州.情感分析的算法與技術應用[J].電子技術,2022,51(09):190-191.[13]朱玉林.基于機器學習自然語言處理的蘭新高鐵信號設備故障診斷[D].蘭州交通大學,2022.DOI:10.27205/ki.gltec.2022.001121.[14]涂晨,李鑫,葉程軼.基于LDA主題模型與Apriori算法的旅游數(shù)據(jù)挖掘[J].物聯(lián)網(wǎng)技術,2023,13(03):108-112.DOI:10.16667/j.issn.2095-1302.2023.03.032.[15]呂曉將,姚亞男,劉曉鑫.基于文本分析的機器人酒店用戶感知偏好和差異研究[J].中國商論,2023(05):135-137.DOI:10.19699/ki.issn2096-0298.2023.05.135.[16]王一帆,許楠.自然災害事件網(wǎng)絡輿情情感演化特征分析——以“河南暴雨事件”為例[J].情報探索,2023(03):55-61.[17]溫廷新,張杰.三孩政策話題的多屬性語義分析[J].
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年旅游服務代理合同樣本
- 2025年度綠植花卉租賃與城市景觀提升合同范本4篇
- 2025年度綠化工程環(huán)境保護與節(jié)能減排合同范本4篇
- 2025版綠色建筑項目租賃與能源管理合同4篇
- 2025年度個人二手房交易安全協(xié)議范本4篇
- 個人間短期資金周轉(zhuǎn)合同書版
- 個人買賣合同范文(2024版)
- 二零二五年度風力發(fā)電機組安裝及運營維護協(xié)議3篇
- 2025年度個稅起征點調(diào)整下簽勞務合同稅務籌劃合作協(xié)議
- 二零二五年度素食餐飲品牌授權合作合同
- 車站值班員(中級)鐵路職業(yè)技能鑒定考試題及答案
- 極簡統(tǒng)計學(中文版)
- JTG∕T E61-2014 公路路面技術狀況自動化檢測規(guī)程
- 高中英語短語大全(打印版)
- 2024年資格考試-對外漢語教師資格證筆試參考題庫含答案
- 軟件研發(fā)安全管理制度
- 三位數(shù)除以兩位數(shù)-豎式運算300題
- 寺院消防安全培訓課件
- 比摩阻-管徑-流量計算公式
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、異丙醇和正丁醇檢驗
- 五年級數(shù)學應用題100道
評論
0/150
提交評論