![基于數(shù)據(jù)分析的帕金森用戶需求報(bào)告_第1頁](http://file4.renrendoc.com/view14/M03/0F/2F/wKhkGWZnrZSAT35_AAD-GY1Pf8A096.jpg)
![基于數(shù)據(jù)分析的帕金森用戶需求報(bào)告_第2頁](http://file4.renrendoc.com/view14/M03/0F/2F/wKhkGWZnrZSAT35_AAD-GY1Pf8A0962.jpg)
![基于數(shù)據(jù)分析的帕金森用戶需求報(bào)告_第3頁](http://file4.renrendoc.com/view14/M03/0F/2F/wKhkGWZnrZSAT35_AAD-GY1Pf8A0963.jpg)
![基于數(shù)據(jù)分析的帕金森用戶需求報(bào)告_第4頁](http://file4.renrendoc.com/view14/M03/0F/2F/wKhkGWZnrZSAT35_AAD-GY1Pf8A0964.jpg)
![基于數(shù)據(jù)分析的帕金森用戶需求報(bào)告_第5頁](http://file4.renrendoc.com/view14/M03/0F/2F/wKhkGWZnrZSAT35_AAD-GY1Pf8A0965.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于數(shù)據(jù)分析的帕金森用戶需求報(bào)告01背景介紹因?yàn)楣ぷ餍枰它c(diǎn)時(shí)間利用數(shù)據(jù)來分析了下帕金森病用戶(不是患者)關(guān)注的需求,分析的結(jié)果與大家分享。1.1分析目標(biāo)分析帕金森病用戶關(guān)注的內(nèi)容,并了解些內(nèi)容的重要性。1.2研究假設(shè)本次研究過程基于以下假設(shè):用戶的行為反應(yīng)與其關(guān)注的內(nèi)容有強(qiáng)相關(guān)性;收集的數(shù)據(jù)真實(shí)的反應(yīng)了用戶的行為;1.3研究方式通過分析用戶之間討論的話題以及用戶瀏覽的資訊了解其關(guān)注的內(nèi)容。1.4研究思路(1)數(shù)據(jù)收集話題可以從各個(gè)疾病相關(guān)的論壇,或者從相關(guān)產(chǎn)品的評(píng)論、意見反饋中收集。這里選取的是一個(gè)與帕金森相關(guān)的某論壇以及幾個(gè)主流的資訊產(chǎn)品。(2)數(shù)據(jù)分析根據(jù)話題閱讀量,篩選出用戶閱讀量較高的話題,通過自然語言技術(shù)提取內(nèi)容的主題、標(biāo)簽,然后運(yùn)用分類算法對(duì)主題和標(biāo)簽的進(jìn)行分類,匯總出用戶重點(diǎn)關(guān)注的話題內(nèi)容。根據(jù)資訊閱讀量,篩選出閱讀量前置的文章和后置的文章,同樣進(jìn)行標(biāo)簽處理歸類,并與話題分析的結(jié)果比對(duì),以此驗(yàn)證分析結(jié)果是否一致。02分析過程2.1數(shù)據(jù)概覽在收集到話題數(shù)據(jù)后先大致瀏覽下,檢查有無缺省項(xiàng)或者無意義的數(shù)據(jù),如果量不大可以直接刪除掉。經(jīng)過統(tǒng)計(jì)得到有效話題總量是6840條,這個(gè)數(shù)量作為單一病種而言是很可觀的,積累這么多內(nèi)容的背后就是一大批用戶在使用。然后再對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行觀察,下面是話題的數(shù)據(jù)結(jié)構(gòu)。不難發(fā)現(xiàn)這里的發(fā)表時(shí)間、閱讀數(shù)、評(píng)論數(shù)三個(gè)指標(biāo)是值類型(就是可以比較大小的數(shù)字),因此可以直接從這三個(gè)指標(biāo)著手分析。先看發(fā)表時(shí)間,對(duì)數(shù)據(jù)做個(gè)排序就可以知道最近的發(fā)表時(shí)間是2019年9月9日(數(shù)據(jù)從10月中旬開始采集),時(shí)間距離當(dāng)前很近,說明目前仍有人在使用。最早的發(fā)表是2002年3月4日,距今已有17年半,論壇創(chuàng)建的時(shí)間越早,沉淀的內(nèi)容越多是好事。發(fā)表時(shí)間是在時(shí)間維度上是一個(gè)個(gè)的點(diǎn),為了反映出整體規(guī)律,要考慮通過分組聚合。既然時(shí)間跨度較大,這里就采用年作為頻率(月也可以,只是太細(xì)了),按年分組統(tǒng)計(jì)各年發(fā)表的文章見下圖(2002年數(shù)據(jù)較少,2003年數(shù)據(jù)缺失所以未計(jì)入)。從上圖可以看到該論壇的發(fā)貼量大致分為三個(gè)周期:2008年以前在均值附近有較大波動(dòng),2009年有大幅漲增并至2013年,2014年后幾乎逐年下降。從每年的發(fā)貼量似乎發(fā)現(xiàn)不了什么問題,圍繞發(fā)表時(shí)間這個(gè)維度的分析就此打住,該現(xiàn)象背后的原因不在本次分析的范圍內(nèi)就不探究了(本人猜測可能與帕金森患者漲增或社會(huì)環(huán)境有關(guān)(如2013年前后智能機(jī)普及))。接下來看閱讀數(shù)指標(biāo),對(duì)所有話題的閱讀數(shù)匯總后的累計(jì)閱讀數(shù)是22,326,364,這是一個(gè)不小的閱讀量,平均每年僅話題就有近130萬的PV(全國帕金森患者大概200萬左右,每年增量約10萬),側(cè)面說明采集的數(shù)據(jù)可以較好地反映帕金森用戶關(guān)注的問題。根據(jù)閱讀數(shù)對(duì)話題降序處理,然后按10%的發(fā)貼數(shù)作為累進(jìn)對(duì)閱讀數(shù)求和,如下圖所示。從上圖可以很直觀地看有意思的事了,前10%的話題聚中了56.15%的閱讀量,20%的話題產(chǎn)生了65.37%,雖然不符合二八規(guī)律,但是閱讀聚中度依然很明顯。因此可以從這20%的話題入手分析用戶關(guān)注的內(nèi)容(如果閱讀量分布較為均衡就考慮采用分層抽樣統(tǒng)計(jì)。只選20%的內(nèi)容一方面是用戶行為集中可以更好地突顯問題,另一方面留80%的數(shù)據(jù)是為了選取測試數(shù)據(jù)作檢驗(yàn))。2.2對(duì)關(guān)注度較高的話題的內(nèi)容分析接下來采用自然語言技術(shù)對(duì)所有話題基于其內(nèi)容提取出主題標(biāo)簽,瀏覽主題標(biāo)簽,根據(jù)標(biāo)簽內(nèi)容對(duì)話題分類(分類可以手動(dòng),可以基于規(guī)則,也可以適用回歸或決策模型后再調(diào)整,對(duì)分類后的結(jié)果再人工檢查一遍),并將歸類結(jié)果結(jié)合測試數(shù)據(jù)作F檢驗(yàn)(與前20%話題的檢驗(yàn)結(jié)果不一致,說明閱讀量的大小與其內(nèi)容有相關(guān)性),反復(fù)修整分類的劃分,篩選出用戶重點(diǎn)關(guān)注的問題(具體實(shí)現(xiàn)過程省略)。對(duì)閱讀數(shù)前置20%話題的內(nèi)容分析結(jié)果如下圖所示:在分析之前我以為帕金森用戶最關(guān)心的是求醫(yī)的問題,畢竟患者都想找到技術(shù)精湛的專家治療。但從上面可以看到帕金森用戶最關(guān)注的是藥物問題,為什么會(huì)出現(xiàn)這個(gè)結(jié)果,還要結(jié)合病種和患者特征解釋。首先,帕金森病目前無法被根治,只能通過醫(yī)療手段延緩病情發(fā)展,而當(dāng)前最低成本最快見效的治療方法就是吃藥,因此也就意味著帕金森患者用藥群體占有很大的比例(事實(shí)上幾乎人人必須吃藥)。其次,帕金森病發(fā)病的癥狀很多,不同的癥狀使用的藥品也不盡相同,加之該病種主要集中于中老年人群體,受生理機(jī)能衰退影響,往往會(huì)有其它并發(fā)癥出現(xiàn),患者之間用的藥品差異比較大。最后,藥效影響也較大,即使相同癥狀的患者使用相同藥品,受個(gè)體差異的影響,表現(xiàn)的藥效也會(huì)有較大差異,甚至同個(gè)患者不同階段和時(shí)間吃同樣的藥品反應(yīng)的效果也會(huì)不同,所以藥物問題一直備受用戶關(guān)注。帕金森用戶關(guān)注的第二個(gè)問題是治療方法,帕金森患者長期受帕金森困撓,得知一種新的治療方法就如同有了一線改善的希望,這也是本能驅(qū)使。第三個(gè)問題是經(jīng)歷分享,帕金森患者的治療經(jīng)歷大都很曲折,從他人分享的故事中不僅僅是吸取治療經(jīng)驗(yàn),更是能獲得百折不撓的情感共鳴,尋求心理慰藉。并列第四、五位的是日??祻?fù)和癥狀應(yīng)對(duì),日??祻?fù)主要包含運(yùn)動(dòng)、飲食、鍛煉和睡眠幾方面,需要長期堅(jiān)持并隨病情變化做出對(duì)應(yīng)調(diào)整;癥狀應(yīng)對(duì)這類問題主要是患者出現(xiàn)異常癥狀或病情改善效果持續(xù)不佳時(shí)尋求幫助,這類幫助往往比較突發(fā)且頻率不高,話題的深度也視內(nèi)容而定。除了藥物問題外就這四類問題較為受關(guān)注,且與病種有關(guān),其它的問題關(guān)注度相對(duì)少了許多。既然藥物問題是帕金森用戶關(guān)注的首要問題,因此有必要對(duì)藥物問題再作細(xì)分,細(xì)分結(jié)果見下圖:對(duì)涉及藥物相關(guān)的話題從討論的目的這個(gè)維度再作細(xì)分,就可以發(fā)現(xiàn)大致可以分為兩類,第一類是調(diào)整用藥或了解藥效(把二者劃分為一個(gè)問題是因?yàn)槎鄶?shù)話題中討論用藥效果的最終目的也就是想借鑒他人經(jīng)驗(yàn)來調(diào)整自己用藥)。現(xiàn)實(shí)場景中帕金森患者要經(jīng)常找醫(yī)生調(diào)整用藥方案,但是就診過程中醫(yī)生很難精準(zhǔn)掌握患者的病情,因此也難給出精確的用藥方案。如果用藥方案效果不佳,飽受癥狀的折磨之下患者自己常常會(huì)嘗試調(diào)整用藥方案,而調(diào)整的方向很大程度上借鑒其它患者與自己的病情是否相似,需要參考的因素有很多,比如年齡、病齡、嚴(yán)重程度、癥狀以及歷史用藥方案等。因此如何及時(shí)有效地調(diào)整用藥方案成為帕金森患者群體中經(jīng)常討論的問題。涉及藥物的第二類是購買或轉(zhuǎn)讓藥品,產(chǎn)生這個(gè)問題一方面是帕金森相關(guān)的很多藥品經(jīng)常斷貨或者供貨渠道不穩(wěn)定,為了保證藥品的維持,不得不經(jīng)常關(guān)注供貨渠道或者托他人從境外代購,另一方面國內(nèi)出售的帕金森藥品并不便宜,而且多數(shù)患者用藥的品種多且藥量大(比如三年病程的帕金森患者經(jīng)常每天吃四五次藥,每次兩三種),長期用藥必然產(chǎn)生經(jīng)濟(jì)壓力,被迫服用各類仿制藥以降低治療成本。為了更直觀地了解藥物話題的內(nèi)容,這里將涉及藥物話題的主題詞抽取出來制作成詞云:上面可以看到較為突出的詞語有三類,第一類是藥品,如雷沙吉蘭、美多芭、森福羅、泰舒達(dá)等,第二類是與人相關(guān),如病友、醫(yī)生、朋友、患者等,第三類是信息詞語,如效果、病情、經(jīng)歷等。那么這三類詞語融合到一起,大概率就是想表達(dá)向這些人了解藥品的效果或是了解某種病情下的用藥過程。再對(duì)排在第二的治療方法同樣作細(xì)分,細(xì)分的結(jié)果如下圖所示。治療方法當(dāng)中關(guān)注度最高的是新療法,新療法大部分是當(dāng)前還處于研發(fā)或臨床階段的治療方法,提供內(nèi)容的主要是理論支持或是為數(shù)不多的幾例試驗(yàn)結(jié)果,其實(shí)是真正落地仍然有較長時(shí)間,但是對(duì)于帕金森患者來說,每多一種方法就多一份希望和期待。其次是中醫(yī)中藥類療法,帕金森患者主要是中老年人,對(duì)中醫(yī)療法有著較高的接受度,這類療法主要是草藥、針炙、點(diǎn)穴、艾灸或其它一些偏方的應(yīng)用,其效果不能一概而論是有效或是無效,但嘗試的過程多少起到心理安慰的作用,積極的心理可以很好緩解抑郁狀態(tài)。再次是DBS(深度腦刺激)手術(shù),這類手術(shù)是主要是將電極植入到患者腦內(nèi),運(yùn)用脈沖發(fā)生器刺激其大腦深部的某些神經(jīng)核,糾正異常的大腦電環(huán)路,從而減輕這些神經(jīng)方面的癥狀。這是當(dāng)前可以長期改善帕金森癥狀的有效療法,但是接受度并不高,患者主要是對(duì)手術(shù)效果、費(fèi)用及報(bào)銷政策、就醫(yī)水平、等方面產(chǎn)生擔(dān)憂。2.3對(duì)閱讀量最高的話題的情感分析上面從閱讀量前置20%的話題分析出的帕金森用戶主要關(guān)注的是藥物及治療方法等問題,沿著閱讀量這個(gè)維度,再看看閱讀量最高的一個(gè)話題。這個(gè)話題從2004年11月發(fā)布,至今積累的評(píng)論數(shù)達(dá)到1194條,閱讀更是超過148萬。話題講述一位患者試了中醫(yī)醫(yī)生提供的中藥后很快見效,該內(nèi)容與前面分析的用戶最關(guān)注的藥物和中藥問題一致,這也是該話題能產(chǎn)生如此大的訪問量的根本原因。由于話題的內(nèi)容具體,參與的用戶眾多,這次我嘗試從情感層面整體分析用戶對(duì)中藥治療帕金森的態(tài)度(原本是嘗試直接提取觀點(diǎn)的,但效果并不好),在置信度為0.8的條件下分析結(jié)果如下圖所示。對(duì)這則中藥可以緩解帕金森癥狀的消息,67%的用戶持積極或肯定態(tài)度,33%的用戶持消極或質(zhì)疑態(tài)度,兩者正好二比一。表面上看對(duì)中藥持肯定態(tài)度的用戶占有大多數(shù),但另一面卻是幾乎三個(gè)帕金森用戶就有一人表示質(zhì)疑,這個(gè)比例同樣也很大,那么再接下來有必要對(duì)持積極和消極態(tài)度兩類人群的觀點(diǎn)梳理下。上面是部分消極評(píng)論的內(nèi)容,容易看出消極評(píng)論主要是配方成分不明、有無科學(xué)依據(jù)等,由此對(duì)該藥物的使用產(chǎn)生防范心理,其背后是對(duì)信息不透明的擔(dān)心,畢竟不良藥品攝入人身的危害巨大,而更深層的原因是藥物價(jià)值缺乏公信力。持積極態(tài)度的評(píng)論的用戶多是從獲得的希望和實(shí)際效果兩方面做出評(píng)論,這也與藥物及新療法關(guān)注度高的原因一致。2.4對(duì)閱讀量高和閱讀量低的文章的語義網(wǎng)絡(luò)分析以上是基于幾千份用戶討論的話題分析出的用戶需求偏好,文字交流只是用戶行為中的一部分,那么,其行為特點(diǎn)在其它行為中是否還保持一致呢,為此,有必要再通過其它行為的偏好來驗(yàn)證這一結(jié)果。為了方便觀察就選擇閱讀行為,通過閱讀的內(nèi)容來判斷上面的需求是否成立。為了更直觀對(duì)比,閱讀量降序后各選取前置20%和后置20%的文章來分析(約各取280篇)。接下來跟上面的分析話題的方式類似,通過自然語言處技術(shù)提取出主題標(biāo)簽,不過這次就不分類了,因?yàn)槲蚁胪ㄟ^構(gòu)建文章的語義網(wǎng)絡(luò)觀察具體的內(nèi)容。(閱讀量前置20%的文章的語義網(wǎng)絡(luò))(閱讀量后置20%的文章的語義網(wǎng)絡(luò))上面兩張圖非常直觀地反應(yīng)出了閱讀量前置和后置各20%的文章的語義網(wǎng)絡(luò)。標(biāo)簽圖形越大反應(yīng)出該標(biāo)簽的文章越多,網(wǎng)絡(luò)線越粗表示連接的標(biāo)簽同時(shí)出現(xiàn)的頻次越高。不難發(fā)現(xiàn)二者的網(wǎng)絡(luò)內(nèi)容存在較大差異,主要有這樣幾點(diǎn)。第一、語義網(wǎng)絡(luò)的復(fù)雜程度不同。相較于閱讀量后置20%的文章,閱讀量前置20%的文章的語義網(wǎng)絡(luò)較為復(fù)雜,但中心標(biāo)簽與邊緣標(biāo)簽分明,中心標(biāo)簽之間連接清晰,邊緣標(biāo)簽幾乎都直接連接中心標(biāo)簽。閱讀量后置20%的文章的語義網(wǎng)絡(luò)較為簡單,中心標(biāo)簽與邊緣標(biāo)簽無法清晰界定,且邊緣標(biāo)簽多為間接連接中心標(biāo)簽。由此可以推測出閱讀量高的文章的特點(diǎn)是內(nèi)容緊扣主題,文章的深度主要表現(xiàn)涉及的信息又比較為廣(邊緣標(biāo)簽較多且復(fù)雜),簡單地理解就是高閱讀量的文章相對(duì)篇幅較大且緊扣主題,而低閱讀量的文章比較泛泛而談,缺乏實(shí)質(zhì)內(nèi)容。第二、主要的主題標(biāo)簽不同。閱讀量前置20%的文章的中心標(biāo)簽是藥品、養(yǎng)生、運(yùn)動(dòng),閱讀量后置20%的文章的養(yǎng)生最突出,其次是靜止性震顫、運(yùn)動(dòng)、飲食。兩圖的標(biāo)簽對(duì)比最顯明的差別是閱讀量前置20%的文章含有藥品標(biāo)簽,并且該標(biāo)簽在語義網(wǎng)絡(luò)中最醒目。這直接說明涉及藥品的文章的閱讀量較高,也說明用戶較為關(guān)注藥品類文章。由此可見,帕金森用戶對(duì)藥物的高度關(guān)注在話題討論上和閱讀文章上是一致的,這說明了圍繞的藥物問題的確是帕金森用戶的一大痛點(diǎn)。03總結(jié)根據(jù)上面對(duì)帕金森相關(guān)話題和文章的分析,我們可以很清楚地看到,帕金森用戶的線上需求主要是了解藥物的使用和購買、當(dāng)前或前沿的治療方法、其它帕金森患者的治療經(jīng)歷以及日??祻?fù)等信息。其動(dòng)機(jī)多是自己或家屬人受帕金森病癥的折磨,需要積累疾病管理知識(shí),或是面臨某些具體癥狀困撓時(shí)解決經(jīng)驗(yàn)不足,需要尋求幫助或類似的解決經(jīng)驗(yàn),在尋求幫助的過程中目標(biāo)往往很明確。因此,帕金森用戶線上需求的本質(zhì)是尋求以疾病問題解決為導(dǎo)向的經(jīng)驗(yàn)分享。那么圍繞用戶的本質(zhì)需求,產(chǎn)品應(yīng)該盡可能提供豐富的疾病資料或管理經(jīng)驗(yàn),提升用戶獲取解決方法的效果和效率。另外由于帕金森病患者的個(gè)體差異
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川成都市八區(qū)聯(lián)考2024-2025學(xué)年八年級(jí)上學(xué)期期末語文試題(解析版)
- 福建省福州市倉山區(qū)2024-2025學(xué)年八年級(jí)上學(xué)期期末語文試題(解析版)
- 法律職業(yè)客觀題二-2025國家法律職業(yè)資格考試《客觀題卷二》模擬試卷2
- 初級(jí)公司信貸-2019上半年初級(jí)銀行從業(yè)資格考試《公司信貸》真題
- 企業(yè)員工日常運(yùn)行行為規(guī)范
- 2024-2025學(xué)年安徽省合肥市普通高中高三上學(xué)期期末模擬訓(xùn)練(二)物理試題(解析版)
- 北師大版四年級(jí)上冊數(shù)學(xué)第六單元除法培優(yōu)測試卷(及答案)
- 綠化合同范本(2篇)
- 山東省泰安市2024-2025學(xué)年高二上學(xué)期11月期中考試物理試題(解析版)
- 遼寧省沈陽市重點(diǎn)高中聯(lián)合體2024-2025學(xué)年高三上學(xué)期11月期中考試物理試題(解析版)
- JTG 3362-2018公路鋼筋混凝土及預(yù)應(yīng)力混凝土橋涵設(shè)計(jì)規(guī)范
- 電動(dòng)汽車用驅(qū)動(dòng)電機(jī)系統(tǒng)-編制說明
- 江蘇卷2024年高三3月份模擬考試化學(xué)試題含解析
- 門診導(dǎo)診課件
- 2024年四川省成都市新都區(qū)中考英語一診試卷(含解析)
- 《樹立正確的“三觀”》班會(huì)課件
- ISO15614-1 2017 金屬材料焊接工藝規(guī)程及評(píng)定(中文版)
- 醫(yī)療器械物價(jià)收費(fèi)申請(qǐng)流程
- “一帶一路”背景下的西安市文化旅游外宣翻譯研究-基于生態(tài)翻譯學(xué)理論
- 2024年江蘇省昆山市六校中考聯(lián)考(一模)化學(xué)試題
- 國家電網(wǎng)智能化規(guī)劃總報(bào)告
評(píng)論
0/150
提交評(píng)論