《Python商業(yè)數(shù)據(jù)分析》案例:知識(shí)付費(fèi)中顧客滿意度分析_第1頁(yè)
《Python商業(yè)數(shù)據(jù)分析》案例:知識(shí)付費(fèi)中顧客滿意度分析_第2頁(yè)
《Python商業(yè)數(shù)據(jù)分析》案例:知識(shí)付費(fèi)中顧客滿意度分析_第3頁(yè)
《Python商業(yè)數(shù)據(jù)分析》案例:知識(shí)付費(fèi)中顧客滿意度分析_第4頁(yè)
《Python商業(yè)數(shù)據(jù)分析》案例:知識(shí)付費(fèi)中顧客滿意度分析_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Python商業(yè)數(shù)據(jù)分析知識(shí)付費(fèi)中顧客滿意度分析19.1案例背景在線社交問(wèn)答社區(qū)(OnlineSocialQ&ACommunity)極大地促進(jìn)了知識(shí)的分享、交流和傳播。無(wú)論是在國(guó)內(nèi)還是國(guó)外,在線社交問(wèn)答社區(qū)都呈現(xiàn)出蓬勃發(fā)展的勢(shì)態(tài)。在國(guó)內(nèi),截止到2018年底,知乎的注冊(cè)用戶數(shù)已經(jīng)超過(guò)2億,問(wèn)題數(shù)超過(guò)3千萬(wàn),成為中國(guó)最大的在線社交回答社區(qū)。在國(guó)外,也有Quora、StackOverflow等一般性或?qū)I(yè)性問(wèn)答社區(qū),匯聚了全世界不同國(guó)家和地區(qū)用戶的知識(shí)和經(jīng)驗(yàn)。這些社區(qū)允許用戶公開(kāi)提出問(wèn)題,鼓勵(lì)用戶回答他人提出的問(wèn)題。用戶也可以“關(guān)注”專家用戶,進(jìn)而持續(xù)獲得相關(guān)領(lǐng)域的高質(zhì)量知識(shí)。19.1案例背景隨著免費(fèi)知識(shí)分享的蓬勃發(fā)展,在線社交問(wèn)答社區(qū)的運(yùn)營(yíng)方也開(kāi)始思考如何將知識(shí)和流量變現(xiàn)。除了傳統(tǒng)的廣告投放外,平臺(tái)也積極地利用專家用戶的知識(shí)和影響進(jìn)行盈利。盡管免費(fèi)的知識(shí)社交允許用戶分享彼此的知識(shí)、經(jīng)驗(yàn)和見(jiàn)解,但和任何免費(fèi)模式一樣,大量的免費(fèi)知識(shí)質(zhì)量參差不齊,存在“信息過(guò)載”的問(wèn)題。為了獲取高質(zhì)量的知識(shí),用戶逐漸形成知識(shí)付費(fèi)的意向和需求。同時(shí),部分在特定領(lǐng)域有著良好專業(yè)積累的用戶在此過(guò)程中建立口碑及認(rèn)知,成為優(yōu)質(zhì)的知識(shí)提供者,他們可將自身知識(shí)包裝成產(chǎn)品或服務(wù),并通過(guò)知識(shí)付費(fèi)平臺(tái)售賣給知識(shí)付費(fèi)者以創(chuàng)造商業(yè)價(jià)值。知識(shí)付費(fèi)化符合平臺(tái)、知識(shí)需求方、知識(shí)供給方的共同利益。19.1案例背景付費(fèi)知識(shí)產(chǎn)品應(yīng)運(yùn)而生,其中較為成功的是知乎于2016年推出的線上講座類知識(shí)產(chǎn)品:知乎Live。在知乎Live中,專家用戶可以自己設(shè)計(jì)一場(chǎng)1~2小時(shí)的講座,通過(guò)文字、圖片、語(yǔ)音、視頻等多種方式傳遞知識(shí)。一場(chǎng)Live同時(shí)允許眾多聽(tīng)眾觀看,主講人可以通過(guò)文字、圖片、音視頻、幻燈片等方式向聽(tīng)眾講授知識(shí)。每場(chǎng)Live的售價(jià)在10至500元不等。付費(fèi)知識(shí)產(chǎn)品讓顧客、專家用戶和平臺(tái)都能獲益。顧客獲得了高質(zhì)量的知識(shí),專家用戶獲得了直接的收益,平臺(tái)則能從中收取一定的管理費(fèi)用。我國(guó)知識(shí)付費(fèi)用戶規(guī)模呈高速增長(zhǎng)趨勢(shì)。從宏觀來(lái)看,2018年知識(shí)付費(fèi)用戶規(guī)模超過(guò)2億,2019年知識(shí)付費(fèi)用戶規(guī)模已接近4億。從微觀來(lái)看,以知乎為例,截止到2020年2月底,知乎宣布其付費(fèi)用戶數(shù)比去年同期增長(zhǎng)4倍。19.1案例背景講座類付費(fèi)知識(shí)產(chǎn)品:知乎Live

19.1案例背景知識(shí)消費(fèi)不同于免費(fèi)的知識(shí)分享,用戶群體發(fā)生了微妙的變化。在免費(fèi)模式下,用戶在不同的問(wèn)題下創(chuàng)作知識(shí)、閱讀知識(shí),用戶和用戶之間分享和討論知識(shí),呈現(xiàn)出較為對(duì)稱的地位。而在付費(fèi)模式下,用戶分化形成兩大群體:知識(shí)提供者和知識(shí)付費(fèi)者。一部分用戶提供知識(shí),另一部分用戶消費(fèi)知識(shí)。用戶和用戶之間變成了“講授”和“學(xué)習(xí)”的非對(duì)稱關(guān)系。免費(fèi)模式的推動(dòng)力是“分享”和“社交”,而付費(fèi)模式的推動(dòng)力必然是“購(gòu)買”。和任何付費(fèi)模式一樣,知識(shí)付費(fèi)的核心是知識(shí)付費(fèi)者心甘情愿地、持續(xù)地花錢購(gòu)買知識(shí),也就需要持續(xù)地提供高質(zhì)量知識(shí)、保證顧客的滿意度。作為消費(fèi)者,聽(tīng)眾可以對(duì)自己購(gòu)買的Live進(jìn)行評(píng)分,來(lái)表達(dá)自己對(duì)知識(shí)付費(fèi)的滿意程度:主講人講得好不好?錢花的值不值?一場(chǎng)成功的Live不僅要有眾多聽(tīng)眾愿意付費(fèi)觀看,而且應(yīng)該為主講人積累良好的聲譽(yù)和口碑,為他下一場(chǎng)Live吸引更多聽(tīng)眾。19.1案例背景本案例試圖探究知識(shí)消費(fèi)中哪些因素影響顧客的滿意度。首先,從單次購(gòu)買來(lái)看,Live的價(jià)格是知識(shí)產(chǎn)品極為重要的信息。Live的價(jià)格既是顧客需要付出的經(jīng)濟(jì)成本,也可能是知識(shí)質(zhì)量的指示信號(hào)。更高的價(jià)格會(huì)提高消費(fèi)者對(duì)產(chǎn)品的期望,當(dāng)現(xiàn)實(shí)產(chǎn)生落差時(shí),顧客更可能產(chǎn)生不滿意的情緒;而從相反的角度,高價(jià)格的產(chǎn)品往往意味著更優(yōu)秀的知識(shí)質(zhì)量,也可能讓顧客更為滿意。從多次購(gòu)買的角度,顧客之前的購(gòu)買記錄也可能會(huì)影響顧客滿意度,這包括顧客對(duì)過(guò)往消費(fèi)Live的評(píng)價(jià)情況,以及過(guò)往消費(fèi)Live的價(jià)格水平。過(guò)往評(píng)價(jià)高的用戶可能更為寬容,對(duì)所有Live都有較高的滿意度;而過(guò)往消費(fèi)水平高的用戶有較強(qiáng)的購(gòu)買力,往往也有較高的滿意度。此外,顧客本身的特質(zhì)還值得進(jìn)一步挖掘:顧客到底對(duì)哪些內(nèi)容感興趣?具備哪方面的背景知識(shí)?某場(chǎng)Live是否能滿足顧客的需求?因此,顧客對(duì)特定Live的專業(yè)性同樣會(huì)影響顧客的滿意程度。顧客可能更傾向于深入了解自己熟悉的領(lǐng)域,也可能更傾向于探索自己未知的領(lǐng)域。當(dāng)然,對(duì)于專業(yè)性程度不同的用戶,他們對(duì)知識(shí)產(chǎn)品的感知可能完全不同,也可能影響滿意度的影響機(jī)制。19.1案例背景知識(shí)付費(fèi)中滿意度的影響因素

19.1案例背景學(xué)完本案例,你應(yīng)該能夠:了解在線社交問(wèn)答社區(qū)的免費(fèi)內(nèi)容和付費(fèi)內(nèi)容的運(yùn)營(yíng)模式及特點(diǎn);使用doc2vec模型刻畫(huà)在線問(wèn)答社區(qū)中的用戶特征;刻畫(huà)付費(fèi)知識(shí)產(chǎn)品及其消費(fèi)者的特征;預(yù)測(cè)付費(fèi)知識(shí)產(chǎn)品的用戶滿意度。19.2數(shù)據(jù)介紹本案例的所有數(shù)據(jù)收集自知乎,包括其免費(fèi)問(wèn)答社區(qū)和付費(fèi)知識(shí)產(chǎn)品(知乎Live)。截至2018年7月,我們從知乎上收集到1,756名主講人主辦的4,010場(chǎng)Live。這些Live下記錄了超過(guò)50萬(wàn)條顧客評(píng)價(jià),涉及超過(guò)27萬(wàn)名聽(tīng)眾。我們首先對(duì)數(shù)據(jù)進(jìn)行了抽樣和清洗。由于聽(tīng)眾數(shù)量過(guò)多,后續(xù)還要抓取每名聽(tīng)眾在免費(fèi)平臺(tái)上的活動(dòng),我們?cè)噲D從全部數(shù)據(jù)中提取一個(gè)有代表性的子集進(jìn)行分析。我們使用系統(tǒng)抽樣法對(duì)顧客評(píng)價(jià)進(jìn)行了抽樣,在網(wǎng)頁(yè)顯示的每頁(yè)評(píng)論中保留第一條評(píng)論。此外,為了分析歷史交易對(duì)顧客滿意度的影響,我們需要顧客有一定次數(shù)的購(gòu)買記錄。因此,我們剔除了評(píng)價(jià)Live不足5場(chǎng)的聽(tīng)眾。保留下來(lái)的顧客經(jīng)驗(yàn)更為豐富,評(píng)分應(yīng)該更為穩(wěn)定,能更好地體現(xiàn)他們的滿意程度。在剔除所有缺失值后,我們保留了8,538名顧客,并且獲取了他們從注冊(cè)知乎起至2018年7月在免費(fèi)平臺(tái)上的所有行為。最終的數(shù)據(jù)包括3,911場(chǎng)Live、1,687名主講人和100,780條顧客評(píng)價(jià)。我們同樣抓取了主講人在免費(fèi)平臺(tái)上的所有行為。我們重點(diǎn)記錄了顧客或主講人的四類行為:創(chuàng)建回答、創(chuàng)建專欄文章、點(diǎn)贊回答和點(diǎn)贊專欄文章。用戶信息付費(fèi)平臺(tái)信息主講人數(shù)聽(tīng)眾數(shù)Live數(shù)顧客評(píng)論數(shù)1,6878,5383,911100,780免費(fèi)平臺(tái)信息創(chuàng)建回答數(shù)創(chuàng)建專欄文章數(shù)點(diǎn)贊回答數(shù)點(diǎn)贊專欄文章數(shù)157,41611,4353,519,540439,89819.2.1變量介紹首先,我們介紹可以直接收集到的數(shù)值變量。在顧客評(píng)價(jià)中,顧客對(duì)每場(chǎng)Live的評(píng)價(jià)中包含一個(gè)1~5星的評(píng)分,可以作為顧客滿意度的衡量指標(biāo)。其次,每場(chǎng)Live會(huì)有明確的價(jià)格。通過(guò)顧客ID,我們可以將顧客對(duì)不同Live的購(gòu)買和評(píng)價(jià)聯(lián)系起來(lái),進(jìn)而計(jì)算出顧客歷史購(gòu)買均價(jià)和顧客歷史評(píng)價(jià)均分。某場(chǎng)Live的顧客評(píng)價(jià)19.2.1變量介紹其次,我們用文本表征學(xué)習(xí)的方法度量顧客專業(yè)性。顧客專業(yè)性表示顧客對(duì)于他購(gòu)買的知識(shí)(Live)有多了解。對(duì)于同一位顧客而言,他對(duì)不同知識(shí)的專業(yè)性可能是不同的。在已有學(xué)術(shù)文獻(xiàn)中,有學(xué)者將對(duì)某人的描述和對(duì)技能描述的相似程度作為某人在該項(xiàng)技能上的專業(yè)程度。在該情境下,顧客的描述可以使用他在免費(fèi)平臺(tái)上的行為記錄。然而知識(shí)(Live)的描述往往過(guò)于簡(jiǎn)潔,無(wú)法提取足夠的信息。因此,我們采取了一種變通的方式:將主講人在免費(fèi)平臺(tái)上的行為記錄作為他主辦Live知識(shí)領(lǐng)域的替代描述。一般來(lái)說(shuō),主講人在免費(fèi)平臺(tái)和付費(fèi)平臺(tái)上的知識(shí)領(lǐng)域具有一致性。免費(fèi)社區(qū)上一位攝影領(lǐng)域的優(yōu)質(zhì)回答者,主講的Live一般也與攝影高度相關(guān)。這一方面取決于主講人的知識(shí)積累,另一方面也取決于他的聽(tīng)眾基礎(chǔ)。因此,我們假設(shè)主講人在免費(fèi)平臺(tái)上的知識(shí)分布和他所開(kāi)講的Live內(nèi)容之間具有高度相關(guān)性?;谶@一假設(shè),我們將用“聽(tīng)眾-主講人”在免費(fèi)平臺(tái)上知識(shí)分布的相似性代替“聽(tīng)眾-Live”的顧客專業(yè)性。顧客在免費(fèi)平臺(tái)上的行為記錄

19.2.1變量介紹具體來(lái)說(shuō),聽(tīng)眾或主講人在免費(fèi)平臺(tái)上是地位平等的用戶,他們會(huì)創(chuàng)作、點(diǎn)贊其他回答或?qū)谖恼隆N覀冏ト×怂猩婕暗降幕卮鸷蛯谖恼碌乃形谋?。將一名用戶(包括?tīng)眾或主講人)創(chuàng)作/點(diǎn)贊的所有回答/文章收集起來(lái),就形成了該用戶的一份特征文檔,可以用來(lái)計(jì)算該用戶的知識(shí)分布。19.2.1變量介紹從用戶的特征文檔計(jì)算用戶的特征分布,本質(zhì)上是將特征文檔轉(zhuǎn)化成特征向量表征。我們使用Doc2Vec模型進(jìn)行文本向量表征,將所有特征文檔轉(zhuǎn)化成200維的特征向量。與LDA話題模型相比,Doc2Vec保留了文檔中的詞語(yǔ)順序和句子順序。利用Doc2Vec模型,我們將數(shù)據(jù)集中的10,208名用戶(包括主講人和聽(tīng)眾)的特征文檔,建模成10,208個(gè)特征向量,來(lái)表示用戶的知識(shí)分布。在得到用戶的知識(shí)分布向量后,我們可以用兩向量的余弦值計(jì)算兩名用戶(聽(tīng)眾-主講人)的知識(shí)背景相似性,用以衡量聽(tīng)眾對(duì)該主講人主辦的Live的專業(yè)程度。19.2.2數(shù)據(jù)獲取Step1-確定已發(fā)布Live的列表:首先要明確有哪些已發(fā)布的Live。我們可以在知乎Live的首頁(yè)(/lives)獲得Live的列表。需要注意的是,這份列表長(zhǎng)度很短,而且不同登錄用戶展示的內(nèi)容也有所差異。這說(shuō)明該Live列表并不是平臺(tái)上已發(fā)布的所有Live,而是知乎對(duì)不同用戶進(jìn)行個(gè)性化推薦而產(chǎn)生的推薦列表。知乎Live首頁(yè)的推薦列表19.2.2數(shù)據(jù)獲取Step1-確定已發(fā)布Live的列表:找到更多的Live:在任何一個(gè)Live的詳情頁(yè)面內(nèi),我們發(fā)現(xiàn)頁(yè)面底部有“發(fā)現(xiàn)更多”功能,即知乎對(duì)每場(chǎng)Live又提供了一個(gè)推薦列表,向觀眾推薦主題類似的Live。從每場(chǎng)Live的推薦列表中,我們可以不斷發(fā)現(xiàn)新的Live。因此,我們可以不斷遍歷已知Live的推薦列表,直到不能再發(fā)現(xiàn)新的Live為止。Live下的“發(fā)現(xiàn)更多”功能

19.2.2數(shù)據(jù)獲取Step1-確定已發(fā)布Live的列表:找到更多的Live;記錄每場(chǎng)Live的ID:Live的ID可以從Live的詳情網(wǎng)址中獲取。從Live首頁(yè)獲得初始Live列表;并根據(jù)“發(fā)現(xiàn)更多”功能擴(kuò)展Live列表。19.2.2數(shù)據(jù)獲取Step1-確定已發(fā)布Live的列表:為了避免死循環(huán),我們要記錄哪些Live的推薦Live已經(jīng)找到,而哪些有待查找。首先,initial_Live_ID_list里記錄的Live都需要“尋找推薦Live”。我們將它作為“待處理列表”,并且額外定義一個(gè)“已處理的Live列表”,即output_Live_ID_list。當(dāng)還有未處理的Live時(shí),我們從未處理Live中選擇第1條,來(lái)尋找它的推薦列表。如果找到的Live是已處理的Live,則跳過(guò);反之,則應(yīng)先檢查未處理Live中是否有該Live,若沒(méi)有則將其記錄到未處理Live中。當(dāng)該Live的推薦Live都處理完畢后,則將其移入已處理Live列表,并從未處理列表中刪除。所有循環(huán)結(jié)束后,則得到了所需的Live列表,并將其保存。19.2.2數(shù)據(jù)獲取Step2-獲取已發(fā)布Live的基本信息:我們關(guān)心每場(chǎng)Live的售價(jià)等基本信息,這些信息記錄在Live詳情頁(yè)中。這部分信息的獲取相對(duì)簡(jiǎn)單,使用urllib.request.urlopen()或requests.get()獲取源代碼,并利用BeautifulSoup()提取價(jià)格、時(shí)長(zhǎng)、文件數(shù)、問(wèn)答數(shù)、主講人ID等信息即可。Live基本信息

19.2.2數(shù)據(jù)獲取Step3-獲取已發(fā)布Live的評(píng)論信息:在新版知乎Live的網(wǎng)頁(yè)端,Live的評(píng)論列表只顯示部分用戶的評(píng)論。本案例采用的數(shù)據(jù)于2018年抓取自舊版知乎Live網(wǎng)頁(yè)端。同樣,Live評(píng)論頁(yè)對(duì)應(yīng)單獨(dú)的網(wǎng)址,可以獲得評(píng)論人ID、評(píng)分、評(píng)論文本等信息。某場(chǎng)Live的顧客評(píng)價(jià)19.2.2數(shù)據(jù)獲取Step4-獲取用戶在免費(fèi)平臺(tái)上的行為:在抓取Live簡(jiǎn)介和評(píng)論信息的過(guò)程中,我們獲取到主講人ID和評(píng)論人ID。我們可以前往用戶的個(gè)人主頁(yè)抓取相應(yīng)的信息。任何一位用戶都有個(gè)人主頁(yè)。值得注意的是,該頁(yè)面采取滾動(dòng)式翻頁(yè),即采用異步加載技術(shù),需要從開(kāi)發(fā)者工具中找到加載數(shù)據(jù)的真實(shí)網(wǎng)址。在個(gè)人主頁(yè)的“動(dòng)態(tài)”標(biāo)簽下記錄著該用戶的多種行為。我們重點(diǎn)關(guān)注其中的四類行為:贊同回答、贊同專欄文章、發(fā)表回答、發(fā)表專欄文章??梢酝ㄟ^(guò)verb或action_text字段進(jìn)行區(qū)分。個(gè)人主頁(yè)-動(dòng)態(tài)動(dòng)態(tài)加載的源代碼19.2.2數(shù)據(jù)獲取Step5-提取用戶知識(shí)背景向量:假設(shè)我們對(duì)每名用戶生成了3類文檔:點(diǎn)贊的回答/專欄文章(VF,VoteFile)、創(chuàng)作的回答/專欄文章(CF,CreateFile)、所有回答和專欄文章(AF,AllFile)。我們以AF文檔為例,簡(jiǎn)要介紹使用Doc2Vec模型進(jìn)行特征向量表征。首先,對(duì)文檔進(jìn)行預(yù)處理,使用jieba或PyLTP等第三方庫(kù)等對(duì)中文文本進(jìn)行分詞,刪除停用詞等。然后使用gensim庫(kù)訓(xùn)練Doc2Vec模型。Doc2Vec模型分為訓(xùn)練和測(cè)試兩階段。在訓(xùn)練階段,我們需要用到大量數(shù)據(jù),遠(yuǎn)遠(yuǎn)超過(guò)電腦內(nèi)存。因此,我們將數(shù)據(jù)分批輸入到模型中,對(duì)模型進(jìn)行增量式訓(xùn)練。具體過(guò)程為從所有用戶中隨機(jī)抽取一個(gè)數(shù)據(jù)集,來(lái)初始化Doc2Vec模型。然后不斷地隨機(jī)抽取數(shù)據(jù)集,更新Doc2Vec模型,當(dāng)模型訓(xùn)練完畢后保存更新后的模型。19.2.2數(shù)據(jù)獲取Step5-提取用戶知識(shí)背景向量:get_random_data_set()函數(shù)負(fù)責(zé)從所有用戶中隨機(jī)抽取一定數(shù)量的用戶樣本,得到對(duì)應(yīng)的特征文檔,并將這些文檔轉(zhuǎn)換成Doc2Vec模型可以處理的格式。假設(shè)用戶的AF數(shù)據(jù)(所有點(diǎn)贊/創(chuàng)作的回答/專欄文章)存放在目錄user_AF_document下,每個(gè)文件對(duì)應(yīng)1名用戶,以用戶ID命名。那么該文件夾下所有文件名就對(duì)應(yīng)用戶全體(all_user_list)。利用random.sample()從中隨機(jī)抽取一定數(shù)量的用戶,并讀取他們的AF文檔,將預(yù)處理后的結(jié)果用modes.doc2vec.TaggedDocument()進(jìn)行處理,即可得到Doc2Vec模型所需的數(shù)據(jù)格式。利用models.doc2vec.Doc2Vec()函數(shù)能便捷地實(shí)現(xiàn)模型的初始化,其中Sample參數(shù)可以限制頻率過(guò)高的詞被采樣的概率;negative參數(shù)則表示是否要使用負(fù)采樣策略,以及應(yīng)該抽取多少的“噪音”樣本,這些參數(shù)的取值可能會(huì)影響Doc2vec的結(jié)果,在計(jì)算機(jī)科學(xué)領(lǐng)域有更多的討論。而當(dāng)我們希望得到對(duì)管理有幫助的知識(shí)或建議時(shí),技術(shù)性的參數(shù)調(diào)整不應(yīng)該起主要作用。無(wú)論在何種參數(shù)設(shè)定下,結(jié)論都應(yīng)該是成立的、穩(wěn)健的。在定義了模型后,使用dataset對(duì)模型進(jìn)行訓(xùn)練,用model.save()將訓(xùn)練好的模型保存到特定位置。19.2.2數(shù)據(jù)獲取19.2.2數(shù)據(jù)獲取Step5-提取用戶知識(shí)背景向量:增量訓(xùn)練更新模型的過(guò)程比較簡(jiǎn)單,只需要讀取模型,隨機(jī)生成新語(yǔ)料,用新的語(yǔ)料在原有模型的基礎(chǔ)上更新即可。這里需要著重介紹gc(GarbageCollector)模塊,該模塊用來(lái)進(jìn)行垃圾回收,實(shí)現(xiàn)手動(dòng)釋放內(nèi)存功能。由于每次訓(xùn)練的數(shù)據(jù)量都很大,因此在使用dataset后,需要用del()將dataset顯式地刪除,并且調(diào)用gc.collect()釋放內(nèi)存。在內(nèi)存足夠大的設(shè)備上不需要這樣的機(jī)制。19.2.2數(shù)據(jù)獲取Step5-提取用戶知識(shí)背景向量:在模型訓(xùn)練完畢后,我們將所有用戶的文檔輸入到模型中,即可輸出表征向量。將文檔處理成Doc2Vec可接受格式,然后用model.infer_vector()方法即可得到相應(yīng)的向量表示,最后使用numpy庫(kù)中的savetxt()函數(shù)將向量?jī)?chǔ)存到特定位置。19.2.2數(shù)據(jù)獲取

19.3.1分析方法回歸分析是經(jīng)濟(jì)管理領(lǐng)域常用的統(tǒng)計(jì)分析方法,我們使用回歸分析來(lái)驗(yàn)證Live當(dāng)前價(jià)格、顧客歷史價(jià)格、歷史滿意度和顧客專業(yè)型等因素對(duì)顧客的滿意度的影響程度。統(tǒng)計(jì)分析方法建議使用R、SPSS等專業(yè)的統(tǒng)計(jì)分析軟件,在Python中,也可以使用statsmodels庫(kù)進(jìn)行回歸分析。我們使用一個(gè)簡(jiǎn)單的例子進(jìn)行回歸分析。19.3.1分析方法用R軟件也可以得到相同的結(jié)果:19.3.1分析方法在將各變量標(biāo)準(zhǔn)化后,我們使用最基礎(chǔ)的回歸分析來(lái)檢驗(yàn)知識(shí)付費(fèi)中顧客滿意度的影響因素。模型1僅包括控制變量;模型2檢驗(yàn)自變量的主效應(yīng);模型3檢驗(yàn)交互效應(yīng)。根據(jù)VIF統(tǒng)計(jì)量,各模型均不存在多重共線性問(wèn)題。模型結(jié)果如下表所示:

模型1模型2模型3常數(shù)項(xiàng)8.56E-15(0)6.19E-05(0.024)1.10E-03(0.43)顧客專業(yè)性1.32E-02***(5.023)1.45E-02***(5.512)當(dāng)前價(jià)格-3.34E-02***(-11.689)-3.34E-02***(-11.677)歷史均價(jià)9.81E-03***(3.372)1.07E-02***(3.64)歷史滿意度5.83E-01***(228.906)5.83E-01***(228.448)當(dāng)前價(jià)格×顧客專業(yè)性1.21E-02***(3.927)歷史均價(jià)×顧客專業(yè)性-6.95E-03*(-2.572)歷史滿意度×顧客專業(yè)性-1.73E-02***(-6.605)控制變量Live市場(chǎng)6.89E-02***(16.171)6.37E-02***(18.435)6.34E-02***(18.339)問(wèn)答數(shù)-4.66E-02***(-10.095)-7.59E-03*(-2.025)-7.60E-03*(-2.028)文件數(shù)2.11E-02***(5.672)1.61E-02***(5.349)1.63E-02***(5.421)Live音頻信息數(shù)5.18E-02***(9.594)1.53E-02***(3.497)1.55E-02***(3.553)主講人Live場(chǎng)數(shù)7.55E-02***(23.223)4.13E-02***(15.37)4.18E-02***(15.553)主講人知乎回答數(shù)1.12E-02**(2.97)4.10E-03(1.34)4.30E-03(1.406)主講人知乎文章數(shù)-3.03E-02***(-8.197)-1.85E-02***(-6.161)-1.91E-02***(-6.359)主講人粉絲數(shù)1.78E-02***(4.736)3.61E-02***(11.793)3.59E-02***(11.721)主講人關(guān)注數(shù)7.63E-03*(2.331)-1.46E-03(-0.541)2.30E-04(0.081)主講人擅長(zhǎng)話題數(shù)-1.89E-02***(-5.908)-1.20E-02***(-4.615)-1.24E-02***(-4.779)調(diào)整后的R20.01470.35340.353819.3.2分析結(jié)論從上述模型可以看出,在其他條件一定時(shí),顧客專業(yè)性對(duì)顧客滿意度有正向的影響,即顧客專業(yè)程度越高,對(duì)知乎Live的滿意度也越高。類似的,當(dāng)前價(jià)格對(duì)顧客滿意度有負(fù)向影響,顧客歷史購(gòu)買價(jià)格和歷史滿意度對(duì)當(dāng)前Live的滿意度有正向影響。模型3中引入了當(dāng)前價(jià)格、歷史均價(jià)、歷史滿意度和顧客專業(yè)性的交互項(xiàng)。我們發(fā)現(xiàn)顧客專業(yè)性在顧客滿意度中也具有調(diào)節(jié)效應(yīng)。19.3.2分析結(jié)論首先,顧客專業(yè)性在“當(dāng)前價(jià)格-滿意度”的影響機(jī)制中起到調(diào)節(jié)作用。在不考慮顧客專業(yè)性時(shí),當(dāng)前價(jià)格對(duì)滿意度有負(fù)向影響,當(dāng)前價(jià)格越高,顧客滿意度越低。而在區(qū)分顧客專業(yè)性后,我們發(fā)現(xiàn)對(duì)于專業(yè)性低的顧客,當(dāng)前價(jià)格的負(fù)面影響更強(qiáng);而對(duì)于專業(yè)性高的顧客,當(dāng)前價(jià)格幾乎沒(méi)有負(fù)面影響?;诔杀臼找胬碚摚╟ost-benefittheory),價(jià)格體現(xiàn)為顧客付出的經(jīng)濟(jì)成本,而收益則是顧客從Live中學(xué)到的知識(shí)、獲得的效用。另一方面,知識(shí)產(chǎn)品價(jià)格對(duì)知識(shí)產(chǎn)品質(zhì)量具有“信號(hào)效應(yīng)”,一般認(rèn)為價(jià)格越高的產(chǎn)品會(huì)講授更為專業(yè)的高階知識(shí)。由于知識(shí)產(chǎn)品的效用感知具有多樣性,不是所有用戶都能感知到產(chǎn)品帶來(lái)的效用。對(duì)于專業(yè)性高的顧客來(lái)說(shuō),盡管要支付較高的價(jià)格,但他能理解高價(jià)的知識(shí)產(chǎn)品“物有所值”,對(duì)價(jià)格變動(dòng)的敏感性低。而對(duì)專業(yè)性低的顧客來(lái)說(shuō),他難以理解復(fù)雜的專業(yè)知識(shí),因此更容易作出不滿意的評(píng)價(jià)。19.3.2分析結(jié)論其次,顧客專業(yè)性在“歷史價(jià)格-滿意度”的影響機(jī)制中起到調(diào)節(jié)作用。在不考慮顧客專業(yè)性時(shí),歷史價(jià)格對(duì)滿意度有正向影響,歷史價(jià)格越高,顧客滿意度越高。而在區(qū)分顧客專業(yè)性后,我們發(fā)現(xiàn)對(duì)于專業(yè)性低的顧客,歷史價(jià)格的正面影響更強(qiáng);而對(duì)于專業(yè)性高的顧客,歷史價(jià)格對(duì)滿意度卻有負(fù)向影響?;贖elson的適應(yīng)性水平理論,個(gè)體在過(guò)去的經(jīng)驗(yàn)中會(huì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論