手機(jī)上的大數(shù)據(jù) 用戶行為模式的挖掘和利用_第1頁
手機(jī)上的大數(shù)據(jù) 用戶行為模式的挖掘和利用_第2頁
手機(jī)上的大數(shù)據(jù) 用戶行為模式的挖掘和利用_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

手機(jī)上的大數(shù)據(jù)用戶行為模式的挖掘和利用

通過手機(jī)閱讀、手機(jī)音樂上的用戶行為,我們可以看到手機(jī)大數(shù)據(jù)在移動互聯(lián)網(wǎng)應(yīng)用上的威力,但同時,手機(jī)上的大數(shù)據(jù)也不是萬能的,它的發(fā)展還面臨著很多實(shí)際的問題和挑戰(zhàn)。數(shù)據(jù)的稀疏性智能手機(jī)端的App應(yīng)用數(shù)以十萬計(jì),但是每個應(yīng)用中兩個用戶之間選擇的重疊非常少,如果用用戶和商品之間已有的選擇關(guān)系占所有可能存在的選擇關(guān)系的比例來衡量系統(tǒng)的稀疏性,在我們研究的幾個App數(shù)據(jù)中,稀疏度均不超過4%,其實(shí)這些其實(shí)都是非常密的數(shù)據(jù)。想想一個具有千萬級用戶,百萬級歌手的App,平均而言一個用戶能聽100首歌嗎,估計(jì)不能,所以稀疏度應(yīng)該在萬分之一或以下的量級。這個問題本質(zhì)上是無法完全克服的,但是有很多辦法,可以在相當(dāng)程度上緩解這個問題。比如擴(kuò)散方法、隨機(jī)缺省值方法、隨機(jī)選擇等冷啟動問題在我們前面討論的音樂APP中,我們發(fā)現(xiàn)歌曲的覆蓋只有2%左右,這個是由于大量歌曲出于冷啟動狀態(tài)造成的。這是因?yàn)樾律唐酚捎诒贿x擇次數(shù)很少或沒有,難以找到合適的辦法推薦給用戶結(jié)論。最近一個有趣的研究顯示,新用戶更容易選擇特別流行的商品—這無論如何是一個好消息,說明使用熱歌榜也能獲得不錯的結(jié)果。大數(shù)據(jù)處理與增量計(jì)算問題盡管數(shù)據(jù)很稀疏,大部分?jǐn)?shù)據(jù)都包含百千萬計(jì)的用戶,與此同時新用戶不停進(jìn)入系統(tǒng)。數(shù)據(jù)量不僅大,而且數(shù)據(jù)本身還時時動態(tài)變化,如何快速高效處理這些數(shù)據(jù)成為迫在眉睫的問題。在這個大前提下,算法時間和空間的復(fù)雜性,尤其是前者,獲得了空前重視。一般而言,一個高效的算法,要么自身復(fù)雜性很低,要么能夠很好并行化,要么兩者兼具。隨著加入的信息量的增多,最終每過一段時間還是需要利用全局?jǐn)?shù)據(jù)重新進(jìn)行計(jì)算。更先進(jìn)但也更苦難的辦法,是設(shè)計(jì)出一種算法,能夠保證其誤差不會累積,也就是說其結(jié)果與利用全部數(shù)據(jù)重新計(jì)算的結(jié)果之間的差異不會單調(diào)上升。用戶行為模式的挖掘和利用深入挖掘用戶的行為模式能更準(zhǔn)確的抓住用戶喜好,從而有希望做出更好的用戶體驗(yàn)。譬如說在音樂APP中,新用戶和老用戶具有很不一樣的選擇模式:一般而言,新用戶傾向于選擇熱門的歌曲,而老用戶對歌曲的多樣性關(guān)注更多。用戶行為的時空統(tǒng)計(jì)特性也可以用于提高者設(shè)計(jì)針對特定場景的應(yīng)用。舉個例子,在進(jìn)行手機(jī)個性化閱讀推薦的時候,如果曾經(jīng)的數(shù)據(jù)顯示某個用戶只在7點(diǎn)到8點(diǎn)之間有一個小時左右的手機(jī)閱讀行為(可能是上班時在地鐵或者公交車上),那么9點(diǎn)鐘發(fā)送一個電子書閱讀的短信廣告就是很不明智的選擇。從含時數(shù)據(jù)中還可以分析出影響用戶選擇的長期和短期的興趣,通過將這兩種效應(yīng)分離出來,可以明顯提高推薦的精確度。多維數(shù)據(jù)的交叉利用目前手機(jī)端的APP還出于孤立的狀態(tài),并沒有真正的完成數(shù)據(jù)打通及數(shù)據(jù)共享的地步。想象如果能夠把這些數(shù)據(jù)整合起來,特別是知道每個節(jié)點(diǎn)身份的對應(yīng)關(guān)系(不需要知道你真實(shí)身份,只需要知道不同APP中存在的若干節(jié)點(diǎn)是同一個人),可以帶來的巨大的社會經(jīng)濟(jì)價值。舉個例子,你可能已經(jīng)在新浪微博上關(guān)注了很多數(shù)據(jù)挖掘達(dá)人的微博,并且分享了很多算法學(xué)習(xí)的心得和問題,當(dāng)你第一次上當(dāng)當(dāng)網(wǎng)購書的時候,如果主頁向你推薦數(shù)據(jù)挖掘的最新專著并附有折扣,你會心動嗎?所以多維數(shù)據(jù)挖掘是真正有望解決系統(tǒng)內(nèi)部冷啟動問題的法寶——只要用戶在系統(tǒng)外部的其他系統(tǒng)有過活動。目前有很多技術(shù)方法可以實(shí)現(xiàn)這種多維數(shù)據(jù)挖掘,比如統(tǒng)計(jì)物理學(xué)的物質(zhì)擴(kuò)散、熱傳導(dǎo)方法,機(jī)器學(xué)習(xí)的遷移學(xué)習(xí)方法都有望解決這種多維數(shù)據(jù)挖掘。結(jié)論與展望由于移動互聯(lián)網(wǎng)的迅速崛起,讓互聯(lián)網(wǎng)大數(shù)據(jù)變得更為多樣、豐富。它不但可以作為互聯(lián)網(wǎng)大數(shù)據(jù)的一個有益補(bǔ)充,而且還可以作為移動互聯(lián)網(wǎng)新業(yè)務(wù)本身的行動指導(dǎo)。在市場營銷領(lǐng)域,數(shù)據(jù)可以用來洞察客戶,例如衡量他們的生命周期價值或者預(yù)測可能的購買行為。對于整個企業(yè)而言,利用數(shù)據(jù)進(jìn)行分析和應(yīng)對的能力,對于進(jìn)行正確的決策并最終取得更好的業(yè)績是至關(guān)重要的。真正實(shí)現(xiàn)“精準(zhǔn)營銷”需要底層海量的用戶行為數(shù)據(jù)做支撐,網(wǎng)絡(luò)營銷追求的都不應(yīng)是曝光率,而是用戶轉(zhuǎn)化率。而對用戶轉(zhuǎn)化過程進(jìn)行有效的數(shù)據(jù)分析,可實(shí)現(xiàn)效果的優(yōu)化。效果可從三個層面分解:目標(biāo)是否清晰、向過程要效果,最終目標(biāo)達(dá)成率就是效果。利用數(shù)據(jù)工具控制和優(yōu)化營銷過程,可不斷提升ROI效率。這需要具體了解客戶的業(yè)務(wù)發(fā)展目標(biāo)和推廣需求,可以考慮借助專業(yè)的第三方服務(wù)公司作有關(guān)于網(wǎng)絡(luò)營銷策略的效果評估。以制定出或調(diào)整有關(guān)于網(wǎng)絡(luò)營銷策略。一般來說,對于不同的營銷平臺會有不同的廣告形式投放,從而產(chǎn)生的效果也多種多樣,各家說各家的好。網(wǎng)絡(luò)營銷中,品牌認(rèn)知、提升偏好、主動尋找、購買轉(zhuǎn)化、分享/再購各階段,分別對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論