下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
手機(jī)上的大數(shù)據(jù)用戶行為模式的挖掘和利用
通過(guò)手機(jī)閱讀、手機(jī)音樂(lè)上的用戶行為,我們可以看到手機(jī)大數(shù)據(jù)在移動(dòng)互聯(lián)網(wǎng)應(yīng)用上的威力,但同時(shí),手機(jī)上的大數(shù)據(jù)也不是萬(wàn)能的,它的發(fā)展還面臨著很多實(shí)際的問(wèn)題和挑戰(zhàn)。數(shù)據(jù)的稀疏性智能手機(jī)端的App應(yīng)用數(shù)以十萬(wàn)計(jì),但是每個(gè)應(yīng)用中兩個(gè)用戶之間選擇的重疊非常少,如果用用戶和商品之間已有的選擇關(guān)系占所有可能存在的選擇關(guān)系的比例來(lái)衡量系統(tǒng)的稀疏性,在我們研究的幾個(gè)App數(shù)據(jù)中,稀疏度均不超過(guò)4%,其實(shí)這些其實(shí)都是非常密的數(shù)據(jù)。想想一個(gè)具有千萬(wàn)級(jí)用戶,百萬(wàn)級(jí)歌手的App,平均而言一個(gè)用戶能聽(tīng)100首歌嗎,估計(jì)不能,所以稀疏度應(yīng)該在萬(wàn)分之一或以下的量級(jí)。這個(gè)問(wèn)題本質(zhì)上是無(wú)法完全克服的,但是有很多辦法,可以在相當(dāng)程度上緩解這個(gè)問(wèn)題。比如擴(kuò)散方法、隨機(jī)缺省值方法、隨機(jī)選擇等冷啟動(dòng)問(wèn)題在我們前面討論的音樂(lè)APP中,我們發(fā)現(xiàn)歌曲的覆蓋只有2%左右,這個(gè)是由于大量歌曲出于冷啟動(dòng)狀態(tài)造成的。這是因?yàn)樾律唐酚捎诒贿x擇次數(shù)很少或沒(méi)有,難以找到合適的辦法推薦給用戶結(jié)論。最近一個(gè)有趣的研究顯示,新用戶更容易選擇特別流行的商品—這無(wú)論如何是一個(gè)好消息,說(shuō)明使用熱歌榜也能獲得不錯(cuò)的結(jié)果。大數(shù)據(jù)處理與增量計(jì)算問(wèn)題盡管數(shù)據(jù)很稀疏,大部分?jǐn)?shù)據(jù)都包含百千萬(wàn)計(jì)的用戶,與此同時(shí)新用戶不停進(jìn)入系統(tǒng)。數(shù)據(jù)量不僅大,而且數(shù)據(jù)本身還時(shí)時(shí)動(dòng)態(tài)變化,如何快速高效處理這些數(shù)據(jù)成為迫在眉睫的問(wèn)題。在這個(gè)大前提下,算法時(shí)間和空間的復(fù)雜性,尤其是前者,獲得了空前重視。一般而言,一個(gè)高效的算法,要么自身復(fù)雜性很低,要么能夠很好并行化,要么兩者兼具。隨著加入的信息量的增多,最終每過(guò)一段時(shí)間還是需要利用全局?jǐn)?shù)據(jù)重新進(jìn)行計(jì)算。更先進(jìn)但也更苦難的辦法,是設(shè)計(jì)出一種算法,能夠保證其誤差不會(huì)累積,也就是說(shuō)其結(jié)果與利用全部數(shù)據(jù)重新計(jì)算的結(jié)果之間的差異不會(huì)單調(diào)上升。用戶行為模式的挖掘和利用深入挖掘用戶的行為模式能更準(zhǔn)確的抓住用戶喜好,從而有希望做出更好的用戶體驗(yàn)。譬如說(shuō)在音樂(lè)APP中,新用戶和老用戶具有很不一樣的選擇模式:一般而言,新用戶傾向于選擇熱門的歌曲,而老用戶對(duì)歌曲的多樣性關(guān)注更多。用戶行為的時(shí)空統(tǒng)計(jì)特性也可以用于提高者設(shè)計(jì)針對(duì)特定場(chǎng)景的應(yīng)用。舉個(gè)例子,在進(jìn)行手機(jī)個(gè)性化閱讀推薦的時(shí)候,如果曾經(jīng)的數(shù)據(jù)顯示某個(gè)用戶只在7點(diǎn)到8點(diǎn)之間有一個(gè)小時(shí)左右的手機(jī)閱讀行為(可能是上班時(shí)在地鐵或者公交車上),那么9點(diǎn)鐘發(fā)送一個(gè)電子書閱讀的短信廣告就是很不明智的選擇。從含時(shí)數(shù)據(jù)中還可以分析出影響用戶選擇的長(zhǎng)期和短期的興趣,通過(guò)將這兩種效應(yīng)分離出來(lái),可以明顯提高推薦的精確度。多維數(shù)據(jù)的交叉利用目前手機(jī)端的APP還出于孤立的狀態(tài),并沒(méi)有真正的完成數(shù)據(jù)打通及數(shù)據(jù)共享的地步。想象如果能夠把這些數(shù)據(jù)整合起來(lái),特別是知道每個(gè)節(jié)點(diǎn)身份的對(duì)應(yīng)關(guān)系(不需要知道你真實(shí)身份,只需要知道不同APP中存在的若干節(jié)點(diǎn)是同一個(gè)人),可以帶來(lái)的巨大的社會(huì)經(jīng)濟(jì)價(jià)值。舉個(gè)例子,你可能已經(jīng)在新浪微博上關(guān)注了很多數(shù)據(jù)挖掘達(dá)人的微博,并且分享了很多算法學(xué)習(xí)的心得和問(wèn)題,當(dāng)你第一次上當(dāng)當(dāng)網(wǎng)購(gòu)書的時(shí)候,如果主頁(yè)向你推薦數(shù)據(jù)挖掘的最新專著并附有折扣,你會(huì)心動(dòng)嗎?所以多維數(shù)據(jù)挖掘是真正有望解決系統(tǒng)內(nèi)部冷啟動(dòng)問(wèn)題的法寶——只要用戶在系統(tǒng)外部的其他系統(tǒng)有過(guò)活動(dòng)。目前有很多技術(shù)方法可以實(shí)現(xiàn)這種多維數(shù)據(jù)挖掘,比如統(tǒng)計(jì)物理學(xué)的物質(zhì)擴(kuò)散、熱傳導(dǎo)方法,機(jī)器學(xué)習(xí)的遷移學(xué)習(xí)方法都有望解決這種多維數(shù)據(jù)挖掘。結(jié)論與展望由于移動(dòng)互聯(lián)網(wǎng)的迅速崛起,讓互聯(lián)網(wǎng)大數(shù)據(jù)變得更為多樣、豐富。它不但可以作為互聯(lián)網(wǎng)大數(shù)據(jù)的一個(gè)有益補(bǔ)充,而且還可以作為移動(dòng)互聯(lián)網(wǎng)新業(yè)務(wù)本身的行動(dòng)指導(dǎo)。在市場(chǎng)營(yíng)銷領(lǐng)域,數(shù)據(jù)可以用來(lái)洞察客戶,例如衡量他們的生命周期價(jià)值或者預(yù)測(cè)可能的購(gòu)買行為。對(duì)于整個(gè)企業(yè)而言,利用數(shù)據(jù)進(jìn)行分析和應(yīng)對(duì)的能力,對(duì)于進(jìn)行正確的決策并最終取得更好的業(yè)績(jī)是至關(guān)重要的。真正實(shí)現(xiàn)“精準(zhǔn)營(yíng)銷”需要底層海量的用戶行為數(shù)據(jù)做支撐,網(wǎng)絡(luò)營(yíng)銷追求的都不應(yīng)是曝光率,而是用戶轉(zhuǎn)化率。而對(duì)用戶轉(zhuǎn)化過(guò)程進(jìn)行有效的數(shù)據(jù)分析,可實(shí)現(xiàn)效果的優(yōu)化。效果可從三個(gè)層面分解:目標(biāo)是否清晰、向過(guò)程要效果,最終目標(biāo)達(dá)成率就是效果。利用數(shù)據(jù)工具控制和優(yōu)化營(yíng)銷過(guò)程,可不斷提升ROI效率。這需要具體了解客戶的業(yè)務(wù)發(fā)展目標(biāo)和推廣需求,可以考慮借助專業(yè)的第三方服務(wù)公司作有關(guān)于網(wǎng)絡(luò)營(yíng)銷策略的效果評(píng)估。以制定出或調(diào)整有關(guān)于網(wǎng)絡(luò)營(yíng)銷策略。一般來(lái)說(shuō),對(duì)于不同的營(yíng)銷平臺(tái)會(huì)有不同的廣告形式投放,從而產(chǎn)生的效果也多種多樣,各家說(shuō)各家的好。網(wǎng)絡(luò)營(yíng)銷中,品牌認(rèn)知、提升偏好、主動(dòng)尋找、購(gòu)買轉(zhuǎn)化、分享/再購(gòu)各階段,分別對(duì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 4706.124-2024家用和類似用途電器的安全第124部分:商用真空包裝器具的特殊要求
- GB/T 44783-2024大口徑空間天文望遠(yuǎn)鏡光學(xué)成像質(zhì)量地面評(píng)價(jià)方法
- 圖案形態(tài)課件教學(xué)課件
- 第二章 相互作用-力的合成與分解 2025年高考物理基礎(chǔ)專項(xiàng)復(fù)習(xí)
- 5.2 課時(shí)2 共價(jià)鍵 分子間作用力 課件 高一上學(xué)期化學(xué)蘇教版(2019)必修第一冊(cè)
- 3.3鹽類的水解 第一課時(shí) 課件高二上學(xué)期化學(xué)人教版(2019)選擇性必修1
- 糖尿病與感染綜合管理
- 糖尿病足換藥技術(shù)
- 醫(yī)藥總監(jiān)年度規(guī)劃
- 白血病病人的護(hù)理講課
- 小學(xué)校本課程-海上飛行家教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- GB/T 19973.1-2023醫(yī)療保健產(chǎn)品滅菌微生物學(xué)方法 第1部分:產(chǎn)品上微生物總數(shù)的確定
- ISO27001信息安全管理體系整套資料匯編
- 鑒賞家-教學(xué)講解課件
- 地鐵車站畢業(yè)設(shè)計(jì)
- 5.11.互聯(lián)網(wǎng)上網(wǎng)服務(wù)營(yíng)業(yè)場(chǎng)所安全審查意見(jiàn)書
- 注塑成型參數(shù)條件表
- 苯-甲苯二元混合液連續(xù)精餾的工藝設(shè)計(jì)和塔設(shè)備設(shè)計(jì)-化工課程設(shè)計(jì)
- 招商總監(jiān)面試題目
- 自然保護(hù)區(qū)學(xué)智慧樹(shù)知到答案章節(jié)測(cè)試2023年?yáng)|北林業(yè)大學(xué)
- 普通話考試說(shuō)話題談?wù)劼殬I(yè)道德
評(píng)論
0/150
提交評(píng)論