用戶社交屬性判別模型_第1頁
用戶社交屬性判別模型_第2頁
用戶社交屬性判別模型_第3頁
用戶社交屬性判別模型_第4頁
用戶社交屬性判別模型_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

用戶社交屬性判別模型目錄1研究目標(biāo)和意義2關(guān)系群體社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)移動(dòng)軌跡OD穩(wěn)定點(diǎn)發(fā)現(xiàn)提升家庭、集團(tuán)客戶營(yíng)銷精準(zhǔn)度針對(duì)性制定競(jìng)爭(zhēng)策略加強(qiáng)核心客戶維系和粘性價(jià)值利用群體影響力拓展?fàn)I銷市場(chǎng)掌握用戶群體出行規(guī)律,強(qiáng)化廣告投放、業(yè)務(wù)營(yíng)銷策略拓展信息化服務(wù)業(yè)務(wù)產(chǎn)品提升目標(biāo)客戶群體圈定的準(zhǔn)確率和效率豐滿客戶畫像了解客戶分布,定位商務(wù)區(qū)、居民區(qū)、流動(dòng)性大區(qū)域?qū)τ脩舻慕煌?、移?dòng)軌跡等使用社會(huì)網(wǎng)絡(luò)分析相關(guān)分析方法進(jìn)行建模,判別用戶間各類交往關(guān)系,如家庭、同事等。研究方法3包括用戶個(gè)人通話行為、用戶交往圈以及用戶移動(dòng)軌跡,首次引入不同時(shí)段的位置信息,提升關(guān)系識(shí)別精準(zhǔn)度。從數(shù)據(jù)倉庫中讀取源數(shù)據(jù),校驗(yàn)數(shù)據(jù)的完整性,去除冗余和具有明顯錯(cuò)誤的數(shù)據(jù)。1)OD發(fā)現(xiàn)/軌跡分析:分析基站數(shù)據(jù)得到用戶移動(dòng)軌跡的時(shí)間和空間規(guī)律,可判定用戶的OD穩(wěn)定點(diǎn),有助于描述用戶行為模式和關(guān)系特征;2)特征提?。禾崛颖綩D、通話頻次、交往規(guī)律等用戶行為特征,作為關(guān)系分類判別的依據(jù);3)關(guān)系分類:基于特征建立不同關(guān)系分類訓(xùn)練器,計(jì)算不同關(guān)系和社群聚類,作為社會(huì)關(guān)系網(wǎng)絡(luò)基礎(chǔ)。地圖直觀展示用戶穩(wěn)定點(diǎn)和關(guān)系分布,動(dòng)態(tài)顯示用戶群行為軌跡,可作為營(yíng)銷參考依據(jù),并支持靈活擴(kuò)展配置。使用河南濟(jì)源三個(gè)月(2010.07-09)數(shù)據(jù)進(jìn)行研究。4階段一:接口檢測(cè)檢測(cè)配置文件,讀取數(shù)據(jù)訪問權(quán)限階段二:數(shù)據(jù)校驗(yàn)檢測(cè)表結(jié)構(gòu),清洗數(shù)據(jù)檢查實(shí)體完整性和參照完整性運(yùn)行狀態(tài)檢測(cè)檢測(cè)模型運(yùn)行狀態(tài),運(yùn)行提示配置文件數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)標(biāo)準(zhǔn)化處理校驗(yàn)5階段三:OD提?。〞r(shí)間+空間優(yōu)化)出現(xiàn)頻率大的基站區(qū)頻繁度得到增強(qiáng)出現(xiàn)次數(shù)下限大的基站區(qū)頻繁度得到增強(qiáng)周期性規(guī)律更顯著的基站區(qū)得到突出OD識(shí)別解決了數(shù)據(jù)非實(shí)時(shí),數(shù)據(jù)稀缺的問題仍有不足,需要利用時(shí)空規(guī)律進(jìn)行改進(jìn)OD同時(shí)被多個(gè)基站覆蓋,數(shù)據(jù)分散需要進(jìn)行合并-手機(jī)行為隨機(jī),不能只用次數(shù)作為頻繁度刻畫-需要用行為的周期性規(guī)律對(duì)次數(shù)做修正OD發(fā)現(xiàn)樸素算法空間規(guī)律利用時(shí)間規(guī)律利用識(shí)別效果:共有400000多位用戶,其中識(shí)別380000位用戶OD,識(shí)別率約為95%。其他12000多位用戶由于位置暴露信息過少無法識(shí)別,8000多用戶O和D只能識(shí)別其一。6關(guān)系分類分類效果:引入交叉驗(yàn)證功能,家庭識(shí)別精度81%,同事識(shí)別精度73%。正在優(yōu)化訓(xùn)練樣本特征提取,逐步結(jié)果調(diào)優(yōu)。階段四:產(chǎn)生訓(xùn)練集使用已知集團(tuán)用戶或家庭用戶關(guān)系的其中一方除已知關(guān)系外的所有關(guān)系作為反例??赏ㄟ^配置文件定義訓(xùn)練集規(guī)模階段五:訓(xùn)練分類器主要使用用戶間通話屬性、交往圈重合、OD來進(jìn)行分類7關(guān)系識(shí)別識(shí)別效果:識(shí)別出882178個(gè)家庭關(guān)系,2147524個(gè)同事關(guān)系;形成了10948個(gè)家庭,每個(gè)家庭的人數(shù)平均為5;形成了4743個(gè)集團(tuán),每個(gè)集團(tuán)的人數(shù)平均為13。階段六:計(jì)算關(guān)系利用分類器,對(duì)用戶的關(guān)系進(jìn)行分類階段七:計(jì)算群組根據(jù)得到的關(guān)系,可以將用戶聚集成組,形成家庭和同事群體模型識(shí)別效果測(cè)試8模塊性能效果OD識(shí)別共有400000多位用戶,其中識(shí)別380000位用戶OD,識(shí)別率約為95%關(guān)系識(shí)別模型測(cè)試:家庭識(shí)別精度81%,同事識(shí)別精度73%實(shí)際外呼測(cè)試:家庭識(shí)別精度75%,同事識(shí)別精度65%群組發(fā)現(xiàn)形成了10948個(gè)家庭,每個(gè)家庭的人數(shù)平均為5;形成了4743個(gè)集團(tuán),每個(gè)集團(tuán)的人數(shù)平均為13OD切換時(shí)間服從正態(tài)分布,與日常規(guī)律一致不同關(guān)系群體與親密指數(shù)分布符合常態(tài)規(guī)律關(guān)系識(shí)別可視化9結(jié)合地圖信息,提供了可展示不同用戶社群關(guān)系歸屬、OD穩(wěn)定點(diǎn)、動(dòng)態(tài)移動(dòng)軌跡、OD分布和用戶密度分布的可視化Web頁面,可更加直觀和便捷地圈定和查詢家庭集團(tuán)客戶,有助于市場(chǎng)拓展應(yīng)用和精準(zhǔn)營(yíng)銷。以Googlemap方式展示家庭、同事、朋友等不同關(guān)系群體分類查詢,靜態(tài)顯示住所和工作地穩(wěn)定點(diǎn)。列表給出查詢用戶附近同類群體成員信息,可直接點(diǎn)擊查看靜態(tài)分布。設(shè)定時(shí)間段,動(dòng)態(tài)播放該關(guān)系群體的動(dòng)態(tài)軌跡分布,有助于了解不同群體用戶移動(dòng)出行規(guī)律以及消費(fèi)特征。聚類展示該區(qū)域集中的居民區(qū)和商務(wù)區(qū);利用熱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論