電商平臺(tái)下用戶畫像的設(shè)計(jì)與分析培訓(xùn)資料_第1頁
電商平臺(tái)下用戶畫像的設(shè)計(jì)與分析培訓(xùn)資料_第2頁
電商平臺(tái)下用戶畫像的設(shè)計(jì)與分析培訓(xùn)資料_第3頁
電商平臺(tái)下用戶畫像的設(shè)計(jì)與分析培訓(xùn)資料_第4頁
電商平臺(tái)下用戶畫像的設(shè)計(jì)與分析培訓(xùn)資料_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、The dessign aand immplemeentatiion off userr pro e-commmerce platfform專 業(yè): 計(jì)算機(jī)科學(xué)學(xué)與技術(shù)姓 名: 史維君指 導(dǎo) 教 師:申請(qǐng)學(xué)位級(jí)別: 學(xué) 士論文提交日期: 20166年6月1日日學(xué)位授予單位: 天津科技技大學(xué) 引言 隨著互聯(lián)網(wǎng)時(shí)代代的來臨,人人們?cè)絹碓街刂匾晫?duì)數(shù)據(jù)的的利用與處理理,在海量數(shù)數(shù)據(jù)中提取有有效信息,進(jìn)進(jìn)行數(shù)據(jù)分析析與挖掘發(fā)現(xiàn)現(xiàn)商業(yè)價(jià)值1。用戶是時(shí)代發(fā)展展的最重要的的因素,利用用大數(shù)據(jù)來分分析用戶的行行為與消費(fèi)習(xí)習(xí)慣,可以預(yù)預(yù)測(cè)商品的發(fā)發(fā)展的趨勢(shì),提提高產(chǎn)品質(zhì)量量,同時(shí)提高高用戶滿意度度2。本文基于大數(shù)

2、據(jù)據(jù)與Hadooop技術(shù)進(jìn)行電商商用戶畫像的的開發(fā)與設(shè)計(jì)計(jì),論文將從從國(guó)內(nèi)外研究究,需求分析析,系統(tǒng)概要要設(shè)計(jì),系統(tǒng)統(tǒng)詳細(xì)設(shè)計(jì),系系統(tǒng)的實(shí)現(xiàn)等等方面進(jìn)行整整個(gè)項(xiàng)目的描描述。 用戶畫像的的背景及意義義 隨著大數(shù)據(jù)興起起與不斷發(fā)展展,數(shù)據(jù)量越越來越來,人人們想著從這這些數(shù)據(jù)中挖挖掘出自己想想要的信息。所所以有了各種種各樣的數(shù)據(jù)據(jù)挖掘方式或或者種類并將將其抽象到各各個(gè)行業(yè)。再再次我們討論論的是其中的的一個(gè)種類,用用戶畫像。 在“用戶中心心論”理論支支持下,很多多行業(yè)意識(shí)到到用戶的重要要性,在整個(gè)個(gè)社會(huì)發(fā)展的的過程中用戶戶是主導(dǎo)因素素3。所以以有很多行業(yè)業(yè)從原來以產(chǎn)產(chǎn)品和服務(wù)為為中心的思維維方式轉(zhuǎn)換到

3、到以用戶為主主導(dǎo),開始研研究用戶的需需求,反饋和和用戶滿意度度等信息44?;ヂ?lián)網(wǎng)網(wǎng)行業(yè)也是如如此,互聯(lián)網(wǎng)網(wǎng)企業(yè)開始加加深對(duì)用戶的的了解。為了了使生產(chǎn)或銷銷售的產(chǎn)品能能夠吸引更多多的新用戶,同同時(shí)留住老用用戶,提高企企業(yè)的利潤(rùn),基基于用戶的研研究越來越重重要了5。 在很多傳統(tǒng)行行業(yè)中,商家為了了提高用戶量量,經(jīng)常會(huì)分分析用戶的生生命周期和價(jià)價(jià)值,用戶的的忠誠(chéng)度,地地域等信息來來進(jìn)行商業(yè)決決策6。比如如電商行業(yè),商商家會(huì)對(duì)用戶戶的年齡分布布,地區(qū),性性別,星座,消消費(fèi)能力,家家庭收入的方方面對(duì)用戶進(jìn)進(jìn)行分析,判判斷用戶將來來會(huì)給商家?guī)淼睦麧?rùn),來來進(jìn)行商業(yè)決決策7。再者者分析用戶的的整體消費(fèi)情情

4、況可以了解解用戶的消費(fèi)費(fèi)偏好,進(jìn)行行商品的推送送服務(wù),例如如:短信推送送,郵件推送送等。這樣就就形成了比較較成熟的用戶戶行為與消費(fèi)費(fèi)習(xí)慣分析體體系,為商家家如何長(zhǎng)遠(yuǎn)的的獲得利益與與吸引新用戶戶打下堅(jiān)實(shí)的的基礎(chǔ)。 隨著互聯(lián)網(wǎng)行行業(yè)的不斷發(fā)發(fā)展,人們對(duì)對(duì)網(wǎng)上消費(fèi)人人群的分析越越來越重要。例例如很多大型型互聯(lián)網(wǎng)企業(yè)業(yè)都推出了自自己的分析體體系,例如:百度,谷歌歌,阿里和京京東等。京東東將在電子商商務(wù)全過程中中的所有用戶戶的數(shù)據(jù)都添添加到用戶畫畫像的建模當(dāng)當(dāng)中,而且對(duì)對(duì)用戶進(jìn)行全全方位的精確確定位,描繪繪用戶的特征征。目前京東東的用戶畫像像中運(yùn)用大約約三百多個(gè)標(biāo)標(biāo)簽來描述客客戶,涵蓋了了用戶的基本本屬

5、性,購買買能力,偏好好等各個(gè)方面面,利用分析析的結(jié)果來推推薦產(chǎn)品,廣廣告等,同時(shí)時(shí)也更加智能能的設(shè)置搜索索提示功能,更更好的服務(wù)于于用戶,來提提高用戶的滿滿意度8。 系統(tǒng)所用的的開發(fā)技術(shù)及及工具簡(jiǎn)介一、 開發(fā)技技術(shù)簡(jiǎn)介 Java與與JavaEEE簡(jiǎn)介Java是一種種與C+相相似的面向?qū)?duì)象編程語言言,但它比CC+功能更更強(qiáng)大、學(xué)起起來更為簡(jiǎn)單單,而且它具具有簡(jiǎn)單、安安全、高性能能、面向?qū)ο笙?、高可移植植性以及跨平平臺(tái)性等優(yōu)點(diǎn)點(diǎn),因而受到到了廣大編程程人員的追捧捧。同時(shí)由于于其具有其強(qiáng)強(qiáng)大的平臺(tái)無無關(guān)性,所以以用Javaa開發(fā)的應(yīng)用用程序可以在在各個(gè)系統(tǒng)平平臺(tái)上運(yùn)行,這這使得Javva成為目前前

6、應(yīng)用范圍最最廣的編程語語言9。JavaEE是是一套用于開開發(fā)Javaa企業(yè)級(jí)應(yīng)用用程序的規(guī)范范標(biāo)準(zhǔn),功能能十分強(qiáng)大,目目前有許多網(wǎng)網(wǎng)站的服務(wù)端端代碼都由它它完成編寫,使使用JavaaEE可以開開發(fā)出類似電電子商務(wù)網(wǎng)站站和企業(yè)資源源評(píng)估系統(tǒng)這這一類伸縮性性與靈活性強(qiáng)強(qiáng),且容易維維護(hù)的分布式式企業(yè)級(jí)網(wǎng)絡(luò)絡(luò)應(yīng)用程序10。JavaaEE的APPI結(jié)構(gòu)如圖圖1-1所示示。圖1- SEQ Figure * ARABIC 1 JJavaEEE的結(jié)構(gòu)圖分布式框架Haadoop Hadoop本本質(zhì)上來說是是一個(gè)開源的的分布式框架架。在Gooogle的三三大論文發(fā)表表之后,有AApachee基金會(huì)負(fù)責(zé)責(zé)開發(fā)的大數(shù)

7、數(shù)據(jù)的開發(fā)工工具。Haddoop的核核心內(nèi)容是HHDFS和MMapredduce算法法11。HHadoopp有以下三個(gè)個(gè)特點(diǎn):1.可靠性,因因?yàn)镠adooop在數(shù)據(jù)據(jù)處理是會(huì)維維護(hù)多個(gè)數(shù)據(jù)據(jù)副本,使得得即使在某一一節(jié)點(diǎn)上計(jì)算算失敗還能重重新繼續(xù)分布布處理,而不不對(duì)數(shù)據(jù)造成成不可恢復(fù)性性錯(cuò)誤。2.高擴(kuò)展性,HHadoopp在集群處理理上,可以特特別方便的擴(kuò)擴(kuò)展節(jié)點(diǎn)數(shù)量量。3.低成本,因因?yàn)镠adooop是開源源的,所以可可以降低好多多軟件開發(fā)成成本。數(shù)據(jù)倉庫HivveHive是一款款基于Haddoop的數(shù)數(shù)據(jù)倉庫基礎(chǔ)礎(chǔ)架構(gòu),他可可以方便的將將一個(gè)結(jié)構(gòu)化化的數(shù)據(jù)文件件映射成數(shù)據(jù)據(jù)庫里面的一一張表,

8、還提提供sql查查詢,學(xué)習(xí)成成本低等優(yōu)點(diǎn)點(diǎn)12。Hive還可可以將sqll查詢語句轉(zhuǎn)轉(zhuǎn)為Maprreducee算法運(yùn)行,特特別適合大型型數(shù)據(jù)的開發(fā)發(fā)與分析。目目前想Faccebookk,淘寶等大大型公司都是是用Hivee進(jìn)行數(shù)據(jù)倉倉庫建模和數(shù)數(shù)據(jù)分析。easyui簡(jiǎn)簡(jiǎn)介easyui是是一個(gè)輕量級(jí)級(jí)的前端UI開發(fā)框架架,easyyui是一套套的前端開發(fā)發(fā)庫,提供了了很多常用的的各種CSSS和JavaaScrippt合集,內(nèi)內(nèi)置了非常多多的漂亮樣式式,簡(jiǎn)潔靈活活,而且eaasyui是是可擴(kuò)展的,我我們可以根據(jù)據(jù)自己需求在在他原始的基基礎(chǔ)上加以擴(kuò)擴(kuò)展來達(dá)到我我們個(gè)性化功功能的開發(fā),除除此之外eaas

9、yui還還對(duì)一下常用用的jQueery方法進(jìn)進(jìn)行了分裝可可以很簡(jiǎn)單的的時(shí)候webb項(xiàng)目開發(fā)過過程中前后要要的交互。二、 開發(fā)工工具與環(huán)境介介紹CentOS操操作系統(tǒng)CentOSS全成Commmunitty ENTTerpriise Opperatiing Syystem,又又被很多人成成為“社區(qū)企企業(yè)操作系統(tǒng)統(tǒng)”,是liinux的發(fā)發(fā)行版之一。CentOS是是Redhaat企業(yè)版產(chǎn)產(chǎn)品RHELL的克隆版,但但是CenttOS是不收收費(fèi)的,CeentOS具具有以下四個(gè)個(gè)特點(diǎn):1環(huán)境比較穩(wěn)穩(wěn)定2有穩(wěn)定的開開發(fā)團(tuán)隊(duì)提供供長(zhǎng)久的免費(fèi)費(fèi)的更新支持持3具有保守性性4. 性能比比較好,就算算是大規(guī)模的的系統(tǒng)

10、也能保保持良好的性性能Eclipsee工具Eclipsee是一款開源源的Javaa開發(fā)工具,EEclipsse系列里面面有很多版本本,比如說支支持PHP,andriiod等開發(fā)發(fā)的專門的EEclipsse版本。而而且Ecliipse可擴(kuò)擴(kuò)展能力比較較強(qiáng),可以給給里面做各種種插件,比如如說我們熟知知的SSH插插件,在這EEclipsse具有很好好的提示和查查找功能,給給我們的開發(fā)發(fā)帶來了很多多的便利之處處。當(dāng)前Ecclipsee也有收費(fèi)的的不開源,但但是提供了很很多插件的開開發(fā)工具myyEclippse。 系統(tǒng)環(huán)境搭搭建基礎(chǔ)環(huán)境搭建本系統(tǒng)的開發(fā)運(yùn)運(yùn)行環(huán)境都是是基于虛擬機(jī)機(jī)安裝的CeentOS系系

11、統(tǒng),安裝JJDK和配置置環(huán)境變量1 解壓jdkk首先在userr目錄下創(chuàng)建建一個(gè)Javva文件夾,然然后將執(zhí)行ttar -zzxvf jjdk-7uu55-liinux-ii586.ttar.gzz -C /usr/JJava/ 語句將jddk安裝到JJava目錄錄下2 將Javva添加到環(huán)環(huán)境變量中執(zhí)行vim /etc/profiile 命令令打開配置文文件在文件最最后加入以下下兩句話配置置環(huán)境expport JJAVA_HHOME=/usr/JJava/jjdk1.77.0_555export PATH=$PATHH:$JAVVA_HOMME/binn然后執(zhí)行souurce /etc/pp

12、rofille 刷新環(huán)環(huán)境配置Hadoop集集群搭建1配置haadoop,搭建Haddoop偽分分布式,需要要修改一下五五個(gè)配置文件件內(nèi)容:第一個(gè):haadoop-env.ssh,配置jjdk路徑,HHadoopp開發(fā)依賴于于jdk vim hhadoopp-env.sh exporrt JAVVA_HOMME=/ussr/Javva/jdkk1.7.00_65第二個(gè):coore-siite.xmml 配置HHDFS中NNameNoode的地址址 fs.defauultFShddfs:/hadooop01:99000haddoop.ttmp.diir/iitcastt/hadooop-2.4.

13、1/ttmp 第三個(gè):hddfs-siite.xmml配置HDDFS數(shù)據(jù)存存儲(chǔ)是,備份份副本的數(shù)量量dfss.repllicatiion1 第四個(gè):maapred-site.xml 指定mr運(yùn)運(yùn)行在yarrn上mappreducce.fraameworrk.nammeyaarn 第五個(gè):yarrn-sitte.xmll,配置yaarn的管理理者ResoourceMManageer的地址yarrn.ressourceemanagger.hoostnammeittcast001 yarrn.noddemanaager.aaux-seerviceesmaapreduuce_shhufflee 2將h

14、adooop添加到到環(huán)境變量vim /eetc/prroflieeexporrt JAVVA_HOMME=/ussr/Javva/jdkk1.7.00_65exporrt HADDOOP_HHOME=/soft/hhadoopp-2.4.1exporrt PATTH=$PAATH:$JJAVA_HHOME/bbin:$HHADOOPP_HOMEE/bin:$HADOOOP_HOOME/sbbinsourcee /etcc/proffile3格式化naamenodde(是對(duì)nnamenoode進(jìn)行初初始化)hdfs namennode -formaat (haadoop namennode -f

15、ormaat)4.配置sshh免登陸首先生成sshh免登陸密鑰鑰然后到我的hhome目錄錄cd /.sshssh-kkeygenn -t rrsa (四四個(gè)回車)執(zhí)行完這個(gè)命命令后,會(huì)生生成兩個(gè)文件件id_rssa(私鑰)、iid_rsaa.pub(公公鑰)將公鑰拷貝到要要免登陸的機(jī)機(jī)器上ssh-coopy-idd locaalhosttHbase安裝裝與配置HBase安裝裝完成后修改改一下配置文文件:1修改hbasse-envv.shexportt JAVAA_HOMEE=/usrr/Javaa/jdk11.7.0_55告訴hbasse使用外部部的zookkeeperr exportt HB

16、ASSE_MANNAGES_ZK=faalse2 vim hhbase-site.xml hbasee.roottdir hdfss:/nss1/hbaase hbasee.clusster.ddistriibutedd truee hbasse.zoookeepeer.quoorum hadooop01:22181, hadooop02:22181 Hive安裝與與配置1.安裝和配置置Hive查詢以前安裝的的mysqll相關(guān)包rppm -qaa | grrep myysql暴力刪除這個(gè)包包r pm -e myysql-llibs-55.1.666-2.ell6_3.ii686 nodeeps

17、rpm -ivh MMySQL-serveer-5.11.73-11.glibbc23.ii386.rrpm rpm -ivh MMySQL-cliennt-5.11.73-11.glibbc23.ii386.rrpm執(zhí)行命令設(shè)設(shè)置mysqql/usr/bin/mmysql_securre_insstallaation執(zhí)行一下語句句,將Hivve添加到環(huán)環(huán)境變量當(dāng)中中GRANTT ALL PRIVIILEGESS ON HHive.* TO root% IDENTTIFIEDD BY 123 WITH GRANTT OPTIION;2. 利用sqqoop將mmysq當(dāng)中中的數(shù)據(jù)直接接導(dǎo)入到Hi

18、ive當(dāng)中sqoop imporrt -cconnecct jdbbc:myssql:/192.1168.722.10:33306/ttest userrname root -passswordd roott -taable uuser_iinfo Hivee-impoort Hive-overwwrite -Hivve-tabble usser_innfo fieldds-terrminatted-byy t 論文整體設(shè)設(shè)計(jì)結(jié)構(gòu)一、 系統(tǒng)設(shè)設(shè)計(jì)思想本項(xiàng)目通過JaavaEE+Hadooop+Hivve技術(shù),設(shè)設(shè)計(jì)并實(shí)現(xiàn)一一個(gè)簡(jiǎn)單的用用戶畫像的wweb界面系系統(tǒng),系統(tǒng)通通過后臺(tái)數(shù)據(jù)據(jù)操作得出的的

19、結(jié)果,將其其以界面形式式反映到前臺(tái)臺(tái),決策者可可以根據(jù)系統(tǒng)統(tǒng)提供的圖表表等信息對(duì)整整個(gè)平臺(tái)下客客戶的忠誠(chéng)度度,所屬區(qū)域域,訪客的跳跳出率等幾個(gè)個(gè)方面對(duì)客戶戶進(jìn)行初次的的總結(jié)歸納,最最后知道企業(yè)業(yè)的整體營(yíng)銷銷措施。二、 論文結(jié)結(jié)構(gòu)安排第一章主要介紹紹了本設(shè)計(jì)的選選題背景、選選題意義、然然后再介紹開開發(fā)所使用的的語言與軟件件工具,再者者介紹個(gè)整個(gè)個(gè)系統(tǒng)的環(huán)境境搭建,最后后介紹本論文文的整體結(jié)構(gòu)構(gòu)安排。第二章主要介紹紹了系統(tǒng)整體體的需求分析析,然后根據(jù)據(jù)需求寫出初初步的概要設(shè)設(shè)計(jì)。首先對(duì)對(duì)系統(tǒng)進(jìn)行簡(jiǎn)單單的需求分析析、可行性研研究分析,然然后接著介紹紹本網(wǎng)站總體體結(jié)構(gòu)、功能能模塊設(shè)計(jì),最最后對(duì)界面進(jìn)進(jìn)

20、行簡(jiǎn)單描述述。第三章主要介紹紹介紹了用戶畫畫像的詳細(xì)實(shí)實(shí)現(xiàn)過程,在在需求分析和和概要設(shè)計(jì)之之上更加詳細(xì)細(xì)的設(shè)計(jì)和實(shí)實(shí)現(xiàn)部分系統(tǒng)統(tǒng)功能,其次次進(jìn)行功能模模塊流程圖設(shè)設(shè)計(jì),并對(duì)一一些關(guān)鍵的地地方進(jìn)行代碼碼的說明,最最后對(duì)整個(gè)系系統(tǒng)的界面做做一下簡(jiǎn)單的的說明與介紹紹。第四章主要介紹紹了系統(tǒng)測(cè)試試的方法與步步驟。首先簡(jiǎn)單介介紹了系統(tǒng)測(cè)試的目目的、意義及及步驟,然后后根據(jù)系統(tǒng)測(cè)測(cè)試要求對(duì)本本系統(tǒng)進(jìn)行某某些模塊的測(cè)測(cè)試。第五章是總結(jié)與與展望。對(duì)本本系統(tǒng)開發(fā)與與設(shè)計(jì)過程中中遇到的問題題和難點(diǎn),還還有自己所收收獲到的東西西進(jìn)行總結(jié),并并對(duì)自己以后后的職業(yè)生涯涯和努力方向向加以重定向向、或者進(jìn)行行階段性的計(jì)計(jì)劃

21、。 系統(tǒng)需求分分析與概要設(shè)設(shè)計(jì)在這一章里面我我們對(duì)用戶畫畫像這整個(gè)系系統(tǒng)進(jìn)行進(jìn)行行需求分析,可可行性研究,還還有系統(tǒng)的總總體結(jié)構(gòu)介紹紹和和分模塊塊介紹,最后后對(duì)部分頁面面進(jìn)行簡(jiǎn)單的的介紹。 用戶畫像的的需求分析本系統(tǒng)大的范圍圍劃分總共分分為兩塊:1. 后臺(tái)數(shù)據(jù)據(jù)處理與分析析采用Haddoop+HHive進(jìn)行行數(shù)據(jù)分析與與數(shù)據(jù)倉庫的的建模,系統(tǒng)統(tǒng)分析元數(shù)據(jù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫2. 前臺(tái)顯示示運(yùn)用了JaavaEE+JfreeeChar+Echarrts技術(shù),對(duì)對(duì)后臺(tái)分析數(shù)數(shù)據(jù)進(jìn)行前臺(tái)臺(tái)展示。本系統(tǒng)利用這樣樣的總體結(jié)構(gòu)構(gòu)對(duì)整個(gè)用戶戶畫像進(jìn)行開開發(fā)與設(shè)計(jì),使使之能夠初步步實(shí)現(xiàn)對(duì)電商商客戶的初步

22、步分析以及對(duì)對(duì)領(lǐng)導(dǎo)者決策策進(jìn)行幫助。首先我們從系統(tǒng)統(tǒng)的后臺(tái)數(shù)據(jù)據(jù)處理進(jìn)行分分析,我們利利用Hivee進(jìn)行數(shù)據(jù)分分析,將整個(gè)個(gè)平臺(tái)的與客客戶相關(guān)的數(shù)數(shù)據(jù)分為了以以下的七張表表進(jìn)行數(shù)據(jù)分分析與數(shù)據(jù)結(jié)結(jié)構(gòu)化存儲(chǔ):客戶消費(fèi)訂單表表根據(jù)客客戶的消費(fèi)情情況提取用戶戶標(biāo)簽用于了了解用戶的消消費(fèi)總體情況況,以根據(jù)用用戶的消費(fèi)習(xí)習(xí)慣和消費(fèi)能能力來進(jìn)行營(yíng)營(yíng)銷行為。數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中的:訂訂單表,退貨貨表,購物車車表,用戶表表。 客戶購買類目目表根據(jù)客客戶購買類目目的情況來提提取用戶標(biāo)簽簽用于了了解購買人群群情況和某一一類目的營(yíng)銷銷策略數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中的:訂訂單表,類目目維表,購物物車

23、表。客戶購買商店表表根據(jù)客客戶購買商店店來提取用戶戶標(biāo)簽用于了了解商店及品品牌的購買人人群情況常用來來用作某一商商店或者某一一品牌的營(yíng)銷銷數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中的:訂訂單表,退貨貨表,購物車車表,商店表表??蛻艋緦傩员肀砀鶕?jù)用用戶所填寫的的屬性標(biāo)簽與與推算出來的的屬性用于了了解用戶的人人口屬性的基基本屬性和按按屬性統(tǒng)計(jì)按人口口屬性進(jìn)行營(yíng)營(yíng)銷,例如金金牛座的優(yōu)惠惠和生日優(yōu)惠惠數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中的:用用戶表,用戶戶調(diào)查表,孕孕歸模型表,馬馬甲模型表,用用戶價(jià)值模型型表??蛻魻I(yíng)銷信息表表將用戶戶營(yíng)銷相關(guān)的的常用標(biāo)簽放放到一張表中中,方便使用用數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中

24、的:用用戶表,訂單單表,用戶價(jià)價(jià)值模型表,購購物車表,客客戶品類分群群模型表,活活動(dòng)表??蛻艋顒?dòng)信息表表根據(jù)客客戶參與的活活動(dòng)的情況提提取的客戶標(biāo)標(biāo)簽用戶了了解用戶的對(duì)對(duì)活動(dòng)的參與與情況,以進(jìn)進(jìn)行活動(dòng)的策策劃或者根據(jù)據(jù)對(duì)活動(dòng)不同同敏感度的人人群做營(yíng)銷數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中的:訂訂單表,活動(dòng)動(dòng)表,活動(dòng)訂訂單表,用戶戶表??蛻粼L問信息表表根據(jù)客客戶訪問的情情況提取的客客戶標(biāo)簽用戶了了解用戶的訪訪問總體情況況,以根據(jù)用用戶瀏覽的習(xí)習(xí)慣做營(yíng)銷數(shù)據(jù)來源于myysql數(shù)據(jù)據(jù)庫中的:PPC端PV表表,PC端vview表,AAPP端PVV表,APPP端vieww表。然后進(jìn)行前臺(tái)顯顯示界面功能能的分析

25、,在在前端我們要要用圖表加數(shù)數(shù)據(jù)的模式展展示給用戶或或者決策者,主主要以一下幾幾個(gè)方面進(jìn)行行展示:系統(tǒng)管理模塊在這個(gè)模塊里面面我們就主要要對(duì)用戶畫像像前端系統(tǒng)的的一個(gè)管理和和配置,主要要包括,菜單單管理,系統(tǒng)統(tǒng)用戶管理,和和角色管理,當(dāng)當(dāng)然在這個(gè)里里面也對(duì)整個(gè)個(gè)系統(tǒng)的權(quán)限限進(jìn)行管理。用戶行為分析在這個(gè)模塊里面面我們就針對(duì)對(duì)用戶的一些些行為進(jìn)行分分析,然后得得到具體的數(shù)數(shù)據(jù),主要從從用戶的跳出出率,忠誠(chéng)度度,活躍度等等幾個(gè)方面對(duì)對(duì)用戶進(jìn)行分分析??蛻舴治鲈谶@個(gè)模塊里面面我們就根據(jù)據(jù)訪客所在的的地域信息,訪訪客使用的終終端環(huán)境,還還有訪客訪問問速度等幾個(gè)個(gè)方面進(jìn)行分分析。 可行性分析析每個(gè)軟件的開

26、發(fā)發(fā)過程中都會(huì)會(huì)受到各種條條件限制,比比如說資源,時(shí)時(shí)間,技術(shù),資資金等制約因因素。所以在在每個(gè)軟件開開發(fā)之間我們們都要對(duì)這個(gè)個(gè)軟件各個(gè)方方面進(jìn)行調(diào)查查出一份比較較權(quán)威的可行行性分析研究究報(bào)告,看這這個(gè)軟件開發(fā)發(fā)各個(gè)方面條條件是否滿足足,對(duì)于商業(yè)業(yè)軟件來說主主要還是這個(gè)個(gè)軟件的開發(fā)發(fā)是否盈利,是是否成本大于于盈利等等各各個(gè)方面進(jìn)行行權(quán)衡。在軟軟件開發(fā)之前前進(jìn)行可行性性的研究可以以避免軟件開開發(fā)風(fēng)險(xiǎn),避避免人力,資資源等方面的的浪費(fèi)。下面面我們就這幾幾個(gè)方面進(jìn)行行簡(jiǎn)要的可行行性分析。技術(shù)可行性本系統(tǒng)在后臺(tái)服服務(wù)方面利用用了CenttOS和Haadoop+Hive 因?yàn)楝F(xiàn)在是是大數(shù)據(jù)時(shí)代代,我為了

27、提提高自身能力力所以自學(xué)了了大數(shù)據(jù)方面面知識(shí),其中中就包括Haadoop+Hive ,而且對(duì)于于linuxx操作系統(tǒng)我我們?cè)诖髮W(xué)課課程里面學(xué)了了操作這門可可能講的liinux操作作系統(tǒng)所以在在后臺(tái)服務(wù)方方面技術(shù)上是是可行的。本系統(tǒng)的前臺(tái)展展示頁面使用用的JavaaEE技術(shù),在在大學(xué)課程里里面我們既學(xué)學(xué)習(xí)了JavvaSE也學(xué)學(xué)習(xí)了JavvaEE并且且本人從事JJava開發(fā)發(fā)行業(yè)也一年年多了所以在在這方面還是是比較有經(jīng)驗(yàn)驗(yàn)的所以技術(shù)術(shù)上也是可行行的。對(duì)于eeasyuii前端顯示框框架和Echharts圖圖表插件而言言,他們兩都都是輕量級(jí)的的,并且在官官網(wǎng)上都有所所對(duì)應(yīng)的案例例,所以學(xué)習(xí)習(xí)起來也比較

28、較容易,再者者在前面公司司做項(xiàng)目是也也用到了這兩兩個(gè)框架,所所以整理而言言在技術(shù)方面面也是可行的的。再者UMML圖,我們們?cè)诖髮W(xué)階段段開設(shè)過軟件件工程這門課課學(xué)的就是uuml圖的制制作和整個(gè)軟軟件開發(fā)流程程,在上課時(shí)時(shí)我們也學(xué)會(huì)會(huì)了利用viisio等工工具畫umll圖,所以在在技術(shù)上也是是可行的。綜上所述,我們們可得出結(jié)論論本系統(tǒng)的開開發(fā)在技術(shù)上上是可行的。經(jīng)濟(jì)可行性本系統(tǒng)開發(fā)使用用的IDE,環(huán)環(huán)境還有開發(fā)發(fā)語言都是開開源的,所以以在整個(gè)開發(fā)發(fā)成本上節(jié)約約了很多資源源。法律可行性由于本系統(tǒng)開發(fā)發(fā)過程中使用用的開發(fā)語言言,開發(fā)環(huán)境境這些都是采采用開源項(xiàng)目目,所以不涉涉及版權(quán)問題題,而且本系系統(tǒng)不

29、會(huì)用于于商業(yè)用途,當(dāng)當(dāng)然也不會(huì)泄泄露企業(yè)內(nèi)部部信息,所以以軟件整體而而言在法律上上是可行的。操作可行性本系統(tǒng)后臺(tái)數(shù)據(jù)據(jù)不需要用戶戶進(jìn)行操作,用用戶或者決策策者所能接觸觸到的只是前前臺(tái)的數(shù)據(jù)分分析成果展示示,所以在操操作上沒有什什么難度,主主要是需要用用戶操作的地地方和專業(yè)名名詞都有相應(yīng)應(yīng)的備注。用用戶只需要有有一臺(tái)電腦,能能夠聯(lián)網(wǎng)就可可以對(duì)系統(tǒng)進(jìn)進(jìn)行操作,所所以系統(tǒng)整體體而言操作簡(jiǎn)簡(jiǎn)單符合操作作可行性。 系統(tǒng)總體結(jié)構(gòu)構(gòu)設(shè)計(jì)本系統(tǒng)是由JaavaEE和和Hadooop開發(fā),其其中數(shù)據(jù)分析析采用Haddoop,在在數(shù)據(jù)分析時(shí)時(shí)需要計(jì)算出出用戶的各種種行為等,比比如說用戶的的跳出率的計(jì)計(jì)算,用戶忠忠誠(chéng)

30、度的分析析方法,還有有用戶對(duì)商品品打折促銷等等電商進(jìn)行的的促銷活動(dòng)的的敏感度,用用戶價(jià)值的潛潛力等各個(gè)方方面的計(jì)算與與分析,在系系統(tǒng)前端用JJavaEEE做的前臺(tái)展展示效果,側(cè)側(cè)重于整個(gè)系系統(tǒng)權(quán)限的管管理還有對(duì)用用戶行為,地地域等信息進(jìn)進(jìn)行分析。本本系統(tǒng)達(dá)到的的效果是使電電商更加了解解客戶,理解解客戶的真正正需求,然后后分種類,分分地域,分人人群進(jìn)行產(chǎn)品品的推銷,已已達(dá)到客戶滿滿意度最高,也也可以使電商商獲得最大利利潤(rùn)。系統(tǒng)的的整體框架圖圖如圖2-11所示。圖2-1 用用戶畫像整體體框架圖本系統(tǒng)分為后臺(tái)臺(tái)數(shù)據(jù)分析和和前臺(tái)分析結(jié)結(jié)果展示,后后臺(tái)數(shù)據(jù)分析析主要是為了了數(shù)據(jù)挖掘工工程師用來研研究和統(tǒng)

31、計(jì),建建模用的,前前臺(tái)是展示給給一般系統(tǒng)用用戶看的,這這個(gè)主要是提提供給企業(yè)內(nèi)內(nèi)部,領(lǐng)導(dǎo)者者,或者公司司內(nèi)部做營(yíng)銷銷等專家作分分析,并在分分析的基礎(chǔ)上上領(lǐng)導(dǎo)企業(yè)的的發(fā)展方向和和以后生產(chǎn)產(chǎn)產(chǎn)品定向。系統(tǒng)后臺(tái)全是數(shù)數(shù)據(jù)的分析和和算法,基本本上是供程序序員使用的,后后臺(tái)通過Hiive簡(jiǎn)歷的的七張表對(duì)整整個(gè)企業(yè)客戶戶的消費(fèi)行為為,購買能力力等方面進(jìn)行行分析,統(tǒng)計(jì)計(jì)生成數(shù)據(jù)。而而統(tǒng)計(jì)數(shù)據(jù)來來源于企業(yè)以以前系統(tǒng)用來來儲(chǔ)存數(shù)據(jù)的的數(shù)據(jù)庫myysql中的的表。整個(gè)后后臺(tái)的整個(gè)功功能就是數(shù)據(jù)據(jù)倉庫建模,根根據(jù)一定的算算法模型計(jì)算算出客戶消費(fèi)費(fèi)訂單表,客客戶購買類目目表,客戶購購買商店表,客客戶基本屬性性表,客戶

32、營(yíng)營(yíng)銷信息表,客客戶活動(dòng)表,客客戶訪問信息息表七張表。這這七張表分別別從不同的方方向統(tǒng)計(jì)了用用戶在購買能能力,區(qū)域分分布,忠誠(chéng)度度,敏感指數(shù)數(shù)等方面的值值,對(duì)用戶潛潛在價(jià)值進(jìn)行行挖掘與分析析。同時(shí)后臺(tái)臺(tái)還進(jìn)行很多多算法模型的的設(shè)置和分析析例如:潛在汽車消費(fèi)模模型現(xiàn)在大多數(shù)電商商網(wǎng)站都具有有汽車頻道,對(duì)對(duì)用戶的汽車車模型也很關(guān)關(guān)心,如表22-1所示。表2-1 汽車車消費(fèi)模型表表用戶是否有車0:未識(shí)別1:是根據(jù)用戶是否購購買汽車相關(guān)關(guān)的產(chǎn)品來判判斷用戶是否否有車潛在汽車用戶0:未識(shí)別1:是用戶瀏覽或者搜搜索汽車相關(guān)關(guān)的產(chǎn)品進(jìn)行行判斷用戶價(jià)值模型體現(xiàn)用戶對(duì)網(wǎng)站站的價(jià)值,對(duì)對(duì)于提高用戶戶留存率非常常重

33、要使用FRM實(shí)現(xiàn)現(xiàn)用戶價(jià)值模模型參考指標(biāo)標(biāo)最近一次消費(fèi)時(shí)時(shí)間或者最后后一次消費(fèi)至至今時(shí)間消費(fèi)頻率消費(fèi)金額用戶忠誠(chéng)度模型型忠誠(chéng)度越高的用用戶越多,對(duì)對(duì)網(wǎng)站的發(fā)展展有利,如表表2-2所示示表2-2 用戶戶忠誠(chéng)度模型型表用戶忠誠(chéng)度忠誠(chéng)型用戶偶爾型用戶投資型用戶瀏覽型用戶未識(shí)別瀏覽型用戶:只只瀏覽沒購買買購買天數(shù)大于一一定天數(shù)的直直接判斷為忠忠誠(chéng)用戶購買天數(shù)小于一一定天數(shù)的大大部分有優(yōu)惠惠才購買的其他類型根據(jù)購購買天數(shù),購購買最后一次次距今時(shí)間,購購買金額進(jìn)行行聚類客戶活躍狀態(tài)模模型注冊(cè)未購買(只只注冊(cè)沒購買買,多是第三三方登錄)活躍(可以分為為高頻,中頻頻,低頻,或或者直接最近近六十天有購購買者)沉

34、睡(近九十天天購買了,近近六十天沒有有購買)流失(近九十天天無購買,曾曾經(jīng)購買過)疑似馬甲模型馬甲是指一個(gè)用用戶注冊(cè)多個(gè)個(gè)賬號(hào)多次訪問ip地地址想的用戶戶賬號(hào)是同一一個(gè)人所有同一臺(tái)手機(jī)登錄錄多次的用戶戶賬號(hào)是一個(gè)個(gè)人所有收貨手機(jī)號(hào)相同同的賬號(hào)是同同一個(gè)所有以上幾個(gè)模型是是其中比較典典型的幾個(gè)分分析模型,我我們的整個(gè)數(shù)數(shù)據(jù)分析都是是在這些模型型的基礎(chǔ)上生生成的和操作作的。本系統(tǒng)前臺(tái)主要要功能有菜單單管理,用戶戶管理,角色色管理,跳出出率,忠誠(chéng)度度,活躍度,訪訪客流失度,地地域分析,速速度分析,客客戶端分析等等,如表2-3所示。表2-3 系統(tǒng)統(tǒng)功能表用戶管理實(shí)現(xiàn)對(duì)新添用戶戶,給用戶賦賦予角色,和和

35、編輯用戶基基本信息,刪刪除用戶等功功能。菜單管理對(duì)系統(tǒng)的左側(cè)菜菜單進(jìn)行管理理,實(shí)現(xiàn)增刪刪改查等功能能。角色管理一個(gè)系統(tǒng)可以具具有多個(gè)角色色,而每個(gè)角角色又具有不不同的權(quán)限,在在這個(gè)模塊里里面實(shí)現(xiàn)了對(duì)對(duì)角色的增刪刪改查的功能能,除此之外外,還有給角角色賦予權(quán)限限和修改權(quán)限限等功能。跳出率利用折線圖對(duì)客客戶跳出率進(jìn)進(jìn)行展現(xiàn),同同時(shí)在圖表下下面配有查詢?cè)兊臄?shù)據(jù)集做做圖表作為支支持。忠誠(chéng)度利用餅狀圖對(duì)用用戶忠誠(chéng)度進(jìn)進(jìn)行展現(xiàn),同同時(shí)在圖表下下面配有查詢?cè)兊臄?shù)據(jù)集做做圖表作為支支持?;钴S度利用折現(xiàn)圖對(duì)用用戶活躍度進(jìn)進(jìn)行展現(xiàn),同同時(shí)在圖表下下面配有查詢?cè)兊臄?shù)據(jù)集做做圖表作為支支持。在這個(gè)個(gè)模塊里面還還統(tǒng)計(jì)了

36、用戶戶流失率的統(tǒng)統(tǒng)計(jì),同時(shí)也也有相應(yīng)的數(shù)數(shù)據(jù)作為對(duì)圖圖表的支持。地域分析利用餅狀圖對(duì)用用戶所在地域域等信息進(jìn)行行展現(xiàn),同時(shí)時(shí)在圖表下面面配有查詢的的數(shù)據(jù)集做圖圖表作為支持持。速度分析利用地圖對(duì)每個(gè)個(gè)地方用戶的的訪問速度進(jìn)進(jìn)行分析,同同時(shí)在地圖下下面配有查詢?cè)兊臄?shù)據(jù)集做做圖表作為支支持。客戶端分析利用餅狀圖對(duì)用用戶訪問所使使用的瀏覽器器和操作系統(tǒng)統(tǒng)進(jìn)行分析。同同時(shí)在圖表下下面配有查詢?cè)兊臄?shù)據(jù)集做做圖表作為支支持。 系統(tǒng)功能模塊塊設(shè)計(jì)系統(tǒng)用例圖分析析用例圖是在整個(gè)個(gè)軟件或系統(tǒng)統(tǒng)開發(fā)的分析析階段,常用用來描述整個(gè)個(gè)網(wǎng)站的或系系統(tǒng)的整體功功能,是軟件件開發(fā)中的一一種可視化的的建模語言。用用例圖由三部部

37、分組成,分分別是參與者者,用例,以以及參與者與與用例之間關(guān)關(guān)系的線或箭箭頭。參與者者,是指系統(tǒng)統(tǒng)以外的操作作系統(tǒng)或者與與系統(tǒng)發(fā)生交交互的人。用用例,是指整整個(gè)系統(tǒng)的功功能模塊。在在畫用例圖時(shí)時(shí)一般小人表表示參與者,橢橢圓形圖標(biāo)表表示用例。用用例圖只是展展示整個(gè)系統(tǒng)統(tǒng)功能模塊和和操作人的關(guān)關(guān)系,并不是是介紹代碼。本系統(tǒng)利用用例例圖展示系統(tǒng)統(tǒng)前臺(tái)的功能能模塊和操作作者的關(guān)系。超超級(jí)管理員可可以操作:菜菜單管理,用用戶管理,角角色管理,用用戶行為分析析,用戶訪客客分析等整個(gè)個(gè)功能,而普普通用戶或者者一般決策者者只能使用用用戶行為分析析,用戶訪客客行為等非系系統(tǒng)管理功能能模塊。本系系統(tǒng)的總體用用例圖

38、如下下圖2-2:圖2-2 系系統(tǒng)總體用例例圖系統(tǒng)功能模塊分分析 根據(jù)前面的對(duì)對(duì)本系統(tǒng)的需需求分析,我我們可將整個(gè)個(gè)系統(tǒng)分為三三塊,系統(tǒng)管管理,用戶行行為,訪客分分析。以下對(duì)對(duì)每個(gè)模塊進(jìn)進(jìn)行介紹:系統(tǒng)管理系統(tǒng)管理,管理理的是整個(gè)系系統(tǒng)的配置信信息,比如說說權(quán)限管理,系系統(tǒng)菜單管理理,用戶管理理等等。(1) 用戶管管理:由于本系統(tǒng)統(tǒng)是公司或企企業(yè)內(nèi)部系統(tǒng)統(tǒng),所以不存存在注冊(cè)等信信息,本系統(tǒng)統(tǒng)的用戶管理理包括:新用用戶的添加(只只有超級(jí)管理理員才有權(quán)限限),用戶角角色的分配,還還有用戶基本本信息的修改改,例如修改改密碼等等功功能。(2) 用戶登登陸:系統(tǒng)里里面已經(jīng)存在在的用戶,可可以根據(jù)自己己的賬號(hào)

39、和密密碼,同時(shí)輸輸入系統(tǒng)自動(dòng)動(dòng)生成的驗(yàn)證證碼,當(dāng)這些些信息都對(duì)的的時(shí)候才能登登錄系統(tǒng)。進(jìn)進(jìn)入系統(tǒng)后系系統(tǒng)會(huì)根據(jù)用用戶的不同角角色顯示不同同的菜單和數(shù)數(shù)據(jù),同時(shí)支支持登錄用戶戶修改自己密密碼的功能。(3) 角色管管理:此功能只有有超級(jí)管理員員才能用,在在這塊里面用用戶可以建立立不同的角色色,比如說超超級(jí)管理員,一一般用戶等等等信息,除此此之外還可以以對(duì)角色信息息分條件查看看,刪除,修修改等功能,在在這個(gè)里面最最重要的就是是給不同的角角色授予不同同的權(quán)限。 (4) 菜單管管理:這個(gè)模模塊只有在建建系統(tǒng)或者系系統(tǒng)功能變更更或者系統(tǒng)新新添加或去除除功能的時(shí)候候才會(huì)用到,因因?yàn)檫@個(gè)涉及及到寫代碼,建建立

40、后臺(tái)處理理了。當(dāng)然我我們?cè)诒鞠到y(tǒng)統(tǒng)中對(duì)此功能能也是進(jìn)行了了添加修改,刪刪除,查看等等功能。用戶行為模塊用戶行為模塊主主要包括對(duì)用用戶的行為分分析,包括用用的使用網(wǎng)站站的跳出率,用用戶忠誠(chéng)度,用用戶的活躍度度等信息。注: 跳出出率:跳出者是指訪問問量只有一頁頁(即PV(page view)是1)訪問問者。此類訪訪問者所占的的比例越高,說說明網(wǎng)站的對(duì)對(duì)他們沒有太太高的吸引力力。跳出率是指單頁頁訪問次數(shù)(即即訪問者從進(jìn)進(jìn)入頁面離開開網(wǎng)站的訪問問次數(shù))所占占的百分比。跳出率是衡量訪訪問質(zhì)量的指指標(biāo),跳出率率較高通常表表示網(wǎng)站進(jìn)入入頁(目標(biāo)網(wǎng)網(wǎng)頁)與訪問問者相關(guān)性不不強(qiáng)。我們可以針對(duì)每每個(gè)關(guān)鍵字和和我們

41、投放的的廣告來調(diào)整整目標(biāo)網(wǎng)頁,從從而最大程度度地降低跳出出率。目標(biāo)網(wǎng)網(wǎng)頁應(yīng)提供廣廣告中承諾的的信息和服務(wù)務(wù)。 忠誠(chéng)度度:回訪次數(shù),距離離上次訪問超超過12小時(shí)時(shí)的再次訪問問,被記錄為為一次回頭。 該功能有助助于站長(zhǎng)了解解站點(diǎn)粘性和和用戶忠誠(chéng)度度。忠誠(chéng)的訪問者通通常對(duì)我們的的品牌有較高高的興趣,大大量的重復(fù)訪訪問表示客戶戶為優(yōu)質(zhì)客戶戶并且網(wǎng)站有有較好的訪問問者保持力。新新訪問者量大大表示對(duì)訪問問者有強(qiáng)烈的的吸引力。(1) 跳出率率:根據(jù)后臺(tái)HHive數(shù)據(jù)據(jù)統(tǒng)計(jì)的數(shù)據(jù)據(jù)建立用戶的的跳出率菜單單,該功能在在界面上顯示示功能主要包包括,根據(jù)時(shí)時(shí)間查詢一個(gè)個(gè)時(shí)間段內(nèi)的的訪客量和跳跳出訪客量,然然后做成折

42、線線圖進(jìn)行展示示,并提供相相應(yīng)的數(shù)據(jù)支支持。(2) 忠誠(chéng)度度:根據(jù)后臺(tái)臺(tái)Hive數(shù)數(shù)據(jù)統(tǒng)計(jì)的數(shù)數(shù)據(jù)建立用戶戶的忠誠(chéng)度菜菜單,該功能能在界面上顯顯示功能主要要包括,根據(jù)據(jù)時(shí)間查詢一一個(gè)時(shí)間段內(nèi)內(nèi)的訪問次數(shù)數(shù)和比例,然然后制成餅狀狀圖進(jìn)行顯示示,并提供相相應(yīng)的數(shù)據(jù)支支持。(3) 活躍度度:根據(jù)后臺(tái)HHive數(shù)據(jù)據(jù)統(tǒng)計(jì)的數(shù)據(jù)據(jù)建立用戶的的活躍度菜單單,該功能在在界面上顯示示功能主要包包括,根據(jù)時(shí)時(shí)間查詢一個(gè)個(gè)時(shí)間段內(nèi)的的活躍訪客量量,當(dāng)然在這這個(gè)模塊里面面我們也添加加了查看流失失訪客的數(shù)量量,然后做成成折線圖進(jìn)行行展示,并提提供相應(yīng)的數(shù)數(shù)據(jù)支持。訪客分析該模塊里面主要要是針對(duì)客戶戶地理位置,訪訪客瀏

43、覽速度度,和訪客所所使用客戶端端類型等幾個(gè)個(gè)方面從客觀觀角度,對(duì)客客戶進(jìn)行分析析。(1)地域分布布:根據(jù)后臺(tái)臺(tái)Hive數(shù)數(shù)據(jù)統(tǒng)計(jì)的數(shù)數(shù)據(jù)建立用戶戶的地域分布布菜單,可以以使決策者直直觀的看出我我們現(xiàn)在的客客戶主要來自自哪里,等地地域分布情況況。根據(jù)用戶戶自己設(shè)定的的時(shí)間查詢不不用地區(qū)客戶戶的訪問量和和占總訪問量量的百分比等等信息,將統(tǒng)統(tǒng)計(jì)結(jié)果利用用餅狀圖顯示示,并提供的的相應(yīng)的數(shù)據(jù)據(jù)支持。(2) 速度分分布:根據(jù)后后臺(tái)Hivee數(shù)據(jù)統(tǒng)計(jì)的的數(shù)據(jù)建立用用戶的速度分分布菜單,查查詢每個(gè)地方方的訪客訪問問速度等信息息,最終在前前臺(tái)用一張地地圖作為圖表表,顯示不同同地區(qū)訪問速速度等數(shù)據(jù),直直觀大方同時(shí)

44、時(shí)提供相應(yīng)的的數(shù)據(jù)支持。(3) 客戶端端分析:根據(jù)據(jù)后臺(tái)Hivve數(shù)據(jù)統(tǒng)計(jì)計(jì)的數(shù)據(jù)建立立用戶的客戶戶端分析菜單單,查詢并統(tǒng)統(tǒng)計(jì)用于使用用的不同客戶戶端信息,如如瀏覽器版本本,不同瀏覽覽器,操作系系統(tǒng)等,然后后將統(tǒng)計(jì)數(shù)據(jù)據(jù)制作成餅狀狀圖進(jìn)行顯示示,提供相應(yīng)應(yīng)的數(shù)據(jù)支持持。(4) 移動(dòng)端端分析:根據(jù)據(jù)后臺(tái)Hivve數(shù)據(jù)統(tǒng)計(jì)計(jì)的數(shù)據(jù)建立立用戶的移動(dòng)動(dòng)端分析菜單單,查詢并統(tǒng)統(tǒng)計(jì)用于使用用的不同移動(dòng)動(dòng)端信息,如如移動(dòng)版版本本,手機(jī)型號(hào)號(hào)等,然后將將統(tǒng)計(jì)數(shù)據(jù)制制作成餅狀圖圖進(jìn)行顯示,提提供相應(yīng)的數(shù)數(shù)據(jù)支持。 系統(tǒng)的詳細(xì)細(xì)設(shè)計(jì)與實(shí)現(xiàn)現(xiàn)本章主要介紹了了詳細(xì)實(shí)現(xiàn)過過程,在上一一章需求分析析與概要設(shè)計(jì)計(jì)的基礎(chǔ)之上

45、上首先進(jìn)行數(shù)數(shù)據(jù)倉庫建模模,其次進(jìn)行行功能模塊流流程圖設(shè)計(jì),再再次對(duì)功能模模塊的實(shí)現(xiàn)過過程與代碼進(jìn)進(jìn)行詳細(xì)說明明,最后對(duì)本本網(wǎng)站的大體體結(jié)構(gòu)進(jìn)行簡(jiǎn)簡(jiǎn)單介紹。 數(shù)據(jù)倉庫建模模數(shù)據(jù)倉庫概述數(shù)據(jù)倉庫從本質(zhì)質(zhì)上來講是一一種工具或者者整個(gè)企業(yè)內(nèi)內(nèi)數(shù)據(jù)集成環(huán)環(huán)境。它是操操作系統(tǒng)過渡渡到?jīng)Q策者為為了決策而用用的支持系統(tǒng)統(tǒng)14。在在這個(gè)過程中中它還解決了了好多數(shù)據(jù)流流相關(guān)的問題題。這些問題題主要包括以以下幾類:如何從原來的操操作系統(tǒng)中提提取數(shù)據(jù)。如何把不同數(shù)據(jù)據(jù)統(tǒng)一化,并并且能夠提高高性能等。二、 數(shù)據(jù)倉倉庫表的概念念結(jié)構(gòu)設(shè)計(jì)不管是數(shù)據(jù)庫建建庫還是利用用數(shù)據(jù)倉庫建建模,建表,其其實(shí)其最重要要和最本質(zhì)的的東西或

46、者原原型就是實(shí)體體15。一個(gè)實(shí)體應(yīng)應(yīng)包含名稱和和屬性等各個(gè)個(gè)屬性。一個(gè)個(gè)實(shí)體一般有有其所特定的的概念模型。概念模型的表示方法有很多,目前最常用的是實(shí)體-聯(lián)系(E-R)模型設(shè)計(jì)方法,實(shí)體-聯(lián)系模型一般使用E-R圖來表示,它使用不同形狀來分別表示實(shí)體、屬性、和聯(lián)系,其中實(shí)體用方框表示,代表用戶體中客觀存在的事務(wù);屬性使用橢圓來表示,描述了每個(gè)實(shí)體所有的特性;而實(shí)體間的聯(lián)系用菱形來表示16。根據(jù)上一章對(duì)系統(tǒng)的需求分析以及概要設(shè)計(jì),建立部分實(shí)體的ER圖,如圖3-1所示。 圖3-1 系統(tǒng)統(tǒng)管理E-RR圖三、 數(shù)據(jù)庫庫邏輯結(jié)構(gòu)設(shè)設(shè)計(jì)數(shù)據(jù)倉庫邏輯結(jié)結(jié)構(gòu)設(shè)計(jì),這這個(gè)階段是將將上個(gè)階段完成成的數(shù)據(jù)庫實(shí)實(shí)體-屬性

47、圖圖轉(zhuǎn)換成在HHive數(shù)據(jù)據(jù)表里面可以以建表的屬性性和字段類型型,屬性名等等信息177。在實(shí)際際應(yīng)用時(shí),應(yīng)應(yīng)先建立實(shí)體體的物理模型型,將模型關(guān)關(guān)系和應(yīng)該包包含的字段確確定下來之后后進(jìn)行數(shù)據(jù)倉倉庫表的建模模。 (1) 系統(tǒng)用用戶表,存放放所有的系統(tǒng)統(tǒng)用戶信息,表表結(jié)構(gòu)如表33-1所示。表3-1 普普通用戶表(ssys_usser)字段名稱類型字節(jié)數(shù)描述Idint10用戶編號(hào)(主鍵鍵)(自增)usernammestring32用戶名(非空)passworrdstring32密碼(非空)emailstring64郵箱(非空)stateint4狀態(tài)(非空)addresssstring64地址(可為空)

48、sexstring6性別(可為空)phoneint20聯(lián)系電話(可為為空)roleIdint4用戶角色(非空空)userTyppeint4用戶類型(非空空)Remarkstring500備注(可為空)(2) 系統(tǒng)菜菜單表,存放放所有的系統(tǒng)統(tǒng)菜單信息,表表結(jié)構(gòu)如表33-2所示。表3-2 系統(tǒng)統(tǒng)菜單表(aauth)字段名稱類型字節(jié)數(shù)描述cidint10菜單id(主鍵鍵)(自增)authNammestring32菜單名(非空)authpatthstring20對(duì)應(yīng)路徑(非空空)parentIIdint10父級(jí)菜單Id(可可為空)iconstring50菜單圖標(biāo)(可為為空)stateint4菜單狀態(tài)r

49、emarkstring500備注(可為空)(3) 系統(tǒng)角角色表,存放放所有的角色色信息,表結(jié)結(jié)構(gòu)如表3-3所示。表3-3 系系統(tǒng)角色表(rrole)字段名稱類型字節(jié)數(shù)描述roleIdint10角色id(主鍵鍵)(非空)roleNammestring32角色名稱(非空空)authIdstring32菜單Id(非空空)remarkstring500備注(可為空)(4)客戶消費(fèi)費(fèi)訂單表,存存放所有的客客戶消費(fèi)訂單單的分析結(jié)果果數(shù)據(jù),表結(jié)結(jié)構(gòu)如表3-4所示。表3-4 客客戶消費(fèi)訂單單表(useer_porrtraitt_ordeer)字段名稱類型字節(jié)數(shù)描述user_iddbigint20客戶IDfir

50、st_oorder_timetimestaamp第一次消費(fèi)時(shí)間間last_orrder_ttimetimestaamp最近一次消費(fèi)時(shí)時(shí)間first_oorder_agobigint20首單距今時(shí)間last_orrder_aagobigint20尾單距今時(shí)間month1_hg_orrder_ccntbigint20近三十天的購買買次數(shù)month1_hg_orrder_aamtdouble近三十天的購買買金額month2_hg_orrder_ccntbigint20近六十天的購買買次數(shù)month2_hg_orrder_aamtdouble近六十天的購買買金額month3_hg_orrder_ccn

51、tbigint20近六十天的購買買次數(shù)month3_hg_orrder_aamtdouble近九十天的購買買金額max_ordder_ammtdouble最大消費(fèi)金額min_ordder_ammtdouble最小消費(fèi)金額total_oorder_cntbigint20累計(jì)消費(fèi)次數(shù)total_oorder_amtdouble累計(jì)消費(fèi)金額total_ccouponndouble累計(jì)使用代金卷卷金額common_addreessstring200常用收貨地區(qū)common_paytyypestring200常用支付方式forenooon_ordder_cnntbigint上午下單總數(shù)afternooo

52、n_orrder_ccntbigint20下午下單總數(shù)night_oorder_cntbigint20晚上下單總數(shù)(5)客戶購買買類目表,存存放所有客戶戶購買類目的的分析數(shù)據(jù),表表結(jié)構(gòu)如表33-5所示。表3-5 客客戶購買類目目表(useer_porrtraitt_cat)字段名稱類型字節(jié)數(shù)描述user_Iddbigint20客戶Idfirst_ccatbigint20一級(jí)分類IDfirst_ccat_naamestring20一級(jí)分類名稱second_catbigint20二級(jí)分類IDsecond_cat_nnamestring20二級(jí)分類名稱third_ccatbigint20三級(jí)分類ID

53、third_ccat_naamestring20三級(jí)分類名稱month1_cat_ccntbigint20近三十天購買類類目次數(shù)month1_cat_aamtdouble近三十天購買類類目金額month2_cat_ccntbigint20近六十天購買類類目次數(shù)month2_cat_aamtdouble近六十天購買類類目金額month3_cat_ccntbigint20近九十天購買類類目次數(shù)month3_cat_aamtdouble近九十天購買類類目金額total_ccat_cnntbigint20累計(jì)購買類目次次數(shù)total_ccat_ammtdouble累計(jì)購買類目金金額last_caat_

54、timmetimestaamp最后一次購買類類目時(shí)間 (6) 客戶戶購買商店表表,存放商店店近期的所有有分析數(shù)據(jù)信信息,表結(jié)構(gòu)構(gòu)如表3-66所示。表3-6 客客戶購買商店店表(useer_porrtraitt_shopp)字段名稱類型字節(jié)數(shù)描述user_iddbigint20客戶Idshop_iddbigint20商店IDshop_naamestring50商店名稱brand_iidbigint20品牌Idbrand_nnamestring20品牌名稱Month1_cart_cntbigint20最近三十天購物物車次數(shù)Month1_cart_goodss_cntbigint20最近三十天購物物

55、車商品件數(shù)數(shù)Month1_cart_submiit_gooods_cnntbigint20最近三十天商品品提交件數(shù)Month1_cart_ratebigint20最近三十天的交交易成功率Month1_cart_canceel_cnttbigint20最近三十天的購購物車取消商商品數(shù)last_caart_tiimetimestaamp最后一次購物車車時(shí)間Month3_validd_goodds_cnttbigint20最近九十天排除除退據(jù)商品件件數(shù)Month3_validd_goodds_amttdouble最近九十天排除除退據(jù)商品金金額Month3_saless_cntbigint20最近九十

56、天購買買訂單數(shù)Month3_cod_ccntbigint20最近九十貨到付付款訂單數(shù)Month3_returrn_gooods_cnntbigint20最近九十天的退退貨數(shù)Month3_returrn_gooods_ammtdouble最近九十天的退退貨金額Last_reeturn_timetimestaamp最后一次退貨時(shí)時(shí)間(7) 客戶屬屬性信息表,存存放所有客戶戶屬性信息,表表結(jié)構(gòu)如表33-7所示。表3-7 客客戶屬性信息息表(useer_porrtraitt_basiic)字段名稱類型字節(jié)數(shù)描述user_iddint10客戶IdUser_naamestring100客戶登錄名Sexst

57、ring10性別birthdaaystring20生日Ageint4年齡constelllatioonstring10星座big_areea_nammestring32大區(qū)域provinccestring50省份Citystring50城市City_leevelstring50城市等級(jí)Hex_maiilstring50郵箱Hex_phoonestring50加密手機(jī)Fore_phhonestring50手機(jī)前幾位Op_phonnestring50手機(jī)運(yùn)營(yíng)商Add_timmestring50注冊(cè)時(shí)間Login_iipstring50登錄IP地址Login_ssourceestring200登陸來

58、源Requestt_userrstring50邀請(qǐng)人Total_mmarkbigint20會(huì)員積分Used_maarkbigint20已使用積分Level_nnamestring20會(huì)員等級(jí)名稱Blackliistbigint20客戶黑名單Is_marrriedbigint20婚姻狀況Educatiionstring50學(xué)歷Monthlyy_incoomedouble月收入Professsionstring50職業(yè)Sex_moddelbigint20性別模型Is_preggnant_womannbigint20是否為孕婦Is_havee_chilldrenbigint20是否有小孩Childr

59、een_sexx_rateedouble20孩子性別概率Childreen_agee_rateedouble20孩子年齡概率is_havee_carbigint20是否有車Potentiial_caar_useer_rattedouble 潛潛在汽車用戶戶概率Phone_bbrandstring50使用手機(jī)品牌Phone_bbrand_levellstring50使用手機(jī)品牌檔檔次Phone_ccntbigint20使用多少種不同同手機(jī)Change_phonee_rateedouble更換手機(jī)頻率majia_fflagstring50疑似馬甲標(biāo)識(shí)Majia_aaccounnt_cnttbigi

60、nt20疑似馬甲賬號(hào)Loyal_mmodelbigint20用戶忠誠(chéng)度Shoppinng_typpe_moddelbigint20用戶購物類型Figure_modellbigint20身材Staturee_modeelbigint20身高 (8) 客戶戶營(yíng)銷信息表表,存放所有有客戶營(yíng)銷分分析數(shù)據(jù)的表表,表結(jié)構(gòu)如如表3-8所所示。表3-8 客客戶營(yíng)銷信息息表(user_portrrait_mmarkett)字段名稱類型字節(jié)數(shù)描述User_iddbigint20客戶IdTag_phoonestring32營(yíng)銷手機(jī)號(hào)First_oorder_timetimestrramp32第一個(gè)有效訂單單時(shí)間Fi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論