2021高職 大數(shù)據(jù)技術(shù)與應(yīng)用 任務(wù)書6(賽項(xiàng)賽題)_第1頁(yè)
2021高職 大數(shù)據(jù)技術(shù)與應(yīng)用 任務(wù)書6(賽項(xiàng)賽題)_第2頁(yè)
2021高職 大數(shù)據(jù)技術(shù)與應(yīng)用 任務(wù)書6(賽項(xiàng)賽題)_第3頁(yè)
2021高職 大數(shù)據(jù)技術(shù)與應(yīng)用 任務(wù)書6(賽項(xiàng)賽題)_第4頁(yè)
2021高職 大數(shù)據(jù)技術(shù)與應(yīng)用 任務(wù)書6(賽項(xiàng)賽題)_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2021年全國(guó)職業(yè)院校技能大賽

高職組

“大數(shù)據(jù)技術(shù)與應(yīng)用”

賽項(xiàng)賽卷(GZ-xxxxxxx-X卷)

務(wù)

參賽隊(duì)編號(hào):

背景描述

企業(yè)消費(fèi)服務(wù)平臺(tái),為大中小型企業(yè)提供基于云化的消費(fèi)場(chǎng)景一

站式智能消費(fèi)、智能管控,幫助企業(yè)獲得更高效、簡(jiǎn)單、美好的消費(fèi)

管理。從“費(fèi)控+支付”出發(fā),到覆蓋全場(chǎng)景支出的創(chuàng)新模式,讓員

工在數(shù)字化平臺(tái)上直接完成所有消費(fèi),從員工下單、到財(cái)務(wù)入賬,全

流程實(shí)現(xiàn)自動(dòng)化統(tǒng)一結(jié)算、統(tǒng)一數(shù)據(jù)分析。解決傳統(tǒng)差旅系統(tǒng)面臨的

場(chǎng)景覆蓋不全、員工體驗(yàn)差、消費(fèi)體驗(yàn)割裂等情況,真正做成一套讓

企業(yè)節(jié)省支出,讓員工滿意的差旅平臺(tái)。

企業(yè)消賽服務(wù)平臺(tái)的出現(xiàn)將原來(lái)傳統(tǒng)的差旅行程放到網(wǎng)絡(luò)平臺(tái)

上,更廣泛的傳遞差旅信息,互動(dòng)式的交流更方便客人的咨詢和訂購(gòu),

越來(lái)越多的人在出行的時(shí)候使用企業(yè)消費(fèi)服務(wù)平臺(tái)預(yù)訂機(jī)票、火車票、

住宿等,使得更多的商家愿意與企業(yè)消費(fèi)服務(wù)平臺(tái)建立合作,提升住

宿場(chǎng)所的營(yíng)業(yè)額,這也為企業(yè)消費(fèi)服務(wù)平臺(tái)的發(fā)展帶來(lái)新的機(jī)遇,為

了抓住這個(gè)機(jī)會(huì),“企業(yè)消費(fèi)服務(wù)平臺(tái)”需要從地域、訂單來(lái)源等多

種維度進(jìn)行分析,明確未來(lái)重點(diǎn)拓展合作商家的方向。公司要求多個(gè)

小組進(jìn)行分析,并提出相應(yīng)建議,你所在的小組也在其中,需要通過

數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)分析和數(shù)據(jù)可視化獲得相關(guān)論據(jù),提出未

來(lái)重點(diǎn)拓展合作住宿場(chǎng)所的方向。

你們作為該小組的技術(shù)人員,是這次技術(shù)方案的核心成員,請(qǐng)按

照下面步驟完成本次技術(shù)展示任務(wù),并提交分析報(bào)告,祝你們成功?。?!

模塊A:Hadoop平臺(tái)及組件的部署管理(15分)

環(huán)境要求:

編號(hào)主機(jī)名類型用戶密碼

1master主節(jié)點(diǎn)rootpasswd

2slavel從節(jié)點(diǎn)rootpasswd

3slave2從節(jié)點(diǎn)rootpasswd

相關(guān)軟件安裝包在/chinaskills目錄下

任務(wù)一:Hadoop全分布部署管理

本環(huán)節(jié)需要使用root用戶完成相關(guān)配置,安裝Hadoop需要配置

前置環(huán)境,具體部署要求如下:

1、解壓JDK安裝包到“/usr/local/src”路徑,并配置環(huán)境變量,

將命令(使用絕對(duì)路徑)及環(huán)境變量?jī)?nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

2、從master復(fù)制JDK環(huán)境變量文件到slavel、slave2節(jié)點(diǎn),將命

令(命令中使用絕對(duì)路徑)復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

3、環(huán)境中已創(chuàng)建ssh密鑰,實(shí)現(xiàn)主節(jié)點(diǎn)與從節(jié)點(diǎn)的無(wú)密碼登錄;截

取主節(jié)點(diǎn)登錄其中一個(gè)從節(jié)點(diǎn)的結(jié)果,將命令和結(jié)果復(fù)制粘貼至

對(duì)應(yīng)報(bào)告中;

4、將/chinaskills下的Hadoop包解壓到/usr/local/src,不修改

解壓后文件夾名稱,配置Hadoop全局環(huán)境變量,并使環(huán)境變量只

對(duì)當(dāng)前root用戶生效,將命令(使用絕對(duì)路徑)及環(huán)境變量?jī)?nèi)容

復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

5、根據(jù)要求修改Hadoop相關(guān)文件(hadoop-env.sh、core-site,xml、

HDFS-site.xml>mapred-site.xml,yarn-site,xml),并初始化

Hadoop,將初始化結(jié)果內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

6、啟動(dòng)Hadoop,使用相關(guān)命令查看所有節(jié)點(diǎn)Hadoop進(jìn)程,并將結(jié)

果內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

任務(wù)二:Zookeeper集群部署管理

1、解壓Zookeeper安裝包到“/usr/local/src”路徑,并修改解壓

后文件夾名為zookeeper,將命令復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

2、設(shè)置Zookeeper環(huán)境變量,并使環(huán)境變量只對(duì)當(dāng)前用戶生效,將

命令(使用絕對(duì)路徑)及環(huán)境變量?jī)?nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

3、配置“zoo.cfg”文件,并將修改的內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

4、修改myid文件,并將修改的內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

5、啟動(dòng)每個(gè)虛擬機(jī)上面的Zookeeper節(jié)點(diǎn),啟動(dòng)完成之后查看每個(gè)

節(jié)點(diǎn)的狀態(tài),并將Zookeeper運(yùn)行狀態(tài)結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告

中。

任務(wù)三:Kafka組件部署管理

本環(huán)節(jié)需要使用root用戶完成相關(guān)配置,已安裝Hadoop及需要

配置前置環(huán)境,具體部署要求如下:

1、將Zookeeper配置完畢后,在各節(jié)點(diǎn)啟動(dòng)Zookeeper,查看

Zookeeper狀態(tài),并將命令和Zookeeper運(yùn)行狀態(tài)結(jié)果復(fù)制粘貼

至對(duì)應(yīng)報(bào)告中;

2、修改Kafkaserver.properties文件,并將修改的內(nèi)容復(fù)制粘貼至

對(duì)應(yīng)報(bào)告中;

3、啟動(dòng)Kafka,并將Kafka啟動(dòng)命令和輸出結(jié)果前10行復(fù)制粘貼至

報(bào)告中。

模塊B:數(shù)據(jù)采集與處理(20分)

1、網(wǎng)站解析,利用Chrome查看網(wǎng)頁(yè)源碼,分析企業(yè)消費(fèi)平臺(tái)網(wǎng)站網(wǎng)

頁(yè)結(jié)構(gòu)。

1)打開企業(yè)消費(fèi)平臺(tái)網(wǎng)站,在網(wǎng)頁(yè)中右鍵點(diǎn)擊檢查,或者F12

快捷鍵,查看元素頁(yè)面;

2)檢查網(wǎng)站:瀏覽網(wǎng)站源碼查看所需內(nèi)容。

2、從企業(yè)消費(fèi)平臺(tái)網(wǎng)站中爬取需要數(shù)據(jù),按照要求使用Python語(yǔ)言

編寫爬蟲代碼,爬取指定數(shù)據(jù)項(xiàng),并對(duì)結(jié)果數(shù)據(jù)集進(jìn)行數(shù)據(jù)探索、

以及必要的數(shù)據(jù)處理操作。請(qǐng)將符合題目要求的代碼答案復(fù)制粘

貼至對(duì)應(yīng)報(bào)告中。

具體步驟如下:

1)創(chuàng)建爬蟲項(xiàng)目

2)構(gòu)建爬蟲請(qǐng)求

3)按要求定義相關(guān)字段

4)獲取有效數(shù)據(jù)

5)將爬取到的數(shù)據(jù)保存到指定位置

至此已從企業(yè)消費(fèi)平臺(tái)網(wǎng)站中爬取了所需數(shù)據(jù),下一步我們要將

爬取結(jié)果進(jìn)一步進(jìn)行相關(guān)數(shù)據(jù)操作。

詳細(xì)數(shù)據(jù)描述:

1)請(qǐng)創(chuàng)建Scrapy項(xiàng)目chinaskills_accommodation(C:\

chinaskillsaccommodation),從網(wǎng)站(網(wǎng)站地址在競(jìng)賽

平臺(tái)模塊B中給出)中爬取頁(yè)面相關(guān)字段(包括name,seq,業(yè)

務(wù)部門,住宿場(chǎng)所總訂單,住宿場(chǎng)所總間夜,住宿場(chǎng)所星級(jí),

住宿場(chǎng)所直銷實(shí)住訂單,住宿場(chǎng)所直銷實(shí)住間夜);將抓取

結(jié)果保存為json格式文件,并命名為accommodations.jsono

每條信息請(qǐng)以Key:Value格式單獨(dú)保存為一行數(shù)據(jù)。

例如:

{“name":"***”,"seq":"***",…….)

任務(wù)中要求將“以下內(nèi)容及答案完整復(fù)制粘貼至對(duì)應(yīng)報(bào)告

中。“,粘貼到對(duì)應(yīng)報(bào)告中的內(nèi)容舉例如下:

“中國(guó)”網(wǎng)頁(yè)源碼對(duì)應(yīng)字段為:Country

“四川”網(wǎng)頁(yè)源碼對(duì)應(yīng)字段為:Province

2)爬取數(shù)據(jù)量不少于28萬(wàn)條。

具體任務(wù)要求:

任務(wù)一:網(wǎng)頁(yè)源碼對(duì)應(yīng)字段

使用Chrome瀏覽器,查找網(wǎng)站異步請(qǐng)求的數(shù)據(jù),并將以下內(nèi)容及

答案完整復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

“城市平均實(shí)住間夜”網(wǎng)頁(yè)源碼對(duì)應(yīng)字段為:

“房間數(shù)”網(wǎng)頁(yè)源碼對(duì)應(yīng)字段為:

“城市直銷拒單率”網(wǎng)頁(yè)源碼對(duì)應(yīng)字段為:

“處于商圈”網(wǎng)頁(yè)源碼對(duì)應(yīng)字段為:

任務(wù)二:創(chuàng)建Scrapy工程

自行創(chuàng)建Scrapy工程編寫爬蟲代碼,爬取"name、seq、業(yè)務(wù)部

門有效數(shù)據(jù)項(xiàng)包括:業(yè)務(wù)部門,房間數(shù),國(guó)家,圖片數(shù),城市,城市平均

實(shí)住間夜,城市直銷拒單率,處于商圈”頁(yè)面相關(guān)數(shù)據(jù),通過爬蟲代碼

分頁(yè)爬取,以合理的程序邏輯判斷相關(guān)數(shù)據(jù)包含的頁(yè)數(shù)并將程序代碼

復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

任務(wù)三:在MySQL中創(chuàng)建數(shù)據(jù)庫(kù)表

根據(jù)爬取字段,在MySQL中創(chuàng)建crawl數(shù)據(jù)庫(kù),在該數(shù)據(jù)庫(kù)中創(chuàng)

建accommodations1表(包含name,seq,業(yè)務(wù)部門,住宿場(chǎng)所總訂單,

住宿場(chǎng)所總間夜),創(chuàng)建accommodations2表(包含name,seq,業(yè)務(wù)

部門,住宿場(chǎng)所星級(jí),住宿場(chǎng)所直銷實(shí)住訂單,住宿場(chǎng)所直銷實(shí)住間夜)

并查看表結(jié)構(gòu),將查看結(jié)果(含字段總行數(shù))復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

任務(wù)四:對(duì)數(shù)據(jù)庫(kù)表排序

爬蟲程序運(yùn)行結(jié)束后查看MySQL數(shù)據(jù)庫(kù)accommodations2表,按

seq字段倒序排序,返回前100行數(shù)據(jù),將命令與查看結(jié)果復(fù)制粘貼

至對(duì)應(yīng)報(bào)告中。

任務(wù)五:對(duì)數(shù)據(jù)表填充處理

1、請(qǐng)根據(jù)步驟3中accommodations2表中的數(shù)據(jù),對(duì)數(shù)據(jù)集中“住

宿場(chǎng)所直銷實(shí)住間夜”字段的缺失值,使用平均值進(jìn)行填充。查

看填充后的數(shù)據(jù)集前15條記錄,將查看結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告

中。

2、請(qǐng)根據(jù)步驟3中accommodations?表中的數(shù)據(jù),對(duì)數(shù)據(jù)集中存在

空值的記錄進(jìn)行刪除。查看刪除后的數(shù)據(jù)集條數(shù),將查看結(jié)果復(fù)

制粘貼至對(duì)應(yīng)報(bào)告中。

accominodations2表刪除后條數(shù)為:

模塊C:數(shù)據(jù)清洗與挖掘分析(25分)

現(xiàn)已從相關(guān)網(wǎng)站及平臺(tái)獲取到原始數(shù)據(jù)集,為保障用戶隱私和行

業(yè)敏感信息,已進(jìn)行數(shù)據(jù)脫敏。數(shù)據(jù)脫敏是指對(duì)某些敏感信息通過脫

敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。在涉及客戶

安全數(shù)據(jù)或者一些商業(yè)性敏感數(shù)據(jù)的情況、不違反系統(tǒng)規(guī)則條件下,

對(duì)真實(shí)數(shù)據(jù)進(jìn)行改造并提供測(cè)試使用,如身份證號(hào)、手機(jī)號(hào)等個(gè)人信

息都需要進(jìn)行數(shù)據(jù)脫敏。

相關(guān)數(shù)據(jù)文件中已經(jīng)包含了數(shù)據(jù)采集階段從企業(yè)消費(fèi)平臺(tái)網(wǎng)站

上爬取的數(shù)據(jù)集,其中包含了來(lái)自不同城市的多家住宿場(chǎng)所的銷售信

息,你的小組需要通過編寫代碼或腳本完成對(duì)相關(guān)數(shù)據(jù)文件中住宿場(chǎng)

所銷售管理數(shù)據(jù)的清洗和整理,并完成數(shù)據(jù)計(jì)算和分析任務(wù)。綜合利

用MapReduce、Spark,Storm,分布式存儲(chǔ)系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)Hive、數(shù)

據(jù)推送工具等技術(shù),使用Java、Python、Scala等開發(fā)語(yǔ)言,完成本

階段數(shù)據(jù)清洗、處理、分析及數(shù)據(jù)挖掘等任務(wù)。通過多個(gè)維度分析住

宿場(chǎng)所的銷售信息,并以此評(píng)價(jià)住宿場(chǎng)所銷售業(yè)績(jī)、區(qū)域的游客接納

能力、接納質(zhì)量等指標(biāo)。

初始數(shù)據(jù)集來(lái)自多個(gè)網(wǎng)站及平臺(tái)系統(tǒng),且為多次采集匯總結(jié)果,

因此數(shù)據(jù)集中不可避免地存在一些臟數(shù)據(jù),即源數(shù)據(jù)不在給定的范圍

內(nèi)或?qū)τ趯?shí)際業(yè)務(wù)毫無(wú)意義,或是數(shù)據(jù)格式非法,以及在源系統(tǒng)中存

在不規(guī)范的編碼和含糊的業(yè)務(wù)邏輯。

請(qǐng)分析相關(guān)數(shù)據(jù)集,根據(jù)題目規(guī)定要求實(shí)現(xiàn)數(shù)據(jù)清洗及分析。

任務(wù)一:數(shù)據(jù)清洗

住宿場(chǎng)所銷售數(shù)據(jù)涉及到多個(gè)平臺(tái)及數(shù)據(jù)庫(kù)對(duì)接,個(gè)別信息由于

人為操作失誤或計(jì)算機(jī)故障等原因產(chǎn)生了數(shù)據(jù)缺失值。缺失值是一種

常見的臟數(shù)據(jù)情況,由于粗糙數(shù)據(jù)中缺少信息而造成的數(shù)據(jù)缺失或截

斷?,F(xiàn)有數(shù)據(jù)集中某個(gè)或某些屬性的值是不完全的。對(duì)于缺失值的處

理,從總體上來(lái)說(shuō)分為缺失值刪除和缺失值插補(bǔ)。當(dāng)缺失值過多時(shí),

信息條目本身的價(jià)值也會(huì)隨之降低,此時(shí)如果對(duì)缺失值進(jìn)行填補(bǔ)則將

產(chǎn)生結(jié)果的人為干預(yù)。結(jié)合行業(yè)數(shù)據(jù)本身特點(diǎn)及上述考慮,請(qǐng)你根據(jù)

題目具體參數(shù)要求實(shí)現(xiàn)以下功能:將缺失值大于n個(gè)的數(shù)據(jù)條目從原

始數(shù)據(jù)集中剔除,并輸出剔除的條目數(shù)量。

詳細(xì)描述:

數(shù)據(jù)源文件存放于/chinaskills/accommodationdata.csv,請(qǐng)編

寫MapReduce程序,按照如下要求實(shí)現(xiàn)對(duì)數(shù)據(jù)的清洗,并將結(jié)果輸出

至HDFS文件系統(tǒng)中/accommodation_outputl:

1)解析該文件;

2)按照題目要求剔除缺失數(shù)據(jù)信息(n=3),并以打印語(yǔ)句輸出刪

除條目數(shù);

3)程序打包并在Hadoop平臺(tái)運(yùn)行,結(jié)果輸出至HDFS文件系統(tǒng)中

/accommodationoutput10

具體任務(wù)要求:

1、將accommodationdata,csv文件上傳至HDFS新建目錄/file3_l

中;運(yùn)行代碼,刪除數(shù)據(jù)源中缺失值大于3個(gè)字段的數(shù)據(jù)記錄,

打印輸出刪除條目數(shù),將運(yùn)行結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

2、查看清洗后輸出的結(jié)果文件總行數(shù)(/accommodation_outputl),

將運(yùn)行結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

對(duì)于數(shù)據(jù)集字段缺失情況,通??梢圆捎锰畛淠J(rèn)值、均值、眾

數(shù)、KNN填充、以及把缺失值作為新的label等方式處理。同時(shí),不

當(dāng)?shù)奶畛淇赡軙?huì)令后續(xù)的分析結(jié)果出現(xiàn)導(dǎo)向性偏差,當(dāng)缺失信息較少

時(shí)可采用刪除的方式來(lái)進(jìn)行處理。下面請(qǐng)根據(jù)題目具體參數(shù)要求處理

關(guān)鍵字段缺失,復(fù)制粘貼至對(duì)應(yīng)報(bào)告中結(jié)果。

詳細(xì)描述:

數(shù)據(jù)源使用HDFS文件系統(tǒng)中的accommodationdata.csv,請(qǐng)編

寫MapReduce程序,按照如下要求實(shí)現(xiàn)對(duì)數(shù)據(jù)的清洗,并將結(jié)果輸出

至HDFS文件系統(tǒng)中/accommodation_output2:

1)解析該文件;

2)將任意關(guān)鍵字段為空的條目剔除,關(guān)鍵字段定義為{星級(jí)、評(píng)

論數(shù)、評(píng)分},并以打印語(yǔ)句輸出刪除條目數(shù);

3)程序打包并在Hadoop平臺(tái)運(yùn)行,結(jié)果輸出至HDFS文件系統(tǒng)中

/accommodation_output2。

具體任務(wù)要求:

3、運(yùn)行代碼,將字段{星級(jí)、評(píng)論數(shù)、評(píng)分}中任意字段為空的數(shù)據(jù)

刪除,并打印輸出刪除條目數(shù),將運(yùn)行結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告

中;

4、查看清洗后輸出的結(jié)果文件(accommodationoutput2)總行數(shù),將

運(yùn)行結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

任務(wù)二:數(shù)據(jù)挖掘分析

城市游客接納能力是城市規(guī)劃建設(shè)中的重要指標(biāo),其中城市的住

宿場(chǎng)所數(shù)量和房間數(shù)量是城市游客接納能力的關(guān)鍵要素。請(qǐng)編寫程序

或腳本根據(jù)住宿場(chǎng)所管理網(wǎng)站中的數(shù)據(jù)統(tǒng)計(jì)各城市的相關(guān)信息,并寫

入指定的數(shù)據(jù)庫(kù)或數(shù)據(jù)文件。

詳細(xì)描述:

1)請(qǐng)根據(jù)數(shù)據(jù)清洗的輸出數(shù)據(jù)集,編寫HQL語(yǔ)句統(tǒng)計(jì)各城市的住

宿場(chǎng)所出租率,以各城市住宿場(chǎng)所出租率降序排列并輸出前

10條統(tǒng)計(jì)結(jié)果,同時(shí)創(chuàng)建并寫入數(shù)據(jù)表a_4。要求輸出字段包

含:省份、城市、住宿場(chǎng)所出租率。

數(shù)據(jù)定義如下:

數(shù)據(jù)項(xiàng)字段名備注

省份province

城市city

住宿場(chǎng)所出租率lease要求保留6位小數(shù)

數(shù)據(jù)樣式如下:

provincecitylease

貴州貴陽(yáng)0.123456

具體任務(wù)要求:

1、創(chuàng)建表table3_4,

2、統(tǒng)計(jì)各城市住宿場(chǎng)所出租率,將出租率前10的數(shù)據(jù)降序排列并寫

入數(shù)據(jù)表table3_4中,將命令復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

企業(yè)消費(fèi)平臺(tái)是住宿場(chǎng)所營(yíng)銷的主要途徑之一,不僅降低銷售成

本,同時(shí)也提高了顧客體驗(yàn)滿意度。當(dāng)顧客通過企業(yè)消費(fèi)平臺(tái)進(jìn)行住

宿場(chǎng)所預(yù)訂時(shí),住宿場(chǎng)所就擁有了用戶的相關(guān)數(shù)據(jù)。通過這些數(shù)據(jù),

能夠更好地收集用戶需求,從而可以提供更有針對(duì)性和個(gè)性化的服務(wù),

最終能夠產(chǎn)生更多的忠誠(chéng)會(huì)員并帶來(lái)更多訂單。但企業(yè)消費(fèi)平臺(tái)銷售

也存在用戶拒單等情況,拒單原因有很多:例如,平臺(tái)信息不同步,

信息更新不及時(shí);分銷層次過多,導(dǎo)致無(wú)法及時(shí)查證訂單;住宿場(chǎng)所

違反企業(yè)消費(fèi)規(guī)則擅自以低價(jià)讓客戶取消訂單,這種情況又叫做“切

單”。企業(yè)消費(fèi)平臺(tái)需要統(tǒng)計(jì)用戶訂單的分布情況,以此發(fā)現(xiàn)平臺(tái)缺

陷及用戶、商家的行為模式,企業(yè)消費(fèi)平臺(tái)據(jù)此調(diào)整營(yíng)銷策略。根據(jù)

現(xiàn)有數(shù)據(jù)及給定參數(shù)完成訂單數(shù)據(jù)統(tǒng)計(jì),并寫入指定的數(shù)據(jù)庫(kù)或數(shù)據(jù)

文件,復(fù)制粘貼至對(duì)應(yīng)報(bào)告中結(jié)果。

詳細(xì)描述:

1)請(qǐng)根據(jù)數(shù)據(jù)清洗的輸出數(shù)據(jù)集,編寫HQL語(yǔ)句統(tǒng)計(jì)各省直銷拒

單率,以直銷拒單率升序排列并輸出前10條統(tǒng)計(jì)結(jié)果,同時(shí)

創(chuàng)建并寫入數(shù)據(jù)表table3_5。要求輸出字段包含:省份、直

銷拒單率。

數(shù)據(jù)定義如下:

數(shù)據(jù)項(xiàng)字段名備注

省份province

直銷拒單率norate要求保留6位小數(shù)

數(shù)據(jù)樣式如下:

provincenorate

貴州0.123456

具體任務(wù)要求:

3、創(chuàng)建表table3_5,將命令復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;

4、統(tǒng)計(jì)各省拒單率,將統(tǒng)計(jì)的拒單率升序排列并將前10條統(tǒng)計(jì)結(jié)果

寫入數(shù)據(jù)表table35中,將命令復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。

模塊D:數(shù)據(jù)可視化(20分)

MySQL數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)集包含了城市、省份、評(píng)分、評(píng)論數(shù)

等多項(xiàng)基礎(chǔ)信息字段。請(qǐng)使用Flask框架,結(jié)合Echarts完成下列題

目。

數(shù)據(jù)庫(kù)賬號(hào):takeout密碼:takeout

自行創(chuàng)建代碼工程路徑為:C:\chinaskills_hotel

每個(gè)可視化圖中需要添加圖片作為背景水印。

任務(wù)一:堆疊柱狀圖呈現(xiàn)各省住宿場(chǎng)所數(shù)和訂單信息

在該企業(yè)消費(fèi)平臺(tái)上,各地區(qū)的住宿場(chǎng)所銷售數(shù)據(jù)等信息能夠反

映一個(gè)地區(qū)商業(yè)活動(dòng)的密集程度。例如住宿場(chǎng)所總量多的城市大都具

有強(qiáng)烈的吸納外來(lái)人員的能力,訂單數(shù)量能夠反映該地區(qū)的有較多的

商業(yè)往來(lái)。根據(jù)現(xiàn)有數(shù)據(jù)及給定參數(shù)完成住宿場(chǎng)所銷售數(shù)據(jù)統(tǒng)計(jì)。

詳細(xì)描述:

請(qǐng)根據(jù)數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)集中住宿場(chǎng)所數(shù)量、訂單數(shù)量、實(shí)住數(shù)

量等字段統(tǒng)計(jì)各省份的住宿場(chǎng)所數(shù)量和訂單信息,繪制堆疊柱狀圖。

具體任務(wù)要求:

1)提取表格相關(guān)字段,分別統(tǒng)計(jì)各省的住宿場(chǎng)所數(shù)量、總訂單數(shù)

量和實(shí)住訂單數(shù)量,在控制臺(tái)按照“住宿場(chǎng)所數(shù)量”降序排列,

打印輸出住宿場(chǎng)所數(shù)量最多的5個(gè)省份及其包含的住宿場(chǎng)所

數(shù)量、訂單數(shù)量和實(shí)住數(shù)量;

打印語(yǔ)句格式如下:

==省份:***=住宿場(chǎng)所數(shù)量:**個(gè)=訂單數(shù)量:**個(gè)=實(shí)住數(shù)量:

**個(gè)二二

2)使用Flask框架,結(jié)合Echarts,按照“總訂單數(shù)量”降序排

列,繪制“總訂單數(shù)量”與“實(shí)住訂單數(shù)量”的堆疊柱狀圖。

標(biāo)題為“住宿場(chǎng)所數(shù)量Top5”,橫坐標(biāo)為省份名稱,縱軸分別

表示住宿場(chǎng)所數(shù)量、訂單數(shù)量和實(shí)住數(shù)量

任務(wù)二:多個(gè)餅圖呈現(xiàn)各省份不同等級(jí)住宿場(chǎng)所占比

企業(yè)消費(fèi)平臺(tái)為了更好地發(fā)展企業(yè)業(yè)務(wù),向企業(yè)客戶推薦符合其

定位的協(xié)議住宿場(chǎng)所,需要分析上題中Top5省份的“三星級(jí)/舒適”、

“四星級(jí)/高檔”和“五星級(jí)/豪華”住宿場(chǎng)所以及“其它類別”住宿

場(chǎng)所(除上述三類外,其余類型住宿場(chǎng)所均歸為“其它類別”)的占

比情況。請(qǐng)根據(jù)指定表中數(shù)據(jù),以指定圖例進(jìn)行呈現(xiàn)。

詳細(xì)描述:

請(qǐng)根據(jù)數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)集中省份、星級(jí)等相關(guān)字段統(tǒng)計(jì)各省份

不同等級(jí)住宿場(chǎng)所的占比,繪制多個(gè)餅圖。

具體任務(wù)要求:

1)根據(jù)表格相關(guān)字段分別統(tǒng)計(jì)上題Top5省份不同星級(jí)住宿

場(chǎng)所的占比,打印輸出各省份名稱以及各星級(jí)住宿場(chǎng)所的占比

情況;

打印語(yǔ)句格式如下:

==省份:A=舒適型住宿占比:**===

==省份:A=高檔型住宿占比:**===

==省份:A=豪華型住宿占比:**===

==省份:B=舒適型住宿占比:**===

==省份:B=高檔型住宿占比:**===

==省份:B=豪華型住宿占比:**===

2)使用Flask框架,結(jié)合Echarts在組合圖中繪制多個(gè)餅圖,

每個(gè)省份各星級(jí)住宿場(chǎng)所占比情況分別用一個(gè)餅圖進(jìn)行呈現(xiàn),

將可視化結(jié)果截圖并保存。

任務(wù)三:柱狀圖呈現(xiàn)城市出租率

出租率是反映住宿場(chǎng)所經(jīng)營(yíng)狀況的一項(xiàng)重要指標(biāo),它是已出租的

客房數(shù)與住宿場(chǎng)所可以提供租用的房間總數(shù)的百分比。住宿場(chǎng)所出租

率的情況可以在一定程度上反應(yīng)出該住宿場(chǎng)所的整體運(yùn)營(yíng)的情況,為

了更好的分析指定住宿場(chǎng)所的入住情況,請(qǐng)根據(jù)相關(guān)表中數(shù)據(jù)完成出

租率分析,通過指定圖例進(jìn)行呈現(xiàn)。

詳細(xì)描述:

請(qǐng)以數(shù)據(jù)庫(kù)中相關(guān)表格為數(shù)據(jù)源,分析并統(tǒng)計(jì)各省住宿場(chǎng)所出租

率,使用柱狀圖表達(dá)。

具體任務(wù)要求:

1)提取表格相關(guān)字段,在控制臺(tái)按照“各省住宿場(chǎng)所出租率”

降序排列,打印輸出各省名稱及包含的住宿場(chǎng)所數(shù)量以及出

租率;

打印語(yǔ)句格式如下:

==1.***省=住宿場(chǎng)所數(shù)為***個(gè)=出租率為:***===

==2.***省=住宿場(chǎng)所數(shù)為***個(gè)=出租率為:***===

2)使用Flask框架,結(jié)合Echarts繪制柱狀圖。柱狀圖主標(biāo)題

為“各省住宿場(chǎng)所出租率”(字體要求:紅色、加粗、斜體),

副標(biāo)題為出租率前十的省份;縱坐標(biāo)為出租率,橫坐標(biāo)為省

份名稱(按照出租率降序排列);將可視化結(jié)果截圖并保存。

任務(wù)四:折線圖呈現(xiàn)連鎖住宿場(chǎng)所出租率

一些全國(guó)連鎖的住宿場(chǎng)所品牌通常都具有全國(guó)統(tǒng)一的品牌形

象識(shí)別系統(tǒng)、全國(guó)統(tǒng)一的會(huì)員體系和營(yíng)銷體系、價(jià)格相比較很有

優(yōu)勢(shì)符合大眾化消費(fèi)。連鎖品牌無(wú)論在裝修、服務(wù)還是信譽(yù)上都

有較大的競(jìng)爭(zhēng)優(yōu)勢(shì),所以連鎖品牌的住宿場(chǎng)所是出差、旅游住宿

的好選擇。但是由于三線城市會(huì)員流動(dòng)差、高素質(zhì)管理人員相對(duì)

短缺、營(yíng)銷環(huán)境與消費(fèi)特點(diǎn)的差異等問題,一些已經(jīng)成熟住宿場(chǎng)

所管理模式在三線城市可能并不受用,甚至?xí)霈F(xiàn)水土不服的現(xiàn)

象。請(qǐng)根據(jù)現(xiàn)有數(shù)據(jù)及給定參數(shù),統(tǒng)計(jì)指定連鎖住宿場(chǎng)所的經(jīng)營(yíng)

狀況,并以指定圖例進(jìn)行呈現(xiàn)。

詳細(xì)描述:

1)數(shù)據(jù)庫(kù)中相關(guān)表已保存了指定地區(qū)的某連鎖住宿場(chǎng)所的銷售

信息。請(qǐng)根據(jù)地區(qū)劃分,統(tǒng)計(jì)題中某連鎖住宿場(chǎng)所的出租率

(保留6位小數(shù)),并以折線圖呈現(xiàn);

2)要求統(tǒng)計(jì)以下指定地區(qū)住宿場(chǎng)所相關(guān)信息,指定地區(qū)包括:

東北、華北、華東、華中、西北、西南、華南;

3)指定地區(qū)省份映射表,如表1。

表1:地區(qū)省份映射表

地區(qū)省份

華東地區(qū)山東、江蘇、安徽、浙江、江西、福建、上海

華南地區(qū)廣東、廣西、海南

華中地區(qū)湖北、湖南、河南

華北地區(qū)北京、天津、河北、山西、內(nèi)蒙古

西北地區(qū)寧夏、新疆、青海、陜西、甘肅

西南地區(qū)四川、云南、貴州、西藏、重慶

東北地區(qū)遼寧、吉林、黑龍江

具體任務(wù)要求:

1)根據(jù)表格相關(guān)字段分別統(tǒng)計(jì)某連鎖住宿場(chǎng)所在各地區(qū)的出租

率(保留6位小數(shù)),在控制臺(tái)按照“出租率”降序排列,打

印輸出各地區(qū)名稱以及出租率;

打印語(yǔ)句格式如下:

==1.***地區(qū),出租率為***===

==2.***地區(qū),出租率為***===

2)使用Flask框架,結(jié)合Echarts繪制折線圖,主標(biāo)題為“指

定地區(qū)的住宿場(chǎng)所出租率”(字體要求:紅色、加粗、斜體),

副標(biāo)題為“某連鎖住宿場(chǎng)所的出租率”,縱坐標(biāo)為出租率,橫

坐標(biāo)為地區(qū);輸出折線圖,將可視化結(jié)果截圖并保存。

任務(wù)五:條形統(tǒng)計(jì)圖呈現(xiàn)各省直銷拒單率

企業(yè)消費(fèi)平臺(tái)是住宿場(chǎng)所營(yíng)銷的主要途徑之一,不僅降低銷售成

本,同時(shí)也提高了顧客體驗(yàn)滿意度。當(dāng)顧客通過企業(yè)消費(fèi)平臺(tái)進(jìn)行住

宿場(chǎng)所預(yù)訂時(shí),住宿場(chǎng)所就擁有了用戶的相關(guān)數(shù)據(jù)。通過這些數(shù)據(jù),

能夠更好地收集用戶需求,從而可以提供更有針對(duì)性和個(gè)性化的服務(wù),

最終能夠產(chǎn)生更多的忠誠(chéng)會(huì)員并帶來(lái)更多訂單。但企業(yè)消費(fèi)平臺(tái)銷售

也存在用戶拒單等情況,拒單原因有很多:例如,平臺(tái)信息不同步,

信息更新不及時(shí);分銷層次過多,導(dǎo)致無(wú)法及時(shí)查證訂單;住宿場(chǎng)所

違反企業(yè)消費(fèi)規(guī)則擅自以低價(jià)讓客戶取消訂單,這種情況又叫做“切

單”。企業(yè)消費(fèi)平臺(tái)需要統(tǒng)計(jì)用戶訂單的分布情況,以此發(fā)現(xiàn)平臺(tái)缺

陷及用戶、商家的行為模式,企業(yè)消費(fèi)平臺(tái)據(jù)此調(diào)整營(yíng)銷策略。根據(jù)

現(xiàn)有數(shù)據(jù)統(tǒng)計(jì)訂單數(shù)據(jù),并以指定圖例進(jìn)行呈現(xiàn)。

詳細(xì)描述:

請(qǐng)根據(jù)數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)集中統(tǒng)計(jì)各省直銷拒單率,以直銷拒單

率降序排列,并繪制條形統(tǒng)計(jì)圖。

具體任務(wù)要求:

1)根據(jù)表格相關(guān)字段分別統(tǒng)計(jì)各省份的直銷拒單率(保留6位小

數(shù)),在控制臺(tái)按照“直銷拒單率”降序排列,打印輸出各省

名稱以及直銷拒單率;

打印語(yǔ)句格式如下:

==1.***省,直銷拒單率為***===

==2.***省,直銷拒單率為***===

2)使用Flask框架,結(jié)合Echarts繪制直銷拒單率最高的5個(gè)省

份條形圖,主標(biāo)題為“直銷拒單率最高的5個(gè)省份”(字體要

求:紅色、加粗、斜體),縱坐標(biāo)為省份名稱,橫坐標(biāo)直銷拒

單率;輸出條形圖,將可視化結(jié)果截圖并保存。

任務(wù)六:多線雷達(dá)圖呈現(xiàn)各省份住宿場(chǎng)所綜合情況

企業(yè)銷售平臺(tái)需要綜合評(píng)判一個(gè)城市住宿場(chǎng)所運(yùn)營(yíng)情況,會(huì)涉及

到多方面住宿場(chǎng)所數(shù)據(jù),例如像高端住宿場(chǎng)所數(shù)量、訂單數(shù)量、住客

評(píng)分、評(píng)論數(shù)量、出租率等信息,請(qǐng)根據(jù)指定表中數(shù)據(jù)統(tǒng)計(jì)相關(guān)數(shù)據(jù),

并以指定圖例進(jìn)行呈現(xiàn)。

詳細(xì)描述:

請(qǐng)以數(shù)據(jù)庫(kù)中相關(guān)表格為數(shù)據(jù)源,統(tǒng)計(jì)北京、上海、廣東、四川、

海南各省市住宿場(chǎng)所的“平均評(píng)分“、“評(píng)論數(shù)“、”各省住宿場(chǎng)所出租

率”等綜合指標(biāo),并以多線雷達(dá)圖。

具體任務(wù)要求:

1)根據(jù)數(shù)據(jù)庫(kù)中相關(guān)表格分別統(tǒng)計(jì)北京、上海、廣東、四川、海

南各地平均評(píng)分、評(píng)論數(shù)、各省住宿場(chǎng)所出租率、直銷拒單率,

在控制臺(tái)按照“省份”名稱升序排列,打印輸出各城市住宿場(chǎng)

所的多項(xiàng)運(yùn)營(yíng)指標(biāo);

打印語(yǔ)句格式如下:

==省市:A,平均評(píng)分為:***===

==省市:A,評(píng)論數(shù):***===

==省市:B,平均評(píng)分為:***===

==省市:B,評(píng)論數(shù):***===

2)使用Flask框架,結(jié)合Echarts繪制多線雷達(dá)圖,標(biāo)題為各省

份住宿場(chǎng)所綜合情況(字體要求:紅色、加粗、斜體);輸出

多線雷達(dá)圖,將可視化結(jié)果截圖并保存。

模塊E:綜合分析(20分)

假定你為企業(yè)消費(fèi)平臺(tái)的管理者,在綜合理解住宿場(chǎng)所業(yè)務(wù)數(shù)據(jù)

的基礎(chǔ)上,通過以上模塊A、B、C、D的相關(guān)結(jié)論,對(duì)未來(lái)拓展合作

住宿場(chǎng)所方向做出預(yù)測(cè),根據(jù)題目要求進(jìn)行分析,并編寫輸出分析報(bào)

告。

根據(jù)上述任務(wù)中的結(jié)論,分析以下內(nèi)容,并編寫分析報(bào)告。從住

宿場(chǎng)所分布維度進(jìn)行分析,結(jié)合多省份住宿場(chǎng)所綜合運(yùn)營(yíng)情況,對(duì)企

業(yè)消賽平臺(tái)未來(lái)拓展合作住宿場(chǎng)所的方向提出建議。

分析報(bào)告要求:

任務(wù)一:通過數(shù)據(jù)及圖示分析指定省市運(yùn)營(yíng)情況

結(jié)合平臺(tái)相關(guān)數(shù)據(jù)文件,根據(jù)北京、上海、四川、廣東、海南各

省份住宿場(chǎng)所的直銷拒單率和出租率的條形圖,說(shuō)明幾個(gè)省份住宿場(chǎng)

所的綜合運(yùn)營(yíng)情況。分別以文字描述和圖例進(jìn)行說(shuō)明;

任務(wù)二:對(duì)通過圖示和計(jì)算業(yè)務(wù)分析原因

結(jié)合模塊D可視化分析對(duì)某連鎖住宿場(chǎng)所在不同地區(qū)的住宿場(chǎng)

所出租率的統(tǒng)計(jì),說(shuō)明影響住宿場(chǎng)所出租率的原因可能有哪些?對(duì)于

提高該連鎖住宿場(chǎng)所的出租率,您有哪些建議?分別以文字描述和圖

例進(jìn)行說(shuō)明;

任務(wù)三:對(duì)企業(yè)消費(fèi)平臺(tái)未來(lái)拓展合作建議和意見

1)對(duì)企業(yè)消費(fèi)平臺(tái)未來(lái)拓展合作住宿場(chǎng)所的方向提出建議(不少

于3條建議),請(qǐng)?jiān)趫?bào)告中進(jìn)行說(shuō)明。

附錄:補(bǔ)充說(shuō)明

一、json數(shù)據(jù)格式樣例

{"name":"南京國(guó)美家庭旅社公寓南林店","detail":{"SEQ":

"nanjing」O16","國(guó)家":"中國(guó)","省份":"江蘇","城市":"南京","處于

商圈":"鎖金村地區(qū)玄武湖地區(qū)中山陵景區(qū)","是否為客棧":0,"住宿場(chǎng)所星

級(jí)":"二星及其他","業(yè)務(wù)部門":"低星","剩余房間":8,"圖片數(shù)":0,"住

宿場(chǎng)所評(píng)分":"1","用戶點(diǎn)評(píng)數(shù)":1,"城市平均實(shí)住間夜":"51.701686747","

住宿場(chǎng)所總訂單“:0,”住宿場(chǎng)所總間夜":0,"住宿場(chǎng)所實(shí)住訂單":0,"住宿場(chǎng)

所實(shí)住間夜":0,"住宿場(chǎng)所直銷訂單":0,"住宿場(chǎng)所直銷間夜":0,"住宿場(chǎng)

所直銷實(shí)住訂單":0,"住宿場(chǎng)所直銷實(shí)住間夜":0,"住宿場(chǎng)所直銷拒單":0,"

住宿場(chǎng)所直銷拒單率":null,"城市直銷拒單率":"0.0282838180927","拒單率

是否小于等于直銷城市均值":0,"最低房間價(jià)格":"306"}}

二、fastjsonT.2.41.jar常用API(java)

1、實(shí)例化

JSONObject();

2、JSON解析包

com.alibaba.fastjson.JSON;

com.alibaba.fastjson.JSONObject;

com.alibaba.fastjson.JSONArray;

com.alibaba.fastjson.JSONException;

3、常用API方法:

1)publicstaticfinalObjectparse(Stringtext);//把JSON文本

parse為JSONObject或者JSONArray

2)publicstaticfinalJSONObjectparseObject(Stringtext);//把

JSON文本parse成JSONObject

3)publicstaticfinalTparseObject(Stringtext,Classclazz);//

把JSON文本parse為JavaBean

4)publicstaticfinalJSONArrayparseArray(Stringtext);〃把

JSON文本parse成JSONArray

5)publicstaticfinalListparseArray(Stringtext,Classclazz);

〃把JSON文本parse成JavaBean集合

6)publicstaticfinalStringtoJSONString(Objectobject);//將

JavaBean序列化為JSON文本

7)publicstaticfinalStringtoJSONString(Objectobject,boolean

prettyFormat);//將JavaBean序列化為帶格式的JSON文本

8)publicstaticfinalObjecttoJSONCObjectjavaObject);將JavaBean

轉(zhuǎn)換為JSONObject或者JSONArrayo

三、fastjson-1.2.41.jar常用API[Spark

(scala)]

1、json解析包

com.alibaba.fastjson.JSON

2、常用API

1)實(shí)例化:

JSON.parseObject(x)

2)默認(rèn)值:如果該key沒有值默認(rèn)為null:

jsonObject.getOrDefault(key,默認(rèn)值)

jsonObject.getOrDefault("name",

3)獲取該key的value值

jsonObject.get(json的key)

jsonObject.get("name")

4)判斷key是否存在

jsonObject.containsKey(key)

5)添加kv鍵值對(duì)

jsonObject.put(key,value)

四、控制臺(tái)輸出運(yùn)行日志樣例

9/06/0308:04:21IXFOhandier.Context(Lindier:Stoppedo.s.S一(*rv?!vtC一oQtextHandler*l0fde30一a‘;null.l:\AVAll.ABLi?

9/06/0308:04:21"F。handler.ContextHandler:Stoppedo.s.Sen'lclContcxtlLuidlcr<3383(>19cstatic,nulUNAVAILABLE

9/060308:04:21INFOhandler.C<x)IextHandler:Stoppedas.ServletConlex!HandierC533377h:e?xecutorsthreadDunp/json,nulI.lrNAVAII.ABI.E,

9/06.0308:04:21IXFOhandler.CfHitcitHandlcr:Stoppedo.s.ScnletCoatextllandlertil9a20utiexecutorsthrcadDunp.null,INAVAlLABLEi

9.060308:01:21INFOhandler.ContexdlandIcr:Stoppedas.Scr\'lctCantextlhndIcr1673S9cb8uKcculor5zjson,null,INAVAILABI.E1

19/06/0308:04:21IVF0handler.ContextlkuMilcr:Stoppedo.s.ServletContextllandlcr*65aa6596:executors,nulI,liNAVAlLKRI-E;

19/06/0308:04:21INFOhandler.Contcxlllandlcr:Stoppedas.ScnlctContcxdlandlcrf2c7dl21c1environnent/j?on.null,UNAVAlLABLEr

19/06/0308:04:21INFOhandler.Contextlkindler:Stoppedo.s.Serv1vtContextHitudIcr?34625ccd.,/environnetit,nul!,VNAVAILAB1.E)

19/06/0308:04:21INFOhandler.Conlextlkindler:Stoppedo.s.SenlctContextHandlerfTeSraafe(,zstoraKe/rdd/json,nulI,UNAVAILABLE)

19/06/0308:04:21INH)handler.Conlcxtlkinciler:Sloppedo.s.SvrvletConlcxtlIdndlert24Mb479!/stonwj/rdd,nuH,UNAVAILABLE)

1906/0308:01:21INFOhMKllei*.CoritextlLindler:St?“)pcd?).s.Serv)vtGKIIextl|.u)d1rrt127l)5f92zstorHge/json.nuIIJ、AYA11ABI.F:

3/06/0308:04:21|\!!-handler.Contexdlandler:Stoppedo.s.SenlctContextlknd!er#lddae9b5'大1。3,null.UNAVAILABLE

9/060308:04:21INFOhandler.ContexilLuwller:Sloppedas.ServletContextllandleit42f3156d?'St??es-zpoo1/json.nuH.llNAVAILABLE)

9060308:04:21|\F。hand]er.ContcxtHandIer:Stofipedo.g.Serv!e【ContexiHandler#ld7f7hc7{,stages/pool.null.UNAVAILABLE)

9/06/030S:0!:2lIXFOhandler.Cortex[Handler:Stoppedo.s.ScnleiContextllandler<5860t3d7?^trtKcs/stagc/jsan.null.UNAVAILABLE)

0308:04:2!INFOhandler.Cunlex【Handler:Stoj)pedas.Serv1e!CentextHandIer*6a66n20411'&tages/stage.null.INAVAILABLE

0308:04:21INFOhandler.ContcxiHandlcr:Stoppedo.J.s.Son^lcxContcxtllandkrfIle3760b;stages7json,null.INAVAILABLE

0308:04:21l\F0handler.Contextilandler:Slottedo.s.Scn'letContejitllandlertMe5l7i65;/stages,null,UNAVAILABLE

0308:04:21INFOhandler.ConlcxHlundler:Stoppedo.s.ScnletCoinextliandlcr#2cb3d0f"!jobsjobjson,null.INAVAILABLE

0308:04:21INFOhandler.ContextHandler:Stoppedo.j.s.Scn'lctContextllandlcr<2clO'177-1/jobs/job.nulLlXAVAlLABLE

19/06/0308:04:21IXFOhandler.CofilcxiHuKlIcr:Stoppedo.j.s.SetvletC<MJtextHrtndlerl6f0fa692:‘Jobs,json.nul1,INAVAILABiJ!

19/06/0308:04:21INFOhandler.ContcxtUandlcr:,_________j.s.Scn'lctContcxtHandlcrtlbaSS'lbO[/jobs.nullJMYAlLAB出

五、方差、均方根差的定義

1、方差MSE:概率論中方差用來(lái)度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的

偏離程度。統(tǒng)計(jì)中的方差(樣本方差)是每個(gè)樣本值與全體樣本值的平均數(shù)

之差的平方值的平均數(shù)。

2、均方根差RMSE:均方根誤差,是觀測(cè)值與真值偏差的平方和觀測(cè)次數(shù)n比值

的平方根。RMSE是計(jì)算觀測(cè)值與其真值,或者觀測(cè)值與其模擬值之間的偏差。

六、間夜定義

間夜又稱間夜數(shù),是住宿場(chǎng)所在某個(gè)時(shí)間段內(nèi),房間出租率的計(jì)算單位。例

如20間房入住2晚,為40間夜數(shù)。

七、出租率計(jì)算公式

出租率=當(dāng)月發(fā)生的總間夜數(shù)/當(dāng)月所能提供的總房間數(shù)

八、線性回歸預(yù)測(cè)數(shù)據(jù)源

data_accommodation_mu11.csv字段名

SEQ、省份、城市、商圈、是否為客棧、星級(jí)、房間數(shù)、評(píng)論數(shù)、平均評(píng)分

數(shù)、城市平均間夜、住宿場(chǎng)所總訂單、住宿場(chǎng)所總間夜、住宿場(chǎng)所實(shí)住訂單、住

宿場(chǎng)所實(shí)住間夜、住宿場(chǎng)所直銷訂單、住宿場(chǎng)所直銷實(shí)住訂單、住宿場(chǎng)所直銷間

夜、住宿場(chǎng)所直銷實(shí)住間夜、城市直銷拒單、城市直銷拒單率、住宿場(chǎng)所企業(yè)消

費(fèi)平臺(tái)實(shí)住訂單

九、數(shù)據(jù)可視化表字段說(shuō)明

表radar_lines

province省份

accommodati

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論