版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2021年全國(guó)職業(yè)院校技能大賽
高職組
“大數(shù)據(jù)技術(shù)與應(yīng)用“
賽項(xiàng)賽卷(GZ-xxxxxxx-X卷)
任
務(wù)
書
參奏隊(duì)編號(hào):
背景描述
企業(yè)消費(fèi)服務(wù)平臺(tái),為大中小型企業(yè)提供基于云化的消費(fèi)場(chǎng)景一
站式智能消費(fèi)、智能管控,幫助企業(yè)獲得更高效、簡(jiǎn)單、美好的消費(fèi)
管理。從''費(fèi)控+支付”出發(fā),到覆蓋全場(chǎng)景支出的創(chuàng)新模式,讓員工
在數(shù)字化平臺(tái)上直接完成所有消費(fèi),從員工下單、到財(cái)務(wù)入賬,全流
程實(shí)現(xiàn)自動(dòng)化統(tǒng)一結(jié)算、統(tǒng)一數(shù)據(jù)分析。解決傳統(tǒng)差旅系統(tǒng)面臨的場(chǎng)
景覆蓋不全、員工體驗(yàn)差、消費(fèi)體驗(yàn)割裂等情況,真正做成一套讓企
業(yè)節(jié)省支出,讓員工滿意的差旅平臺(tái)。
企業(yè)消費(fèi)服務(wù)平臺(tái)的出現(xiàn)將原來傳統(tǒng)的差旅行程放到網(wǎng)絡(luò)平臺(tái)上,
更廣泛的傳遞差旅信息,互動(dòng)式的交流更方便客人的咨詢和訂購,越
來越多的人在出行的時(shí)候使用企業(yè)消費(fèi)服務(wù)平臺(tái)預(yù)訂機(jī)票、火車票、
住宿等,使得更多的商家愿意與企業(yè)消費(fèi)服務(wù)平臺(tái)建立合作,提升住
宿場(chǎng)所的營(yíng)業(yè)額,這也為企業(yè)消費(fèi)服務(wù)平臺(tái)的發(fā)展帶來新的機(jī)遇,為
了抓住這個(gè)機(jī)會(huì),“企業(yè)消費(fèi)服務(wù)平臺(tái)”需要從地域、訂單來源等多
種維度進(jìn)行分析,明確未來重點(diǎn)拓展合作商家的方向。公司要求多個(gè)
小組進(jìn)行分析,并提出相應(yīng)建議,你所在的小組也在其中,需要通過
數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)分析和數(shù)據(jù)可視化獲得相關(guān)論據(jù),提出未
來重點(diǎn)拓展合作住宿場(chǎng)所的方向。
你們作為該小組的技術(shù)人員,是這次技術(shù)方案的核心成員,請(qǐng)按
照下面步驟完成本次技術(shù)展示任務(wù),并提交分析報(bào)告,祝你們成功?。?!
模塊A:Hadoop平臺(tái)及組件的部署管理(15分)
環(huán)境要求:
編號(hào)主機(jī)名類型用戶密碼
1master主節(jié)點(diǎn)rootpasswd
2slavel從節(jié)點(diǎn)rootpasswd
3slave2從節(jié)點(diǎn)rootpasswd
master01-l主機(jī)上MySQL數(shù)據(jù)庫用戶名密碼是root/Passwordl23$
相關(guān)軟件安裝包在/chinaskills目錄下
任務(wù)一:Hadoop全分布部署管理
本環(huán)節(jié)需要使用root用戶完成相關(guān)配置,安裝Hadoop需要配置
前置環(huán)境,具體部署要求如下:
1、將/chinaskills下的JDK包解壓到/usr/local/src路徑下,將命
令(使用絕對(duì)路徑)復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;
2、設(shè)置JDK環(huán)境變量,并使環(huán)境變量只對(duì)當(dāng)前root用戶生效,將環(huán)
境變量配置內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;
3、從master復(fù)制JDK環(huán)境變量文件到slavel、slave2節(jié)點(diǎn),將命令
(命令中使用絕對(duì)路徑)和結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;
4、環(huán)境中已創(chuàng)建ssh密鑰,實(shí)現(xiàn)從master到slavel節(jié)點(diǎn)的無密碼登
錄,將命令和結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;
5、將/chinaskills下的hadoop包解壓到/usr/local/src,不修改
解壓后文件夾名稱,將命令復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;
6、配置Hadoop全局環(huán)境變量,并使環(huán)境變量只對(duì)當(dāng)前root用戶生
效,將命令和環(huán)境變量配置內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中;
7、通過Hadoop命令格式化namenode,并將格式化命令復(fù)制粘貼至對(duì)
應(yīng)報(bào)告中;
8、啟動(dòng)Hadoop,使用相關(guān)命令查看所有節(jié)點(diǎn)Hadoop服務(wù)進(jìn)程,并
將命令和結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)二:Kafka組件部署管理
1、將Zookeeper配置完畢后,在各節(jié)點(diǎn)啟動(dòng)Zookeeper,查看
Zookeeper狀態(tài),并將命令和Zookeeper運(yùn)行狀態(tài)結(jié)果復(fù)制粘貼
至對(duì)應(yīng)報(bào)告中;
2、修改Kafkaserver.properties文件,并將修改的內(nèi)容復(fù)制粘貼
至對(duì)應(yīng)報(bào)告中;
3、啟動(dòng)Kafka,并將Kafka啟動(dòng)命令和輸出結(jié)果前10行復(fù)制粘貼
至報(bào)告中。
任務(wù)三:Sqoop組件部署管理
本環(huán)節(jié)需要使用root用戶完成相關(guān)配置,已安裝Hadoop及需要
配置前置環(huán)境,具體部署要求如下:
1、解壓/chinaskills路徑下的Sqoop安裝包到/usr/local/src路
徑下,并使用相關(guān)命令,修改解壓后文件夾名為sqoop,進(jìn)入
sqoop文件夾,并將查看內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
2、修改Sqoop環(huán)境變量,并使環(huán)境變量只對(duì)當(dāng)前root用戶生效,并
將環(huán)境變量配置內(nèi)容復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
3、修改并配置sqoop-env.sh文件,將sqoop-env.sh文件修改內(nèi)容
復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
4、測(cè)試Sqoop連接MySQL數(shù)據(jù)庫是否成功,將執(zhí)行命令和執(zhí)行結(jié)果
復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
模塊B:數(shù)據(jù)采集與處理(20分)
1、網(wǎng)站解析,利用Chrome查看網(wǎng)頁源碼,分析企業(yè)消費(fèi)平臺(tái)網(wǎng)站
網(wǎng)頁結(jié)構(gòu)。
1)打開企業(yè)消費(fèi)平臺(tái)網(wǎng)站,在網(wǎng)頁中右鍵點(diǎn)擊檢查,或者
F12快捷鍵,查看元素頁面;
2)檢查網(wǎng)站:瀏覽網(wǎng)站源碼查看所需內(nèi)容。
2、從企業(yè)消費(fèi)平臺(tái)網(wǎng)站中爬取需要數(shù)據(jù),按照要求使用Python語
言編寫爬蟲代碼,爬取指定數(shù)據(jù)項(xiàng),并對(duì)結(jié)果數(shù)據(jù)集進(jìn)行數(shù)據(jù)探
索、以及必要的數(shù)據(jù)處理操作。請(qǐng)將符合題目要求的代碼答案復(fù)
制粘貼至對(duì)應(yīng)報(bào)告中。
具體步驟如下:
1)創(chuàng)建爬蟲項(xiàng)目
2)構(gòu)建爬蟲請(qǐng)求
3)按要求定義相關(guān)字段
4)獲取有效數(shù)據(jù)
5)將爬取到的數(shù)據(jù)保存到指定位置
至此已從企業(yè)消費(fèi)平臺(tái)網(wǎng)站中爬取了所需數(shù)據(jù),下一步我們要將
爬取結(jié)果進(jìn)一步進(jìn)行相關(guān)數(shù)據(jù)操作。
詳細(xì)數(shù)據(jù)描述:
1)請(qǐng)創(chuàng)建Scrapy項(xiàng)目chinaskills_accommodation(C:\
chinaskills_accommodation),從網(wǎng)站(網(wǎng)站地址在競(jìng)
賽平臺(tái)模塊B中給出)中爬取頁面相關(guān)字段(包括name、
seq、業(yè)務(wù)部門有效數(shù)據(jù)項(xiàng)包括:業(yè)務(wù)部門,房間數(shù),國(guó)
家,圖片數(shù),城市,城市平均實(shí)住間夜,城市直銷拒單
率,處于商圈);將抓取結(jié)果保存為json格式文件,并命
名為accommodations,json。每條信息請(qǐng)以Key:Value格
式單獨(dú)保存為一行數(shù)據(jù)。
例如:
{“name":"***”,"seq":"***",…….}
任務(wù)中要求將“以下內(nèi)容及答案完整復(fù)制粘貼至對(duì)應(yīng)報(bào)告中
粘貼到對(duì)應(yīng)報(bào)告中的內(nèi)容舉例如下:
“中國(guó)”網(wǎng)頁源碼對(duì)應(yīng)字段為:Country
“四川”網(wǎng)頁源碼對(duì)應(yīng)字段為:Province
2)爬取數(shù)據(jù)量不少于28萬條。
具體任務(wù)要求:
任務(wù)一:網(wǎng)頁源碼對(duì)應(yīng)字段
使用Chrome瀏覽器,查找網(wǎng)站異步請(qǐng)求的數(shù)據(jù),并將以下內(nèi)容及
答案完整復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
“業(yè)務(wù)部門”網(wǎng)頁源碼對(duì)應(yīng)字段為:
“城市”網(wǎng)頁源碼對(duì)應(yīng)字段為:
“城市直銷拒單率”網(wǎng)頁源碼對(duì)應(yīng)字段為:
任務(wù)二:創(chuàng)建Scrapy工程
自行創(chuàng)建Scrapy工程編寫爬蟲代碼,爬取"name、seq、業(yè)務(wù)部
門有效數(shù)據(jù)項(xiàng)包括:業(yè)務(wù)部門,房間數(shù),國(guó)家,圖片數(shù),城市,城
市平均實(shí)住間夜,城市直銷拒單率,處于商圈”頁面相關(guān)數(shù)據(jù),通過
爬蟲代碼分頁爬取,以合理的程序邏輯判斷相關(guān)數(shù)據(jù)包含的頁數(shù)并將
程序代碼復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)三:在MySQL中創(chuàng)建數(shù)據(jù)庫表
根據(jù)爬取字段,在MySQL中創(chuàng)建crawl數(shù)據(jù)庫,在該數(shù)據(jù)庫中創(chuàng)
建accommodations],表(包含name、seq、業(yè)務(wù)部門,房間數(shù),國(guó)家,
圖片數(shù),城市),創(chuàng)建accommodations2表(包含ame、seq、城市、
城市平均實(shí)住間夜、城市直銷拒單率、處于商圈),將爬取數(shù)據(jù)寫入
相應(yīng)數(shù)據(jù)表中,并分別統(tǒng)計(jì)accommodations!表和accommodations2
表的總行數(shù),將統(tǒng)計(jì)結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)四:對(duì)數(shù)據(jù)庫表排序
爬蟲程序運(yùn)行結(jié)束后查看MySQL中crawl數(shù)據(jù)庫的
acommodationsl表,按seq字段倒序排序,返回前100行數(shù)據(jù),將命
令與查看結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)五:對(duì)數(shù)據(jù)表填充處理
請(qǐng)根據(jù)步驟3中accommodations!表中的數(shù)據(jù),對(duì)數(shù)據(jù)集中“房
間價(jià)格”字段的缺失值,使用平均值進(jìn)行填充。查看填充后的數(shù)據(jù)集
前5條記錄,將查看結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)六:對(duì)數(shù)據(jù)表刪除處理
請(qǐng)根據(jù)步驟3中accommodations2表中的數(shù)據(jù),對(duì)數(shù)據(jù)集中存在
空值的字段進(jìn)行刪除。查看刪除后的數(shù)據(jù)集條數(shù),將查看結(jié)果復(fù)制粘
貼至對(duì)應(yīng)報(bào)告中。
accommodations2表刪除后條數(shù)為:
模塊C:數(shù)據(jù)清洗與分析(25分)
現(xiàn)已從相關(guān)網(wǎng)站及平臺(tái)獲取到原始數(shù)據(jù)集,為保障用戶隱私和行
業(yè)敏感信息,已進(jìn)行數(shù)據(jù)脫敏。數(shù)據(jù)脫敏是指對(duì)某些敏感信息通過
脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。在涉及
客戶安全數(shù)據(jù)或者一些商業(yè)性敏感數(shù)據(jù)的情況、不違反系統(tǒng)規(guī)則條
件下,對(duì)真實(shí)數(shù)據(jù)進(jìn)行改造并提供測(cè)試使用,如身份證號(hào)、手機(jī)號(hào)
等個(gè)人信息都需要進(jìn)行數(shù)據(jù)脫敏。
相關(guān)數(shù)據(jù)文件中已經(jīng)包含了數(shù)據(jù)采集階段從企業(yè)消費(fèi)平臺(tái)網(wǎng)站上
爬取的數(shù)據(jù)集,其中包含了來自不同城市的多家住宿場(chǎng)所的銷售信
息,你的小組需要通過編寫代碼或腳本完成對(duì)相關(guān)數(shù)據(jù)文件中住宿
場(chǎng)所銷售管理數(shù)據(jù)的清洗和整理,并完成數(shù)據(jù)計(jì)算和分析任務(wù)。綜
合利用MapReduce、Spark>Storm>分布式存儲(chǔ)系統(tǒng)、數(shù)據(jù)倉庫
Hive、數(shù)據(jù)推送工具等技術(shù),使用Java、Python、Scala等開發(fā)語
言,完成本階段數(shù)據(jù)清洗、處理、分析及數(shù)據(jù)挖掘等任務(wù)。通過多
個(gè)維度分析住宿場(chǎng)所的銷售信息,并以此評(píng)價(jià)住宿場(chǎng)所銷售業(yè)績(jī)、
區(qū)域的游客接納能力、接納質(zhì)量等指標(biāo)。
初始數(shù)據(jù)集來自多個(gè)網(wǎng)站及平臺(tái)系統(tǒng),且為多次采集匯總結(jié)果,
因此數(shù)據(jù)集中不可避免地存在一些臟數(shù)據(jù),即源數(shù)據(jù)不在給定的范
圍內(nèi)或?qū)τ趯?shí)際業(yè)務(wù)毫無意義,或是數(shù)據(jù)格式非法,以及在源系統(tǒng)
中存在不規(guī)范的編碼和含糊的業(yè)務(wù)邏輯。
請(qǐng)分析相關(guān)數(shù)據(jù)集,根據(jù)題目要求實(shí)現(xiàn)數(shù)據(jù)清洗及分析。
任務(wù)一:數(shù)據(jù)清洗
住宿場(chǎng)所銷售數(shù)據(jù)涉及到多個(gè)平臺(tái)及數(shù)據(jù)庫對(duì)接,個(gè)別信息由于
人為操作失誤或計(jì)算機(jī)故障等原因產(chǎn)生了數(shù)據(jù)缺失值。缺失值是一
種常見的臟數(shù)據(jù)情況,由于粗糙數(shù)據(jù)中缺少信息而造成的數(shù)據(jù)缺失
或截?cái)唷,F(xiàn)有數(shù)據(jù)集中某個(gè)或某些屬性的值是不完全的。對(duì)于缺失
值的處理,從總體上來說分為缺失值刪除和缺失值插補(bǔ)。當(dāng)缺失值
過多時(shí),信息條目本身的價(jià)值也會(huì)隨之降低,此時(shí)如果對(duì)缺失值進(jìn)
行填補(bǔ)則將產(chǎn)生結(jié)果的人為干預(yù)。結(jié)合行業(yè)數(shù)據(jù)本身特點(diǎn)及上述考
慮,請(qǐng)你根據(jù)題目具體參數(shù)要求實(shí)現(xiàn)以下功能:將缺失值大于n個(gè)
的數(shù)據(jù)條目從原始數(shù)據(jù)集中剔除,并輸出剔除的條目數(shù)量。
詳細(xì)描述:
數(shù)據(jù)源文件存放于/chinaskills/accommodationdata.csv文件夾
下,請(qǐng)編寫Spark程序,按照如下要求實(shí)現(xiàn)對(duì)數(shù)據(jù)的清洗,并將結(jié)果
輸出至HDFS文件系統(tǒng)中/accommodationsparktaskl。
1)解析/chinaskills下相關(guān)數(shù)據(jù)文件;
2)按照題目要求剔除缺失數(shù)據(jù)信息大于n(n=3)個(gè)字段的數(shù)據(jù)記
錄,并以打印語句輸出刪除條目數(shù);
3)程序打包并在Spark上運(yùn)行,結(jié)果輸出至HDFS文件系統(tǒng)中
/accominodationsparktaskl。
具體任務(wù)要求:
1、編寫Spark程序,刪除數(shù)據(jù)源中缺失值大于3個(gè)字段的數(shù)據(jù)記錄,
打印輸出刪除條目數(shù),將運(yùn)行結(jié)果復(fù)制粘貼至對(duì)應(yīng)報(bào)告中
打印語句格式如下:
==="刪除缺失值大于3個(gè)的字段的數(shù)據(jù)條數(shù)為***條”===
2、使用Hadoopshell命令查看清洗后輸出的結(jié)果文件總行數(shù)
/accommodationsparktaskl,將查看命令與執(zhí)行結(jié)果復(fù)制粘貼至
對(duì)應(yīng)報(bào)告中。
缺失值是一種常見的臟數(shù)據(jù)情況,對(duì)于數(shù)據(jù)缺失值的處理,從總
體上來說分為缺失值刪除和缺失值插補(bǔ)兩種處理方式。當(dāng)缺失值過
多時(shí),信息條目本身的價(jià)值也會(huì)隨之降低,此時(shí)如果對(duì)缺失值進(jìn)行
填補(bǔ),則數(shù)據(jù)分析結(jié)果可能會(huì)受到干擾,有失客觀性。結(jié)合行業(yè)數(shù)
據(jù)本身特點(diǎn)及上述考慮,對(duì)于數(shù)據(jù)集中數(shù)值字段缺失的情況,通常
可以采用填充固定值、均值、眾數(shù)、KNN填充、以及把缺失值作為
新的label等方式處理。同時(shí),不當(dāng)?shù)奶畛淇赡軙?huì)令后續(xù)的分析結(jié)
果出現(xiàn)導(dǎo)向性偏差,當(dāng)缺失信息較少時(shí)可采用刪除的方式來進(jìn)行處
理。下面請(qǐng)根據(jù)題目具體參數(shù)要求處理關(guān)鍵字段缺失。
詳細(xì)描述:
請(qǐng)以上述1、(題目數(shù)字編號(hào))任務(wù)結(jié)果數(shù)據(jù)集作為輸入數(shù)據(jù)源,
編寫Spark程序,按照如下要求實(shí)現(xiàn)對(duì)數(shù)據(jù)的清洗,并將結(jié)果輸出至
HDFS文件系統(tǒng)中/accommodationsparktask2。
1)解析/accommodationsparktaskl中的數(shù)據(jù)文件;
2)將關(guān)鍵字段“星級(jí)”、“評(píng)論數(shù)”、“評(píng)分”中存在缺失值的數(shù)據(jù)
刪除;
3)程序打包并在Spark上運(yùn)行,結(jié)果輸出至HDFS文件系統(tǒng)中
/accominodationsparktask2。
具體任務(wù)要求:
3、運(yùn)行代碼,將字段“星級(jí)”、“評(píng)論數(shù)”、“評(píng)分”中存在缺失值的數(shù)
據(jù)刪除,打印輸出刪除條目數(shù),將打印輸出結(jié)果復(fù)制并保存至對(duì)
應(yīng)報(bào)告中(復(fù)制內(nèi)容需包含打印語句輸出結(jié)果的上下各5行運(yùn)行
日志)。
打印語句格式如下:
==="刪除的數(shù)據(jù)條數(shù)為***條”===
4、使用Hadoopshell命令查看清洗后輸出的結(jié)果文件
/accommodationsparktask2總行數(shù),將查看命令與執(zhí)行結(jié)果復(fù)制
粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)二:數(shù)據(jù)挖掘分析
城市游客接納能力是城市規(guī)劃建設(shè)中的重要指標(biāo),其中城市的住
宿場(chǎng)所數(shù)量和房間數(shù)量是城市游客接納能力的關(guān)鍵要素。請(qǐng)編寫程
序或腳本根據(jù)住宿場(chǎng)所管理網(wǎng)站中的數(shù)據(jù)統(tǒng)計(jì)各城市的相關(guān)信息,
并寫入指定的數(shù)據(jù)庫或數(shù)據(jù)文件。
詳細(xì)描述:
請(qǐng)以上個(gè)任務(wù)的輸出結(jié)果作為輸入數(shù)據(jù)源,編寫Spark程序統(tǒng)計(jì)
各城市的住宿場(chǎng)所數(shù)量和房間數(shù)量,以城市房間數(shù)量降序排列并輸
出前10條統(tǒng)計(jì)結(jié)果,輸出至HDFS文件系統(tǒng)中
/accommodationhive1,同時(shí)創(chuàng)建并寫入數(shù)據(jù)表table3_l。要求輸
出字段包含:省份、城市、住宿場(chǎng)所數(shù)量、房間數(shù)量。
具體任務(wù)要求:
1、編寫Spark程序,統(tǒng)計(jì)各城市的住宿場(chǎng)所數(shù)量和房間數(shù)量,以城
市房間數(shù)量降序排列,輸出前10條統(tǒng)計(jì)結(jié)果至HDFS文件系統(tǒng)中
/accommodationhive1,使用Hadoopshell命令查看統(tǒng)計(jì)結(jié)果,
將查看命令與執(zhí)行結(jié)果復(fù)制并粘貼至對(duì)應(yīng)報(bào)告中;
2、在accommodationdata數(shù)據(jù)庫中創(chuàng)建表table3_l;將統(tǒng)計(jì)結(jié)果
寫入表table3_l中,輸出表table3_l前10行數(shù)據(jù),將執(zhí)行命
令與結(jié)果復(fù)制并粘貼至對(duì)應(yīng)報(bào)告中。
通過收集數(shù)據(jù)能夠更好地收集用戶需求,從而可以提供更有針對(duì)
性和個(gè)性化的服務(wù),最終能夠產(chǎn)生更多的忠誠(chéng)會(huì)員并帶來更多訂
單。但企業(yè)消費(fèi)平臺(tái)平臺(tái)銷售也存在用戶拒單等情況,拒單原因有
很多:例如,平臺(tái)信息不同步,信息更新不及時(shí);分銷層次過多,
導(dǎo)致無法及時(shí)查證訂單;住宿場(chǎng)所違反企業(yè)消賽平臺(tái)規(guī)則擅自以低
價(jià)讓客戶取消訂單,這種情況又叫做“切單:企業(yè)消費(fèi)平臺(tái)平臺(tái)需
要統(tǒng)計(jì)用戶訂單的分布情況,以此發(fā)現(xiàn)平臺(tái)缺陷及用戶、商家的行
為模式,企業(yè)消費(fèi)平臺(tái)平臺(tái)據(jù)此調(diào)整營(yíng)銷策略。根據(jù)現(xiàn)有數(shù)據(jù)及給
定參數(shù)完成訂單數(shù)據(jù)統(tǒng)計(jì),并寫入指定的數(shù)據(jù)庫或數(shù)據(jù)文件。
詳細(xì)描述:
1)請(qǐng)以上個(gè)任務(wù)結(jié)果數(shù)據(jù)集作為輸入數(shù)據(jù)源,編寫MapReduce
程序統(tǒng)計(jì)各省直銷拒單率,以直銷拒單率升序排列并輸出前
10條統(tǒng)計(jì)結(jié)果,同時(shí)創(chuàng)建并寫入數(shù)據(jù)表table3_2;
2)要求輸出字段包含:省份、直銷拒單率;
具體任務(wù)要求:
3、在accommodationdata數(shù)據(jù)庫中創(chuàng)建表table3_2,將執(zhí)行命令
復(fù)制并粘貼至對(duì)應(yīng)報(bào)告中;
4、運(yùn)行代碼,將統(tǒng)計(jì)的直銷拒單率按升序排列,并將前10條統(tǒng)計(jì)
結(jié)果輸出至HDFS文件系統(tǒng)/accommodationhive2中,并寫入數(shù)
據(jù)表table3_2中,將執(zhí)行命令與結(jié)果復(fù)制并粘貼至對(duì)應(yīng)報(bào)告
中。
模塊D:數(shù)據(jù)可視化(20分)
MySQL數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)集包含了城市、省份、評(píng)分、評(píng)論數(shù)
等多項(xiàng)基礎(chǔ)信息字段。請(qǐng)使用Flask框架,結(jié)合Echarts完成下列
題目。
數(shù)據(jù)庫賬號(hào):takeout密碼:takeout
自行創(chuàng)建代碼工程路徑為:C:\chinaskills_hotel
每個(gè)可視化圖中需要添加圖片作為背景水印。
任務(wù)一:條形圖呈現(xiàn)住宿場(chǎng)所訂單量
住宿場(chǎng)所訂單量是反映住宿場(chǎng)所入住數(shù)量的重要指標(biāo)之一,某省
訂單數(shù)量一定程度上可以反應(yīng)出該省住宿場(chǎng)所入住情況,為了更好
地分析全國(guó)各省住宿場(chǎng)所訂單量,請(qǐng)根據(jù)指定表中數(shù)據(jù)統(tǒng)計(jì)出全國(guó)
各省住宿場(chǎng)所訂單量的情況,并以指定圖例進(jìn)行呈現(xiàn)。
詳細(xì)描述:
請(qǐng)以數(shù)據(jù)庫中相關(guān)表格為數(shù)據(jù)源,分析并統(tǒng)計(jì)各省訂單數(shù)量,繪
制條形圖。
具體任務(wù)要求:
1)提取表格相關(guān)字段,分別統(tǒng)計(jì)各省的訂單數(shù)量,在控制臺(tái)按
照“訂單數(shù)量”降序排列,打印輸出各省份的訂單數(shù)量;
打印語句格式如下:
==省份:***=訂單數(shù)量:**個(gè)==
2)使用Flask框架,結(jié)合Echarts繪制“訂單數(shù)量”的條形
圖,標(biāo)題為“各省訂單數(shù)量”(字體顏色:紅色,加粗),縱
坐標(biāo)為省份名稱,橫坐標(biāo)為訂單數(shù)量,并將可視化結(jié)果復(fù)制
粘貼至對(duì)應(yīng)報(bào)告中。
任務(wù)二:多個(gè)餅圖呈現(xiàn)各省份不同等級(jí)住宿場(chǎng)所占比
企業(yè)消費(fèi)平臺(tái)為了更好地發(fā)展企業(yè)業(yè)務(wù),向企業(yè)客戶推薦符合其
預(yù)定的協(xié)議住宿場(chǎng)所,需要分析上題中Top5省份的“三星級(jí)/舒適”、
“四星級(jí)/高檔”和“五星級(jí)/豪華”住宿場(chǎng)所以及“其它類別”住宿
場(chǎng)所(除上述三類外,其余類型住宿場(chǎng)所均歸為“其它類別”)的占比
情況。請(qǐng)根據(jù)指定表中數(shù)據(jù),以指定圖例進(jìn)行呈現(xiàn)。
詳細(xì)描述:
請(qǐng)根據(jù)數(shù)據(jù)庫中相關(guān)數(shù)據(jù)集中省份、星級(jí)等相關(guān)字段統(tǒng)計(jì)各省份
不同等級(jí)住宿場(chǎng)所的占比,繪制多個(gè)餅圖。
具體任務(wù)要求:
1)根據(jù)表格相關(guān)字段分別統(tǒng)計(jì)上題Top5省份不同星級(jí)住宿場(chǎng)所
的占比,打印輸出各省份名稱以及各類型住宿場(chǎng)所的占比情況;
打印語句格式如下:
==省份:A=舒適型住宿占比:**===
==省份:A=高檔型住宿占比:**===
==省份:A=豪華型住宿占比:**===
==省份:B=舒適型住宿占比:**===
==省份:B=高檔型住宿占比:**===
==省份:B=豪華型住宿占比:**===
2)使用Flask框架,結(jié)合Echarts在組合圖中繪制多個(gè)餅圖,
每個(gè)城市各星級(jí)住宿場(chǎng)所占比情況分別用一個(gè)餅圖進(jìn)行呈
現(xiàn),將可視化結(jié)果截圖并保存。
任務(wù)三:柱狀圖呈現(xiàn)城市出租率
出租率是反映住宿場(chǎng)所經(jīng)營(yíng)狀況的一項(xiàng)重要指標(biāo),它是已出租的
客房數(shù)與住宿場(chǎng)所可以提供租用的房間總數(shù)的百分比。住宿場(chǎng)所出
租率的情況可以在一定程度上反應(yīng)出該住宿場(chǎng)所的整體運(yùn)營(yíng)的情
況,為了更好的分析指定住宿場(chǎng)所的入住情況,請(qǐng)根據(jù)相關(guān)表中數(shù)
據(jù)完成出租率分析,通過指定圖例進(jìn)行呈現(xiàn)。
詳細(xì)描述:
請(qǐng)以數(shù)據(jù)庫相關(guān)表作格為數(shù)據(jù)源,以柱狀圖呈現(xiàn)城市出租率。
具體任務(wù)要求:
1)提取表格相關(guān)字段,在控制臺(tái)按照“各省住宿場(chǎng)所出租率”降
序排列,打印輸出各省名稱及包含的住宿場(chǎng)所數(shù)量;
打印語句格式如下:
==1.***省=住宿場(chǎng)所數(shù)為***個(gè)=出租率為:***===
==2.***省=住宿場(chǎng)所數(shù)為***個(gè)=出租率為:***===
2)使用Flask框架,結(jié)合Echarts繪制柱狀圖。柱狀圖主標(biāo)題為
“各省住宿場(chǎng)所出租率”(字體要求:紅色、加粗、斜體),副
標(biāo)題為出租率前十的省份;縱坐標(biāo)為出租率,橫坐標(biāo)為省份名
稱(按照出租率降序排列);將可視化結(jié)果截圖并保存。
任務(wù)四:折線圖呈現(xiàn)連鎖住宿場(chǎng)所出租率
1、連鎖住宿場(chǎng)所一般都具有全國(guó)統(tǒng)一的品牌形象識(shí)別系統(tǒng)、全國(guó)統(tǒng)
一的會(huì)員體系和營(yíng)銷體系、價(jià)格相比較很有優(yōu)勢(shì),更適合大眾化
消費(fèi)。連鎖住宿場(chǎng)所無論在裝修、服務(wù)還是信譽(yù)上都有較大的競(jìng)
爭(zhēng)優(yōu)勢(shì),所以連鎖住宿場(chǎng)所是出差、旅游住宿的首選。但是由于
三線城市會(huì)員流動(dòng)差、高素質(zhì)管理人員相對(duì)短缺、營(yíng)銷環(huán)境與消
費(fèi)特點(diǎn)存在差異等問題,一些已經(jīng)成熟住宿場(chǎng)所管理模式在三線
城市可能并不受用,甚至?xí)霈F(xiàn)水土不服的現(xiàn)象。請(qǐng)根據(jù)現(xiàn)有數(shù)
據(jù)及給定參數(shù),統(tǒng)計(jì)指定連鎖住宿場(chǎng)所的經(jīng)營(yíng)狀況,并以指定圖
例進(jìn)行呈現(xiàn)。
詳細(xì)描述:
1)數(shù)據(jù)庫中相關(guān)表格已保存了指定地區(qū)的某連鎖住宿場(chǎng)所銷售
信息。請(qǐng)根據(jù)地區(qū)劃分,統(tǒng)計(jì)題中某連鎖住宿場(chǎng)所的出租率(保
留6位小數(shù)),并以折線圖呈現(xiàn);
2)要求統(tǒng)計(jì)以下指定地區(qū)住宿場(chǎng)所相關(guān)信息,指定地區(qū)包括:東
北、華北、華東、華中、西北、西南、華南;
3)指定地區(qū)省份映射表,如表1。
表1:地區(qū)省份映射表
地區(qū)省份
華東地區(qū)山東、江蘇、安徽、浙江、江西、福建、上海
華南地區(qū)廣東、廣西、海南
華中地區(qū)湖北、湖南、河南
華北地區(qū)北京、天津、河北、山西、內(nèi)蒙古
西北地區(qū)寧夏、新疆、青海、陜西、甘肅
西南地區(qū)四川、云南、貴州、西藏、重慶
東北地區(qū)遼寧、吉林、黑龍江
具體任務(wù)要求:
1)根據(jù)表格相關(guān)字段分別統(tǒng)計(jì)某連鎖住宿場(chǎng)所在各地區(qū)的出租
率(保留6位小數(shù)),在控制臺(tái)按照“出租率”降序排列,打
印輸出各地區(qū)名稱以及出租率;
打印語句格式如下:
==1.***地區(qū),出租率為***===
==2.***地區(qū),出租率為***===
2)使用Flask框架,結(jié)合Echarts繪制折線圖,主標(biāo)題為“指定
地區(qū)的住宿場(chǎng)所出租率”(字體要求:紅色、加粗、斜體),副
標(biāo)題為“某連鎖住宿場(chǎng)所的出租率”,縱坐標(biāo)為出租率,橫坐
標(biāo)為地區(qū);輸出折線圖,將可視化結(jié)果截圖并保存。
任務(wù)五:散點(diǎn)地圖呈現(xiàn)各城市住宿場(chǎng)所間夜數(shù)
住宿場(chǎng)所的間夜量也叫間夜數(shù),是住宿場(chǎng)所在某個(gè)時(shí)間段內(nèi),房
間出租率的計(jì)算單位,關(guān)于住宿場(chǎng)所間夜量的計(jì)算公式為間夜量=入
住房間數(shù)*入住天數(shù)。例如某住宿場(chǎng)所今天入住的房間數(shù)為500,則
今天的間夜量=500*1=500,而又比如某住宿場(chǎng)所這個(gè)月(30天)的
平均每天入住房間數(shù)為400,則這個(gè)月的間夜量=400*1*30=12000。
請(qǐng)根據(jù)指定表中數(shù)據(jù)統(tǒng)計(jì)住宿場(chǎng)所間夜數(shù)相關(guān)數(shù)據(jù),并以指定圖例
進(jìn)行呈現(xiàn)。
詳細(xì)描述:
請(qǐng)以數(shù)據(jù)庫相關(guān)表格中相關(guān)表作為數(shù)據(jù)源,各城市住宿場(chǎng)所間夜
數(shù)散點(diǎn)地圖。
具體任務(wù)要求:
1)根據(jù)表格相關(guān)字段分別統(tǒng)計(jì)各城市住宿場(chǎng)所間夜數(shù),打印輸出
各城市的間夜數(shù),在控制臺(tái)按照“間夜數(shù)”降序排列,打印輸
出各地區(qū)名稱以及間夜數(shù);
打印語句格式如下:
==***市:間夜數(shù)為***===
==***市:間夜數(shù)為***===
2)使用Flask框架,結(jié)合Echarts繪制散點(diǎn)地圖,主標(biāo)題為各城
市住宿場(chǎng)所間夜數(shù)(字體要求:紅色、加粗、斜體);輸出各城
市住宿場(chǎng)所間夜數(shù)散點(diǎn)地圖,將可視化結(jié)果截圖并保存。
任務(wù)六:多線雷達(dá)圖呈現(xiàn)各省份住宿場(chǎng)所綜合情況
企業(yè)消費(fèi)平臺(tái)需要綜合評(píng)判一個(gè)城市住宿場(chǎng)所運(yùn)營(yíng)情況,會(huì)涉及
到多方面住宿場(chǎng)所數(shù)據(jù),例如像高端住宿場(chǎng)所數(shù)量、訂單數(shù)量、住
客評(píng)分、評(píng)論數(shù)量、出租率、200元/晚以下快捷住宿場(chǎng)所數(shù)量等信
息,請(qǐng)根據(jù)指定表中數(shù)據(jù)統(tǒng)計(jì)相關(guān)數(shù)據(jù),并以指定圖例進(jìn)行呈現(xiàn)。
詳細(xì)描述:
請(qǐng)根據(jù)數(shù)據(jù)庫中相關(guān)表格,統(tǒng)計(jì)各城市住宿場(chǎng)所綜合運(yùn)營(yíng)情況,
并以多線雷達(dá)圖表達(dá)。
具體任務(wù)要求:
1)根據(jù)數(shù)據(jù)庫中相關(guān)表格分別統(tǒng)計(jì)北京、上海、廣東、四川、海
南各地四星/五星住宿場(chǎng)所的數(shù)量、平均評(píng)分、評(píng)論數(shù)、各省
住宿場(chǎng)所出租率、直銷拒單率,在控制臺(tái)按照“城市”名稱升
序排列,打印輸出各城市住宿場(chǎng)所的多項(xiàng)運(yùn)營(yíng)指標(biāo);
打印語句格式如下:
==城市:A,四星/五星住宿場(chǎng)所數(shù)量為:***===
==城市:A,平均評(píng)分為:***===
==城市:B,四星/五星住宿場(chǎng)所數(shù)量為:***===
==城市:B,平均評(píng)分為:***===
2)使用Flask框架,結(jié)合Echarts繪制多線雷達(dá)圖,標(biāo)題為各省
份住宿場(chǎng)所綜合情況(字體要求:紅色、加粗、斜體);輸出多
線雷達(dá)圖,將可視化結(jié)果截圖并保存。
模塊E:綜合分析(20分)
假定你為企業(yè)消費(fèi)平臺(tái)的管理者,在綜合理解住宿場(chǎng)所業(yè)務(wù)數(shù)據(jù)
的基礎(chǔ)上,通過以上模塊A、B、C、D的相關(guān)結(jié)論,對(duì)未來拓展合作
住宿場(chǎng)所方向做出預(yù)測(cè),根據(jù)題目要求進(jìn)行分析,并編寫輸出分析
報(bào)告。
根據(jù)上述任務(wù)中的結(jié)論,分析以下內(nèi)容,并編寫分析報(bào)告。從住
宿場(chǎng)所分布維度,結(jié)合多省份住宿場(chǎng)所綜合運(yùn)營(yíng)情況,對(duì)企業(yè)消費(fèi)
平臺(tái)未來拓展合作住宿場(chǎng)所的方向提出建議。
分析報(bào)告要求:
任務(wù)一:通過數(shù)據(jù)及圖示分析指定省市運(yùn)營(yíng)情況
結(jié)合平臺(tái)相關(guān)數(shù)據(jù)文件,根據(jù)北京、上海、四川、廣東、海南各省
份的直銷拒單率和出租率的條形圖,說明幾個(gè)省份住宿場(chǎng)所的綜合運(yùn)
營(yíng)情況。分別以文字描述和圖例進(jìn)行說明;
任務(wù)二:對(duì)通過圖示和計(jì)算業(yè)務(wù)分析原因
結(jié)合模塊D可視化分析對(duì)某連鎖住宿場(chǎng)所在不同地區(qū)的住宿場(chǎng)所
出租率的統(tǒng)計(jì),說明影響住宿場(chǎng)所出租率的原因可能有哪些?對(duì)于提
高該連鎖住宿場(chǎng)所的出租率,您有哪些建議?分別以文字描述和圖例
進(jìn)行說明;
任務(wù)三:對(duì)企業(yè)消賽平臺(tái)未來拓展合作建議和意見
對(duì)企業(yè)消費(fèi)平臺(tái)未來拓展合作住宿場(chǎng)所的方向提出建議(不少于
3條建議);
附錄:補(bǔ)充說明
一、json數(shù)據(jù)格式樣例
{"name":"南京國(guó)美家庭旅社公寓南林店","detail":{"SEQ":
"nanjing」O16","國(guó)家":"中國(guó)","省份":"江蘇","城市":"南京","處
于商圈":"鎖金村地區(qū)玄武湖地區(qū)中山陵景區(qū)","是否為客棧":0,"住宿場(chǎng)
所星級(jí)":"二星及其他","業(yè)務(wù)部門":"低星","剩余房間":8,"圖片數(shù)":0,
"住宿場(chǎng)所評(píng)分":"1","用戶點(diǎn)評(píng)數(shù)":1,"城市平均實(shí)住間夜":
"51.701686747","住宿場(chǎng)所總訂單":0,"住宿場(chǎng)所總間夜":0,"住宿場(chǎng)所實(shí)
住訂單":0,"住宿場(chǎng)所實(shí)住間夜":0,"住宿場(chǎng)所直銷訂單":0,"住宿場(chǎng)所直
銷間夜":0,"住宿場(chǎng)所直銷實(shí)住訂單":0,"住宿場(chǎng)所直銷實(shí)住間夜":0,"住宿
場(chǎng)所直銷拒單":0,"住宿場(chǎng)所直銷拒單率":null,"城市直銷拒單率":
"0.0282838180927","拒單率是否小于等于直銷城市均值":0,"最低房間價(jià)格":
"306"})
二、fastjson-1.2.41.jar常用API(java)
1、實(shí)例化
JSONObject();
2、JSON解析包
com.alibaba.fastjson.JSON;
com.alibaba.fastjson.JSONObject;
com.alibaba.fastjson.JSONArray;
com.alibaba.fastjson.JSONException;
3、常用API方法:
1)publicstaticfinalObjectparse(Stringtext);//把JSON文本
parse為JSONObject或者JSONArray
2)publicstaticfinalJSONObjectparseObject(Stringtext);//
把JSON文本parse成JSONObject
3)publicstaticfinalTparseObject(Stringtext,Classclazz);
//把JSON文本parse為JavaBean
4)publicstaticfinalJSONArrayparseArray(Stringtext);//把
JSON文本parse成JSONArray
5)publicstaticfinalListparseArray(Stringtext,Classclazz);
〃把JSON文本parse成JavaBean集合
6)publicstaticfinalStringtoJSONString(Objectobject);//將
JavaBean序列化為JSON文本
7)publicstaticfinalStringtoJSONString(Objectobject,boolean
prettyFormat);//將JavaBean序列化為帶格式的JSON文本
8)publicstaticfinalObjecttoJSON(ObjectjavaObject);將
JavaBean轉(zhuǎn)換為JSONObject或者JSONArrayo
三、fastjsonT.2.41.jar常用API[Spark(scala)l
1、json解析包
com.alibaba.fastjson.JSON
2、常用API
1)實(shí)例化:
JSON.parseObject(x)
2)默認(rèn)值:如果該key沒有值默認(rèn)為null:
jsonObject.getOrDefault(key,默認(rèn)值)
jsonObject.getOrDefault("name",
3)獲取該key的value值
jsonObject.get(json的key)
jsonObject.get(“name”)
4)判斷key是否存在
jsonObject.containsKey(key)
5)添加kv鍵值對(duì)
jsonObject.put(key,value)
四、控制臺(tái)輸出運(yùn)行日志樣例
19/06,0308:04:2iIXFOhandler.ContextHandler:StoppedSvrvletGxilcxtHandlertlOfdeSOaInuH.HNAVAlLARLE}
19/06,0308:01:21IMl*handler.ContcxtUundlcr:StoppedSon'lctContcxlll4indlcrt3383619estatic,null,INAVAILABI.E;
19/060308:04:21INFOhandler.Conlextlhndicr:StoppedServletConlextHandIer*533377b!executors/thr^adDuiap>jsun,null,I'XAVAII^BI.E*
19/060308:04:21IXFOhandler.ContextHandler:StoppedServletContextMand1crtl!9a20a6cxecutors,thrcadDunp,nulI,LNAVAILABLEI
19/06/0308:04:21INFOhtindlcr.ContextHandler:SloppedServletContextl(andlcr967389cb8executors7json.null,iNAVA1LABLB
19-06/0308:0-1:21INFOhandler.ConlexlHandler:StoppedServlctContextllandlerH65a.i6596executors,nui
1906,0308:01:21IXFOhandler.Conlextllandlcr:StoppedServlctContexIHund1cr<2c7dl21c.environBcnl/js<m,nulI.UNAVAILABLE,
19/06/0306:04:21INFOhandler.Contextlhndler:StoppedServlctC??{ilextllrtndlcri34625ccdIenvironnent.nulI,INAVAIIABI.Ej
19/06/0308:01:21INFOhandler.Contex〔Handler:StoppedSenietC<mtextllandler#7e3f95fcI/storageiv^A/json,nu11,UNAVAILABLE)
0308:04;21IXFOhandler.ConiexdtuKlIcr:StoppedSen'letContextllandlcr*24bdb479/storaRc/rdd.nuIUNAVAIIABLE;
0308:04:21INFOhandler.CiMitextIfeuxiler;St<wdSrrvletCrM?ttfXtilandierW27b5f92/storage/json.null.^XAVATLABII
0308:01:INFOhandler.CaiIex[Handler:StoppedServlctConiextllandkr*1ddau9b5storage,null.UNAVAILABLE)
0308:04:21i\rohandier.Cm)lvitll.unlifiStoppedServletCodtextHandIrrf12(3156d(^tates/pooi/json.nu11.UNAVAILABLE)
03o?:ai:21INFOhitndIer.ConIexIHandIer:StoppedS(*rvletConlextHandiertld7f7be7'/stagespool.nu!1.VMVAI【ABLE>
0308:0-1:21INI'Ohandler.Contexllbindler:StoppedScnleiContextHandlcr*5860!3d7stagesstage,Json,nul1.UKAVAII.AB1J-/
19/06/0308:(M:21INFOhandler.ContextlLmdler:StoppedServletG>ntextHandlert6a06a2O4;stages/stage.null.IXAVAII.ARIf
19/060308:04:21INFOhandler.ContcxtHandlcr:Stopped$ervictContcxtHandIcrifrllc3760b,■stagesjson,null.I'NAVAILARU:
19/06,0308:01:21INFOhandler.ContextHandler:StoppedServlctContextllandlcHMe5l7l65l/stage^null.UNAVAILABLE!
19/06/0308:04:21l\E0handler.ContextHandIer:StoppedServletContex(llandlerC!cb3d0f7jobs/job/json,nulUNAVAILABLE
19/06/0308:04:2:1ISH)handler.ContextHandler:StoppedScnictCantcxtliandlcr^c101774{/jobs/job,nul1.UNAVAILABLE-
19,06,0308:M:2:1INFOhdndler.GxitexULudlcr:SloppedScrvletConlextHandlcrt6f0cd692:jobs;json.nulI,IXWAlLABifJ
9/06/0308:04:21IM,Ohundlcr.Contcxtllandicr:StewedScn'letCantcxtHandlcr*-lba534bOjobs.null.IWA1LABLE
五、方差、均方根差的定義
1、方差MSE:概率論中方差用來度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的
偏離程度。統(tǒng)計(jì)中的方差(樣本方差)是每個(gè)樣本值與全體樣本值的平均
數(shù)之差的平方值的平均數(shù)。
2、均方根差RMSE:均方根誤差,是觀測(cè)值與真值偏差的平方和觀測(cè)次數(shù)n比值
的平方根。RMSE是計(jì)算觀測(cè)值與其真值,或者觀測(cè)值與其模擬值之間的偏
差。
六、間夜定義
間夜又稱間夜數(shù),是住宿場(chǎng)所在某個(gè)時(shí)間段內(nèi),房間出租率的計(jì)算單位。例
如20間房入住2晚,為40間夜數(shù)。
七、出租率計(jì)算公式
出租率=當(dāng)月發(fā)生的總間夜數(shù)/當(dāng)月所能提供的總房間數(shù)
八、線性回歸預(yù)測(cè)數(shù)據(jù)源data_accommodation_mult.csv
字段名
SEQ、省份、城市、商圈、是否為客棧、星級(jí)、房間數(shù)、評(píng)論數(shù)、平均評(píng)分?jǐn)?shù)、
城市平均間夜、住宿場(chǎng)所總訂單、住宿場(chǎng)所總間夜、住宿場(chǎng)所實(shí)住訂單、住宿場(chǎng)
所實(shí)住間夜、住宿場(chǎng)所直銷訂單、住宿場(chǎng)所直銷實(shí)住訂單、住宿場(chǎng)所直銷間夜、
住宿場(chǎng)所直銷實(shí)住間夜、城市直銷拒單、城市直銷拒單率、住宿場(chǎng)所企業(yè)消費(fèi)平
臺(tái)實(shí)住訂單
九、數(shù)據(jù)可視化表字段說明
表radar_lines
province省份
accommodation_num住宿場(chǎng)所數(shù)
avg_score平均分
comment_num評(píng)論數(shù)
lease_rate出租率
direno_rate直銷率
表platformrate
accommodationname住宿場(chǎng)所名稱
provice省份
city城市
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 房屋租賃合同
- 2024合伙人合作合同范本
- 2024市政施工勞務(wù)合同范本
- 2024工程承包合同樣板
- 2024學(xué)校功能室裝修合同
- 2024年LED驅(qū)動(dòng)電源項(xiàng)目發(fā)展計(jì)劃
- 2024年超低頻測(cè)振儀合作協(xié)議書
- 2024四會(huì)酒店勞動(dòng)合同范文
- 2024年電磁屏蔽用套管項(xiàng)目發(fā)展計(jì)劃
- 2024年其他煤炭采選產(chǎn)品(低熱值燃料)項(xiàng)目發(fā)展計(jì)劃
- 中國(guó)血脂管理指南(基層版2024年)解讀
- 窗戶成品保護(hù)協(xié)議書
- DZT 0449-2023 地質(zhì)災(zāi)害氣象風(fēng)險(xiǎn)預(yù)警規(guī)范
- 碳中和技術(shù)概論全套教學(xué)課件
- 《初中信息科技》 解讀-七年級(jí)上冊(cè)第二單元 互聯(lián)網(wǎng)原理
- 2024年中國(guó)中車集團(tuán)有限公司校園招聘考試試題匯編
- 2024年中國(guó)五礦集團(tuán)有限公司校園招聘考試試題匯編
- 商品發(fā)票模板
- PE袋化學(xué)品安全技術(shù)說明書MSDS(聚乙烯塑膠袋)
- ISO 31000-2018 風(fēng)險(xiǎn)管理指南
- 外科手術(shù)備皮范圍
評(píng)論
0/150
提交評(píng)論