




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、大數(shù)據(jù)在房產(chǎn)領域的實踐提綱蜀道難難于上青天行困難而正確之事往事可鑒未來可追蜀道難難于上青天客少、物少數(shù)據(jù)來源少買賣行為少周期長行為數(shù)據(jù)稀少線下行為重容易分流線上線下難打通業(yè)務復雜性-分析挖掘無坦途提綱蜀道難難于上青天行困難而正確之事往事可鑒未來可追提升服務品質(zhì)的環(huán)節(jié)房源真實無虛假合適的房屋給合適的人房屋買賣不再難縮短周期見效率減少資源浪費效果概述1000萬/天數(shù)百萬/天數(shù)T級別/天6000萬2300萬效果概述經(jīng)紀人91/150維業(yè)主/房54/319維客戶32/107維23/55維33/81維27/72維升30%應用挖掘數(shù)據(jù)采集計算DW存儲分析計算技術架構手動調(diào)度 認證系統(tǒng) 權限安全ETLDSF
2、lumeCollectorSETELinkhdiclog文件Kafka日志流其他HDFSSparkHiveHadoopMetaMRHBaseYarnBIWeb可視化OLAPData ServiceRDBSNginxHueAdhoc市場報告解讀客源解讀A房推薦業(yè)主端鏈家指數(shù)數(shù)據(jù)頻道用戶畫像房源畫像小區(qū)畫像業(yè)主畫像經(jīng)紀人畫像房屋估價elasticsearch,hbase,spark等成熟的開源數(shù)據(jù)存儲、處理系elasticsearch存儲、索引融合層全量數(shù)據(jù),線上用戶行為數(shù)據(jù)線上日志流處理并傳送至elasticsearch集群。用戶畫像統(tǒng)上全量索引以及熱數(shù)據(jù)hbase存儲線上用戶行為數(shù)據(jù)spark
3、完成批量和流式數(shù)據(jù)處理,包括線下全量/增量數(shù)據(jù)導入,用戶畫像用戶畫像KV查詢:如通過手機號查詢客源的一切數(shù)據(jù)數(shù)據(jù)篩選:如篩選西山商圈,近三個月新增房源的小區(qū)名、掛牌價和房屋狀態(tài),要求房屋必須是精裝修或大于3居室OLAP查詢: 如查詢海淀區(qū)2015年不同月份客源帶看次數(shù)的分布用戶畫像用戶特征傾向居室特征分布面積特征傾向價格特征分布區(qū)域特征傾向應用挖掘數(shù)據(jù)采集計算DW存儲分析計算行困難而正確之事KafkaETLFlume調(diào)度 認證系統(tǒng) 權限安全DSSETELinkhdicCollectorlog文件 日志流手動其他HDFSSparkHiveHadoopMetaMRHBaseYarnBIWeb可視化
4、OLAPData ServiceRDBSNginxHueAdhoc市場報告解讀客源解讀A房推薦業(yè)主端鏈家指數(shù)數(shù)據(jù)頻道用戶畫像房源畫像小區(qū)畫像業(yè)主畫像經(jīng)紀人畫像房屋估價房屋估價90%房屋估價經(jīng)紀人業(yè)主/房客戶房屋價格房屋估價房屋估價估價準確:diff = 5%房屋估價房屋估價房屋估價DataSource1DataSource2DataSourceN.ExtractFeatureExtractFeatureFeatureTransformFeatureTransformLOF-樣本異常點處理多模型并舉ANNHedonicGBDTEvaluateEnsembleBest Model房屋估價 LOF(Local Outlier Factor)算法是一種機遇密度的異常檢測算法, 通過計算每個實例相對于其鄰居的孤立情況來判斷這個實例是否為離群點 為每一個每個實例計算一個異常分數(shù),這個分數(shù)稱為實例的局部離群因子(LOF) 較高的LOF值指示這個實例可能是異常的,較低的LOF值指示這個實例可能是正常的提綱蜀道難難于上青天行困
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校國際合作項目的策略性規(guī)劃與實踐
- 學期班級自我評價與反思計劃
- 生物學科實驗操作難點攻克計劃
- 學生自我管理能力的培養(yǎng)與實踐
- 2025綠色環(huán)保產(chǎn)品供需合同
- 2025建筑裝修工程勞務分包合同
- 2025年設備租賃合同范文
- 醫(yī)療行業(yè)合同管理的特殊要求及規(guī)范操作流程
- 各類平臺2024年圖書管理員試題及答案
- 2025年福建省醫(yī)療機構醫(yī)療設備租賃合同樣本
- 2025版新冠肺炎護理:全方位護理要點解讀
- 《光電對抗原理與應用》課件第6章
- 2025山東能源集團中級人才庫選拔高頻重點提升(共500題)附帶答案詳解
- 技術-浙江省2024年12月五校(杭州二中、溫州中學、金華一中、紹興一中、衢州二中)高三第一次聯(lián)考試題和答案
- 2024年浙江省中考社會(開卷)真題卷及答案解析
- focus-pdca改善案例-提高護士對糖尿病患者胰島素注射部位正確輪換執(zhí)行率
- 建筑工程竣工驗收消防設計質(zhì)量檢查報告(表格填寫模板)
- 《ipf診治共識》課件
- 項目施工-三級動火許可證(范本)
- 2024年遼寧省第二屆職業(yè)技能大賽(信息網(wǎng)絡布線賽項)理論參考試題庫(含答案)
- 二零二四年商務考察團組織合同
評論
0/150
提交評論