版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
嘉賓:京東-搜索與大數(shù)據(jù)平臺(tái)部王春明wangchunming@??搜索產(chǎn)品簡(jiǎn)介?搜索架構(gòu)演進(jìn)之路?搜索應(yīng)對(duì)1111之道?搜索的挑戰(zhàn)?索引商品數(shù)億,每天近億次更新?服務(wù)用戶(hù)數(shù)過(guò)億,日PV過(guò)億?相同點(diǎn)–海量數(shù)據(jù)–高并發(fā)請(qǐng)求–低延遲響應(yīng)?差異點(diǎn)–電商數(shù)據(jù)結(jié)構(gòu)化–召回率要求高–信息更新時(shí)效性要求高–用戶(hù)個(gè)性化需求高?搜索產(chǎn)品簡(jiǎn)介??搜索架構(gòu)演進(jìn)之路?搜索應(yīng)對(duì)1111之道?搜索的挑戰(zhàn)ee?系統(tǒng)結(jié)構(gòu):簡(jiǎn)單?數(shù)據(jù)量級(jí):百萬(wàn)?更新方式:全量Index1DB1dex………IndexNDBNIndex1DB1dex………IndexNDBNSearchserviceIndex1?系統(tǒng)結(jié)構(gòu)–數(shù)據(jù)分庫(kù)分表,分別處理,進(jìn)行合并–增加實(shí)時(shí)索引模塊?數(shù)據(jù)量級(jí):千萬(wàn)?更新方式:全量+增量workerIndexN?系統(tǒng)結(jié)構(gòu)–離線(xiàn)hadoop處理?數(shù)據(jù)量級(jí):億級(jí)?更新方式:全量+增量8Blender27Merger56Detail34Searcher運(yùn)營(yíng)平臺(tái),QP8Blender27Merger56Detail34Searcher運(yùn)營(yíng)平臺(tái),QP,廣告平臺(tái)等OfflineBuildUpdate增量數(shù)據(jù)中心Hadoop全量數(shù)據(jù)前端VIP1CM調(diào)用流數(shù)據(jù)流服務(wù)注冊(cè)與訂閱?數(shù)據(jù)生產(chǎn):數(shù)據(jù)生產(chǎn)分片,全量、增量統(tǒng)一分?Clustermap:角色管理、負(fù)責(zé)均衡?Blender:不同搜索結(jié)果混合服務(wù)?Merger:搜索結(jié)果合并?Seacher:搜索召回服務(wù)?Detail:搜索結(jié)果包裝服務(wù)Blender?搜索產(chǎn)品簡(jiǎn)介?搜索架構(gòu)演進(jìn)之路??搜索應(yīng)對(duì)1111之道?搜索的挑戰(zhàn)–高并發(fā)查詢(xún):平時(shí)5-10倍的流量–低延時(shí):平均耗時(shí)100ms以?xún)?nèi)–復(fù)雜的排序模型:相關(guān)性、品牌等眾多模型耗時(shí)–個(gè)性化需求:緩存命中率低?部署結(jié)構(gòu)–雙機(jī)房部署–機(jī)房?jī)?nèi)均勻分布–負(fù)載均衡–核心渠道調(diào)用,與其他調(diào)用物理隔離YNNNergerSearcherofileHitattrHitpageNHitdoccache果AttronlylHitpage果Y?搜索服務(wù)流程YNNNergerSearcherofileHitattrHitpageNHitdoccache果AttronlylHitpage果YtMergerMergerYNYNNClient解析參數(shù)請(qǐng)求Searcher調(diào)用UserProfileYHitpagecacheYN拉取增量結(jié)果合并不同搜索結(jié)果AttronlyY在線(xiàn)業(yè)務(wù)邏輯處理排序合并各列結(jié)果HitattrcacheYNYNNClient解析參數(shù)請(qǐng)求Searcher調(diào)用UserProfileYHitpagecacheYN拉取增量結(jié)果合并不同搜索結(jié)果AttronlyY在線(xiàn)業(yè)務(wù)邏輯處理排序合并各列結(jié)果Hitattrcache請(qǐng)請(qǐng)求MergerHitdoccache調(diào)用OP、QP拉取全量+增量結(jié)果排序HitpagecHitpagecache包裝在線(xiàn)業(yè)務(wù)邏輯處理MergerSearcherMerger?搜索托底系統(tǒng)?監(jiān)控–外部服務(wù)–核心模塊性能–調(diào)用方?報(bào)警–范圍–閾值?壓測(cè)–全鏈路–線(xiàn)上日志回放
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工辭職報(bào)告(14篇)
- 方劑練習(xí)題復(fù)習(xí)測(cè)試附答案
- 二年級(jí)美麗的大海作文300字
- xx省長(zhǎng)距離供熱管道項(xiàng)目可行性研究報(bào)告
- 2024年度新能源物流配送運(yùn)營(yíng)承包合同3篇
- 電廠(chǎng)保溫工程施工流程(3篇)
- 2024年度黏結(jié)劑產(chǎn)品進(jìn)出口代理合同3篇
- 2024年特色水果種植與深加工項(xiàng)目合作協(xié)議3篇
- 2024年球團(tuán)膨潤(rùn)土裝卸作業(yè)服務(wù)協(xié)議燒結(jié)廠(chǎng)專(zhuān)用版
- 2024年版室內(nèi)油漆施工承包具體協(xié)議模板版B版
- 鄧州市龍理鄉(xiāng)第一初級(jí)中學(xué)-2025年春節(jié)寒假跨學(xué)科主題實(shí)踐作業(yè)模板【課件】
- 2024年社區(qū)工作者考試必考1000題【歷年真題】
- 2023-2024學(xué)年廣東省深圳市福田區(qū)八年級(jí)(上)期末歷史試卷
- 公司安全事故隱患內(nèi)部舉報(bào)、報(bào)告獎(jiǎng)勵(lì)制度
- 歷史常識(shí)單選題100道及答案解析
- 2024年WPS計(jì)算機(jī)二級(jí)考試題庫(kù)350題(含答案)
- 冬季傳染病預(yù)防-(課件)-小學(xué)主題班會(huì)課件
- 眼視光學(xué)理論和方法智慧樹(shù)知到期末考試答案2024年
- 2024年陜西西安自貿(mào)港投資集團(tuán)及下屬公司招聘筆試參考題庫(kù)含答案解析
- 采礦學(xué)課程設(shè)計(jì)[3]
- 上海牛津英語(yǔ)三年級(jí)句型轉(zhuǎn)換
評(píng)論
0/150
提交評(píng)論